LLM

Gallery

List

Search

<이미지 출처: Will we run out of data? An analysis of the limits of scaling datasets in Machine Learning>

데이터는 영원한 존재가 아니다

우연한 기회로, “Will we run out of data? An analysis of the limits of scaling datasets in Machine Learning”의 제목을 가진 논문을 읽게 되었습니다.

논문의 핵심 요지는 “현재 머신러닝 모델이 학습할 수 있는 데이터의 증가 속도가, 공개되어 있는 데이터의 증가 속도보다 빠르다” 입니다.

RAG의 중요성

요즘 LLM의 매력에 푹 빠져서, 오랜만에 노마드 코더님의 강의를 듣고 있는데요

문서 정보를 제공해주는 챗봇 애플리케이션을 제작하는 과정이 재밌으면서, 정말 배울 점이 많아 이 곳에 정리하려고 합니다. 논문 내용을 정리하거나, 막히는 부분이 있을 때 ChatGPT를 활용하는데, 서비스를 클론 코딩을 해볼 수 있어 정말 좋았습니다!

목표는 챗봇 애플리케이션을 만드는 것이며, 챗봇은 주어진 문서에 대한 정보를 제공하는 역할을 수행합니다. 이때, 웹 애플리케이션 제작을 위해 Streamlit 프레임워크를 사용하였습니다. 또한, Langchain을 통해, LLM 기반 챗봇 구현을 수행했습니다.

전체 코드와 데모 영상은 아래 깃허브 링크에 있으니, 참고하시면 좋을 것 같습니다!

SmartDoc 챗봇 구축기

안녕하세요! 오랜만에 LLM 컨텐츠를 주제로 돌아왔습니다

LLM 관련 기술을 학습하고, 여러 프로젝트를 수행하면서 문득 한 가지 생각이 들더군요.

‘상품에 대한 설명을 참고하여 가격을 어느 정도 정확하게 예측을 할 수 있을까?’

Amazon 상품 가격 예측 봇 구축기(1) - 전처리

안녕하세요.

오늘은 Amazon 제품 가격 예측 봇 개발의 두 번째 시간입니다.

데이터 전처리

Baseline 모델 생성

LLM 파인튜닝 with GPT

Amazon 상품 가격 예측 봇 구축기(2) - Baseline 모델

오늘은 드디어 OpenAI GPT-4o 모델을 파인튜닝하여 Amazon 상품 예측 봇을 만드는 날입니다.

데이터 전처리

Baseline 모델 생성

LLM 파인튜닝 with GPT

Amazon 상품 가격 예측 봇 구축기(3) - GPT-4o 파인튜닝

안녕하세요!

드디어 Amazon 상품 가격 예측 봇 구축기 마지막 세션입니다.

오늘은 오픈소스 모델을 대표하는 Llama-3.1을 파인튜닝하고, 성능을 평가하도록 하겠습니다.

데이터 전처리

Baseline 모델 생성

Amazon 상품 가격 예측 봇 구축기(4) - LlaMa-3.1 파인튜닝

안녕하세요!

저는 얼마 전, 우연하게 모두의 AI 케인님의 유튜브 영상을 시청하였습니다.

AI Agent에 대한 개념과 필요성에 대해 설명을 기막히게 잘 해주시더라구요!

덕분에 해당 주제에 대해 큰 흥미와 관심을 가지게 되었고, 본격적으로 Deep-dive하게 된 동기가 되었습니다 :)

vLLM 기반 AI Agent 구축기

Workflow

전체 프로세스는 다음과 같습니다.

캐시 시스템

파일 전처리(Loader, Chunking, Embedding, Vector database)

RAG Agent

RAG Agent 구축기

Text-to-SQL 파인튜닝에 관련된 핵심 주제 및 관련 레퍼런스를 정리하는 공간입니다.

Topic 1. 병렬 처리를 통한 SQL 질문 생성

Use case: SQL 생성 목적에 따라, 별도의 분기를 생성하여 그래프를 실행한다 > 전체 그래프 실행 시간을 단축시킬 수 있다.

핵심 키워드

레퍼런스

Text-to-SQL 파인튜닝을 위한 LangGraph 레퍼런스 정리