728x90
반응형

(개념) 대규모 데이터로 사전 학습된(pre-trained) 딥러닝 모델을 특정 작업에 맞게 추가로 학습시켜 성능을 향상시키는 과정

- 모델이 이미 방대한 데이터로 학습한 일반화된 지식을 기반으로, 새로운 데이터셋에 맞춰 가중치를 조정(Fine-tuning)함으로써 특정 작업에 최적화되도록 재학습하는 작업

 

https://velog.io/@soyoun9798/Pre-training-fine-tuning

 

파인튜닝의 과정

  1. 사전 학습된 모델 선택
    • 목표 작업과 관련성이 높은 사전 학습 모델을 선택한다.
    • 예: BERT, GPT, ResNet 등
  2. 데이터셋 준비
    • 특정 작업에 적합한 데이터를 수집하고 전처리한다.
    • 데이터의 품질과 다양성이 성능에 큰 영향을 미침.
  3. 모델 조정
    • 준비된 데이터로 모델을 재학습시킨다.
    • 학습률을 신중하게 설정하여 기존 지식을 유지하면서 새로운 작업에 적응하도록 조정.

파인튜닝의 장점

  • 데이터 효율성: 적은 양의 데이터로도 우수한 성능을 발휘.
  • 시간 및 비용 절감: 모델을 처음부터 학습시키는 것보다 빠르고 경제적.
  • 도메인 최적화: 일반화된 지식을 특정 도메인이나 작업에 맞게 특화.
  • 높은 성능: 특정 작업에 대해 더욱 일관된 응답 및 높은 정확도 제공.

RAG와 파인튜닝 비교

특징 RAG (Retrieval-Augmented Generation) 파인튜닝 (Fine-tuning)
주요 방식 외부 데이터베이스나 최신 정보 실시간 참조 내부 파라미터 조정을 통한 특정 데이터셋 학습
적용 사례 최신 정보나 빠르게 변화하는 트렌드에 대응 특정 도메인, 스타일, 양식에 최적화된 응답 생성
장점 - 최신 정보 활용 가능 - 일관된 응답 생성
- 데이터베이스와의 유연한 연결 - 특정 요구사항 충족
단점 - 외부 데이터베이스의 품질에 의존 - 학습 데이터가 고정적이므로 최신 정보 반영 어려움
- 실시간 참조로 인한 지연 가능성
활용 사례 - 뉴스, 기술 트렌드 응답 - 기업의 브랜드 어조 유지
- 실시간 정보 제공 필요 상황 - 특정 포맷에 맞춘 응답 생성

 

RAG와 파인튜닝의 기능 비교

기능 RAG 파인튜닝
지식 업데이트 - 외부 검색으로 지식을 최신 상태 유지 - 정적인 데이터 저장
- 빈번한 재훈련 필요 없음 - 지식 및 데이터 업데이트를 위해 재훈련 필요
- 동적 데이터 환경에 적합 - 정적 환경에 적합
외부 지식 - 외부 리소스 활용에 능숙 - 대형 언어 모델과 외부 지식 조정 가능
- 문서 및 구조화/비구조화 데이터베이스 활용에 적합 - 자주 변경되는 데이터소스에는 덜 실용적
데이터 처리 - 최소한의 데이터 처리 및 핸들링 요구 - 고품질 데이터셋에 의존
- 제한된 데이터셋은 성능 향상에 부정적 영향을 미칠 수 있음
모델 맞춤화 - 정보 검색 및 외부 지식 통합에 중점 - 특정 톤/용어 기반으로 모델 행동 및 스타일 조정 가능
- 모델 행동이나 작성 스타일 완전 맞춤화는 어려울 수 있음 - 특정 도메인에 특화된 모델 생성 가능
해석 가능성 - 답변을 특정 데이터 소스로 추적 가능 - 블랙박스처럼 작동
- 높은 해석 가능성 - 모델 반응의 원인을 항상 명확히 알기 어려움
계산 자원 - 데이터베이스 검색 지원 및 통합/업데이트에 계산 자원 소모 - 고품질 훈련 데이터 준비 및 관리 필요
- 계산 자원 소모
지연 요구 사항 - 데이터 검색 포함으로 지연 시간 길어질 수 있음 - 검색 없이 응답 가능
- 지연 시간 짧음
할루시네이션 감소 - 검색된 증거 기반으로 응답 생성 - 도메인 데이터로 훈련 시 할루시네이션 감소
- 할루시네이션 발생 낮음 - 익숙하지 않은 입력 시 할루시네이션 여전히 가능
윤리 및 프라이버시 - 외부 데이터베이스 텍스트 저장 및 검색으로 윤리적/프라이버시 문제 발생 가능 - 훈련 데이터의 민감한 내용으로 윤리적/프라이버시 문제 발생 가능

 

 

[Digital Insight 2024-4] 검색증강생성(RAG) 기술의 등장과 발전 동향, 정현영, 2024.12

 

 

 

 

 

 

https://www.nia.or.kr/site/nia_kor/ex/bbs/View.do;jsessionid=BC6592C4028AFA044514D1CE87E826BA.ce2e4862958f06361138?cbIdx=82618&bcIdx=27539&parentSeq=27539&pageIndex=1&mode=&searchKey=&orderbyDiv=date

 

https://www.nia.or.kr/site/nia_kor/ex/bbs/View.do;jsessionid=BC6592C4028AFA044514D1CE87E826BA.ce2e4862958f06361138?bcIdx=27539&cbIdx=82618&mode=&orderbyDiv=date&pageIndex=1&parentSeq=27539&searchKey=

[Digital Insight 2024-4] 검색증강생성(RAG) 기술의 등장과 발전 동향 2024.12.13 조회수 1513 정현영 미래전략팀 [Digital Insight 2024-4] 검색증강생성(RAG) 기술의 등장과 발전 동향 ======================================

www.nia.or.kr

 

https://youtu.be/tK0l9sC9v_o?si=XFyNo3jPirPTlSKM

 

728x90

'07.AI' 카테고리의 다른 글

LLM - 데이터 검증  (0) 2025.01.09
LLM - 캐시  (0) 2025.01.09
LLM - 분석 - 텍스트 분석  (1) 2025.01.08
클라우드 컴퓨팅 - AI  (0) 2025.01.07
클라우드 컴퓨팅 - AI - AIaaS (인공지능 서비스)  (0) 2025.01.07
Posted by Mr. Slumber
,