728x90
반응형
(개념) 대규모 데이터로 사전 학습된(pre-trained) 딥러닝 모델을 특정 작업에 맞게 추가로 학습시켜 성능을 향상시키는 과정
- 모델이 이미 방대한 데이터로 학습한 일반화된 지식을 기반으로, 새로운 데이터셋에 맞춰 가중치를 조정(Fine-tuning)함으로써 특정 작업에 최적화되도록 재학습하는 작업
파인튜닝의 과정
- 사전 학습된 모델 선택
- 목표 작업과 관련성이 높은 사전 학습 모델을 선택한다.
- 예: BERT, GPT, ResNet 등
- 데이터셋 준비
- 특정 작업에 적합한 데이터를 수집하고 전처리한다.
- 데이터의 품질과 다양성이 성능에 큰 영향을 미침.
- 모델 조정
- 준비된 데이터로 모델을 재학습시킨다.
- 학습률을 신중하게 설정하여 기존 지식을 유지하면서 새로운 작업에 적응하도록 조정.
파인튜닝의 장점
- 데이터 효율성: 적은 양의 데이터로도 우수한 성능을 발휘.
- 시간 및 비용 절감: 모델을 처음부터 학습시키는 것보다 빠르고 경제적.
- 도메인 최적화: 일반화된 지식을 특정 도메인이나 작업에 맞게 특화.
- 높은 성능: 특정 작업에 대해 더욱 일관된 응답 및 높은 정확도 제공.
RAG와 파인튜닝 비교
특징 | RAG (Retrieval-Augmented Generation) | 파인튜닝 (Fine-tuning) |
주요 방식 | 외부 데이터베이스나 최신 정보 실시간 참조 | 내부 파라미터 조정을 통한 특정 데이터셋 학습 |
적용 사례 | 최신 정보나 빠르게 변화하는 트렌드에 대응 | 특정 도메인, 스타일, 양식에 최적화된 응답 생성 |
장점 | - 최신 정보 활용 가능 | - 일관된 응답 생성 |
- 데이터베이스와의 유연한 연결 | - 특정 요구사항 충족 | |
단점 | - 외부 데이터베이스의 품질에 의존 | - 학습 데이터가 고정적이므로 최신 정보 반영 어려움 |
- 실시간 참조로 인한 지연 가능성 | ||
활용 사례 | - 뉴스, 기술 트렌드 응답 | - 기업의 브랜드 어조 유지 |
- 실시간 정보 제공 필요 상황 | - 특정 포맷에 맞춘 응답 생성 |
RAG와 파인튜닝의 기능 비교
기능 | RAG | 파인튜닝 |
지식 업데이트 | - 외부 검색으로 지식을 최신 상태 유지 | - 정적인 데이터 저장 |
- 빈번한 재훈련 필요 없음 | - 지식 및 데이터 업데이트를 위해 재훈련 필요 | |
- 동적 데이터 환경에 적합 | - 정적 환경에 적합 | |
외부 지식 | - 외부 리소스 활용에 능숙 | - 대형 언어 모델과 외부 지식 조정 가능 |
- 문서 및 구조화/비구조화 데이터베이스 활용에 적합 | - 자주 변경되는 데이터소스에는 덜 실용적 | |
데이터 처리 | - 최소한의 데이터 처리 및 핸들링 요구 | - 고품질 데이터셋에 의존 |
- 제한된 데이터셋은 성능 향상에 부정적 영향을 미칠 수 있음 | ||
모델 맞춤화 | - 정보 검색 및 외부 지식 통합에 중점 | - 특정 톤/용어 기반으로 모델 행동 및 스타일 조정 가능 |
- 모델 행동이나 작성 스타일 완전 맞춤화는 어려울 수 있음 | - 특정 도메인에 특화된 모델 생성 가능 | |
해석 가능성 | - 답변을 특정 데이터 소스로 추적 가능 | - 블랙박스처럼 작동 |
- 높은 해석 가능성 | - 모델 반응의 원인을 항상 명확히 알기 어려움 | |
계산 자원 | - 데이터베이스 검색 지원 및 통합/업데이트에 계산 자원 소모 | - 고품질 훈련 데이터 준비 및 관리 필요 |
- 계산 자원 소모 | ||
지연 요구 사항 | - 데이터 검색 포함으로 지연 시간 길어질 수 있음 | - 검색 없이 응답 가능 |
- 지연 시간 짧음 | ||
할루시네이션 감소 | - 검색된 증거 기반으로 응답 생성 | - 도메인 데이터로 훈련 시 할루시네이션 감소 |
- 할루시네이션 발생 낮음 | - 익숙하지 않은 입력 시 할루시네이션 여전히 가능 | |
윤리 및 프라이버시 | - 외부 데이터베이스 텍스트 저장 및 검색으로 윤리적/프라이버시 문제 발생 가능 | - 훈련 데이터의 민감한 내용으로 윤리적/프라이버시 문제 발생 가능 |
https://youtu.be/tK0l9sC9v_o?si=XFyNo3jPirPTlSKM
728x90
'07.AI' 카테고리의 다른 글
LLM - 데이터 검증 (0) | 2025.01.09 |
---|---|
LLM - 캐시 (0) | 2025.01.09 |
LLM - 분석 - 텍스트 분석 (1) | 2025.01.08 |
클라우드 컴퓨팅 - AI (0) | 2025.01.07 |
클라우드 컴퓨팅 - AI - AIaaS (인공지능 서비스) (0) | 2025.01.07 |