Char :: LLM - 검색 증강 생성 (RAG, Retrieval-augmented generation)

LLM - 검색 증강 생성 (RAG, Retrieval-augmented generation)

07.AI 2025. 5. 16. 14:01

728x90

(정의) 프라이빗 또는 독점 데이터 소스의 정보로 텍스트 생성을 보완하는 기술

 정보 검색 구성 요소와 텍스트 생성기 모델을 결합

- 데이터의 정확도를 높여 생성형 AI 환각을 없애는 데 초점을 맞춘 기술

원본 RAG 논문에는 RAG 성능을 미세 조정하기 위한 고급 훈련 방법이 포함되어 있습니다 (출처: Lewis, P. 외. 「Retrieval-Augmented Generation for Knowledge-Intensive NLP Tasks」 )

사용자 쿼리가 입력되면 먼저 외부 지식베이스에서 관련 정보를 검색(Retrieval)한 후, 이 정보를 컨텍스트로 활용해 생성형 모델(Generation)이 최종 응답을 만듭니다. GPT와 같은 생성에 특화된 모델과 BERT처럼 검색에 강점을 가진 모델의 장점을 결합한 "검색 + 생성" 구조를 가집니다.

검색기 retriever : 기준 정답을 저장소에 저장하고 쿼리가 주어졌을 때 이를 검색하는 LLM.
생성기 generator : 사용자의 쿼리와 검색된 지식을 추론하여 인라인 대화형 답변을 제공하는 LLM.

[Digital Insight 2024-4] 검색증강생성(RAG) 기술의 등장과 발전 동향, 정현영, 2024.12

기본 RAG (Naive RAG) , https://futuredrill.stibee.com/p/46/

Enhancing Retrieval-Augmented Generation: A Study of Best Practices (25.1.13)

RAG와 파인튜닝 비교

특징	RAG (Retrieval-Augmented Generation)	파인튜닝 (Fine-tuning)
주요 방식	외부 데이터베이스나 최신 정보 실시간 참조	내부 파라미터 조정을 통한 특정 데이터셋 학습
적용 사례	최신 정보나 빠르게 변화하는 트렌드에 대응	특정 도메인, 스타일, 양식에 최적화된 응답 생성
장점	- 최신 정보 활용 가능	- 일관된 응답 생성
장점	- 데이터베이스와의 유연한 연결	- 특정 요구사항 충족
단점	- 외부 데이터베이스의 품질에 의존	- 학습 데이터가 고정적이므로 최신 정보 반영 어려움
단점	- 실시간 참조로 인한 지연 가능성	- 학습 데이터가 고정적이므로 최신 정보 반영 어려움
활용 사례	- 뉴스, 기술 트렌드 응답	- 기업의 브랜드 어조 유지
활용 사례	- 실시간 정보 제공 필요 상황	- 특정 포맷에 맞춘 응답 생성

생성형 AI 시스템에 대한 적대적 기계학습 공격 대응방안 ,전자금융과 금융보안(제37호)

(한계) 지식 베이스가 방대해질수록 개별 단위 조각에 대한 충분한 맥락이 부족하여 특정 정보에 대한 검색이 정확하지 않을 수 있다. 문서를 작은 단위 조각 (chunk)으로 나누고, 임베딩을 통해 각 단위 조각을 벡터화하여 검색하기 때문이다.

주간기술동향 2159호, 대규모 언어 모델(LLM) 성능 향상을 위한 연구 동향, 2024.12.11

생성형 AI의 소개 및 활용시 규제 관련 논의사항(금융보안원), 2024.03

*벡터화: 정형, 비정형 등 다양한 포맷의 데이터를 숫자로 표현하는 것

- 대규모 데이터 세트 또는 지식 기반을 검색하도록 설계된 검색 모델에 해당 정보를 가져와 읽을 수 있는 텍스트 응답을 생성하는 대규모 언어 모델(LLM)과 같은 생성 모델을 결합

- 추가 데이터 소스의 컨텍스트를 더하고 훈련을 통해 LLM의 원래 지식 기반을 보완함으로써 검색 경험의 정확도를 개선할 수 있습니다. 따라서 모델을 다시 훈련할 필요 없이 대규모 언어 모델의 출력이 향상됩니다.

- 생성형 AI 시스템이 외부 정보 소스를 사용하여 보다 정확한 상황 인식 응답을 생성할 수 있도록 해주기 때문에 질문 답변 및 콘텐츠 생성과 같은 작업에 유용합니다. 일반적으로 시맨틱 검색이나 하이브리드 검색과 같은 검색 방법을 구현하여 사용자 의도에 응답하고 보다 정확한 결과를 제공합니다.

(동작방식)

1. 검색

2. 생성

AutoRAG: 자동으로 최적의 RAG 파이프라인을 찾아주는 자동화 툴

AutoRAG는 ML을 자동으로 최적화 해주는 AutoML처럼 RAG를 자동으로 최적화 해줌
수천개의 문서(pdf, 워드 등)들 내에서 검색을 통해 LLM이 모르는 지식에 대해서도 답변할 수 있게 하는 RAG(Retrieval-Augmented Generation)가 많은 관심을 받고 있음.
실제 문서에서 높은 성능의 RAG 파이프라인을 구성하는 것은 어려움.
RAG는 데이터와 목적에 따라 어울리는 조합이 모두 다르며 최적의 조합을 찾기 위해서는 많은 실험과 평가를 반복해야 함.
RAG 파이프라인 조합은 AutoRAG에서 현재 지원하는 12개의 모듈에서만 960가지의 조합이 나올 정도로 다양함.
(임베딩 및 언어모델은 조합에서 제외)
AutoRAG는 ML을 자동으로 최적화 해주는 AutoML처럼 RAG를 자동으로 최적화 해줌
YAML 파일을 간단히 수정하는 것 만으로 사용 가능.
찾은 최적의 RAG를 곧바로 fastAPI 서버로 실행하여 사용 가능.

RAG를 공부하고, 여러 파이프라인을 만들고 성능을 시험해 보며 느꼈던 가장 큰 어려움은 ‘데이터마다 최적화 하는 것’ 이었습니다.
학계에서는 매일 새로운 RAG 모듈이나 파이프라인을 제안하고 있지만, 힘들게 가져와 실제 데이터에 적용을 해보면 성능이 전혀 향상되지 않는 경우가 많았습니다. 또한, pdf와 같은 문서들에서 평가용 데이터셋을 구축하고, 여러 모듈로 실험하고 평가하는 과정이 귀찮고 힘들었습니다.

대부분의 RAG 개발팀이 같은 어려움을 겪을 것이라 예상이 되어 저희 팀에서 오픈소스로 AutoRAG를 만들었습니다. 깃허브와 저희의 Docs를 보시고 따라하시면 쉽게 이용하실 수 있을 것입니다.

RAG를 기존에 열심히 만들고 계셨던 분들도, 새롭게 RAG에 입문하시는 분들도 모두 만족하며 사용하실 수 있을 것입니다!

https://www.elastic.co/kr/what-is/retrieval-augmented-generation

검색 증강 생성(RAG)이란? | 포괄적인 RAG 안내서

기술 및 애플리케이션에서의 검색 증강 생성과 그 사용 사례를 정의합니다. 검색 증강 생성의 이점, 문제점 및 미래 동향을 이해합니다. ...

www.elastic.co

https://www.promptingguide.ai/techniques/rag

Retrieval Augmented Generation (RAG) – Nextra

A Comprehensive Overview of Prompt Engineering

www.promptingguide.ai

https://github.com/Marker-Inc-Korea/AutoRAG

GitHub - Marker-Inc-Korea/AutoRAG: RAG AutoML Tool - Find optimal RAG pipeline for your own data.

RAG AutoML Tool - Find optimal RAG pipeline for your own data. - Marker-Inc-Korea/AutoRAG

github.com

https://byline.network/2024/02/240219_003/

[그게 뭔가요] 생성AI 환각 줄이는 ‘RAG’ - 바이라인네트워크

생성 인공지능(AI) 기술의 확산 속에서 항상 문제로 지적되는 게 바로 ‘환각’ 이슈다. 거대언어모델(LLM)이 잘못된 정보를 진짜인 것처럼 뽑아내고, 애먼 정보를 제시하는 부작용은 생성AI를 십

byline.network

https://www.nia.or.kr/site/nia_kor/ex/bbs/View.do;jsessionid=BC6592C4028AFA044514D1CE87E826BA.ce2e4862958f06361138?cbIdx=82618&bcIdx=27539&parentSeq=27539&pageIndex=1&mode=&searchKey=&orderbyDiv=date

https://www.nia.or.kr/site/nia_kor/ex/bbs/View.do;jsessionid=BC6592C4028AFA044514D1CE87E826BA.ce2e4862958f06361138?bcIdx=27539&cbIdx=82618&mode=&orderbyDiv=date&pageIndex=1&parentSeq=27539&searchKey=

[Digital Insight 2024-4] 검색증강생성(RAG) 기술의 등장과 발전 동향 2024.12.13 조회수 1513 정현영 미래전략팀 [Digital Insight 2024-4] 검색증강생성(RAG) 기술의 등장과 발전 동향 ======================================

www.nia.or.kr

https://www.hanbit.co.kr/channel/view.html?cmscode=CMS6821227905

생성형 AI는 정말 ‘생각’하고 있을까? — LLM의 사고(Thinking) vs 추론(Reasoning) 능력의 차이

제미나이, 클로드-3, 라마-3 GPT-4와 같은 현재의 생성형 LLM이 생각Thinking 하기보다 주어진 맥락에서 추론 Reasoning 하는 데 더 뛰어나다고 말하는 것은 다소 논란의 여지가 있을 수 있습니다. 그래서

www.hanbit.co.kr

728x90

저작자표시 (새창열림)

'07.AI' 카테고리의 다른 글

인공지능 (4)	2025.05.16
LLM - 성능 - 모델 최적화 - '테스트 타임 스케일링(test-time scaling)' 기법 (0)	2025.05.16
생성형 AI - 추론 ‘inference’ 비용 (0)	2025.05.16
인공지능 - 인공지능 에이전트 (Agent) - 에이전틱 AI (Agentic AI) (1)	2025.05.16
LLM - 성능 - 최적화 - 배치 (Batch) (0)	2025.05.16

Posted by Mr. Slumber

Char

LLM - 검색 증강 생성 (RAG, Retrieval-augmented generation)

RAG와 파인튜닝 비교

'07.AI' 카테고리의 다른 글

카테고리

태그목록

최근에 올라온 글

최근에 달린 댓글

글 보관함

달력

링크

티스토리툴바

« 2025/08 »
일	월	화	수	목	금	토
					1	2
3	4	5	6	7	8	9
10	11	12	13	14	15	16
17	18	19	20	21	22	23
24	25	26	27	28	29	30
31