RAG는 LLM모델을 강화하는 방법 중 하나이다.
기존 언어 모델에 외부 지식을 결합하여 “최신 정보”를 제공한다.
ㅜ작동 원리
1.
Retreival (검색)
질문을 부석해 외부 DB를 기반으로 검색하고 그 중 연관성 높은 정보를 선별한다.
2.
Augmented (증강)
LLM입력에 1의 결과를 요약 / 재구성 / 가중치 부여 등의 처리를 한 후 추가한다.
3.
Generation (최종 응답 생성)
1, 2의 결과를 기반으로 최종 응답을 생성한다.
해결한 문제
1.
지식의 한계
LLM은 학습된 시점까지의 정보만 가질 수 있다는 한계 극복
2.
환각 현상 (hallucination)
학습 데이터의 패턴을 따라 존재하지 않는 정보를 생성하는 환각 현상 완화
3.
출처 제시가 어려운 문제
검색을 기반으로 함으로써 해당 문제 완화
4.
특정 도메인에 대한 전문지식 갖기 어려운 문제
범용 LLM의 전문성 부족 문제 완화
단점
1.
검색과정으로 인해 계산 복잡도 증가
2.
데이터 소스에 대한 의존성
데이터 소스에 대한 검증과 관리 필수
3.
보안 / 프라이버시 문제
외부 DB사용으로 민감 정보가 노출될 가능성 존재