에이전틱 RAG 이해하기: 검색에 '추론 루프'를 두르다
Understanding Agentic RAG: Wrapping Retrieval in a Reasoning Loop
전통적 RAG는 질문을 임베딩해 한 번 검색하고 그 결과를 그대로 프롬프트에 붙이는 단방향 파이프라인이다. 문제는 검색 단계가 자주 실패한다는 데 있다. 단순 RAG 파이프라인이 검색에서 상당한 비율로 부정확한 결과를 낸다는 분석이 반복적으로 보고된다. 에이전틱 RAG는 검색 주위에 추론 루프를 두른다. 에이전트가 "정보가 충분한가? 관련 있나? 질의를 다시 짜서 재검색해야 하나?"를 스스로 판단하고, 필요하면 질의를 재구성해 여러 번 검색한다. 그래프 기반 검색, 계층적 검색 인터페이스, 병렬 검증 에이전트로 확장되는 흐름이다. 동시에 정적 지식엔 RAG가 여전히 유효하되, 적응형 어시스턴트에는 컨텍스트 메모리가 점점 더 큰 비중을 차지한다는 관측도 나온다. 한국 개발자에게는 "생성보다 검색이 병목"이라는 현실 인식과, 검색을 에이전트가 능동 제어하도록 설계하라는 실무 지침이 핵심이다.
RAG 실패의 대부분이 생성이 아닌 검색 단계에서 나온다는 점을 짚고, 검색을 에이전트가 제어하는 설계로 옮겨야 하는 이유를 설명한다.
원문 출처
arXiv (Agentic RAG Survey)