컨텍스트 엔지니어링 입문: 무엇을 언제 어떻게 넣을지 설계하기
Context Engineering for AI Agents (Explainer)
에이전트 품질은 모델 자체보다 컨텍스트 창에 무엇을 채우느냐에 점점 더 좌우된다. 컨텍스트 엔지니어링은 시스템 지침·사용자 입력·검색 문서·메모리·세션 상태·도구 결과를 한정된 토큰 예산 안에 어떻게 배치할지 설계하는 작업이다. 핵심 기법은 여섯 가지다 — 압축(추출·추상 요약, 사실 추출), 메모리 큐레이션, 프롬프트 캐싱, 요약 아티팩트, RAG, 필터링. 특히 RAG에서는 모든 청크를 그냥 프롬프트에 쏟아붓는 대신, 높은 재현율로 50개 후보를 검색한 뒤 리랭킹으로 상위 5개로 정밀화하는 파이프라인이 일반적으로 더 낫다. 청킹·임베딩·재현율/정밀도 트레이드오프, 최신성 가중치, 중요도 임계값을 함께 다뤄야 환각을 줄이고 비용을 통제할 수 있다. '컨텍스트가 길수록 좋다'는 직관은 종종 틀린다 — 관련성 낮은 토큰은 노이즈이자 비용이다.
RAG·에이전트 정확도 문제의 상당수가 모델 한계가 아니라 컨텍스트 구성 실패에서 오므로, 이 사고 틀이 디버깅의 출발점이 된다.
원문 출처
Sourcegraph