컨텍스트 엔지니어링: 에이전트 시대의 새 핵심 역량 (상록 가이드)
Context Engineering for AI Agents (Evergreen Guide)
컨텍스트 엔지니어링은 에이전트가 보는 토큰을 '최소한의 고신호(high-signal) 집합'으로 큐레이션하는 작업으로, 프롬프트 엔지니어링과 RAG를 모두 포함하는 상위 개념이다. 컨텍스트 아키텍처는 시스템 컨텍스트, 세션 컨텍스트, 메모리, 산출물(artifact), 온디맨드 검색의 다섯 계층으로 구성된다. 실무 원칙은 분명하다. 관련 청크를 긴 컨텍스트 한가운데 끼워 넣으면 '중간에서 길을 잃는(lost in the middle)' 현상이 생기므로, 50개를 높은 재현율로 검색한 뒤 재순위화(re-ranking)로 상위 5개만 추리는 편이 통째로 던지는 것보다 낫다. 코드 RAG라면 검색된 함수가 호출하는 다른 함수의 시그니처·정의와 인자 타입까지 자동으로 끌어와야 추론 정확도가 오른다. 도구도 마찬가지다. 5개면 되는데 40개를 주면 오히려 추론이 저하되므로, 계획(읽기)·실행(쓰기)·검증 단계별로 도구를 동적으로 제공한다. 토큰 수가 아니라 채움 비율(fill %)로 예산을 잡고 60%를 넘기 전에 선제적으로 압축하라.
에이전트 품질을 좌우하는 건 모델 선택이 아니라 무엇을 컨텍스트에 넣고 빼느냐이며, 이는 모든 LLM 앱에 보편적으로 적용된다.
원문 출처
Sourcegraph