[분석] 1M 컨텍스트가 비용 문제를 푸는 게 아니라 옮긴다
Claude Code가 Sonnet 계열 1M 토큰 컨텍스트를 붙이면서 '레포 통째로 넣기'가 가능해졌지만, 실무에서 드러난 건 한도가 늘어도 관리 부담은 안 사라진다는 점이다. 200K를 넘기는 구간부터 입력 토큰 단가가 프리미엄으로 올라가고, 컨텍스트가 길수록 중간에 묻힌 지시를 흘리는 lost-in-the-middle 경향이 다시 고개를 든다. 프롬프트 캐싱이 반복 호출의 입력 비용을 깎아주지만, 캐시는 접두사가 바뀌면 무효화돼서 대화 앞쪽에 큰 컨텍스트를 쌓고 뒤에서 계속 편집하는 패턴과 궁합이 나쁘다. 결국 '/compact로 요약 압축, 무관한 파일은 서브에이전트로 격리, 자주 쓰는 규칙은 CLAUDE.md로 고정'이라는 컨텍스트 예산 관리가 한도와 무관하게 여전히 필요하다.
실무에선 1M을 '다 채워도 된다'는 신호로 읽으면 토큰 청구서와 정확도 양쪽에서 손해를 본다. 캐시 적중률을 지키려면 큰 불변 컨텍스트는 앞에, 변하는 작업은 뒤에 두는 배치가 직접적인 비용 차이를 만든다.
원문 출처
Anthropic Docs