Anthropic, 민감 주제는 Opus 4.8로 폴백하는 Claude Fable 5 공개
Claude Fable 5 and Claude Mythos 5
Anthropic이 6월 9일 Opus 클래스보다 한 단계 높은 'Mythos급' 모델을 일반에 처음 공개했다. 동일한 기반 모델을 공유하는 두 버전으로, Fable 5는 콘텐츠 분류기를 탑재해 사이버보안·생화학·증류(distillation) 요청 시 Claude Opus 4.8로 자동 폴백하고(세션의 5% 미만 영향), Mythos 5는 인가된 사용자에 한해 이 안전장치를 해제한다. 가격은 두 모델 모두 입력 100만 토큰당 10달러, 출력 100만 토큰당 50달러로 'Mythos Preview의 절반 미만'이다. Anthropic은 Fable 5가 '거의 모든 벤치마크에서 SOTA'이며 Cognition의 프런티어 코딩 평가 FrontierCode에서 최고점이라고 밝혔다. 외부 파트너와 1,000시간 넘는 레드팀에서 보편적 탈옥은 발견되지 않았다고 했다. 단, 이 모델들은 6월 12일 美 정부 수출통제 지시로 사흘 만에 접근이 차단됐다.
동일 가중치를 안전장치만 달리해 두 SKU로 출시한 구조는 '안전을 모델이 아니라 배포 레이어에 둔다'는 프런티어 랩의 새 운영 모델을 보여준다. 민감 질의를 하위 모델로 라우팅하는 폴백은 능력과 책임을 분리하는 실용적 패턴이지만, 곧바로 정부 회수로 이어진 점은 '안전 SKU'조차 규제 리스크를 상쇄하지 못함을 드러낸다. API 가격 절반 인하는 프런티어급 토큰 단가 경쟁이 가속되고 있다는 실무 신호다.
원문 출처
Anthropic / Tom's Hardware