Mistral Large 3, 675B 오픈웨이트 MoE로 플래그십 가격 80% 인하
Mistral Large 3 (675B Instruct 2512, Apache 2.0)
Mistral이 2025년 12월 2일 Mistral 3 패밀리를 공개했고, 그 정점이 Mistral Large 3다. Mixtral 이후 처음 돌아온 MoE로, 총 675B·활성 41B 파라미터 구조다 — 41B 덴스 모델 수준의 연산 비용으로 675B의 용량을 끌어쓴다는 설계다. 라이선스는 Apache 2.0으로 가중치를 전면 공개했고, 14B·8B·3B 덴스 소형 모델도 함께 풀었다. 가격이 공격적이다. 입력 100만 토큰당 $0.50, 출력 $1.50로 주요 상용 플래그십 대비 약 80% 저렴하다. 컨텍스트는 256k, 멀티모달을 지원한다. 다만 절대 지능 점수는 냉정히 봐야 한다. Artificial Analysis Intelligence Index 23으로, 비추론(non-reasoning) 오픈웨이트 동급 중에서는 평균 이하이고 출력 속도(52 tok/s)도 평범하다. 대신 첫 토큰 지연(TTFT 1.11s)은 경쟁력 있고, 단일 8×A100/8×H100 노드 또는 Blackwell NVL72에서 vLLM으로 효율 구동하도록 최적화 체크포인트를 제공한다.
Large 3는 'frontier 점수'가 아니라 '단가×자체호스팅 가능성'으로 승부하는 모델이다. 비추론 워크로드(대량 분류·요약·추출)를 Apache 2.0 가중치로 자체호스팅하면, 토큰당 비용을 상용 API의 1/5 수준으로 떨어뜨릴 수 있다. 한국 빌더에게 시사점은 명확하다 — 모델 선택을 'IQ 순위표'가 아니라 워크로드 성격(추론 필요 여부)과 TCO로 나눠 봐야 한다. 추론이 필요 없는 파이프라인이라면 Large 3가 단가 면에서 가장 합리적인 오픈 옵션 중 하나다.
원문 출처
Mistral AI / Artificial Analysis