Google Gemini 3.5 Flash GA, 작년 Pro 능가했지만 가격은 3배
Google Releases Gemini 3.5 Flash: Frontier-Level Coding and Agentic Performance
Google이 5월 19일 Gemini 3.5 Flash를 정식(GA) 출시했고, 6월 들어 제품 통합이 가속됐다. 6월 16일부터 Gemini Enterprise 앱에서 3.5 Flash가 기본 활성화되며 비활성화 토글이 제거된다. 핵심은 'Flash 등급이 이전 세대 Pro를 추월했다'는 점이다 — Terminal-Bench 2.1에서 3.1 Pro 70.3% 대비 76.2%, MCP Atlas 83.6% vs 78.2%, Finance Agent v2 57.9% vs 43.0%, GDPval-AA Elo 1656 vs 1314로 코딩·에이전틱 스위트 전반에서 앞선다. 대신 가격이 올랐다. 글로벌 티어 입력 $1.50·출력 $9.00/MTok(캐시 입력은 90% 할인 $0.15), 비-글로벌 리전은 $1.65/$9.90이다. 이전 Flash 세대 대비 사실상 3배 수준이라 '저렴한 보조 모델'이라는 Flash의 포지셔닝이 흔들린다. 다음 단계인 Gemini 3.5 Pro 정식 GA가 6월 중 예고돼 있으며, 관례적 비율(~10배)을 따르면 $15/$60 수준이 점쳐진다.
'Flash가 작년 Pro를 이긴다'는 건 모델 등급 인플레이션의 전형이다 — 같은 이름의 하위 티어가 1년 전 상위 티어를 추월하는 속도가 비용 절감보다 빠르다. 다만 가격이 3배 오르면서 Flash의 '싸고 빠른 백업' 정체성이 약해졌다. 한국 개발자는 모델명만 보고 비용을 가정하지 말고 캐시 입력 90% 할인($0.15)을 적극 활용하는 프롬프트 캐싱 설계로 실효 단가를 낮춰야 한다.
원문 출처
DataNorth AI / Google AI for Developers