Category
Jeff Bezos와 Vik Bajaj가 공동 설립한 Prometheus가 6월 11일 시리즈B 120억 달러 조달과 410억 달러 기업가치를 공개했다. 투자자에는 JPMorgan Chase, Goldman Sachs, BlackRock과 Bezos 본인이 포함됐다. 2025년 말 출범 시 62억 달러를 먼저 조달해 누적 180억 달러를 넘겼고, 단숨에 세계 최고가치 비상장 AI 스타트업 중 하나가 됐다. 챗봇·텍스트 생성에 몰린 경쟁사들과 달리 Prometheus는 제트 엔진부터 신약 화합물까지 복잡한 물리 시스템의 설계와 제조를 자동화하는 '인공 일반 엔지니어(artificial general engineer)' 소프트웨어를 목표로 한다. Bezos는 '비밀주의가 아니다'라며 엔지니어링·제조 영역을 정조준한다고 밝혔다.
OpenAI가 6월 9일 ChatGPT Go·Free에 개인화 개선을 배포하며 GPT-5.5 Instant을 새 기본 모델로 전환했다. 응답이 더 명확·간결해지고 공유 컨텍스트 활용이 강화됐다. 모델 선택기도 단순화돼 Instant / Medium / High / Pro 전용 티어로 정리되며 웹·iOS·안드로이드의 Plus·Pro 사용자에게 롤아웃됐다. 본체 GPT-5.5는 4월 23일 출시된 OpenAI의 '가장 강력한 에이전틱 코딩 모델'로, 1M 컨텍스트(입력 ~922K + 출력 128K), reasoning effort 레벨 none/low/medium(기본)/high/xhigh를 지원한다. 벤치마크 도약이 크다 — 1M 장문맥 추론이 GPT-5.4의 36.6%에서 74.0%로, Terminal-Bench 2.0은 82.7%를 기록했다. 가격은 표준 입력 $5·출력 $30/MTok로 GPT-5.4($2.50/$15) 대비 약 2배, GPT-5.5 Pro는 $30/$180이다. 6주 만에 가격을 두 배로 올린 셈이라 비용 민감 워크로드에서는 effort 레벨 하향과 모델 분기 전략이 필요하다.
로그 보다 봇이 자기 시스템 프롬프트를 읊고 있길래 식겁했고, 프롬프트 한 줄로는 안 막혀서 결국 스키마 밖에서 끊은 이야기
vLLM은 PagedAttention과 연속 배칭(continuous batching)을 처음으로 대중화한 오픈소스 LLM 서빙 엔진으로, 프로덕션 추론의 사실상 기본 선택지가 됐다. 핵심 아이디어는 KV 캐시 메모리를 OS의 페이징처럼 블록 단위로 관리해 메모리 낭비를 줄이고, 여러 요청을 토큰 단위로 끼워 넣어 GPU를 쉴 틈 없이 돌리는 것이다. 덕분에 전통적 방식 대비 처리량이 크게 올라간다. Apache 2.0 라이선스에 OpenAI 호환 API 서버를 기본 제공해, 클라이언트 코드를 거의 바꾸지 않고 폐쇄형 API를 자체 인프라로 교체할 수 있다. Llama, Mixtral, DeepSeek-V3 같은 HuggingFace 모델과 NVIDIA·AMD·Intel·TPU 등 폭넓은 하드웨어를 지원한다. 비용 절감, 데이터가 외부로 나가지 않는 프라이버시, 응답 지연 통제가 필요할 때 자체 호스팅의 출발점으로 검토할 가치가 있다.
웹의 1차 인터페이스가 검색창에서 'AI 에이전트 브라우저'로 옮겨가는 흐름이 2026년 상반기 가장 뜨거운 제품 전장이 됐다. OpenAI의 Chromium 기반 ChatGPT Atlas는 2025년 10월 macOS로 출시됐고, 2026년 3월 OpenAI는 Atlas를 ChatGPT·Codex와 합쳐 단일 데스크톱 슈퍼앱으로 통합하겠다고 발표하면서 Windows 단독 출시 시점은 불투명해졌다. Atlas의 에이전트 모드는 Plus($20)·Pro($200) 유료 구간에서 열린다. Perplexity Comet은 정반대 전략을 택했다. 2025년 7월 리서치 중심으로 출발해 한때 월 $200 독점이었으나 10월 전면 무료로 전환했고, 이후 iOS까지 포함해 전 플랫폼에 무료로 풀었다. Comet은 여러 사이트를 가로질러 멀티스텝 작업을 자율 수행한다. 결정적 사건은 2026년 1월 Amazon이 Comet의 자동 쇼핑 기능을 문제 삼아 제기한 소송 — 에이전트 브라우저 기술에 대한 첫 법적 분쟁으로, '봇이 사용자 대신 사이트를 조작'하는 행위의 합법성 경계를 가른다.
2026년 1분기 글로벌 스타트업 투자가 약 3,000억 달러로 분기 사상 최대를 기록했고, 그중 1,880억 달러 이상이 AI 기업에 몰렸다. 핵심은 자본의 집중이다. 전 세계 VC의 약 3분의 2가 OpenAI·Anthropic·xAI·Waymo 단 네 곳으로 흘러갔다. OpenAI는 단일 라운드로 1,220억 달러를 모았는데, 1차 1,100억 달러는 Amazon($50B)·Nvidia($30B)·SoftBank($30B)가 주도했고, 처음으로 은행 채널을 통해 개인 투자자에게도 문을 열어 30억 달러 이상을 끌어모았다. Anthropic은 5월 시리즈 H로 650억 달러를 조달하며 포스트머니 9,650억 달러 — 세계에서 가장 비싼 비상장 AI 기업이 됐다(OpenAI 추정치 8,520억 달러 추월). 인수 측면에서도 OpenAI는 Hiro Finance 인수로 2026년에만 7건째 M&A를 기록, 작년 한 해(8건)에 육박했다. 한편 Shield AI($1.5B 시리즈 G·밸류 $12.7B), 스텔스에서 나온 Recursive Superintelligence($650M+ 시리즈 A·밸류 $4.65B, NVIDIA·AMD Ventures 참여) 등 인프라·로보틱스·초지능 베팅도 두드러졌다.
Anthropic이 지식 노동자용 에이전트 제품을 프로덕션 등급으로 끌어올렸다. 2026년 1월 리서치 형태로 선보인 Claude Cowork는 2월 일반 사무직의 생산성을 겨냥한 정식 엔터프라이즈 제품으로 전환됐고, 기업이 사내 도구를 연결해 개별 직원의 작업을 '터보차지'할 수 있는 커넥터·플러그인 묶음이 함께 출시됐다. 개발자 쪽에서는 Claude Code가 단일 세션에서 수백 개의 병렬 서브에이전트를 계획·실행하는 능력을 얻어, 수십만 줄 규모 코드베이스의 마이그레이션을 Dynamic Workflows로 수행한다(Enterprise·Team·Max 티어). 두 제품은 Claude Enterprise 번들로 묶여 엔지니어링과 비즈니스 팀이 보안 심사·조달을 쪼개지 않고 함께 배포할 수 있다. 5월 6일 샌프란시스코에서 열린 'Code with Claude 2026' 행사에서는 managed agents, proactive workflows, capability curve가 공개됐고 GitHub·Vercel·Datadog·Bun 등 파트너 배포 사례가 다뤄졌다.
OpenAI가 조니 아이브의 스타트업 io를 65억 달러에 인수한 뒤 준비해온 첫 하드웨어가 2026년 하반기 공개로 공식화됐다. 최고글로벌담당자 Chris Lehane이 다보스에서 연내 첫 물리 제품 공개를 확인했다. 핵심은 폼팩터다 — 코드명 'Sweetpea'는 화면 없는(screen-free) 귀 뒤 착용형 웨어러블로, 2nm 칩과 환경 센서를 탑재해 항상 주변을 듣는 '음성 우선' 기기로 설계됐다. 펜 형태의 'Gumdrop' 등 복수 폼팩터가 병행 개발 중이다. 샘 올트먼은 이 제품을 스마트폰에 대한 '평온하고 차분한(peaceful and calm)' 대안으로 규정했고, 즉 알림과 화면 중독을 줄이는 방향의 인터랙션을 노린다. 생산은 Foxconn을 통해 초기 4,000만~5,000만 대 규모를 목표로 한다. 다만 'always-listening' 특성은 프라이버시·상시 녹음 논쟁을 필연적으로 부른다.
벤치 말고 내 트래픽으로 한 달 갈라 돌려보니, 한국어 표 PDF에선 Sonnet 쪽이 덜 깨지더라고요
Anthropic이 2024년 11월 오픈소스로 공개한 Model Context Protocol(MCP)이 2025년 12월 Linux Foundation 산하 신설 Agentic AI Foundation(AAIF)으로 기부되며 중립적 거버넌스로 이전했다. AAIF는 Anthropic·Block·OpenAI가 공동 설립했고 Google, Microsoft, AWS, Cloudflare가 지원한다. OpenAI(2025년 4월), Microsoft(7월), AWS(11월)가 차례로 채택하면서 SDK 다운로드가 월 수천만 건 규모로 늘었고, 2026년 3월 기준 Anthropic은 1만 개 이상의 공개 MCP 서버가 활성 상태라고 밝혔다. 한 조사에서는 소프트웨어 조직의 약 41%가 MCP 서버를 제한적 또는 광범위 프로덕션에 투입 중이다. 2026 로드맵은 전송 계층 확장성, 에이전트 통신 정교화, 성숙한 거버넌스, 엔터프라이즈급 확장에 무게를 둔다.
₩4,500보다 무서웠던 건, 그 돈 낸 사람이 제가 아는 사람이 아니었다는 거였습니다.
Anthropic이 2026년 6월 15일부터 Claude Agent SDK, headless 모드(claude -p), Claude Code GitHub Actions, 그리고 제3자 에이전트의 사용량을 기존 구독 한도에서 분리해 별도 월간 크레딧으로 청구한다. 대화형 Claude Code 세션은 여전히 구독 한도를 쓰지만, 무인 자동화·CI 파이프라인·SDK로 돌리는 에이전트는 Pro 20달러, Max 5x 100달러, Max 20x 200달러의 별도 풀에서 차감되며 소진 후에는 정규 API 단가로 과금된다. 야간 배치, PR 리뷰 봇, 스케줄 잡 등을 구독으로 돌려온 팀이라면 비용 구조가 즉시 바뀌므로 자동화 워크로드의 토큰 소비량을 점검하고, 무거운 잡은 모델 티어를 낮추거나 호출 빈도를 조정하는 대응이 필요하다.
두 번 망하고 이번엔 코드 대신 랜딩부터 띄웠는데, 신청 숫자 말고 주관식 답을 다들 어디까지 믿으시나요?
한국 정부가 ChatGPT에 맞설 자체 파운데이션 모델 개발을 위해 Naver, LG, SK, NC, Upstage 5개 정예 팀을 선정해 고성능 컴퓨팅 인프라, 대규모 데이터셋, AI 인재 인건비 보조를 지원한다. Upstage는 자사 모델 Solar를 1,000억~3,000억 파라미터 규모로 목표하며 언어 능력에 더해 멀티모달과 산업 특화 버전으로 단계적 확장을 계획하고, 2026년 3월에는 AMD와 차세대 모델 개발·배포 가속 및 GPU 공급 협력을 확대했다. Naver의 HyperCLOVA X는 한국어·문화·맥락에 강점을 둔 초대규모 모델로 자리잡았다. 한국어 데이터와 국내 인프라 위에서 모델·도구가 만들어지는 흐름은, 데이터 주권과 규제 대응이 중요한 국내 서비스에 실질적인 모델 선택지를 넓힌다.
OpenAI가 2026년 4월 새 플래그십 모델 GPT-5.5를 공개하고 API로도 제공하기 시작했다. GPT-5.5는 단일 응답보다 여러 단계에 걸쳐 계획하고 도구를 호출하며 긴 시간 지평에서 작업을 수행하는 복합 에이전트 작업에 초점을 맞춰 설계됐다. ChatGPT에는 더 빠른 GPT-5.5 Instant가 기본 모델로 먼저 적용됐고, API에서는 GPT-5.5와 GPT-5.5 Pro가 함께 제공되며 항상 최신 버전을 가리키는 chat-latest 별칭으로도 접근할 수 있다. 앞서 3월에는 GPT-5.4 계열(Thinking·Pro, mini·nano)이 단계적으로 풀렸다. 에이전트 빌더라면 멀티스텝 툴 호출 신뢰성과 장기 작업 일관성이 핵심 개선점이므로, 기존 파이프라인을 벤치마크해 비용 대비 성능을 직접 비교해볼 만하다.
AI 코드 에디터 Cursor를 만드는 Anysphere가 약 500억 달러 기업가치로 20억 달러 이상의 신규 투자를 협상 중이라고 TechCrunch가 보도했다. 라운드는 Andreessen Horowitz와 Thrive Capital이 공동 주도하고 Nvidia가 전략적 공동 투자자로 참여한다. Cursor의 ARR은 2025년 11월 10억 달러에서 2026년 3월 20억 달러로 약 3개월 만에 두 배가 됐고, 회사는 2026년 말 연환산 60억 달러 이상을 전망한다. 매출의 60%가 대형 기업 고객에서 나오고 Fortune 500의 절반 이상에 침투했으며, 엔터프라이즈 계정은 흑자 마진을 내는 반면 개인 개발자 계정은 여전히 적자라는 점이 주목된다. AI 코딩 도구 시장이 개인 생산성에서 조직 단위 도입으로 빠르게 무게중심을 옮기고 있음을 보여준다.