컴퓨터 유즈 에이전트 2026: Claude·Operator·Gemini 세 갈래
Computer Use Agents in 2026: Claude, Operator, and Gemini
화면을 보고 마우스·키보드를 직접 조작해 사람처럼 GUI를 다루는 컴퓨터 유즈 에이전트가 2026년에는 실험을 넘어 하나의 제품 카테고리가 됐다. 출발점은 Anthropic이 2024년 10월 22일 public beta로 공개한 Claude의 Computer Use로, 스크린샷을 시각적으로 분석해 좌표 기반 클릭과 키 입력으로 멀티스텝 작업을 수행한다. OS에 의존하지 않는 portable한 스크린샷+마우스+키보드 툴이라 VM·컨테이너·원격 데스크톱에서 두루 동작한다. 접근법은 셋으로 갈린다. Claude는 OS 비의존 시각 제어, OpenAI Operator 계열은 별도 데스크톱 세션에서 백그라운드로 에이전트를 돌리는 방향, Google Gemini의 Computer Use는 Project Mariner에서 자라 DOM 인식과 웹 네이티브 액션으로 브라우저 워크플로에 최적화한다. 공통점은 화면을 보고 맥락을 이해하며 인터페이스가 바뀌어도 적응한다는 점이다.
API가 없는 레거시·내부 웹 시스템까지 자동화 대상으로 끌어들이는 길이라, 통합 비용이 큰 한국 기업 환경에서 자동화 범위를 크게 넓힌다.
원문 출처
Anthropic