Qwen3-Coder-Next 등 오픈웨이트 모델로 로컬에서 코딩 에이전트 돌리기
Running coding agents locally with open-weight models (Qwen3-Coder-Next and peers)
2026년 들어 로컬에서 돌릴 수 있는 오픈웨이트 코딩 모델이 실용 수준에 올라섰다. Alibaba Qwen 팀이 2026년 2월 공개한 Qwen3-Coder-Next는 총 80B MoE 중 한 번에 3B 파라미터만 활성화하는 구조로, 단일 머신에서 약 46GB 메모리로 SWE-bench Verified 70.6%를 달성했다고 보고된다. 같은 시기 GLM-5(Zhipu, MIT 라이선스), MiniMax M2.5 등 프런티어급 오픈소스 모델이 연달아 나오며 상용과의 격차가 좁혀졌다. Qwen은 Qwen3-Coder에 최적화된 오픈소스 터미널 에이전트 Qwen Code도 제공해, Claude Code나 Aider 같은 경험을 오픈 인프라만으로 구성할 수 있다. 보안·데이터 주권이 중요한 한국 팀이나 비용 민감한 프로젝트라면, 외부 API 없이 온프레미스로 에이전틱 코딩을 시도해볼 현실적 선택지가 생겼다.
데이터를 외부로 보내지 않고 온프레미스에서 에이전틱 코딩이 가능해져, 보안·규제·비용 제약이 큰 한국 팀의 실질 대안이 된다.