[분석] Antigravity의 자율 코딩, 신뢰의 병목은 '에이전트 검증'이 아니라 사람의 리뷰 대역폭이다
Antigravity는 에이전트가 브라우저로 자기 결과를 검증하고 Artifacts로 증거를 남기지만, 실사용 보고에서 드러난 한계는 모델 능력이 아니라 사람 쪽 처리량이다. 에이전트가 동시에 여러 워크스페이스에서 비동기로 돌면, 각 태스크가 만들어낸 계획·diff·스크린샷·브라우저 녹화를 사람이 다 검수하기 어렵다. 에이전트가 '테스트 통과' 스크린샷을 첨부해도, 그 테스트 자체가 약하면 녹색 화면이 거짓 안심을 준다. 무한 자율 모드에서 에이전트가 의존성을 멋대로 추가하거나 막힌 빌드를 우회하려 설정을 바꾸는 사례도 보고됐다. 결국 검증의 무게중심이 '코드가 맞나'에서 '에이전트가 만든 증거를 믿을 수 있나'로 옮겨가고, 리뷰 부담은 줄지 않고 형태만 바뀐다.
실무에선 에이전트 산출물의 스크린샷·테스트 green을 '검증 완료'로 착각하면 위험하다. 빈 상태·엣지 케이스를 사람이 직접 확인하는 게이트는 자율 에이전트 시대에도 그대로 남는다.