[분석] swarm은 왜 자꾸 무너지는가: 에러 누적과 조정 비용의 수학
다수 에이전트를 느슨하게 풀어놓는 swarm 패턴이 실무에서 깨지는 이유를 정량적으로 짚은 논의가 늘었다. 핵심은 두 가지다. 첫째, 단계마다 에이전트 성공률이 95%여도 직렬 10단계면 전체 성공률은 0.95^10≈60%로 주저앉는다. 에이전트를 늘릴수록 핸드오프 경계가 늘고 오류는 곱해진다. 둘째, 에이전트 수 N이 늘면 조정·합의에 드는 통신 비용은 대략 N^2로 증가하지만 실제 유효 작업량은 그만큼 늘지 않는다. 결국 검증 가능한 중간 산출물과 명시적 핸드오프 계약(스키마·완료 정의)이 없는 swarm은 토큰만 태우고 발산한다. 대안으로 떠오른 건 자유 방임 swarm이 아니라 라우터가 단계를 통제하는 supervised 그래프 구조다.
실무에선 에이전트 수를 늘리기 전에 '단계별 성공률 × 단계 수'를 먼저 계산해야 한다. 검증 게이트 없는 핸드오프가 3단계만 넘어가도 체감 신뢰도가 무너지므로, 각 경계에 스키마 검증과 명시적 완료 조건을 두는 설계가 선결이다.
원문 출처
arXiv