Responses API 'background mode'로 30분짜리 에이전트 작업을 비동기로 돌리기
Codex 류 장시간 작업을 프로덕션에 붙일 때 가장 먼저 깨지는 건 HTTP 타임아웃이다. Responses API의 background 실행과 store=true 상태 저장을 묶으면, 작업을 던진 뒤 response_id로 폴링하거나 웹훅으로 완료를 받는 패턴이 표준화된다. 에이전트가 코드 실행·테스트를 수십 턴 돌리는 동안 연결을 잡고 있을 필요가 없어진다. 핵심 함정은 두 가지다. 첫째, background 응답은 중간 reasoning 항목이 잘려 보일 수 있어 재개 시 previous_response_id 체이닝을 정확히 이어야 한다. 둘째, 실패한 실행도 토큰이 과금되므로 max_tool_calls와 타임박스를 SDK 레벨에서 강제하지 않으면 폭주한 에이전트가 비용을 태운다. Vercel류 fire-and-forget 서버리스에선 폴러를 별도 워커로 빼야 한다.
한국 개발자가 Codex 에이전트를 백오피스 자동화에 넣을 때, 동기 호출로 짜면 게이트웨이 타임아웃으로 반드시 깨진다. 처음부터 background+폴링/웹훅으로 설계해야 재작업이 없다.
원문 출처
OpenAI Platform Docs