News초급

[상록] AI 에이전트 메모리 입문: 프로토타입과 프로덕션을 가르는 한 가지

AI Agent Memory & Context Engineering: A Primer

LLM은 기본적으로 stateless다 — 매 호출이 백지에서 시작하므로, 세션을 넘어 맥락을 잇지 못하면 에이전트는 같은 실수를 반복한다. 2026년 실무에서 프로토타입과 프로덕션을 가르는 건 모델이 아니라 '기억하느냐'다. 핵심은 컨텍스트 엔지니어링 — 프롬프트뿐 아니라 메모리·도구·검색·상태까지 정보 환경 전체를 설계하는 것이다. 메모리는 단일 세션 안에서만 존재하는 in-context 메모리와, 트리거·날짜·주를 넘겨 살아남는 외부 메모리(DB·CRM·데이터 스토어)로 나뉜다. 좋은 메모리 페이로드는 작고, 타입이 명확하며, 비즈니스 키에 묶인다 — 고객 ID·활성 케이스 ID·현재 상태·마지막 의미 있는 이벤트·다음 결정에 필요한 최소 맥락만 저장한다. 검색·아카이브용 벡터 저장소는 pgvector로 시작해 지연이 문제될 때 Qdrant·Pinecone 등으로 갈아타는 식이 현실적이다.

메모리 설계는 에이전트 신뢰성의 토대이며, 작고 타입 명확한 외부 상태 저장이 한국 팀의 흔한 '세션마다 맥락 유실' 문제를 직접 해결한다.

원문 출처

The New Stack

원문 보기 ↗

← Today

AI 에이전트 더 보기

AI 에이전트 관련 브리핑

NewsAI 에이전트실전·4일 전

Claude Agent SDK 별도 크레딧 분리, OpenAI Agent Builder는 종료 예고

에이전트 프레임워크 시장이 기능 경쟁을 넘어 과금·라인업 정리 국면으로 들어섰다. Anthropic은 6월 15일부터 Claude Agent SDK 사용량을 구독 요금과 분리된 별도 월간 'Agent SDK 크레딧'에서 차감하기 시작한다 — 구독으로 무한정 에이전트를 돌리던 패턴에 명시적 비용 경계가 생기는 변화다. OpenAI는 6월 3일 Agent Builder와 Evals 제품의 단계적 종료를 발표했고, 두 제품은 11월 30일부터 플랫폼에서 제공되지 않는다(앞서 4월 Agents SDK에 네이티브 샌드박스 실행과 모델 네이티브 하니스를 추가한 흐름의 후속). 한편 프레임워크 진영은 메이저 버전이 안착했다. LangChain 1.0·LangGraph 1.0(2025년 말 GA)은 각각 표준 툴콜링 에이전트 빌드와 장시간·상태 지속(durable state) 오케스트레이션으로 역할이 갈렸고, Microsoft Agent Framework 1.0은 4월 3일 GA, Google ADK도 Java·Go용 1.0을 출시했다.

별도 크레딧 분리는 '구독만 있으면 에이전트는 공짜'라는 착시를 끝내고, 에이전트 실행을 명시적 원가 항목으로 끌어올린다. 자율 루프·스케줄 에이전트를 상시 가동하는 한국 팀은 이제 토큰 단가뿐 아니라 SDK 크레딧 소진 속도를 별도 모니터링해야 한다. OpenAI의 Agent Builder 종료는 'GUI 노코드 에이전트 빌더'보다 코드 기반 SDK로 무게가 쏠렸음을 보여주는 신호로, 노코드 빌더에 락인되지 않는 설계가 안전하다.

OpenAI / TechCrunch원문 ↗

NewsAI 에이전트고급·1주 전

MCP 차기 명세 릴리스 후보 공개, 스테이트리스 코어·Tasks·MCP Apps로 최대 개편

Model Context Protocol 차기 명세의 릴리스 후보(RC)가 공개됐고, 최종본은 7월 28일 확정된다. 프로토콜 출범 이래 최대 규모 개정이며 호환성을 깨는 변경(breaking changes)을 포함한다. 핵심은 다섯 가지다. ① 일반 HTTP 인프라에서 확장 가능한 '스테이트리스 코어' — 세션 상태 의존을 걷어내 로드밸런서·서버리스 환경에서 스케일이 쉬워진다. ② Extensions 프레임워크 — 코어를 얇게 유지하고 기능을 확장으로 분리. ③ Tasks 확장 — 장시간 실행 작업을 표준화. ④ MCP Apps — 서버가 렌더링하는 UI를 클라이언트에 노출. ⑤ OAuth·OpenID Connect 배포에 더 부합하는 인가(authorization) 하드닝과 공식 deprecation 정책. RC 공개 후 약 10주의 검증 윈도가 주어지며, Tier 1 SDK는 이 기간 내 지원을 출시할 것으로 예상된다. SDK 메인테이너와 클라이언트 구현자가 실제 워크로드로 변경을 검증하는 단계다.

스테이트리스 코어로의 전환은 MCP가 '로컬 데스크톱 어시스턴트 연결 규약'에서 '프로덕션 분산 인프라용 표준'으로 성숙한다는 신호다. 다만 breaking changes가 명시된 만큼, MCP 서버를 운영 환경에 배포한 팀은 인가 흐름(OAuth 정합)과 세션 가정을 7월 28일 전에 재점검해야 한다. Tasks·MCP Apps는 그간 각자 커스텀으로 구현하던 장시간 작업·서버 UI를 표준화하므로, 자체 비표준 확장을 걷어낼 좋은 기회다.

Model Context Protocol Blog원문 ↗

NewsAI 에이전트중급·2025년 2월 3일

컴퓨터·브라우저 에이전트 2026: 픽셀 vs DOM, 세 진영의 설계 차이

2026년 컴퓨터·브라우저 에이전트가 실제 워크로드에 쓸 만해졌고, 세 진영이 서로 다른 아키텍처를 택했다. Anthropic의 Claude는 화면 스크린샷을 받아 마우스·키보드 입력을 돌려주는 범용 computer use 도구를 노출하되, 실제 실행 환경은 고객 책임이다 — 즉 화면을 시각적으로 분석해 클릭·입력을 수행하는 픽셀 기반에 가깝다. OpenAI는 Codex Background Computer Use로 엔지니어의 메인 작업 환경과 병렬로 별도 데스크톱 세션에서 에이전트를 돌린다. Google의 Gemini Computer Use는 Project Mariner 계보로, 원시 픽셀 파싱보다 DOM 인식을 우선한다. 오픈소스 쪽에서는 Browser Use가 Playwright를 감싸 Claude·GPT·Gemini·로컬 모델을 백엔드로 붙이는 가장 인기 있는 프레임워크다. 다만 안티봇 탐지·동적 레이아웃·인증 플로우는 여전히 난제로 남아 있다.

웹 자동화·RPA를 대체할 에이전트를 고를 때 '픽셀 기반 vs DOM 기반'이라는 설계 축이 안정성·유지보수성을 가르므로, 용도에 맞는 선택 기준을 준다.

digitalapplied원문 ↗

NewsAI 에이전트실전·2025년 3월 30일

2026 에이전틱 코딩 도구 지형도: 벤치마크는 도구마다 다르게 이긴다

2026년 에이전틱 코딩 도구 비교를 보면, 단일 '최강'은 없고 벤치마크마다 승자가 갈린다. 터미널 작업 중심의 Terminal-Bench 계열에서는 Codex CLI가 선두로, Claude Code와 Gemini CLI가 뒤를 잇는 양상이 보고된다. 반면 실제 저장소 이슈를 푸는 SWE-bench Pro 계열에서는 Claude Code(Opus 4.x)가 앞서는 결과가 나온다. 도구 철학도 다르다 — Claude Code는 터미널·파일시스템·git 히스토리에 직접 붙는 에이전트 중심이고 대용량 컨텍스트로 교차 파일 의존성을 읽는 데 강하다. Cursor는 IDE 우선에 빠른 탭 자동완성·멀티모델 라우팅, 2026년 초 CLI와 클라우드 핸드오프를 추가했다. 결론은 '벤치마크 점수 하나로 고르지 말고, 작업 형태(터미널 자동화 vs 저장소 PR vs 인터랙티브 IDE)에 맞춰 고르라'는 것이다.

팀이 사내 표준 코딩 에이전트를 정할 때, 단일 점수가 아니라 실제 작업 유형에 맞춰 선택해야 ROI가 난다는 실무 기준을 준다.

morphllm / Requesty (벤치마크 종합)원문 ↗

[상록] AI 에이전트 메모리 입문: 프로토타입과 프로덕션을 가르는 한 가지

Claude Agent SDK 별도 크레딧 분리, OpenAI Agent Builder는 종료 예고

MCP 차기 명세 릴리스 후보 공개, 스테이트리스 코어·Tasks·MCP Apps로 최대 개편

컴퓨터·브라우저 에이전트 2026: 픽셀 vs DOM, 세 진영의 설계 차이

2026 에이전틱 코딩 도구 지형도: 벤치마크는 도구마다 다르게 이긴다

이 브리핑에 대한 Q&A

매주 화요일, 한 주의 AI를 정리해 드립니다

댓글