Q&A

질문과 답변

막히는 지점을 묻고, 브리핑·커뮤니티 글·가이드와 연결된 답을 찾아보세요.

RAG 답변이 검색 청크엔 정답이 있는데 모델이 엉뚱하게 답합니다 (한국어 임베딩)

LangChain으로 만든 에이전트가 느리고 디버깅이 안 됩니다. 직접 짜는 게 나을까요?

LLM 출력 JSON이 가끔 ```json 코드펜스 붙어서 json.loads가 터집니다. 안정적으로 구조화 출력 받는 법?

GPT-5랑 Claude Opus 4, 사내 코딩 에이전트 백엔드로 뭘 골라야 할지 기준이 궁금합니다

vLLM으로 서빙하는데 동시 요청 늘리면 첫 토큰 지연(TTFT)이 급격히 나빠집니다

프롬프트 조금만 바꿔도 출력 품질이 들쭉날쭉합니다. 평가를 어떻게 자동화하나요?

Claude tool_use가 안 잡히고 stop_reason이 end_turn으로 옵니다 (그냥 텍스트로만 답함)

RAG에서 chunk size는 어떻게 잡아야 하나요?