Community
직접 만들고 배운 것을 글로 남겨, 함께 쌓아가는 공간이에요.
exit code 137 한 줄 보고 시작된 사흘짜리 삽질. OOMKilled랑 database is locked 잡으러 Postgres까지 간 기록
로그 보다 봇이 자기 시스템 프롬프트를 읊고 있길래 식겁했고, 프롬프트 한 줄로는 안 막혀서 결국 스키마 밖에서 끊은 이야기
embedding으로 바로 top-5 뽑던 걸 top-30 뽑고 리랭킹해서 top-5로 줄였더니 정답률은 올랐는데 지연이 800ms→1.4초로 늘더라
STT 전에 speech enhance 한 단 끼우니 정확도는 올라감. 근데 동시 발화는 enhance로 안 메워짐, 화자 분리 문제라
40페이지 넘는 문서에서 중간 조항 통째로 빠지는 거, 다들 어떻게 잡으세요? 모델을 바꿔야 하나 청킹이 정석인가
에이전트 코드는 빌드 green인데 런타임에서 터집니다. main 직접 push 막고 PR+Codex 리뷰+사람 confirm으로 거르는 우리 셋업 정리.
Cursor에서 Claude Code로 넘어오긴 했는데 자동완성이 그리워서 둘 다 켜놓고 삽니다… 다들 어떻게 조합하시나요?
sdk 깔고 tool 3개 정의가 끝, 반나절이면 되는데 description 한 줄 잘못 쓰면 모델이 헛짓함.
모델 약해서 그런 줄 알고 4개나 갈아끼웠는데, 정작 0.41 vs 0.39 마진을 살린 건 섹션 단위 청킹이었다.
노코드라 "테스트"면 안 나가는 줄 알았는데 Gmail 노드까지 그냥 쏘더라. 발송 노드 막아둔 덕에 겨우 살았음
단일 점수는 죄다 후하고, pairwise는 앞쪽을 편애하고, 정답 모르는 도메인이면 길고 그럴듯하고 자신감 있는 답을 편애한다
POST마다 400 뜨는데 Copilot은 자신만만하게 헛다리만 짚고, e2e 돌리고서야 잡음. 멀티파일 버그 다들 어떻게 디버깅하세요?
6개월 굴려보니 어떤 도구냐는 안 중요하더라고요. 검수할 눈이 없으면 그냥 빠른 속도로 틀리는 기계입니다.
정의문 열 줄 늘리는 것보다, 자주 틀리던 경계 케이스 few-shot 3개가 훨씬 잘 먹혔다
벤치 말고 내 트래픽으로 한 달 갈라 돌려보니, 한국어 표 PDF에선 Sonnet 쪽이 덜 깨지더라고요
엑셀 합치기 한 시간 반짜리를 말로 시켜서 없앴는데, 반품 마이너스가 양수로 둔갑한 거 우연히 발견하고 식겁함 ㅋㅋ
매번 같은 데서 줄줄 새서 박아둔 체크리스트. 라우팅·max_tokens·caching 순으로 깎이는데, 진짜 범인은 보통 로깅 안 붙여서 못 찾는 프론트 코드임.
"Flash 싸던데" 체감 말고 1,200장 떼서 정확도·장당비용 숫자로 박아봄. 결론은 내 케이스 한정.
4GB 인스턴스에 8GB짜리 벡터를 넣고 있었다. dmesg에 Killed 한 줄 남기고 죽은 새벽의 기록.
19시 정각에 cron 박으면 date:less 경계에서 그날 슬롯을 놓침. 18:59에 박아야 걸리더라
₩4,500보다 무서웠던 건, 그 돈 낸 사람이 제가 아는 사람이 아니었다는 거였습니다.