Flux로 한글 박힌 썸네일 만들면 글자가 외계어로 깨지는데 대안 있나요

Question

썸네일이나 배너에 한글 문구를 박은 이미지를 생성하려는데, 이미지 생성 모델로 한글을 넣으면 글자가 외계어처럼 깨집니다. 영어는 그나마 최근 모델들이 잘 쓰는 편인데 한글은 거의 못 쓰네요.

프롬프트에 따옴표로 문구를 명시해도 마찬가지입니다. 모델이 한글 글자 형태를 제대로 못 그리는 것 같은데, 디자인 작업에서 이걸 어떻게 우회하시나요?

Accepted Answer

결론부터: 이미지 생성 모델한테 한글 타이포 맡기지 마세요. 글자는 생성하는 게 아니라 합치는 겁니다. 왜 깨지냐면 — 영어는 학습 데이터에 글자 박힌 이미지가 압도적으로 많아서 짧은 영문은 최근 모델들이 그럭저럭 렌더하는데, 한글은 음절 조합 구조(초성·중성·종성)가 복잡한 데다 학습 데이터도 상대적으로 적어서 글자 형태가 무너집니다. 프롬프트에 따옴표로 명시해도 모델은 '글자'를 그리는 게 아니라 '글자처럼 생긴 텍스처'를 그리는 거라 한계가 명확해요. Flux든 SDXL이든 한글은 다 비슷합니다. 실무 워크플로: 1. 이미지 생성은 배경/비주얼만, 텍스트 자리는 비워서 뽑기. 문구 들어갈 자리는 여백이나 단색 영역으로 확보. 2. 한글 문구는 디자인 툴(Figma/Photoshop/Canva)에서 실제 폰트로 얹기. 이게 정석이고 자간·줄바꿈까지 완벽 통제됩니다. 품질이고 수정 용이성이고 비교가 안 돼요. 3. 꼭 생성 단계에서 글자를 넣어야 하는 특수 케이스면 ControlNet 계열(글자 마스크/레이아웃 컨디셔닝)로 위치·모양을 가이드 주는 방법이 있긴 한데, 한글은 여전히 적중률 낮아서 솔직히 추천 안 합니다. '비주얼 생성 → 한글은 후합성'이 제일 빠르고 깨끗해요. 디자인 실무에서 글자를 모델한테 그리게 하는 건 거의 항상 손해입니다.

Answer

동의. 한 가지 보태면, 자동화 파이프라인으로 대량 생성해야 하는 경우(상품 배너 수백 개 같은)에도 텍스트는 코드로 합성하는 게 답입니다.

배경은 생성 모델로 뽑고, 한글 텍스트는 서버에서 Pillow나 sharp 같은 라이브러리로 폰트 얹어서 합성하면 글자 100% 정확하고 수정도 코드 한 줄이에요. 웹이면 그냥 Canvas/SVG로 오버레이해도 되고. 폰트 파일만 ttf로 박아두면 자간·정렬까지 코드로 다 잡힙니다.

'모델이 글자를 그리게' 하는 순간 검수→재생성 지옥 열려요. 100장 뽑아서 글자 멀쩡한 거 골라내는 것보다 합성 코드 한 번 짜는 게 훨씬 쌉니다.

Flux로 한글 박힌 썸네일 만들면 글자가 외계어로 깨지는데 대안 있나요

답변 2개