본문 바로가기

카테고리 없음

PDF에서 태국어 문자 인식이 안 될 때 해결 방법

PDF 문서에서 태국어 텍스트가 제대로 표시되지 않거나 복사/검색이 되지 않는 문제를 겪고 계신가요? 🤔
PDF 파일에서 태국어가 깨져 보임 (□ 또는 ?로 표시됨)
OCR(문자 인식) 기능을 사용해도 태국어가 제대로 변환되지 않음
PDF에서 태국어를 검색하거나 복사하면 엉뚱한 글자가 나옴

이 문제는 PDF의 문자 인코딩, 폰트 지원, OCR 설정 문제 등 다양한 원인으로 발생할 수 있습니다.
이번 포스팅에서는 PDF에서 태국어가 인식되지 않는 원인과 해결 방법을 자세히 알려드릴게요! 🚀


🔍 1. PDF에서 태국어가 인식되지 않는 원인

🔹 1) PDF가 이미지 형식으로 저장됨 (OCR 필요) 🖼️

✔ 일부 PDF는 텍스트가 아닌 이미지로 저장되어 OCR(문자 인식) 없이는 검색이 불가능함
스캔된 문서나 캡처된 이미지 PDF라면 OCR 기능이 필요함

🔹 2) PDF가 태국어 폰트를 포함하지 않음 🔤

✔ PDF 파일이 태국어 폰트를 내장하지 않으면 다른 기기에서 글자가 깨질 수 있음
✔ 태국어가 □(네모 상자) 또는 ?(물음표)로 표시되는 경우

🔹 3) PDF 리더기의 문자 인코딩 문제 🛠️

✔ PDF 뷰어(예: Adobe Acrobat, Chrome, Edge 등)에서 태국어를 올바르게 렌더링하지 못할 수 있음
✔ PDF 파일을 다른 프로그램에서 열어보면 정상적으로 보일 가능성이 있음

👉 이제, 해결 방법을 하나씩 알아볼까요? 😊


🔧 2. PDF에서 태국어 문자 인식이 안 될 때 해결 방법

✔ 방법 1: OCR(문자 인식) 기능 사용하기 📖

PDF가 이미지 형태라면, OCR(문자 인식) 기능을 사용해야 태국어를 변환할 수 있습니다.

🔹 OCR 변환 방법 (Adobe Acrobat 사용 시)
1️⃣ Adobe Acrobat Reader 실행 → PDF 열기
2️⃣ "도구" → "텍스트 인식(OCR)" 선택
3️⃣ "태국어(Thai)" 언어 선택 후 OCR 실행
4️⃣ 변환 완료 후 태국어 텍스트를 복사 또는 검색 가능

🔹 OCR 변환 무료 사이트 추천

  • Google Drive + Google Docs
    • PDF를 Google Drive에 업로드 후 Google 문서로 열면 자동 OCR 적용됨
  • OnlineOCR
    • PDF를 업로드하고 "태국어(Thai)" 선택 후 변환

TIP:

  • OCR 변환 후에도 태국어가 깨진다면, **다른 OCR 프로그램(예: ABBYY FineReader, Tesseract OCR)**을 사용해 보세요.
  • 태국어 폰트가 필요한 경우, "Angsana New" 또는 "TH Sarabun PSK" 폰트를 설치하면 인식률이 높아집니다.

✔ 방법 2: PDF를 다른 뷰어에서 열어보기 👀

현재 사용 중인 PDF 뷰어에서 태국어 폰트를 지원하지 않을 수도 있습니다.

🔹 PDF 뷰어 변경하여 열어보기
1️⃣ Adobe Acrobat Reader에서 열어보기
2️⃣ Google Chrome 또는 Microsoft Edge에서 PDF 열기
3️⃣ Foxit Reader, Sumatra PDF, PDF-XChange Viewer 등 다른 PDF 리더기로 확인

TIP:

  • 일부 PDF는 특정 뷰어에서만 올바르게 표시될 수 있음
  • Chrome 또는 Edge에서 Ctrl + P(인쇄) → PDF로 다시 저장하면 해결될 수도 있음

✔ 방법 3: 태국어 폰트 설치하기 🔤

PDF가 태국어 폰트를 포함하지 않으면, 태국어가 정상적으로 표시되지 않을 수 있습니다.

🔹 태국어 폰트 설치 방법 (Windows 기준)
1️⃣ "Microsoft Store"에서 "Thai Supplemental Fonts" 검색 후 설치
2️⃣ 또는 다음 태국어 폰트 다운로드 후 설치

  • Angsana New (기본 태국어 폰트)
  • TH Sarabun PSK (태국 정부 공인 폰트)
  • Leelawadee UI (태국어 웹폰트)
    3️⃣ PDF를 다시 열어 정상적으로 표시되는지 확인

TIP:

  • 태국어가 여전히 깨진다면, PDF 파일을 **"Adobe Acrobat에서 다른 폰트 포함하여 다시 저장"**해 보세요.

✔ 방법 4: PDF 텍스트 변환하여 다른 형식으로 저장하기 📝

PDF가 태국어를 지원하지 않는 경우, 다른 형식으로 변환하면 해결될 수 있습니다.

🔹 PDF를 TXT 또는 DOCX로 변환하는 방법
1️⃣ Google Drive에 PDF 업로드 → Google Docs로 열기
2️⃣ "파일 → 다른 이름으로 다운로드 → Microsoft Word(.docx)" 선택
3️⃣ Word 파일에서 태국어가 정상적으로 표시되는지 확인

TIP:

  • "Smallpdf"(https://smallpdf.com/) 같은 PDF 변환 사이트를 이용하면 쉽게 DOCX로 변환 가능
  • 변환 후에도 태국어가 깨진다면, 폰트 문제일 가능성이 높음

📌 결론: PDF에서 태국어가 인식되지 않을 때 해결 방법 정리

해결 방법적용 대상난이도

OCR(문자 인식) 기능 사용 이미지 형태의 PDF ⭐⭐⭐ (중간)
다른 PDF 뷰어에서 열기 뷰어 문제로 태국어가 깨질 때 ⭐ (쉬움)
태국어 폰트 설치 PDF에 폰트가 포함되지 않았을 때 ⭐⭐ (중간)
PDF를 TXT/DOCX로 변환 편집 가능한 형식으로 변환할 때 ⭐⭐ (중간)

가장 먼저 시도할 해결법: 다른 PDF 뷰어에서 열어보기
이미지 PDF라면: OCR 기능을 사용하여 텍스트 변환
태국어 폰트 문제라면: "Thai Supplemental Fonts" 또는 "Angsana New" 폰트 설치
변환이 필요하다면: Google Drive 또는 Smallpdf에서 PDF를 DOCX로 변환

📢 결론: PDF에서 태국어가 인식되지 않는 경우, OCR 기능을 활용하거나 폰트를 설치하면 대부분 해결할 수 있습니다! 🚀