바로킷

📋PDF에서 텍스트 추출

PDF에서 본문 텍스트만 .txt로 추출하세요. 검색·번역기에 넣을 때 편리합니다. 스캔본 PDF(이미지)는 추출이 안 될 수 있습니다.

🔒 브라우저에서 처리워터마크 없음가입 불필요

사용 방법

  1. 1PDF를 업로드합니다.
  2. 2추출된 텍스트가 미리보기에 표시됩니다.
  3. 3.txt로 다운로드하거나 복사합니다.
  4. 4ChatGPT·번역기·메모 앱 등에 바로 붙여넣어 활용하세요.

자주 묻는 질문

스캔본 PDF도 추출되나요?+

스캔본은 이미지라 텍스트가 없어 추출되지 않습니다. OCR(광학 문자 인식)이 필요한데, 이 도구는 OCR 기능이 없습니다.

글자가 추출됐는데 줄바꿈이 이상해요. 왜 그래요?+

PDF는 보이는 위치 기준으로 글자를 저장합니다. 두 단 편집·각주·머리말 같은 레이아웃이 있으면 추출 시 순서가 뒤섞이거나 줄바꿈이 어색해질 수 있습니다.

표나 그림 안의 글자도 추출되나요?+

표 안의 텍스트는 보통 추출됩니다. 다만 표 구조(셀 경계)는 사라지고 줄바꿈된 평문이 됩니다. 그림(이미지)은 추출 안 됩니다.

한글·한자·영문·이모지가 섞여 있어도 되나요?+

네. UTF-8로 저장되어 어떤 문자든 그대로 보존됩니다.

비밀번호 걸린 PDF는요?+

현재 미지원입니다. 잠금을 풀고 시도해 주세요.

결과를 검색용 데이터로 쓰려면?+

추출된 .txt 파일은 일반 텍스트라 코드 에디터·검색 도구(grep, ripgrep 등)에서 바로 검색할 수 있습니다. 키워드 추출에는 [단어 빈도 분석] 도구가 유용합니다.

관련 도구