PDF 텍스트 추출
PDF 파일에서 텍스트 콘텐츠를 온라인으로 추출. 추출된 텍스트를 즉시 복사 또는 다운로드. 무료, 비공개, 브라우저에서 실행.
자주 묻는 질문
PDF 텍스트 추출은 어떻게 작동하나요?
이 도구는 pdf.js를 사용하여 PDF 파일을 파싱하고 각 페이지에서 텍스트 콘텐츠를 추출합니다. PDF에 내장된 텍스트 레이어를 읽어 읽기 순서를 유지합니다. 추출된 텍스트는 일반 텍스트 또는 Markdown 파일로 복사하거나 다운로드할 수 있습니다.
일부 텍스트가 누락되거나 깨지는 이유는?
일부 PDF는 비표준 인코딩의 사용자 정의 글꼴을 사용하거나 텍스트가 이미지로 포함되어 있습니다(스캔 문서). 텍스트 추출은 텍스트 기반 PDF에서만 작동합니다. 스캔 PDF에는 OCR이 필요하며 이 도구에서는 지원하지 않습니다.
PDF 데이터가 안전한가요?
네, 모든 처리는 브라우저에서 완전히 이루어집니다. PDF 파일은 서버에 업로드되지 않으며 JavaScript 라이브러리로 로컬에서 텍스트 추출이 수행됩니다.
특정 페이지만 텍스트를 추출할 수 있나요?
네, 모든 페이지에서 추출하거나 페이지 범위(예: 1-3, 5, 7-10)를 지정할 수 있습니다. 일반 텍스트 또는 Markdown 출력 형식 선택, 출력 내 페이지 번호 표시 전환도 가능합니다.