Ekstrak Teks PDF
Ekstrak kandungan teks daripada fail PDF dalam talian. Salin atau muat turun teks yang diekstrak serta-merta. Percuma, peribadi, berjalan dalam pelayar.
Bagaimana ekstraksi teks PDF berfungsi?
Alat ini menggunakan pdf.js untuk mengurai fail PDF anda dan mengekstrak kandungan teks daripada setiap halaman. Ia membaca lapisan teks yang terbenam dalam PDF, mengekalkan susunan bacaan. Teks yang diekstrak boleh disalin atau dimuat turun sebagai fail teks biasa atau Markdown.
Mengapa sesetengah teks hilang atau rosak?
Sesetengah PDF menggunakan fon tersuai dengan pengekodan bukan standard, atau mengandungi teks sebagai imej (dokumen yang diimbas). Ekstraksi teks hanya berfungsi untuk PDF berasaskan teks. PDF yang diimbas memerlukan OCR yang tidak disokong oleh alat ini.
Adakah data PDF saya selamat?
Ya, semua pemprosesan berlaku sepenuhnya dalam pelayar anda. Fail PDF anda tidak pernah dimuat naik ke mana-mana pelayan. Ekstraksi teks berjalan secara tempatan menggunakan pustaka JavaScript.
Bolehkah saya mengekstrak teks daripada halaman tertentu sahaja?
Ya, anda boleh memilih untuk mengekstrak teks daripada semua halaman atau menentukan julat halaman (contohnya, 1-3, 5, 7-10). Anda juga boleh memilih format output teks biasa atau Markdown, dan menogol nombor halaman dalam output.