استخرج محتوى النص من ملفات PDF عبر الإنترنت. انسخ أو حمّل النص المستخرج فورًا. مجاني، خاص، يعمل في المتصفح.
كيف يعمل استخراج النص من PDF؟
تستخدم هذه الأداة pdf.js لتحليل ملف PDF واستخراج محتوى النص من كل صفحة. تقرأ طبقة النص المضمنة في PDF مع الحفاظ على ترتيب القراءة. يمكن نسخ النص المستخرج أو تنزيله كملف نصي عادي أو Markdown.
لماذا يفقد بعض النص أو يظهر مشوهًا؟
بعض ملفات PDF تستخدم خطوط مخصصة بترميز غير قياسي، أو تحتوي على نص كصور (مستندات ممسوحة ضوئيًا). استخراج النص يعمل فقط لملفات PDF النصية. ملفات PDF الممسوحة تتطلب OCR غير مدعوم في هذه الأداة.
هل بيانات PDF الخاصة بي آمنة؟
نعم، تتم جميع المعالجات بالكامل في متصفحك. لا يتم رفع ملفات PDF إلى أي خادم أبدًا. يتم استخراج النص محليًا باستخدام مكتبات JavaScript.
هل يمكنني استخراج النص من صفحات محددة فقط؟
نعم، يمكنك اختيار استخراج النص من جميع الصفحات أو تحديد نطاق صفحات (مثال: 1-3، 5، 7-10). يمكنك أيضًا اختيار تنسيق الإخراج نص عادي أو Markdown، وتبديل أرقام الصفحات.