السلام عليكم ورحمة الله وبركاته
{الْحَمْدُ لِلَّهِ الَّذِي هَدَانَا لِهَذَا وَمَا كُنَّا لِنَهْتَدِيَ لَوْلَا أَنْ هَدَانَا اللَّهُ}
~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
بعد غياب طويل (لظروف..)، عدت وكلي قلم وأمل وفكر، ورؤيا متجددة..
والحمد لله زالت المشاق، وأجدد معكم اللقاء..
والله يوفقنا على أن نستفيد ونفيد..
_____
من عادة الزائر أن يقدم هدية عند زيارة الأحباب، واليوم جئتكم بهذه الهدية المتواضعة..
~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
محرك التعرف الضوئي على الحروف
يعتبر التعرف الضوئي على الحروف أحد أنواع التكنولوجيا التي تهدف إلى تسهيل حياتنا المكتبية.
وبرامج التعرف الضوئي على الحروف العربية الجيدة غالية الثمن وذات حقوق الملكية..
لحسن الحظ، تعمل (Google) على جعل الأشياء أفضل، حيث تقوم بتطوير محرك التعرف الضوئي على الحروف (Tesseract)،
الذي تم تصميمه في الأساس من قبل المهندسين هيوليت باكارد (HP) من 1985 إلى 1995، وتم التخلي عن تطويره للسنوات العشر التالية.
في عام 2005، أصدرت (HP) شفرة المصدر الخاصة بـ (Tesseract) بموجب ترخيص (Apache)..
منذ ذلك الحين تواصل (Google) في تحديث البرنامج..
[أحدث إصدار مستقر هو 3.05.02، صدر في 19 يونيو 2018]
[أما التجريبي هو 4.0.0-rc4، صدر في 24 أكتوبر 2018]
يعتبر (Tesseract) بحق واحد من أقوى محركات التعرف الضوئي على الحروف الحرة المتاحة.. العائق الوحيد (..) أنه برنامج سطر أوامر
بدلا من ذلك بحثت عن برنامج يوفر للمستخدم واجهة رسومية (GUI) تكون مرنة الاستعمال، وتسمح له بالعمل بشكل مريح.
وبعد تجربة العديد من البرامج الحرة (OcrFree) دفعني بحثي إلى استحسان برنامج وقع اختياري عليه لما يحمله من ميزات، اسمه:
هو برنامج مفتوح المصدر يوفر واجهة رسومية لمحرك التعرف الضوئي على الحروف (tesseract) ويسمح بسهولة استخراج النص من صورة أو وثيقة محمولة منسقة (PDF).
البرنامج له واجهة بسيطة للغاية ومنظمة بشكل واضح في ثلاث نوافذ:
1- يتم استخدام النافذة الجانبية اليسرى للتنقل في مجلد الصور أو الوثائق المحمولة المنسقة (مدخلات).
2- تعرض النافذة المركزية الوسطى الصورة أو الوثيقة المحمولة المنسقة (PDF) التي تعمل عليها (معاينة).
3- يظهر النص المتعرف عليه في نافذة جانبية على اليمين (مخرجات).
· مميزات البرنامج:
- استيراد مستندات (PDF) والصور من القرص أو أجهزة المسح أو الحافظة أو لقطات الشاشة.
- معالجة الصور والوثائق المتعددة دفعة واحدة.
- تحديد منطقة التعرف اليدوي أو التلقائي.
- التعرف على نص عادي أو على مستندات (hOCR *).
- النص المتعرف عليه يتم عرضه مباشرة بجوار الصورة.
- مرحلة المعالجة للنص المتعرف عليه، بما في ذلك التدقيق الإملائي.
- إنشاء مستندات (PDF) من وثائق (hOCR).
__________
* [(hOCR) هو تنسيق لتخزين نتائج ومخرجات التعرف في مستند (HTML)].
· تحميل البرنامج:
- رابط صفحة التحميل:
- روابط مباشرة:
~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
ملاحظة: عند تثبيت البرنامج
النافذة الثالثة - هذا الاختيار (standard localised) يعطيك واجهة عربية للبرنامج
ملف شرح البرنامج في المرفقات..
__________
في الأخير أترككم وبين أيديكم هذه الهدية، لتنطلق الخبرات والتجارب للإفادة والاستفادة بهدف الارتقاء والوصول إلى أحسن نتيجة..
أسأل الله أن يعلمنا ما ينفعنا وينفعنا بما يعلمنا.. وأن يجعلنا نفعا للإسلام والمسلمين..
ونأمل من الله عز وجل أن تنال هذه الهدية على رضا الجميع واستحسانكم..
__________
من طرف الأخ الكريم (ف.المهتدي) حفظه الله
أخذت نتيجة VERUS السابقة وقارنتها مع برنامج gImageReader
النتيجة مرفقة
الصور المصغرة للصور المرفقة
الملفات المرفقة Tesseract&gImageReader.pdf‏ (1.59 ميجابايت) compare_Verus-Tesseract.pdf‏ (61.1 كيلوبايت)
المصدر...