کتابخانه pytesseract python چیست و چگونه آن را نصب کنیم؟

کتابخانه pytesseract python چیست و چگونه آن را نصب کنیم؟


آیا تا به حال این فکر افتاده اید که چطور ممکن است نوشته های یک تصویر را یک به فایل تکست تبدیل کرد؟

پایتون یک زبان قدرتمند بر پایه ویندوز بوده که امروزه در زمینه های مختلفی(همچون وب(جنگو)،ویندوز،موبایل و ...) حرف خود را به کورسی نشانده است.

از مزایای پایتون،داشتن کتابخانه های مختلف بوده که به شما امکان پرسه زدن در هر نوع پلتفرمی را میدهد;من جمله پایتون تسرکت،ابزاری برای تشخیص کاراکتر نوری(OCR) و خوانش متون نوشته شده بر روی تصاویر.

Pytesserect می تواند انواع تصاویر پشتیبانی شده توسط Pillow از جمله gif , png , jpegرا بخواند.

Pytesseract متن شناسایی شده را به جای نوشتن در یک فایل چاپ نظیر txt می کند.

خوبی این ابزار این بوده که به شما امکان خروجی گرفتن در انواع شکل و نوع را میدهد،برای مثال:تبدیل تکست های نوشته شده به فایل اکسل.

تکنولوژی که در پشت پرده تسرکت | Tesseract بوده،OCR نامیده می شود.

OCR = Optical Character Recognition | تشخیص کاراکتر نوری. به عبارت دیگر، سیستم‌های OCR یک تصویر دو بعدی را که می‌تواند حاوی متن چاپ شده یا دست‌نویس ماشینی باشد را به خروجی متنی تبدیل کند،پروسه او سی آر به طور کلی شامل فرآیند های فرعی زیر می باشد :

  •     پیش پردازش تصویر
  •     محلی سازی متن
  •     تقسیم بندی کاراکتر ها
  •     کاراکتر شناسی(شناسایی نهایی کاراکتر ها)
  •     پردازش پست

البته فرآیندهای فرعی در لیست بالا می توانند متفاوت باشند، اما نزدیک ترین شکل ممکن به پروسه کاری ocr بر اساس مراحل بالا تعریف شده است. در نرم افزار OCR، هدف اصلی ، شناسایی و ضبط تمام کلمات منحصر به فرد با استفاده از سیستم ها و ماشین های زبان و کاراکتر شناسی می باشد.

حدود دو دهه، سیستم های تشخیص کاراکتر نوری گسترده ای،برای ارائه ی خودکار ورود متن به سیستم های کامپیوتری استفاده شده است. با این حال، در تمام این مدت، سیستم‌های OCR آنلاین معمولی (مانند OCR ناحیه‌ای) هرگز مشکل ناتوانی در تشخیص بعضی از فونت ها را برطرف نکرده اند. فونت های چاپگر لیزری و حتی بسیاری از فونت های غیرمتناسب تحریری از دسترس این سیستم ها خارج شده اند.

مراحل نصب:

1. نصب tesseract با استفاده از راهنمای Windows installer موجود در: https://github.com/UB-Mannheim/tesseract/wiki

2. به مسیر tesseract از نصب توجه کنید. در زمان ادیت و ویرایش، مسیر نصب پیش فرض به این شیوه باید باشد: "C:UsersUSERAppDataLocalTesseract-OCR"، بنابراین لطفاً مسیر نصب را بررسی کنید.

3. pip install pytesseract

4. قبل از فراخوانی کد "image_to_string" مسیر tesseract را در اسکریپت تنظیم کنید:

pytesseract.pytesseract.tesseract_cmd = r'C:UsersUSERAppDataLocalTesseract-OCR esseract.exe'





نویسنده
 


0





نوشتن دیدگاه



دیدگاه شما پس از بررسی توسط تحریریه منتشر خواهد شد. در صورتی که در بخش نظرات سوالی پرسیده‌اید اگر ما دانش کافی از پاسخ آن داشتیم حتماً پاسخگوی شما خواهیم بود در غیر این صورت تنها به امید دریافت پاسخ مناسب از دیگران آن را منتشر خواهیم کرد.