pytesser-Python(光学式文字認識)用のOCRライブラリ

今日、私はGoogleのプロジェクトをさまようと、かなり興味深い開発に出会いました-pytesser 開発者によると、画像内のテキストを認識します。 ライブラリはtesseract-ocrとPILを使用します。

使用例:

>>> from pytesser import *
>>> image = Image.open('fnord.tif') # Open image object using PIL
>>> print image_to_string(image) # Run tesseract.exe on image
fnord
>>> print image_file_to_string('fnord.tif')
fnord


私にとって大きなマイナスは、Windowsでのみ使用できることです。 したがって、この開発をテストできませんでした。

テスト用のライブラリには、次の画像が含まれています。これは、(理論的には、著者がそこに置いたら)認識すべきものです。

画像

他の画像のhabralumeyテスト結果から聞きたいです。

公式ページ: code.google.com/p/pytesser

Source: https://habr.com/ru/post/J80804/


All Articles