画像内の情報を検索するようにWindows Searchを教える方法


少し前に、ABBYY認識サーバーを使用するためのオプションの1つについて既に説明しましたが 、今日はもう1つについて説明します。 F3を押したときにWindows XPに表示される波打つ尾犬は誰もが知っています。 その背後には便利な検索サービスであるWindows Searchがあります。これにより、コンピューター上で失われたファイルを名前で、場合によってはコンテンツで検索できます。 Windowsコンテンツ検索は、デフォルトではテキストファイル形式でのみサポートされています。

最近、 ABBYY認識サーバーIFilterという新しい製品を発売しました。これは、Windows Searchの特別なアドオンで、この検索サービスがコンピューターに保存されているTIFF、JPEG、PDF、およびその他のファイル形式のインデックスを作成し、後で全文検索を使用して簡単に検索できるようにします。 。 画像ドキュメントからテキストを抽出するには、企業ネットワークにインストールされたABBYY認識サーバーが使用されます。



このシステムは次のように機能します。

IFilterは、イメージをリモートABBYY認識サーバーに転送し、そこから認識されたテキストを受信できる小型の軽量アプリケーションで、従業員の職場のコンピューターにインストールされます。 Windows Searchは、コンピューター上の特定のフォルダーとメールボックスにインデックスを付けるように構成できます。 選択したフォルダーのすべてのテキストドキュメントとレターはWindows Searchで検索され、これらのフォルダーとレターの添付ファイルで見つかったすべての画像は、認識のためにIFilterを介して認識サーバーに送信されます。 認識されたテキストはコンピューターに返され、インデックスに追加されます-画像は全文検索に使用可能になります。

画像

IFilter自体は最小限のシステムリソースを消費します。リソースを集中的に使用するプロセスはすべて、企業ネットワーク上のサーバーで発生します。 画像のコピーは、認識中にのみサーバーに保存され、認識後にサーバーから削除されます。

さて、素敵なボーナス-IFilterは写真を自動的に除外できます(エジプトとトルコの美しさを認識してサーバーを苦しめないようにするため)。

読者のリクエストに応じて更新:アプリケーションはWindows 7、Vista、XPで実行されます:)

ベラ・セロバ
テクノロジー製品アナリスト

Source: https://habr.com/ru/post/J97193/


All Articles