彼女のMa下のオタクのサービスでABBYY認識サーバー

画像
エジンバラ王立植物園(CBSE)は、植物相MI6と呼ばれることもあります。従業員は世界中から植物を栽培し、研究しています。 外部の「植物」インテリジェンスの300年にわたって、CSCは世界の植物の3分の2を研究し、花屋の科学者と熱狂的な植物学者がエジンバラでのみ働くことができる真にユニークな植物コレクションを編集しました。

最近、植物園の指導部は約300万の植物をデジタル化し、インターネットのインテリジェンスを活用することを決定しました。 Nerdsは、ドキュメント入力をストリーミングし、簡単にスケーラブルで高性能な電子アーカイブを作成するための自動化ソリューションを必要としていました。 英国国立図書館の推奨によると、選択はABBYY認識サーバーを優先して行われました。


「植物標本を集めたいですか? そして処理しますか?」

このタスクは、さまざまなフォント、バーコード、およびいくつかの言語の古いバージョンの手書きテキストによって複雑になりました。一部のレコードは1690年に遡り、認識が困難です。 各植物についての知性を持つカードには、数字、名、略語がいっぱいです-これがここにある方法です:

画像

さらに、KBSEには独自の画像管理システムがあり、すべてのカードとメモのTIFFファイルが保存されます。 そのため、デジタル化された素材の品質とワードプロセッシングの自動化に加えて、ガーデン管理者は認識サーバーがこのシステムと調和して動作することを望んでいました。

ハーバリウムオンラインプロジェクト

そして、彼らは一緒に働きました。
そして、黒と黒のボックスでは、次のことが起こります。
認識サーバーは、画像管理システムのいずれかのフォルダーに保存されているすべてのTIFFにアクセスできます。 それらを処理した後、プログラムは2つのファイルを作成します-検索可能なPDF(火災の場合のみ)と単純なテキストファイル。 後者は、CSCEサーバーにある特別なフォルダーに送信され、そこで独自のプログラムによってキャッチされます。このファイルはMySQLデータベースに追加されます。

したがって、デジタル化された植物標本は、CSCE Webサイトの植物標本カタログセクションから入手でき 、いくつかの方法で検索できます。

次のようになります。

たとえば、最も普通のキンポウゲを探しています。 Lingvo辞書は、Ranunculus genの検索対象を示します。

画像

このサービスは、さまざまな探検隊によってさまざまな国から英国に輸入されたすべてのキンポウゲのサンプルのカードの大きなリストを提供します。 乾燥したサンプルの写真が添付されています。 これはリストの一部です。 画像付きのイスラエルの植物カードを選択してください。

画像

画像を拡大できます。 興味がある場合は、添付のテキストを参照してください。

画像

今、花屋の科学者と熱狂的な植物学者は、世界中のどこからでも必要な材料を見つけることができます。

エレナ・アガフォノバ、
翻訳者

Source: https://habr.com/ru/post/J116330/


All Articles