हाल ही में
, रूस और दुनिया में ज्ञात पाठ की ऑप्टिकल पहचान के लिए एक सॉफ्टवेयर उत्पाद, एबीबीवाई फाइनएडर
के 11 वें संस्करण को जारी किया गया था। इस संस्करण में, कई सुधारों की घोषणा की गई है, और उत्पादकता बढ़ाने और त्रुटियों को कम करने पर मुख्य जोर दिया गया है। इन सुधारों की तुलना संस्करण 10 से की जाती है। मैंने अपने छात्र वर्षों से (2000 के दशक की शुरुआत से) इस कार्यक्रम का उपयोग नहीं किया है, और मैं शायद छह संस्करणों से चूक गया। उन वर्षों में, इंटरनेट और मोबाइल प्रौद्योगिकियों का इतना विकास नहीं हुआ था, लेकिन बहुत समय था। इसलिए, मैं एक घंटे के लिए पुस्तकालय में एक पुस्तक लेने, प्रतियां बनाने, शहर के एक छोर पर एक कंप्यूटर पर जाने के लिए तैयार था, जहां एक स्कैनर होता है, फिर दूसरे छोर पर, जहां फाइनरडर होता है, और फिर घर, वर्ड में मान्यता और स्वरूपण त्रुटियों को ठीक करने के लिए। फ़ाइलें। आज, उपयोगकर्ता आलसी और अधिक मांग वाला बन गया है, इसलिए मैं आधुनिक उपलब्ध तकनीकों और समय की तीव्र कमी के परिप्रेक्ष्य से कार्यक्रम के साथ काम करने पर विचार करना चाहता हूं।
प्रोमो कुंजी और
फाइनरडर 11 सीई (कॉर्पोरेट संस्करण) संस्करण के लिए
डिमोनलाइन और
एबीबीवाई के लिए धन्यवाद, जिसने कई परीक्षणों का संचालन करना संभव बना दिया।
कार्यात्मकता परीक्षण
इसलिए, मैंने बुक-गाइड "स्विटज़रलैंड" लिया और एक निश्चित कोण से iPhone पर कई यू-टर्न लिए। एक मोड़:

कुल मिलाकर, मैंने 14 तस्वीरें लीं, जिन्हें मैंने जल्दी से एक लैपटॉप में स्थानांतरित कर दिया। नोटबुक कॉन्फ़िगरेशन: मैकबुक प्रो 15 "/ कोर i7 2.66 गीगाहर्ट्ज़ / रैम 8 जीबी / मैक ओएस एक्स लायन, और फाइनरडर को वीएमवेयर फ्यूजन / विंडोज 7 x64 (2 प्रोसेसर कोर और 2 जीबी रैम आवंटित किया गया है) पर लॉन्च किया गया है। मैंने फाईनलर को लॉन्च किया, फ़ाइल फ़ंक्शन का चयन किया। (छवि) पीडीएफ में ”, फाइलों का चयन किया,“ ओपन ”पर क्लिक किया और अपने व्यवसाय के बारे में जाने के लिए एक अन्य विंडो पर गया। लगभग 15 मिनट के बाद, एक विशिष्ट ध्वनि ने प्रक्रिया के अंत की सूचना दी और मान्यता प्राप्त पृष्ठों वाली एक पीडीएफ फाइल मेरी आंखों के सामने दिखाई दी। फ़ाइल में पृष्ठों से ही:

हालाँकि, पाठ बाहर खड़ा है:

और नोटपैड में ऐसा दिखता है:

अगला, मैं छवि संपादन में गया और आयताकार पृष्ठ के कोनों के स्थान को इंगित करके कीस्टोन विकृति को समाप्त किया। दुर्भाग्यवश, मेरे पृष्ठों में गोलाकार विकृतियाँ हैं। सामान्य तौर पर, पृष्ठ और इसकी छवियां ज्यामितीय रूप से सही दिखना शुरू हुईं, लेकिन पाठ मान्यता नहीं बदली। फिर मैंने फ्लैश के साथ पृष्ठ की एक तस्वीर ली, फोन को पुस्तक के ऊपर सख्ती से पकड़ कर रखा। परिणामस्वरूप, मेरे पास पीडीएफ में ऐसा पृष्ठ है:

और चयनित पाठ नोटपैड में अच्छी तरह से पढ़ता है:

कार्रवाई में पुरानी लोक ज्ञान - यह बेहतर है कि गुणवत्ता के साथ शूट करना बेहतर है, या कुछ समय बिताने के लिए, फिल्म सेट (प्रकाश, पृष्ठभूमि) और उपकरण (मेगापिक्सेल, फ़ोकस) तैयार करने में कुछ मिनट बिताएं, और फिर स्वचालित (यहां एबीबीवाई की कोशिश की गई) मान्यता प्रक्रिया का आनंद लें।
प्रदर्शन परीक्षण
होम लाइब्रेरी में एक निश्चित कंप्यूटर प्रोग्राम (251-पृष्ठ पीडीएफ फाइल) के लिए 500-पेज का मैनुअल था, जिसे इंटरनेट पर लिया गया था।
कॉपीराइट के देवों के प्रकोप को न बढ़ाने के लिए, बौद्धिक संपदा के उपयोग की शर्तों का पालन करने के लिए, मैं स्क्रीनशॉट्स को सम्मिलित नहीं करता हूं। बाध्यकारी क्षेत्र में मामूली गोलाकार विकृति के साथ फोटो खींचे गए पृष्ठ। बहुत सारे चित्र और टेबल। चित्र, मूल रूप से, ऊपर वर्णित कार्यक्रम से स्क्रीनशॉट हैं। परीक्षा परिणाम इस प्रकार हैं:
फ़ाइल खुला समय: 12 मिनट।
मान्यता समय: 26 मिनट।
शब्द निर्यात समय: 2 मिनट।
परियोजना समय बचा: 11 मिनट।
कमियों में से, केवल एक ही नोट किया जा सकता है - अधिकांश चित्रों को टेक्स्ट ब्लॉक के रूप में परिभाषित किया गया है। शायद इसलिए कि इन चित्रों में स्क्रीनशॉट होते हैं जिनमें शीर्षक बार और कार्यक्रम का मेनू शामिल होता है। ऐसा करने के लिए, मुझे एक तस्वीर के साथ प्रत्येक पृष्ठ पर जाना होगा और ब्लॉकों के प्रकार और सीमाओं को बदलना होगा।
ब्लॉक प्रकार समायोजन समय: 35 मिनट।
निष्कर्ष
मैंने घोषित सुधारों में से प्रत्येक पर निष्कर्ष निकालने का फैसला किया।
ब्लॉक प्रकारों की अधिक सटीक परिभाषा
यह वास्तव में, अधिक सटीक है, लेकिन कई चित्रों को पाठ के रूप में परिभाषित किया गया है, हालांकि उनका एक आयताकार आकार है और बहुत से "गैर-पाठ" हैं। शायद प्रोग्राम को संवेदनशीलता सेटिंग्स के रूप में अतिरिक्त कार्यक्षमता की आवश्यकता होती है, स्केल के साथ एक स्लाइडर, स्केल के एक तरफ शिलालेख "बल्कि पाठ", और दूसरे पर "बल्कि एक तस्वीर"।
बड़े (100 से अधिक फ़ाइलों) दस्तावेज़ पैकेजों के साथ अधिक स्थिर काम
हां, वास्तव में, इस तथ्य के बावजूद कि कार्यक्रम कई समानांतर चलने वाले कार्यक्रमों के साथ आभासी मशीन पर चल रहा था, प्रक्रिया विफलताओं के बिना स्थिर थी। निष्ठा के लिए, 500-पृष्ठ के दस्तावेज़ की मान्यता 3 बार की गई।
विकृत तस्वीरों की स्वचालित और मैन्युअल सुधार
मैन्युअल सुधार कार्य करता है जबकि कोई भी स्वचालित परिवर्तन नहीं देखा गया है। हालांकि, विकृत पृष्ठ पर पाठ को सही ढंग से पहचाना गया था। लेकिन पहले (लगभग 10 साल पहले) थोड़ी सी भी विकृति अनिवार्य रूप से त्रुटियों का कारण बनी।
बहु-पृष्ठ दस्तावेजों के साथ बेहतर काम
बहु-पृष्ठ दस्तावेज़ के साथ काम करने में कोई विशेष समस्याएं नहीं थीं।
पीडीएफ में बचत मोड की उपस्थिति: "सबसे अच्छी गुणवत्ता", "छोटे आकार" और "संतुलित मोड"
ऐसे मोड हैं, लेकिन "सर्वश्रेष्ठ गुणवत्ता" के लिए पर्याप्त डिस्क स्थान और कंप्यूटर की शक्ति है।
दस्तावेजों और पीडीएफ फाइलों की छवियों को ODT प्रारूप में सहेजना और परिवर्तित करना (OpenOffice.org लेखक), DjVu, ePub, fb2
यह काफी उपयोगी और प्रासंगिक कार्य है।
शैली के संपादक
यह सुविधा पोस्ट-प्रोसेसिंग के लिए उपयोगी है। यदि मान्यता का उद्देश्य सिर्फ पढ़ना है, प्रिंट नहीं करना है, तो फ़ंक्शन का उपयोग करना वैकल्पिक है।
नई टास्क विंडो उन कार्यों को प्रदर्शित करती है जिनकी सबसे अधिक आवश्यकता होती है
प्राचीन काल के कई कार्यक्रमों में ऐसी खिड़कियां होती हैं। मैंने हमेशा उन्हें बंद किया और जाँच की "इस विंडो को फिर से प्रदर्शित न करें।" लेकिन इस मामले में मैंने इसका इस्तेमाल करने का फैसला किया (शायद मैक और आईफोन को संक्रमण से प्रभावित) और मुझे यह पसंद आया, तब से फाइनरडर में मैंने केवल इस विंडो का उपयोग किया। और यह मेनू पर चढ़ने के लिए बहुत आलसी था।
निष्कर्ष
उपयोगिता एक आधुनिक प्रवृत्ति में काफी है और सॉफ्टवेयर का उपयोग करना सुखद है। कार्यालय कर्मियों की एक निश्चित श्रेणी, यह समय और तंत्रिकाओं को बहुत बचाएगा। दावा किए गए सुधार वास्तव में काम करते हैं। अगर मैं फिर से एक छात्र होता, तो मैं बस पुस्तकालय में फोन पर पुस्तक के टुकड़े की तस्वीर खींचता और घर पर (निबंध और शोध प्रबंध के लिए) पहचानता। अब, मुझे वर्ष में 1-2 बार से अधिक ऐसी कार्यक्षमता की आवश्यकता है, इसलिए पेजिनेशन वाली एक ऑनलाइन सेवा मेरे लिए उपयोगी होगी।
मैं एबीबीवाई टीम को उपभोक्ता को प्रसन्न और आश्चर्यचकित करना जारी रखना चाहता हूं।
* कॉपीराइट धारकों के लिए:
इस लेख में उल्लिखित सामग्रियों को सॉफ्टवेयर की कार्यक्षमता और गति को सत्यापित करने के लिए पूरी तरह से मान्यता प्राप्त थी। सभी मान्यता परिणाम, साथ ही पुस्तक पृष्ठों के डिजिटल चित्र, बाद में अनियमित रूप से नष्ट कर दिए गए थे।पीएस ने
विकृति विज्ञान के बारे में प्रश्न से संबंधित है। यह
लिंक निम्नलिखित ग्रीक पाठ का स्क्रीनशॉट है:
Ἐχεκράτης[५ὐτόςa] αὐτός, ὦ ίδωα ,ν, εγέαρυνου Σωκρἐκείι τῇνάτε ἐκεί έμέρᾳ ᾗ ὐτός μρμακον ἔπιὐτόςνε ὐτός δεσμωτηρίῳ, ἢ ἄλλουτοὐτόςο
Φαίδωνα, ὐτός τεςρατες।
Ἐχεκράτηςὖ οἅττν δή νιν ὖα ὁν ἀ ὖνὴρ πρῦ θοὸ άτανάτου; καπῶς κ ἐτελεύτα; ἂ ἀκρ ἐγὼν ἐγὼ ύσοιαιμι। καὶ γὰρ οὔτε [τῶν πολιτῶν] Φλειασίων οὐδεὶς πάνυ τι ἐπιχωριάζει τὰ νῦν Ἀθήναζε, οὔτε τις ξένος ἀφῖκται χρόνου συχνοῦ [57b] ἐκεῖθεν ὅστις ἂν ἡμῖν σαφές τι ἀγγεῖλαι οἷός τ ἦν περὶ τούτων, πλήν γε δὴ ὅτι φάρμακον πιὼν ἀποθάνοι · τῶν δὲ ἄλλων εἶχενν εἶχεν φράζειν।
जो, केवल ग्रीक भाषा का चयन करते समय, इस तरह से फाइनरडर द्वारा मान्यता प्राप्त थी:Έχεκράτης[५ύτός [] αύτός, ώ ίδωα ,ν, εγέαρυνου Σωκρεκείι τηνάτε εκεί εμερα η ύτός μρμακον έπιύτόςνε ύτός δεσμωτηρίω, ή άλλουσούτόςο
Φαίδωνα, ύτός τεςρατες।
Έχεκράτηςΰ οάττν δή ιιν ΰα όν ά ΰνήρ προ θοο άτανάτου; καπώς κ έτελεύτα; ά άκρ έγών έγώ ύσοιαιμι। καί γάρ οΰτε [τών πολιτών] Φλειασίων ούδείς πάνυ τι επιχωριάζει τά νυν Άθήναζε, οΰτε τις ξένος άφΐκται χρόνου συχνού [57β] έκεΐθεν όστις άν ήμΐν σαφές τι άγγεΐλαι οΐός τ 'ήν περί τούτων, πλήν γε δή ότι φάρμακον πιών άποθάνοι · τών δέ άλλων ε ν ειχεν φρνιν।
ग्रीक और अंग्रेजी चुनते समय - इस तरह:Έχεκράτης[५ύτόςa] αύτός, ώ ίδωα ,ν, εγέαρυνου Σωκρεκείι τηνάτε εκεί εμερα η ύτός μρμακον έπιενε ύτός δεσμωτηρίω, ή άλλουσούτόςο
Φαίδωνα, ύτός τεςρατες।
Έχεκράτηςΰ οάττν δή ιιν ΰα όν ά ΰνήρ προ θοο άτανάτου; καπώς κ έτελεύτα; ά άκρ έγών έγώ ύσοιαιμι। καί γάρ οΰτε [τών πολιτών] Φλειασίων ούδείς πάνυ τι επιχωριάζει τά νυν Άθήναζε, οΰτε τις ξένος άφΐκται χρόνου συχνού [57b] έκεΐθεν όστις άν ήμΐν σαφές τι άγγεΐλαι οΐός τ 'ήν περί τούτων, πλήν γε δή ότι φάρμακον πιών άποθάνοι · τών δέ άλλων ε ν ειχεν φρνιν।
और जब ग्रीक भाषा की एक प्रति तैयार कर रहे थे और सभी वर्णों को इसमें शामिल किया गया था, तो यह इस तरह से निकला:Έχεκράτης[५ύτόςa] αύτός, ώ ίδωαύτόςν, εγέαρ ]νου Σωκρεκείι τηνάτε εκεί εμερα η ύτός μρμακον επιενε τω δεσμωτηρίω, ή άλλουτου;
Φαίδωνα, ύτός τεςρατες।
Έχεκράτης
ΰ οάττν δή νιν ΰα όν ά ΰνήρ πρû θοτ άτανάτου; καπώς κ έτελεύτα; άκρ αν έγώ ύσοιαιμι। καί γάρ οΰτε [τών πολιτών] Φλειασίων ούδεìς πάνυ τι επιχωριάζει τά νûν Άθήναζε, οΰτε τις ξένος άφîκται χρόνου συχνού [57ċ>] έκεîθεν öστις αν ήμîν σαφές τι άγγεΐλαι οîός τ 'ήν περί τούτων, πλήν γε δή öτι φάρμακον πιών άποθάνοι- τών δέ άλλφν ούδέν άν άζερνιν।