कल, Google ने समाचार पत्रों को माइक्रोफिल्म और अखबारों की अन्य अभिलेखीय सामग्री को स्कैन करने और अनुक्रमित करने के लिए
समाचार संग्रह परियोजना के समापन की सूचना देते हुए प्रकाशन घरों को एक
पत्र भेजा। इसके बजाय, Google "अख़बार उद्योग की मदद करने वाली नई परियोजनाओं पर ध्यान केंद्रित करेगा, जिसमें
Google वन पास प्लेटफ़ॉर्म का विकास शामिल है, जो प्रकाशकों को अपनी साइटों से सीधे सामग्री बेचने की अनुमति देता है।"
पांच साल का न्यूज़ आर्काइव प्रोजेक्ट पुराने अखबारों के लिए उसी तरह का संग्रह बनाने का एक महत्वाकांक्षी प्रयास था जैसा कि Google Books, एक प्रकार की विश्व पुस्तकालय की पुस्तकों के लिए है। यह एक अच्छा विचार था: फिल्में Google के खर्च पर स्कैन की गई थीं, और भागीदारों ने सेवा के पृष्ठों पर विज्ञापन दिखाने से लाभ को विभाजित किया।
सेवा सामान्य समाचार खोज का एक अतिरिक्त है, जहां उपलब्ध संग्रह केवल 30 दिनों तक सीमित है। संग्रह में कोई प्रतिबंध नहीं हैं। बहुत कम जानकारी के स्रोत हैं, लेकिन सबसे शुरुआती रिपोर्ट 18 वीं शताब्दी के मध्य की है। प्रत्येक क्वेरी के लिए खोज परिणाम वर्ष और सूचना के स्रोत द्वारा क्रमबद्ध किए जाते हैं। आप वर्ष और दशक तक
विभिन्न शब्दों का उल्लेख करने की
आवृत्ति भी देख सकते हैं। अधिकांश ग्रंथ मुफ्त में उपलब्ध हैं।
पांच वर्षों में, Google ने पहले ही 250 वर्षों के इतिहास को कवर करते हुए 60 मिलियन समाचार पत्रों के पन्नों को क्रॉल कर दिया है। साझेदारों को लिखे पत्र में, Google ने कहा कि यह पहले से ही बनाए गए संग्रह तक पहुंच प्रदान करना जारी रखेगा, लेकिन साइट को अपडेट नहीं किया जाएगा और इसके लिए नई कार्यक्षमता विकसित नहीं की जाएगी।
इसके अलावा, समाचार पत्र अब सभी स्कैन की गई सामग्री को मुफ्त में उठा सकते हैं और इसे अपनी वेबसाइट पर पोस्ट कर सकते हैं (पहले यह सेवा भुगतान की गई थी)।
यह कहना मुश्किल है कि Google ने परियोजना की निरंतरता को छोड़ने का फैसला क्यों किया। कॉपीराइट को लेकर कुछ समस्याएं / जोखिम हो सकते हैं। या Google ने केवल नई जानकारी के मूल्य को अपेक्षाकृत कम माना है, वे कहते हैं, संग्रह पहले से ही काफी पूरा हो गया है, और छोटे क्षेत्रीय समाचार पत्रों के साथ फ़िडलिंग केवल एक नुकसान में है।
एक अन्य संभावित संस्करण तकनीकी जटिलता और प्रसंस्करण की उच्च लागत है। Google ने पूरे पाठ में खोज करने की क्षमता के साथ ग्राफिक चित्रों के रूप में अभिलेखागार प्रकाशित किया। समाचार पत्रों में पाठ को पहचानना पुस्तकों की तुलना में बहुत अधिक कठिन है, क्योंकि विशिष्ट स्वरूपण और हाइफ़नेशन के कारण (लेख अक्सर एक पृष्ठ से दूसरे पृष्ठ पर और एक यादृच्छिक पृष्ठ पर और एक यादृच्छिक स्थान पर स्थानांतरित होते हैं)। बिना सावधान मानव पर्यवेक्षण के लिए कोई रास्ता नहीं है।
यह भी संभव है कि समाचार पुरालेख परियोजना की उपस्थिति कम थी और समाचार पत्रों को डिजिटाइज़ करने की लागत का विज्ञापन भी लगभग नहीं किया था।
यह भी स्पष्ट नहीं है कि क्या Google उन फिल्मों को सूचकांक में जोड़ देगा, जिन्हें हाल के महीनों में स्कैन किया गया है। तथ्य यह है कि प्रकाशकों ने बताया कि फिल्में जल्दी से स्कैन की जाती हैं और वापस आ जाती हैं, लेकिन बहुत लंबे समय तक सूचकांक में जोड़ दी जाती हैं, इसलिए अब बड़ी मात्रा में स्कैन की गई लेकिन संसाधित जानकारी "स्टैक" में जमा नहीं हुई है।