मैं कभी-कभी लोगों को यह कहते हुए सुनता हूं: "याद रखें कि Google कब शुरू हुआ था और परिणाम इतने अच्छे थे? तब Google पर कोई स्पैम नहीं था। एह, उन दिनों को वापस करना अच्छा होगा। ” मैं समझता हूं कि वे ऐसा क्यों कहते हैं। 1999 में, मैंने मजिस्ट्रेटरी में अध्ययन किया और मुझे याद है कि कुछ ही खोजों के बाद मैं Google से कितना प्रभावित हुआ।
लेकिन यह सोचना गलत है कि उन दिनों Google में स्पैम नहीं था। 2000 में, Google उस समय के अन्य खोज इंजनों की तुलना में बहुत अच्छा लग रहा था, लेकिन 2011 का Google मॉडल Google 2000 से बहुत बेहतर है। मुझे यह पता है क्योंकि अक्टूबर 2000 में मैंने 40,000 से अधिक खोज प्रश्नों को google.com पर भेजा था और परिणामों को बचाया था। समय कैप्सूल के एक प्रकार के रूप में।
उदाहरण के लिए, एक खोज क्वेरी [
डोमेन नाम खरीदें ]। Google की वर्तमान सूची सही नहीं है, लेकिन पृष्ठ पर कई संसाधन हैं और कई स्थान हैं जहाँ आप वास्तव में एक डोमेन नाम खरीद सकते हैं। और यहाँ पर 2000 में Google इस प्रश्न पर वापस आया:
URL_1: http: //buy-domain-name.domain-searcher.com/domains/buy-domain-name.shtml
URL_2: http: //buy-domain-name.domain-searcher.com/buy-domain-name.shtml
URL_3: http: //buy-domain.domain-searcher.com/domains/buy-domain.shtml
URL_4: http: //buy-domain.domain-searcher.com/Map3.shtml
URL_5: http: //domain-name-broker.domain-searcher.com/domains/domain-name-broker.shtml
URL_6: http: //users5.50megs.com/buydomain32/
URL_7: http: //users4.50megs.com/buydomain02/
URL_8: http: //domain-name-service.domain-searcher.com/domains/domain-name-service.shtml
URL_9: http: //domain-name-service.domain-searcher.com/Map2.shtml
URL_10: http: //dns-id.co.uk/
पहले दस परिणामों में से सात एक डोमेन से आते हैं, और ये पते थोड़े लगते हैं ... ठीक है, चलो कहते हैं, संदिग्ध। 1999 और 2000 की शुरुआत में, खोज इंजन अक्सर एक डोमेन से 50 परिणामों को एक क्वेरी में वापस कर सकते थे। फरवरी 2000 में, Google ने एक अच्छा नवाचार पेश किया: एक मेजबान पूलिंग एल्गोरिथ्म जिसने प्रत्येक मेजबान से केवल दो परिणाम दिखाए। एक बिंदु पर, खोज परिणाम बहुत क्लीनर और अधिक विविध हैं! यह एक वास्तविक जीत थी - हमें ई-मेल के माध्यम से प्रशंसकों से पत्र भी मिले। दुर्भाग्य से, कुछ महीनों के बाद, लोगों ने मेजबानों के संयोजन के लिए एल्गोरिथ्म को दरकिनार करने के लिए कई उप-डोमेन बनाना शुरू कर दिया, जैसा कि ऊपर दिए गए आउटपुट द्वारा दिखाया गया है। इस प्रकार के उप-डोमेन धोखाधड़ी को रोकने और बेहतर विविधता प्रदान करने के लिए Google ने बाद में अधिक मजबूत कोड जोड़ा। इसीलिए अब
सबडोमेन या उपनिर्देशिका का उपयोग करते हुए समाधान के चारों ओर बहुत चर्चा है।
अपनी खोज गुणवत्ता में सुधार करना एक अंतहीन प्रक्रिया है। मुझे उम्मीद है कि दस साल में हम पीछे देखेंगे और कहेंगे: “वाह, उन दिनों में अधिकांश अनुरोध कुछ शब्द थे। और प्रश्नों को मैन्युअल रूप से लिखना आवश्यक था। कैसे आदिम! ज्यादातर, मैं इस बात पर जोर देना चाहता हूं कि 2000 में Google अन्य खोज इंजनों की तुलना में बहुत अधिक स्वच्छ दिखता था, लेकिन स्पैम तब भी एक समस्या थी, बिना किसी संदेह के। अगर कोई सुनहरा, शांत दिन याद करता है जब Google में कोई स्पैम नहीं था, तो इन यादों के बारे में अविश्वास करें। :)