अपनी एक प्रस्तुति में, Google ने एक दिलचस्प
आंकड़ा पोस्ट किया। यह पता चला है कि हर दिन एक खोज साइट 16% नई खोजों की प्रक्रिया करती है जो पहले कभी नहीं देखी गई थी।
ऐसा लगता है, जहां वे सभी संभावित टाइपो और सभी संयोजनों के साथ शब्दकोश से सभी शब्द समाप्त हो गए हैं, तो वे कहां से आते हैं? लेकिन अगर आप इसके बारे में सोचते हैं, तो आप आसानी से समझ सकते हैं कि वे कहां से आते हैं। सबसे पहले, अंग्रेजी के अलावा सौ भाषाओं के एक जोड़े का योगदान है। दूसरे, उपयोगकर्ता बहुत बार लंबी विशिष्ट खोज क्वेरी (विशिष्ट संस्थानों के नाम, नाम और जीवनी, गीतों के उद्धरण, साहित्यिक रचनाएं और कोड के टुकड़े, बहुत अधिक) में विशिष्ट जानकारी की तलाश करते हैं। अंत में, ये अर्थहीन कीबोर्ड शॉर्टकट हैं जो गलती से खोज इंजन से टकराते हैं, साथ ही साथ "डायनामिक" खोज से अपूर्ण प्रश्न भी आते हैं, जो परिणामों को उपयोगकर्ता प्रकारों के रूप में अपडेट करता है।
हो सकता है कि आंकड़े अनुरोधों की कुल मात्रा को ध्यान में न रखते हों, लेकिन व्यक्तिगत अनुरोध। उदाहरण के लिए, यदि एक मिलियन लोगों ने [facebook] की खोज की, और किसी अन्य व्यक्ति ने [dfg8734kjv3d] की खोज की, तो ऐसे आँकड़ों में
50% अनुरोध "पूरी तरह से नए" होंगे। यानी, 3 बिलियन खोज प्रश्नों की औसत दैनिक मात्रा में से, जो कि Google प्रक्रियाएं हैं, 480 बिलियन पूरी तरह से नई नहीं हैं, लेकिन परिमाण का एक क्रम कम है।
एक तरह से या किसी अन्य, यह पता चलता है कि एक निश्चित अवधि (कई महीनों?) के लिए, केवल एक बार मिले अद्वितीय खोज प्रश्नों का अनुपात "लोकप्रिय" खोज प्रश्नों की संख्या को पार कर सकता है जो दो या अधिक बार मिले थे।
यदि हम मानते हैं कि कुल मात्रा में अद्वितीय अनुरोधों की हिस्सेदारी केवल 1% है, जबकि उनमें से 90% भविष्य में कभी नहीं दोहराए जाएंगे, तो यह पता चलता है कि 55 दिनों में अनुरोधों की सूची में "एक बार" अनुरोध 50% के स्तर तक पहुंच जाते हैं: और खोज इंजन के 110 दिनों के अनुरोधों की सूची में 99, (9)% के स्तर तक पहुंच गया।
भले ही हम नए अनुरोधों की हिस्सेदारी को 0.1% तक कम कर दें, सभी समान, 99 की लाइन, (9)% आश्चर्यजनक रूप से जल्दी से आता है।