आप समाजशास्त्रीय अनुसंधान पर कितना भरोसा कर सकते हैं?

आंकड़े इस लेख को लिखने का कारण यह अध्ययन था, जिस पर पहले चर्चा की गई थी
मेरी उच्च तकनीकी शिक्षा और सटीक विज्ञान और विशेष रूप से गणित के प्यार के साथ, मैं उन सिद्धांतों की सराहना करता हूं और सम्मान करता हूं जो जीवन में लागू होते हैं और व्यावहारिक लाभ प्रदान करते हैं (इस लोकप्रिय धारणा के विपरीत कि सापेक्षता के सिद्धांत का रोजमर्रा की जिंदगी से कोई संबंध नहीं है, यह जीपीएस सिद्धांत का अध्ययन करने के लायक है। सिस्टम और मिसाइल एक ग्रहों के पैमाने पर फायरिंग)। आइए आंकड़ों के ऐसे हिस्से को इस दृष्टिकोण से समाजशास्त्रीय सर्वेक्षण के रूप में देखें। अब वे बहुत फैशनेबल हैं।
हम इसे फ़ार्मुलों से दूर किसी व्यक्ति की आंखों से देखने का प्रयास करेंगे।

सहज समझ


हमारे पास एक गाँव है जहाँ 100 लोग रहते हैं। हम यह पता लगाना चाहते हैं कि इस गांव के निवासी अपने रसायन के निर्माण से कैसे संबंधित हैं। संयंत्र। ऐसा करने के लिए, आपको सभी 100 लोगों का साक्षात्कार करने की आवश्यकता है - सही? इनमें से 20% खिलाफ हैं, 40% सभी समान हैं, 40% इसके लिए हैं:

छवि


लेकिन यहां - आप सभी निवासियों का साक्षात्कार नहीं करेंगे, आप पहचान नहीं पाएंगे। आइए फिर कुछ भाग - कम से कम आधा से पूछताछ करें।

आप ऐसा कर सकते हैं: हम सभी ग्रामीणों को कुछ समूहों में विभाजित करते हैं: कहते हैं, स्वतंत्र कर्मचारी जो स्वयं-नियोजित और गैर-कार्यरत हैं। प्रत्येक समूह से हम कुछ लोगों को लेते हैं और एक प्रतिनिधि नमूना प्राप्त करते हैं :
छवि


या हम अलग तरह से कार्य करेंगे: हमने बेतरतीब ढंग से फैलाया, जिसे हमने पकड़ा, हमने उसे पकड़ लिया। उन्होंने आधे गाँव की गिनती की - और आदेश दिया, एक संभाव्य नमूना मिला:
छवि


आप इसे अधिक सुरुचिपूर्ण ढंग से कर सकते हैं: यादृच्छिक संख्या जनरेटर द्वारा हम कुछ सड़कों का चयन करते हैं और वहां जाते हैं। आप अभी भी निवासियों द्वारा कोटा विभाजित कर सकते हैं। सामान्य तौर पर, हम प्रयोग करने में असमर्थता के तरीकों का नमूना लेते हैं:
छवि


तो सभी समान - निवासियों "के लिए", "बंद" या "खिलाफ" हैं ???

इस मामले में, यह कम या ज्यादा स्पष्ट है। लेकिन ऐसा इसलिए है क्योंकि हम पूरा परिणाम जानते हैं। यदि हम आधे से अधिक निवासियों का साक्षात्कार करते हैं , तो हम अपेक्षाकृत वास्तविक ज्ञान होने का दावा भी कर सकते हैं। या हम यादृच्छिक रूप से चयनित निवासियों की एक छोटी संख्या का कई बार साक्षात्कार कर सकते हैं - ताकि कुल मिलाकर हम गाँव में रहने वाले लोगों की तुलना में कई गुना अधिक निवासियों का साक्षात्कार कर सकें।

जनमत सर्वेक्षण की सामान्य समस्या


किसी भी सर्वेक्षण में, आपको यह सुनिश्चित करने की आवश्यकता है कि आपने उन लोगों का साक्षात्कार लिया है जिन्हें इसकी आवश्यकता है। बतादें, कि दुनिया की सबसे सेक्सी महिला के सर्वे के मामले में गलती करना इतना डरावना नहीं है। लेकिन किसी भी महत्वपूर्ण मुद्दे पर - उदाहरण के लिए, देश के राष्ट्रपति का चुनाव - उन लोगों को मात देना बहुत महत्वपूर्ण है जो मानसिक रूप से स्वस्थ हैं और कम से कम जीवित हैं, उन सभी से जो इस श्रेणी में नहीं आते हैं। आपको यह भी सुनिश्चित करने की आवश्यकता है कि सभी ने एक बार अपने लिए मतदान किया।
दूसरी समस्या उन लोगों की संख्या है जिन्हें साक्षात्कार की आवश्यकता है। अगर हम 10 मिलियन लोगों का औसत यूरोपीय देश लेते हैं, तो 1% 100,000 लोग हैं। कागज पर इस तरह के सर्वेक्षण का संचालन करना लगभग असंभव है।
तुरंत आरक्षण: कागज कठिन है, लेकिन इलेक्ट्रॉनिक आसान है। लेकिन तुरंत उन लोगों की जांच करने की एक बड़ी समस्या है, जिन्हें सर्वेक्षण में जरूरत है और जिनकी जरूरत नहीं है।
दूसरी ओर, ऐसी (और बहुत बड़ी) आबादी का एक विश्वसनीय पेपर सर्वेक्षण संभव है, लेकिन इसके लिए जबरदस्त प्रयास की आवश्यकता है। एक क्लासिक उदाहरण समाजशास्त्रीय चुनाव है जिसे "जनमत संग्रह", "राष्ट्रपति चुनाव" कहा जाता है।

लेवाडा केंद्र से मतदान


और अब वास्तविक सर्वेक्षण पर वापस आते हैं, जो यहां टिप्पणी की गई है :
सर्वेक्षण 25-28 अप्रैल, 2014 को देश के 45 क्षेत्रों के 130 बस्तियों में 182 और उससे अधिक उम्र के 1602 लोगों के बीच शहरी और ग्रामीण आबादी के प्रतिनिधि के रूप में किया गया था। पिछले सर्वेक्षणों के आंकड़ों के साथ उत्तरों के वितरण को कुल उत्तरदाताओं की संख्या के प्रतिशत के रूप में दिया गया है। इन अध्ययनों की सांख्यिकीय त्रुटि 3.4% से अधिक नहीं है

यहाँ से अचानक मुझे क्या समझ में आया?

  1. 1602 लोगों का साक्षात्कार लिया। 2010 की जनगणना के अनुसार, इसकी जनसंख्या 142 856 536 है। 1602 को 142856536 से विभाजित करें और प्राप्त करें - 1.1 * 10 -5 । यह 0.001% है। तो, 0.001% रूसियों के एक सर्वेक्षण के अनुसार , सभी रूसियों के लिए एक निष्कर्ष बनाया गया है
  2. हम इस बात का ध्यान रखते हैं कि 18 से अधिक लोगों का साक्षात्कार लिया गया था। एक ही परिणाम के अनुसार, 19 से कम निवासी 28,026,172 लोग या 19.6% बनाते हैं। खैर, बच्चों को घटाएँ: 1620 को 114 830 364 से विभाजित करें। परिणाम बदल गया है: 1.4 * 10 -5 । यह 0.0014% है। क्या अंतर महत्वपूर्ण है?
  3. सर्वेक्षण 130 बस्तियों में किया गया था। 2010 की अखिल रूसी जनसंख्या जनगणना के परिणामों को देखते हुए , रूस में 1,100 शहर, 1,285 शहरी बस्तियाँ और 153,124 ग्रामीण बस्तियाँ हैं - कुल 155,509 बस्तियाँ। 130 को 155 509 से विभाजित करें और 8.4 * 10 -4 प्राप्त करें । यह 0.083% है। इसका मतलब यह है कि बस्तियों के 0.083% में सर्वेक्षण के परिणामों के अनुसार, रूस के सभी बस्तियों के लिए एक निष्कर्ष निकाला गया है
  4. सर्वेक्षण 45 क्षेत्रों में किया गया था। आज यह 85 क्षेत्र हैं (रूस ने क्रीमिया को यहां शामिल किया है)। 45 को 85 से विभाजित करें और 52% प्राप्त करें। तो, रूस के आधे क्षेत्रों के सर्वेक्षण के अनुसार , सभी क्षेत्रों के लिए एक निष्कर्ष निकाला गया है
  5. "सांख्यिकीय त्रुटि ..." - कौन सा ? किस बारे में?


क्या निष्कर्ष यहाँ का पालन करें? मुझे लगता है कि यह स्पष्ट है ...

क्या वह लेवाडा केंद्र इतनी बुरी अक्षमता है? नहीं, यह रूस जैसे बड़े देशों में किसी भी चुनाव की परेशानी है।

अन्य क्या समस्याएं हैं?


मैं ज्यादा नहीं दोहराऊंगा - इस विषय पर उत्कृष्ट लेख पढ़ें। बीज के लिए, यूएसए में निजी और सार्वजनिक स्कूलों की संख्या दिखाने वाले लेख के ग्राफ को देखें:
छवि

ग्राफ से पता चलता है कि पब्लिक स्कूल छोटे होते जा रहे हैं, और निजी स्कूल नहीं बढ़ रहे हैं ... बंद करो! हम ध्यान से देखते हैं - और अधिक निजी हैं, अश्वेतों! हम उस ग्राफ को देखते हैं जहां निजी स्कूलों की संख्या अलग-अलग दर्शाई गई है:
छवि

अच्छा लगा ना?
अब मेरे निजी जीवन से एक छोटा सा उदाहरण। मान लीजिए मैं अपने खर्चों के आंकड़े रखता हूं। वर्ष के लिए मुझे निम्नलिखित खर्च मिले:
माहखर्च, y। ई।
जनवरी1047
फरवरी2354
मार्च1358
अप्रैल2123
मई1984
जून12,346
जुलाई1023
अगस्त2136
सितंबर1986
अक्टूबर2431
नवंबर1856
दिसंबर2113

मैं एक आस्थगित राशि चाहता हूं जो मेरी आय में तेजी से गिरावट होने पर मेरी मदद करेगी। मैंने तालिका का विश्लेषण करने और अगले वर्ष के लिए निर्णय लेने का फैसला किया: मुझे कितना स्थगित करना चाहिए, ताकि औसत पर पर्याप्त हो? सबसे पहले, मैं न्यूनतम - जुलाई, 1023 को देखता हूं। फिर मैं उच्चतम - जून, 12346 को देखता हूं। तो, क्या मुझे न्यूनतम और अधिकतम का अंकगणितीय औसत लेना चाहिए? मैं (1023 +12346) / 2 = 6684 प्राप्त करूंगा। क्या यह मेरे खर्च को दर्शाता है? बहुत अतिरंजित है।
आइए अलग तरह से देखें - सभी महीनों के अंकगणितीय औसत को लें - हमें 2729 मिलते हैं। क्या यह मेरे खर्च को दर्शाता है? हर महीने मैंने कम पैसे खर्च किए, सिवाय इसके कि जून में मैंने बहुत अधिक खर्च किया। अतिरंजित।
मध्यमा को याद करें: मोटे तौर पर, वितरण में यह मध्य में होगा। इस मामले में, यह 2049 है। आधे मामले में, मैंने कम खर्च किया, आधे में। मामलों की वास्तविक स्थिति के सबसे करीब। प्रश्न - परिणाम के रूप में आप कितनी बार समाजशास्त्रीय सर्वेक्षण में शामिल हुए?
माध्यिका की गणना में नकारात्मक बिंदु यह है कि अंकगणितीय माध्य की तुलना में गणना करना अधिक कठिन है। हाँ, लेकिन फोन में n- कोर प्रोसेसर की उम्र में, यह तर्क अजीब लगता है
ग्राफ इन विचारों को दर्शाता है।
छवि


निष्कर्ष


मुझे लगता है कि यहां हर कोई अपने लिए फैसला करेगा। व्यक्तिगत रूप से, मुझे एहसास हुआ कि जनमत सर्वेक्षण वास्तविक सार्वजनिक राय को प्रतिबिंबित नहीं करते हैं । क्षमा करें ...

Source: https://habr.com/ru/post/In222773/


All Articles