यदि आप इन दिनों समाचार पढ़ते या देखते हैं, तो आप आंकड़ों से घिरे रहते हैं: नए COVID मामले, अपराध दर, जीवन प्रत्याशा। लेकिन: आप कैसे जान सकते हैं कि किन लोगों पर भरोसा करना है? यह एक ऐसा सवाल है जिसका जवाब हमने अपनी नई किताब में देने की कोशिश की है, कैसे पढ़ें अंक: समाचार में सांख्यिकी के लिए एक गाइड (और जब उन्हें विश्वास करना है तब जानना)।
उदाहरण के लिए: यदि कोई आपसे कहे कि “जेली शिशुओं को खाने से आप लंबे समय तक जीवित रहते हैं”, तो क्या आप उन पर विश्वास करेंगे? आप में से अधिकांश, शायद, नहीं। आप किसी तरह के सबूत मांगेंगे, और अगर सबूत “मेरा नैन हर दिन एक जेली बेबी खा गया और 105 साल की भव्य बुढ़ापे में जीया”, तो आप उस पर अधिक विश्वास नहीं कर सकते हैं।
लेकिन क्या होगा अगर आप पेपर में पढ़ते हैं कि “जेली शिशुओं को खाने से पुरानी अग्नाशयशोथ का खतरा 20 प्रतिशत कम हो जाता है”? आप इस पर भरोसा करने के लिए और अधिक तैयार हो सकते हैं?
शायद “20 प्रतिशत” यह अधिक विश्वसनीय लगता है, खासकर अगर यह एक वैज्ञानिक अध्ययन का परिणाम था। लेकिन दूसरी ओर, हम आंकड़ों से सावधान हैं। आखिरकार, तीन प्रकार के झूठ नहीं हैं: “झूठ, शापित झूठ, और आँकड़े”?
तो हम कैसे जानते हैं कि कब एक आंकड़े पर भरोसा करना है और कब नहीं?
सबसे पहले, यह याद रखने योग्य है कि यह द्विआधारी नहीं है: ऐसा नहीं है कि आपको या तो किसी आंकड़े पर भरोसा करना चाहिए या नहीं, लेकिन आपको दूसरों पर कुछ और भरोसा करना चाहिए। यहां तक कि वास्तविक सबूत – जैसे कि जेली-बेबी-लंबे समय तक रहने वाली दादी के बारे में कहानी – अगर नमक की एक बड़ी चुटकी के साथ लिया जाता है तो उपयोगी हो सकता है: आप उन पर भरोसा कर सकते हैं थोड़ा सा।
एडवर्ड जेनर ने टीकों का आविष्कार किया दूधियों के बारे में एक पुरानी-पत्नियों की कहानी सुनने के बाद चेचक नहीं हो रही है। लेकिन यह एक अच्छा विचार नहीं होगा एक राष्ट्रीय जेली बेबी वितरण केंद्र बनाने के लिए क्योंकि आपके दोस्त की दादी ने एक बार कहा था।
नमूना आकार की जाँच करें
यदि आप एक नमूना से लिया गया है, तो एक जनमत सर्वेक्षण की तरह एक सांख्यिकीय में थोड़ा अधिक भरोसा करने में सक्षम हो सकता है। लेकिन इसके नमूने के बारे में थोड़ा जानना जरूरी है। जिस तरह आइसक्रीम का एक नमूना हमारे लिए एक छोटा सा टुकड़ा है, जिसे खरीदने से पहले हम कोशिश करते हैं, हम चाहते हैं कि नमूना उस चीज का प्रतिनिधि हो जिसमें हम रुचि रखते हैं, बड़े नमूने आमतौर पर छोटे नमूनों की तुलना में बेहतर होते हैं, लेकिन यह जरूरी नहीं है वे भरोसेमंद हैं।
यही कारण है कि चुनाव जो आप ट्विटर पर देखते हैं, यहां तक कि हजारों प्रतिक्रियाओं के साथ, भ्रामक हो सकते हैं। इससे कोई फर्क नहीं पड़ता कि नमूना कितना बड़ा है, यह आबादी का प्रतिनिधि नहीं है। एक अध्ययन के अनुसार, केवल 17 फीसदी आबादी ट्विटर का इस्तेमाल करती है, और वे एक पूरे के रूप में जनसंख्या की तुलना में युवा, अधिक महिला और अधिक मध्यम वर्ग के होते हैं। यह पूछना वास्तव में महत्वपूर्ण है, जब आप एक आंकड़ा देखते हैं, तो इसे बनाने में किस नमूने का उपयोग किया गया था, यह कितना बड़ा था, और क्या यह प्रतिनिधि है।
क्या यह सापेक्ष या पूर्ण जोखिम है?
दूसरे, हम एक आंकड़े पर कितना भरोसा करते हैं यह इस बात पर निर्भर करता है कि हम उनकी व्याख्या कैसे करते हैं। उपरोक्त उदाहरण में, यह पूरी तरह से सच हो सकता है कि जेली शिशुओं को खाने से पुरानी अग्नाशयशोथ का खतरा 20 प्रतिशत कम हो जाता है। यह आँकड़ा वही है जिसे इस रूप में जाना जाता है सापेक्ष जोखिम: जो लोग जेली बच्चे खाते हैं और नहीं खाते हैं उनके लिए जोखिम में अंतर।
सिर्फ प्रदर्शित करने के साथ समस्या सापेक्ष जोखिम यह है, अपने दम पर, सांख्यिकीय हमारे लिए बहुत कम उपयोग है। आप नहीं जानते हैं कि आपको पुरानी अग्नाशयशोथ होने की संभावना पहले से थी, इसलिए आप सभी जानते हैं कि यह 20 प्रतिशत से कम है कुछ सम। जब भी आप इस तरह एक आँकड़ा देखते हैं तो आपको पूछा जाना चाहिए: मेरा क्या है पूर्ण जोखिम वैसे भी क्या हो रहा है?
पाँच लाख में पुरानी अग्नाशयशोथ किसी भी वर्ष में। इसलिए 20 फीसदी की कमी से आपके जोखिम में 100,000 में से चार घट जाएंगे।
अपने आप में, एक 20 प्रतिशत कम जोखिम काफी बड़े प्रभाव आकार की तरह लग सकता है। लेकिन पूर्ण जोखिम बहुत कम प्रभावशाली लगता है। भले ही आँकड़ा हो सच, यह अभी भी भ्रामक है: आप इसे अर्थपूर्ण तरीके से व्याख्या करने में असमर्थ हैं।
गणित के बारे में और पढ़ें:
क्या आप किसी आंकड़े पर भरोसा कर सकते हैं?
आम तौर पर, यह आपके द्वारा पढ़े गए किसी भी आंकड़े के बारे में पूछने योग्य है: यह एक बड़ी संख्या है? यह भयानक लग सकता है, कहते हैं, 10,000 लोग हर साल अंतर्वर्धित toenails प्राप्त करते हैं। लेकिन 10,000 में से कितने? यदि यह ब्रिटेन की पूरी आबादी से बाहर है, तो 70 मिलियन लोग, यह हर 7,000 में सिर्फ एक व्यक्ति है, और यह बुरा नहीं लग सकता है।
यह सब आपको चिंतित कर सकता है: आप महसूस कर सकते हैं कि आप अपने द्वारा सुनी गई किसी भी संख्या पर भरोसा नहीं कर सकते। लेकिन साथ ही “झूठ, शापित झूठ, और आँकड़े”, एक और उद्धरण है, जिसका श्रेय सांख्यिकीविद् फ्रेडरिक मोस्टेलर को दिया जाता है: “जबकि आंकड़ों के साथ झूठ बोलना आसान है, उनके बिना झूठ बोलना और भी आसान है।”
संख्याओं के बिना, हम जो भी दावा करते हैं, उस पर भरोसा करना मुश्किल है। सिर्फ एक उदाहरण लेने के लिए, बिना संख्या के हमें पता नहीं चलेगा कि COVID-19 के लिए कोई टीका काम किया या नहीं, अगर यह खतरनाक था या नहीं। नंबर हमारे पास दुनिया को समझने के लिए सबसे अच्छा उपकरण है।
आँकड़ों के साथ झूठ बोलना आसान होने का एकमात्र कारण यह है कि समाज समग्र रूप से यह नहीं समझता है कि संख्याओं को गुमराह करने के लिए इस्तेमाल किया जा सकता है। लेकिन अगर हम सभी कुछ सरल सवाल पूछने में बेहतर हो जाते हैं, जैसे ‘क्या यह एक बड़ी संख्या है?’ या ‘यह किस नमूने पर आधारित है?’, तो यह पहले से मौजूद आंकड़ों के साथ झूठ बोलना और भी कठिन हो जाएगा।
कैसे पढ़ें अंक: समाचार में सांख्यिकी के लिए एक गाइड (और जब उन्हें विश्वास करना है तब जानना) टॉम चिवर्स और डेविड चेवर्स अब बाहर हैं (£ 12.99, वेडेनफील्ड और निकोलसन)।