SATHEE: अध्याय 02 डेटा का संग्रह

अध्याय 02 डेटा का संग्रह

1. परिचय

पिछले अध्याय में आपने अर्थशास्त्र क्या है, इसके बारे में पढ़ा है। आपने अर्थशास्त्र में सांख्यिकी की भूमिका और महत्त्व भी अध्ययन किया है। इस अध्याय में आप आंकड़ों के स्रोतों और आंकड़ों के संग्रह की विधि का अध्ययन करेंगे। आंकड़ों के संग्रह का उद्देश्य किसी समस्या के समाधान तक पहुँचने के लिए ठोस और स्पष्ट प्रमाण प्रस्तुत करना है।

अर्थशास्त्र में आप अक्सर इस प्रकार के कथन से सामना करते हैं,

“कई उतार-चढ़ावों के बाद खाद्यान्न का उत्पादन 1970-71 में 108 मिलियन टन से बढ़कर 1978-79 में 132 मिलियन टन हो गया, परंतु 1979-80 में फिर घटकर 108 मिलियन टन रह गया। इसके बाद खाद्यान्न का उत्पादन लगातार बढ़ता रहा और 2015-16 में 252 मिलियन टन तथा 2016-17 में 272 मिलियन टन तक पहुँच गया।”

इस कथन में आप देख सकते हैं कि विभिन्न वर्षों में खाद्यान्न का उत्पादन समान नहीं रहता है। यह वर्ष दर वर्ष तथा फसल दर फसल बदलता रहता है। चूँकि ये मान परिवर्तित होते हैं, इन्हें चर कहा जाता है। चरों को सामान्यतः अक्षरों $\mathrm{X}, \mathrm{Y}$ या $\mathrm{Z}$ द्वारा दर्शाया जाता है। किसी चर का प्रत्येक मान एक प्रेक्षण होता है। उदाहरणस्वरूप, भारत में खाद्यान्न का उत्पादन निम्नलिखित सारणी में दिखाए अनुसार 1970-71 में 108 मिलियन टन से लेकर 2016-17 में 272 मिलियन टन के बीच बदलता रहता है। वर्षों को चर $X$ तथा भारत में खाद्यान्न का उत्पादन (मिलियन टन में) को चर $Y$ द्वारा दर्शाया गया है।

सारणी 2.1 भारत में खाद्यान्न का उत्पादन (मिलियन टन)

X	Y
1970-71	108
1978-79	132
1990-91	176
1997-98	194
2001-02	212
2015-16	252
2016-17	272

यहाँ इन चरों $X$ और $Y$ के मान ‘डेटा’ हैं, जिनसे हम भारत में खाद्यान्न उत्पादन के बारे में जानकारी प्राप्त कर सकते हैं। खाद्यान्न उत्पादन में उतार-चढ़ाव को जानने के लिए हमें विभिन्न वर्षों के लिए भारत में खाद्यान्न उत्पादन का ‘डेटा’ चाहिए। ‘डेटा’ एक उपकरण है, जो जानकारी प्रदान करके समस्याओं को समझने में मदद करता है।

आप सोच रहे होंगे कि ‘डेटा’ आता कहाँ से है और हम इन्हें इकट्ठा कैसे करते हैं? निम्नलिखित खंडों में हम डेटा के प्रकार, डेटा संग्रह की विधि और उपकरणों तथा डेटा प्राप्त करने के स्रोतों पर चर्चा करेंगे।

2. डेटा के स्रोत क्या हैं?

सांख्यिकीय डेटा दो स्रोतों से प्राप्त किया जा सकता है। शोधकर्ता किसी पूछताछ आयोजित करके डेटा इकट्ठा कर सकता है। ऐसे डेटा को प्राथमिक डेटा कहा जाता है, क्योंकि ये प्रथम सूचना पर आधारित होते हैं। मान लीजिए आप किसी फिल्म स्टार की स्कूली छात्रों में लोकप्रियता के बारे में जानना चाहते हैं। इसके लिए आपको बड़ी संख्या में स्कूली छात्रों से पूछताछ करनी होगी, उनसे प्रश्न पूछकर वांछित जानकारी एकत्र करनी होगी। आपको जो डेटा मिलता है, वह प्राथमिक डेटा का एक उदाहरण है।

यदि डेटा किसी अन्य एजेंसी द्वारा एकत्रित और संसाधित (जांचे और सारणीबद्ध) किए गए हैं, तो उन्हें द्वितीयक डेटा कहा जाता है। इन्हें या तो प्रकाशित स्रोतों जैसे सरकारी रिपोर्टों, दस्तावेजों, समाचार पत्रों, अर्थशास्त्रियों द्वारा लिखी गई पुस्तकों से प्राप्त किया जा सकता है या किसी अन्य स्रोत से, उदाहरण के लिए, एक वेबसाइट से। इस प्रकार, डेटा उस स्रोत के लिए प्राथमिक होते हैं जो उन्हें पहली बार एकत्रित और संसाधित करता है और द्वितीयक उन सभी स्रोतों के लिए होते हैं जो बाद में ऐसे डेटा का उपयोग करते हैं। द्वितीयक डेटा के उपयोग से समय और लागत की बचत होती है। उदाहरण के लिए, फिल्म स्टार की छात्रों में लोकप्रियता पर डेटा एकत्र करने के बाद, आप एक रिपोर्ट प्रकाशित करते हैं। यदि कोई व्यक्ति आपके द्वारा एकत्रित किए गए डेटा का उपयोग समान अध्ययन के लिए करता है, तो वह द्वितीयक डेटा बन जाता है।

3. हम डेटा कैसे एकत्र करते हैं?

क्या आप जानते हैं कि कोई निर्माता किसी उत्पाद के बारे में कैसे निर्णय लेता है या कोई राजनीतिक दल उम्मीदवार के बारे में कैसे निर्णय लेता है? वे एक सर्वेक्षण करते हैं जिसमें वे एक बड़े समूह से किसी विशेष उत्पाद या उम्मीदवार के बारे में प्रश्न पूछते हैं। सर्वेक्षणों का उद्देश्य कुछ विशेषताओं का वर्णन करना होता है जैसे मूल्य, गुणवत्ता, उपयोगिता (उत्पाद के मामले में) और लोकप्रियता, ईमानदारी, निष्ठा (उम्मीदवार के मामले में)। सर्वेक्षण का उद्देश्य डेटा एकत्र करना होता है। सर्वेक्षण व्यक्तियों से जानकारी एकत्र करने की एक विधि है।

उपकरण की तैयारी

सर्वेक्षणों में प्रयोग किए जाने वाला सबसे सामान्य प्रकार का साधन प्रश्नावली/साक्षात्कार अनुसूची है। प्रश्नावली या तो उत्तरदाता द्वारा स्वयं भरी जाती है या शोधकर्ता (गणनाकार) या प्रशिक्षित अन्वेषक द्वारा भरी जाती है। प्रश्नावली/साक्षात्कार अनुसूची तैयार करते समय आपको निम्नलिखित बातों को ध्यान में रखना चाहिए;

प्रश्नावली अत्यधिक लंबी नहीं होनी चाहिए। प्रश्नों की संख्या यथासंभव न्यूनतम होनी चाहिए।

प्रश्नावली समझने में आसान होनी चाहिए और अस्पष्ट या कठिन शब्दों से बचना चाहिए।

प्रश्नों को इस प्रकार क्रमबद्ध किया जाना चाहिए कि उत्तर देने वाला व्यक्ति सहज महसूस करे।
प्रश्नों की श्रृंखला सामान्य से विशिष्ट की ओर बढ़नी चाहिए। प्रश्नावली सामान्य प्रश्नों से शुरू होकर अधिक विशिष्ट प्रश्नों की ओर आगे बढ़नी चाहिए। उदाहरण के लिए:

खराब $Q$

(i) बिजली शुल्क में वृद्धि उचित है?

(ii) क्या आपके क्षेत्र में बिजली आपूर्ति नियमित है?

अच्छा $Q$

(i) क्या आपके क्षेत्र में बिजली आपूर्ति नियमित है?

(ii) बिजली शुल्क में वृद्धि उचित है?

प्रश्न सटीक और स्पष्ट होने चाहिए। उदाहरण के लिए,

खराब $Q$

आप अपनी आय का कितना प्रतिशत भाग प्रस्तुतशील दिखने के लिए कपड़ों पर खर्च करते हैं?

अच्छा $Q$

आप अपनी आय का कितना प्रतिशत भाग कपड़ों पर खर्च करते हैं?

प्रश्न अस्पष्ट नहीं होने चाहिए। उन्हें उत्तरदाताओं को तेजी से, सही और स्पष्ट रूप से उत्तर देने में सक्षम बनाना चाहिए। उदाहरण के लिए:

खराब $Q$

क्या आप एक महीने में पुस्तकों पर बहुत सारा पैसा खर्च करते हैं?

अच्छा $Q$

(उपयुक्त विकल्प पर टिक लगाएं)

आप एक महीने में कितना खर्च करते हैं किताबों पर?

(i) ₹200 से कम

(ii) ₹200-300

(iii) ₹300-400

(iv) ₹400 से अधिक

प्रश्न में दोहला नकार नहीं होना चाहिए। “क्या आप नहीं सोचते…” या “क्या आपको नहीं लगता…” जैसे प्रश्नों से बचें, क्योंकि वे पूर्वाग्रहित उत्तर दे सकते हैं। उदाहरण:

गलत प्रश्न
क्या आप नहीं सोचते कि धूम्रपान पर प्रतिबंध होना चाहिए?

सही प्रश्न
क्या आप सोचते हैं कि धूम्रपान पर प्रतिबंध होना चाहिए?

प्रश्न मार्गदर्शक नहीं होना चाहिए, जो यह संकेत दे कि उत्तरदाता को कैसे उत्तर देना चाहिए। उदाहरण:

गलत प्रश्न
आपको इस उच्च गुणवत्ता वाली चाय का स्वाद कैसा लगा?

सही प्रश्न
आपको इस चाय का स्वाद कैसा लगा?

प्रश्न में उत्तर के विकल्प नहीं दिखाने चाहिए। उदाहरण:

गलत प्रश्न
कॉलेज के बाद आप नौकरी करना चाहेंगी या गृहिणी बनना चाहेंगी?

सही प्रश्न
कॉलेज के बाद आप क्या करना चाहेंगी?

प्रश्नावली बंद-अंत वाले (या संरचित) प्रश्नों या खुले-अंत वाले (या असंरचित) प्रश्नों से बन सकती है। उपरोक्त प्रश्न—जिसमें पूछा गया है कि विद्यार्थी कॉलेज के बाद क्या करना चाहता है—एक खुला-अंत वाला प्रश्न है।

बंद-अंत या संरचित प्रश्न दो-तरफा प्रश्न या बहुविकल्पी प्रश्न हो सकते हैं। जब केवल दो संभावित उत्तर हों, ‘हाँ’ या ‘नहीं’, तो उसे दो-तरफा प्रश्न कहा जाता है।

जब दो से अधिक विकल्प हों, तो बहुविकल्पी प्रश्न अधिक उपयुक्त होते हैं। उदाहरण,

प्र. आपने अपनी ज़मीन क्यों बेची?

(i) कर्ज़ चुकाने के लिए।

(ii) बच्चों की शिक्षा के लिए।

(iii) किसी अन्य सम्पत्ति में निवेश करने के लिए।

(iv) कोई अन्य (कृपया निर्दिष्ट करें)।

बंद प्रश्नों का प्रयोग करना, अंकन करना और विश्लेषण के लिए कोडित करना आसान होता है, क्योंकि सभी उत्तरदाता दिए गए विकल्पों में से चयन कर सकते हैं। परन्तु इन्हें लिखना कठिन होता है क्योंकि विकल्पों को स्पष्ट रूप से लिखा जाना चाहिए ताकि मुद्दे के दोनों पक्षों का प्रतिनिधित्व हो। यह भी सम्भावना रहती है कि किसी व्यक्ति की वास्तविक प्रतिक्रिया दिए गए विकल्पों में मौजूद न हो। इसके लिए ‘कोई अन्य’ का विकल्प दिया गया है, जहाँ उत्तरदाता वह प्रतिक्रिया लिख सकता है जिसकी अनुसंधानकर्ता ने कल्पना नहीं की थी। इसके अतिरिक्त, बहुविकल्पी प्रश्नों की एक अन्य सीमा यह है कि ये विकल्प प्रदान करके उत्तरों को सीमित कर देते हैं, जिनके बिना उत्तरदाता भिन्न रूप से उत्तर दे सकते थे।

खुले प्रश्न अधिक व्यक्तिगत प्रतिक्रियाओं की अनुमति देते हैं, परन्तु इनकी व्याख्या करना और अंकन करना कठिन होता है, क्योंकि प्रतिक्रियाओं में बहुत विविधता होती है। उदाहरण,

प्र. वैश्वीकरण के बारे में आपका क्या दृष्टिकोण है?

डेटा संग्रह की विधि

क्या आपने कभी कोई टेलीविज़न शो देखा है जिसमें रिपोर्टर बच्चों, गृहिणियों या आम जनता से उनकी परीक्षा प्रदर्शन या साबुन की किसी ब्रांड या किसी राजनीतिक दल के बारे में प्रश्न पूछते हैं? प्रश्न पूछने का उद्देश्य सर्वेक्षण करके डेटा एकत्र करना होता है। डेटा एकत्र करने के तीन मूलभूत तरीके हैं: (i) व्यक्तिगत साक्षात्कार, (ii) मेल (प्रश्नावली) सर्वेक्षण, और (iii) टेलीफोन साक्षात्कार।

व्यक्तिगत साक्षात्कार

यह विधि तब प्रयोग की जाती है जब शोधकर्ता को सभी सदस्यों तक पहुंच होती है। शोधकर्ता (या अन्वेषक) उत्तरदाताओं के साथ आमने-सामने साक्षात्कार करता है।

व्यक्तिगत साक्षात्कार विभिन्न कारणों से पसंद किए जाते हैं। उत्तरदाता और साक्षात्कारकर्ता के बीच व्यक्तिगत संपर्क स्थापित होता है। साक्षात्कारकर्ता को अध्ययन की व्याख्या करने और उत्तरदाताओं के प्रश्नों के उत्तर देने का अवसर मिलता है। साक्षात्कारकर्ता उत्तरदाता से विशेष रूप से महत्वपूर्ण उत्तरों का विस्तार करने का अनुरोध कर सकता है। गलत व्याख्या और गलतफहमी से बचा जा सकता है। उत्तरदाताओं की प्रतिक्रियाओं को देखने से पूरक जानकारी प्राप्त हो सकती है।

व्यक्तिगत साक्षात्कार के कुछ दोष भी हैं। यह महंगा होता है, क्योंकि इसके लिए प्रशिक्षित साक्षात्कारकर्ताओं की आवश्यकता होती है। सर्वेक्षण को पूरा करने में अधिक समय लगता है। शोधकर्ता की उपस्थिति उत्तरदाताओं को वह कहने से रोक सकती है जो वे वास्तव में सोचते हैं।

मेल प्रश्नावली

जब किसी सर्वेक्षण में डेटा डाक द्वारा एकत्र किया जाता है, तो प्रत्येक व्यक्ति को डाक द्वारा प्रश्नावली भेजी जाती है और एक निश्चित तिथि तक उसे भरकर वापस भेजने का अनुरोध किया जाता है। इस विधि के लाभ यह हैं कि यह कम खर्चीली है। यह शोधकर्ता को दूरदराज के क्षेत्रों में रहने वाले लोगों तक भी पहुंचने की अनुमति देती है, जिन तक व्यक्तिगत रूप से या टेलीफोन द्वारा पहुंचना कठिन हो सकता है। यह साक्षात्कारकर्ता द्वारा उत्तरदाताओं को प्रभावित करने की अनुमति नहीं देता। यह उत्तरदाताओं को प्रश्नों के बारे में सोच-समझकर उत्तर देने के लिए पर्याप्त समय देने की भी अनुमति देता है।

इन दिनों ऑनलाइन सर्वेक्षण या लघु संदेश सेवा, अर्थात् SMS के माध्यम से सर्वेक्षण लोकप्रिय हैं। क्या आप जानते हैं कि ऑनलाइन सर्वेक्षण कैसे आयोजित किया जाता है?

डाक सर्वेक्षण के नुकसान यह हैं कि निर्देशों को स्पष्ट करने में सहायता प्रदान करने के कम अवसर होते हैं, इसलिए प्रश्नों को गलत समझने की संभावना रहती है। डाक द्वारा सर्वेक्षण कराने पर कुछ कारकों के कारण कम प्रतिक्रिया दर प्राप्त होने की संभावना भी रहती है, जैसे कि प्रश्नावली को भरे बिना वापस भेजना, प्रश्नावली को बिल्कुल वापस न भेजना, डाक में ही प्रश्नावली के खो जाने आदि।

टेलीफोन साक्षात्कार

एक टेलीफोन साक्षात्कार में, जांचकर्ता टेलीफोन के माध्यम से प्रश्न पूछता है। टेलीफोन साक्षात्कारों के लाभ यह हैं कि ये व्यक्तिगत साक्षात्कारों की तुलना में सस्ते होते हैं और कम समय में आयोजित किए जा सकते हैं। ये शोधकर्ता को प्रश्नों को स्पष्ट करके उत्तरदाता की सहायता करने की अनुमति देते हैं। टेलीफोनिक साक्षात्कार उन मामलों में बेहतर होता है जहां उत्तरदाता व्यक्तिगत साक्षात्कारों में कुछ प्रश्नों का उत्तर देने में अनिच्छुक होते हैं।

इस विधि का एक नुकसान लोगों तक पहुंच है, क्योंकि कई लोगों के पास टेलीफोन नहीं हो सकते हैं।

पायलट सर्वेक्षण

एक बार जब प्रश्नावली तैयार हो जाती है, तो एक छोटे समूह के साथ एक परीक्षण करना उचित होता है, जिसे पायलट सर्वेक्षण या प्रश्नावली की पूर्व-परीक्षण कहा जाता है। पायलट सर्वेक्षण सर्वेक्षण के बारे में एक प्रारंभिक विचार प्रदान करने में मदद करता है। यह प्रश्नावली की पूर्व-परीक्षण में मदद करता है, ताकि प्रश्नों की कमियों और कमजोरियों को जाना जा सके। पायलट सर्वेक्षण प्रश्नों की उपयुक्तता, निर्देशों की स्पष्टता, गणनाकर्ताओं के प्रदर्शन और वास्तविक सर्वेक्षण में लगने वाली लागत और समय का आकलन करने में भी मदद करता है।

गतिविधियाँ

आपको एक ऐसे व्यक्ति से जानकारी एकत्र करनी है, जो भारत के एक दूरदराज के गाँव में रहता है। डेटा संग्रह का कौन सा तरीया उपयुक्त होगा और क्यों? चर्चा करें।

आपको एक स्कूल में शिक्षण की गुणवत्ता के बारे में अभिभावकों का साक्षात्कार करना है। यदि स्कूल का प्रधानाचार्य वहां मौजूद है, तो किस प्रकार की समस्याएं उत्पन्न हो सकती हैं?

4. जनगणना और प्रतिदर्श सर्वेक्षण

जनगणना या पूर्ण गणना

एक सर्वेक्षण, जिसमें जनसंख्या के प्रत्येक तत्व को शामिल किया जाता है, को जनगणना या पूर्ण गणना की विधि के रूप में जाना जाता है। यदि कुछ एजेंसियाँ भारत में कुल जनसंख्या का अध्ययन करने में रुचि रखती हैं, तो उन्हें ग्रामीण और शहरी भारत के सभी घरों से जानकारी प्राप्त करनी होती है। यह हर दस वर्ष में आयोजित की जाती है। घर-घर जाकर पूछताछ की जाती है, जिसमें भारत के सभी घरों को शामिल किया जाता है। जन्म और मृत्यु दर, साक्षरता, रोजगार, जीवन प्रत्याशा, जनसंख्या का आकार और संरचना आदि पर जनसांख्यिकीय आंकड़े भारत के रजिस्ट्रार जनरल द्वारा एकत्र किए जाते हैं और प्रकाशित किए जाते हैं। भारत की अंतिम जनगणना 2011 में आयोजित की गई थी।

जनगणना 2011 के अनुसार, भारत की जनसंख्या 121.09 करोड़ थी, जो 2001 में 102.87 करोड़ थी। जनगणना 1901 से संकेत मिलता है कि देश की जनसंख्या 23.83 करोड़ थी। तब से, 110 वर्षों की अवधि में, देश की जनसंख्या में 97 करोड़ से अधिक की वृद्धि हुई है। जनसंख्या की औसत वार्षिक वृद्धि दर, जो 1971-81 के दशक में 2.2 प्रतिशत प्रति वर्ष थी, 1991-2001 में घटकर 1.97 प्रतिशत और 2001-2011 के दौरान 1.64 प्रतिशत हो गई।

जनसंख्या और प्रतिदर्श

सांख्यिकी में जनसंख्या या ब्रह्मांड का अर्थ है अध्ययन के अधीन सभी इकाइयों की समग्रता। इस प्रकार, जनसंख्या या ब्रह्मांड वह समूह है जिस पर अध्ययन के परिणाम लागू होने हैं। एक जनसंख्या सदैव वे सभी व्यक्ति/इकाइयाँ होती हैं जो सर्वेक्षण के उद्देश्य के अनुसार कुछ विशिष्ट लक्षण (या लक्षणों के समूह) रखते हैं। नमूना चयन का प्रथम कार्य जनसंख्या की पहचान करना है। एक बार जनसंख्या की पहचान हो जाने पर, शोधकर्ता उसका अध्ययन करने की विधि चुनता है। यदि शोधकर्ता पाता है कि सम्पूर्ण जनसंख्या का सर्वेक्षण सम्भव नहीं है, तो वह एक प्रतिनिधि नमूना चुनने का निर्णय ले सकता है। नमूना उस समूह या जनसंख्या के खंड को कहते हैं जिससे सूचना प्राप्त करनी होती है। एक अच्छा नमूना (प्रतिनिधि नमूना) सामान्यतः जनसंख्या से छोटा होता है और बहुत कम लागत तथा कम समय में जनसंख्या के बारे में उचित रूप से सटीक सूचना देने में सक्षम होता है।

मान लीजिए आप किसी निश्चित क्षेत्र के लोगों की औसत आय का अध्ययन करना चाहते हैं। जनगणना विधि के अनुसार, आपको क्षेत्र में प्रत्येक व्यक्ति की आय ज्ञात करनी होगी, उन्हें जोड़ना होगा और व्यक्तियों की संख्या से विभाजित करना होगा ताकि क्षेत्र के लोगों की औसत आय प्राप्त हो सके। इस विधि में भारी व्यय की आवश्यकता होगी, क्योंकि बड़ी संख्या में गणनाकारकों को नियोजित करना पड़ेगा। वैकल्पिक रूप से, आप क्षेत्र से कुछ व्यक्तियों का एक प्रतिनिधि नमूना चुनते हैं और उनकी आय ज्ञात करते हैं। चयनित व्यक्तियों के समूह की औसत आय को पूरे क्षेत्र के व्यक्तियों की औसत आय के अनुमान के रूप में प्रयोग किया जाता है।

उदाहरण

अनुसंधान समस्या: मणिपुर के चुराचंदपुर जिले के कृषि श्रमिकों की आर्थिक स्थिति का अध्ययन करना।
जनसंख्या: चुराचंदपुर जिले के सभी कृषि श्रमिक।
नमूना: चुराचंदपुर जिले के कृषि श्रमिकों का दस प्रतिशत।

अधिकांश सर्वेक्षण नमूना सर्वेक्षण होते हैं। ये सांख्यिकी में कई कारणों से पसंद किए जाते हैं। एक नमूना कम लागत और कम समय में उचित रूप से विश्वसनीय और सटीक सूचना प्रदान कर सकता है। चूंकि नमूने जनसंख्या से छोटे होते हैं, इसलिए गहन पूछताछ करके अधिक विस्तृत सूचना एकत्र की जा सकती है। चूंकि हमें गणनाकारकों की छोटी टीम की आवश्यकता होती है, इसलिए उन्हें प्रशिक्षित करना और उनके कार्य पर प्रभावी रूप से निगरानी रखना आसान होता है। अब प्रश्न यह है कि आप नमूना कैसे चुनते हैं? नमूने चुनने के दो मुख्य प्रकार हैं, यादृच्छिक और अयादृच्छिक।

गतिविधियाँ

भारत और चीन में अगली जनगणना किन वर्षों में होगी?

यदि आपको कक्षा XI की नई अर्थशास्त्र की पाठ्यपुस्तक के बारे में छात्रों की राय जाननी है, तो आपकी जनसंख्या और नमूना क्या होंगे?

यदि कोई शोधकर्ता पंजाब में गेहूं की औसत पैदावार का अनुमान लगाना चाहता है, तो उसकी जनसंख्या और नमूना क्या होंगे?

निम्नलिखित विवरण उनके अंतर को स्पष्ट करेगा।

यादृच्छिक प्रतिदर्शन

जैसा कि नाम से स्पष्ट है, यादृच्छिक प्रतिदर्शन वह है जहाँ जनसंख्या से व्यक्तिगत इकाइयों (नमूनों) का चयन यादृच्छिक रूप से किया जाता है। सरकार किसी विशेष क्षेत्र में पेट्रोल की कीमतों में वृद्धि के घरेलू बजट पर प्रभाव को निर्धारित करना चाहती है। इसके लिए, 30 घरों का एक प्रतिनिधि (यादृच्छिक) नमूना लिया और अध्ययन किया जाना है। उस क्षेत्र के सभी 300 घरों के नाम कागज पर लिखे जाते हैं और मिलाए जाते हैं, फिर 30 नाम एक-एक करके साक्षात्कार के लिए चुने जाते हैं।

यादृच्छिक प्रतिदर्शन में, प्रत्येक व्यक्ति के चुने जाने की समान संभावना होती है। उपरोक्त उदाहरण में, जनसंख्या की सभी 300 प्रतिदर्श इकाइयों (जिन्हें प्रतिदर्श ढांचा भी कहा जाता है) को 30 इकाइयों के नमूने में शामिल होने की समान संभावना मिली और इस प्रकार चुना गया नमूना एक यादृच्छिक नमूना है। इसे लॉटरी विधि भी कहा जाता है। आजकल यादृच्छिक नमूनों का चयन करने के लिए कंप्यूटर कार्यक्रमों का उपयोग किया जाता है।

एग्ज़िट पोल्स

आपने देखा होगा कि जब कोई चुनाव होता है, तो टेलीविज़न नेटवर्क चुनाव कवरेज प्रदान करते हैं। वे परिणामों की भविष्यवाणी करने की भी कोशिश करते हैं। यह एग्ज़िट पोल्स के माध्यम से किया जाता है, जिसमें मतदान केंद्र से बाहर निकलने वाले मतदाताओं के एक यादृच्छिक नमूने से पूछा जाता है कि उन्होंने किसे वोट दिया है। मतदाताओं के नमूने के आंकड़ों से भविष्यवाणी की जाती है। आपने देखा होगा कि एग्ज़िट पोल्स हमेशा सही भविष्यवाणी नहीं करते। क्यों?

गतिविधि

आपको पिछले पचास वर्षों के लिए भारत में खाद्यान्न उत्पादन के रुझान का विश्लेषण करना है। चूंकि सभी वर्षों के लिए आंकड़े इकट्ठा करना कठिन है, आपसे दस वर्षों के उत्पादन का एक नमूना चुनने को कहा गया है।
यादृच्छिक संख्या तालिकाओं का उपयोग करके आप अपने नमूने के वर्षों का चयन कैसे करेंगे?

गैर-यादृच्छिक नमूना चयन

ऐसी स्थिति हो सकती है कि आपको किसी क्षेत्र के 100 घरों में से 10 घरों का चयन करना है। आपको यह तय करना है कि किस घर को चुनना है और किसे छोड़ना है। आप सुविधाजनक रूप से स्थित घरों या उन घरों का चयन कर सकते हैं जो आपको या आपके मित्र को ज्ञात हैं। इस स्थिति में, आप 10 घरों के चयन में अपने विवेक (पूर्वाग्रह) का उपयोग कर रहे हैं। 100 में से 10 घरों के चयन की यह विधि यादृच्छिक चयन नहीं है। गैर-यादृच्छिक नमूना चयन विधि में जनसंख्या की सभी इकाइयों के चयन की समान संभावना नहीं होती है और अन्वेषक की सुविधा या विवेक नमूने के चयन में महत्वपूर्ण भूमिका निभाता है। वे मुख्य रूप से विवेक, उद्देश्य, सुविधा या कोटा के आधार पर चुने जाते हैं और गैर-यादृच्छिक नमूने होते हैं।

5. नमूना और गैर-नमूना त्रुटियाँ

नमूना त्रुटियाँ

संख्यात्मक मानों वाली एक जनसंख्या के दो महत्वपूर्ण लक्षण होते हैं जो यहाँ प्रासंगिक हैं। पहला, केंद्रीय प्रवृत्ति जिसे माध्य, माध्यिका या बहुलक से मापा जा सकता है। दूसरा, फैलाव, जिसे “मानक विचलन”, “माध्य विचलन”, “परास” आदि की गणना करके मापा जा सकता है।

नमूने का उद्देश्य जनसंख्या के प्राचलों का एक या अधिक अनुमान प्राप्त करना है। नमूना त्रुटि नमूना अनुमान और संगत जनसंख्या प्राचल (उदाहरण के लिए औसत आय आदि जनसंख्या के लक्षण का वास्तविक मान) के बीच के अंतर को संदर्भित करती है। इस प्रकार, जनसंख्या के किसी प्राचल के वास्तविक मान और उसके अनुमान (नमूने से) के बीच का अंतर नमूना त्रुटि है। बड़ा नमूना लेकर नमूना त्रुटि की मात्रा को कम करना संभव है।

उदाहरण

मान लीजिए मणिपुर के 5 किसानों की आय का मामला है। चर $\mathrm{x}$ (किसानों की आय) के मान 500, 550, $600,650,700$ हैं। हम देखते हैं कि $(500+550+600+650+700)$ $\div 5=3000 \div 5=600$ जनसंख्या औसत है।

अब, मान लीजिए हम दो व्यक्तियों का नमूना चुनते हैं जहाँ $x$ के मान 500 और 600 हैं। नमूना औसत $(500+600) \div 2$ $=1100 \div 2=550$ है।

यहाँ, अनुमान की नमूना त्रुटि $=600$ (सत्य मान) -550 (अनुमान) $=50$ है।

गैर-नमूना त्रुटियाँ

गैर-प्रतिदर्श त्रुटियाँ प्रतिदर्श त्रुटियों से अधिक गंभीर होती हैं क्योंकि प्रतिदर्श त्रुटि को बड़ा प्रतिदर्श लेकर कम किया जा सकता है। गैर-प्रतिदर्श त्रुटि को कम करना कठिन होता है, यहाँ तक कि बड़ा प्रतिदर्श लेने पर भी। एक जनगणना भी गैर-प्रतिदर्श त्रुटियाँ रख सकती है। कुछ गैर-प्रतिदर्श त्रुटियाँ हैं:

प्रतिदर्श पूर्वाग्रह

प्रतिदर्श पूर्वाग्रह तब होता है जब प्रतिदर्श योजना ऐसी हो कि लक्षित जनसंख्या के कुछ सदस्यों का समावेश प्रतिदर्श में संभव ही न हो।

अननुपस्थिति त्रुटियाँ

अननुपस्थिति तब होती है यदि साक्षात्कारकर्ता प्रतिदर्श में सूचीबद्ध व्यक्ति से संपर्क नहीं कर पाता या प्रतिदर्श से कोई व्यक्ति उत्तर देने से इनकार कर देता है। इस स्थिति में, प्रतिदर्श प्रेक्षण प्रतिनिधित्वपूर्ण नहीं हो सकता।

आंकड़ा अर्जन में त्रुटियाँ

इस प्रकार की त्रुटि गलत उत्तरों के अभिलेखन से उत्पन्न होती है। मान लीजिए, शिक्षक छात्रों से कक्षा में शिक्षक की मेज की लंबाई मापने को कहता है। छात्रों द्वारा माप भिन्न हो सकते हैं। अंतर मापने वाली फीता में अंतर, छात्रों की लापरवाही आदि के कारण हो सकते हैं। इसी प्रकार, मान लीजिए हम संतरे की कीमतों पर आंकड़े इकट्ठा करना चाहते हैं। हम जानते हैं कि कीमतें दुकान से दुकान और बाजार से बाजार भिन्न होती हैं। कीमतें गुणवत्ता के अनुसार भी भिन्न होती हैं। इसलिए, हम केवल औसत कीमतों पर विचार कर सकते हैं। अभिलेखन त्रुटियाँ भी हो सकती हैं क्योंकि गणनाकार्ता या उत्तरदाता आंकड़ों को अभिलेखित या प्रतिलेखित करने में त्रुटियाँ कर सकते हैं, उदाहरण के लिए, वह 31 के बजाय 13 अभिलेखित कर सकता है।

6. भारत की जनगणना और NSSO

कुछ एजेंसियाँ राष्ट्रीय और राज्य स्तर पर सांख्यिकीय आँकड़ों को एकत्र, प्रक्रमित और सारणीबद्ध करने के लिए हैं। राष्ट्रीय स्तर पर कुछ एजेंसियाँ हैं भारत की जनगणना, राष्ट्रीय नमूना सर्वेक्षण (एनएसएस), केंद्रीय सांख्यिकी कार्यालय (सीएसओ), भारत के रजिस्ट्रार जनरल (आरजीआई), व्यापारिक खुफिया और सांख्यिकी महानिदेशालय (डीजीसीआईएस), श्रम ब्यूरो आदि।

भारत की जनगणना जनसंख्या का सबसे पूर्ण और निरंतर जनसांख्यिकीय अभिलेख प्रदान करती है। जनगणना 1881 से प्रत्येक दस वर्ष पर नियमित रूप से आयोजित की जाती है। स्वतंत्रता के बाद पहली जनगणना 1951 में आयोजित की गई थी। जनगणना अधिकारी जनसंख्या के विभिन्न पहलुओं जैसे आकार, घनत्व, लिंग अनुपात, साक्षरता, प्रवास, ग्रामीण-शहरी वितरण आदि पर सूचना एकत्र करते हैं। जनगणना आँकड़ों की व्याख्या और विश्लेषण भारत में कई आर्थिक और सामाजिक मुद्दों को समझने के लिए किया जाता है।

एनएसएस को भारत सरकार द्वारा सामाजिक-आर्थिक मुद्दों पर देशव्यापी सर्वेक्षण करने के लिए स्थापित किया गया था। एनएसएस लगातार क्रमिक दौरों में सर्वेक्षण करता है। एनएसएस द्वारा एकत्रित डेटा रिपोर्टों और इसकी त्रैमासिक पत्रिका सर्वेक्षणा के माध्यम से जारी किया जाता है। एनएसएस साक्षरता, स्कूल नामांकन, शैक्षिक सेवाओं के उपयोग, रोजगार, बेरोजगारी, विनिर्माण और सेवा क्षेत्र के उद्यमों, रोगजननता, प्रसूति, बाल देखभाल, सार्वजनिक वितरण प्रणाली के उपयोग आदि के आवधिक अनुमान प्रदान करता है। एनएसएस का 60वां दौर सर्वेक्षण (जनवरी-जून 2004) रोगजननता और स्वास्थ्य सेवा पर था। एनएसएस का 68वां दौर सर्वेक्षण (2011-12) उपभोक्ता व्यय पर था। एनएसएस विभिन्न वस्तुओं के औद्योगिक गतिविधियों और खुदरा मूल्यों का विवरण भी एकत्र करता है। इनका उपयोग भारत सरकार योजना उद्देश्यों के लिए करती है।

7. निष्कर्ष

आर्थिक तथ्य, जिन्हें संख्याओं के रूप में व्यक्त किया जाता है, डेटा कहलाते हैं। डेटा संग्रह का उद्देश्य किसी समस्या और उसके पीछे के कारणों को समझना, समझाना और विश्लेषण करना है। प्राथमिक डेटा सर्वेक्षण करके प्राप्त किया जाता है। सर्वेक्षण में विभिन्न चरण होते हैं, जिनकी सावधानी से योजना बनानी होती है। विभिन्न एजेंसियां हैं जो सांख्यिकीय डेटा एकत्रित, संसाधित, सारणीबद्ध और प्रकाशित करती हैं। इनका उपयोग द्वितीयक डेटा के रूप में किया जाता है। हालांकि, डेटा स्रोत और डेटा संग्रह की विधि का चयन अध्ययन के उद्देश्य पर निर्भर करता है।

सारांश

आँकड़ा एक ऐसा उपकरण है जो किसी भी समस्या पर तर्कसंगत निष्कर्ष तक पहुँचने में मदद करता है।

प्राथमिक आँकड़ा प्रथम-हस्त सूचना पर आधारित होता है।

सर्वेक्षण व्यक्तिगत साक्षात्कार, प्रश्नावली भेजने और टेलीफोन साक्षात्कार द्वारा किया जा सकता है।

जनगणना जनसंख्या से सम्बद्ध प्रत्येक व्यक्ति/इकाई को सम्मिलित करती है।

नमूना जनसंख्या से चयनित एक छोटा समूह है जिससे सम्बद्ध सूचना प्राप्त की जाती है।

यादृच्छिक प्रतिदर्श में प्रत्येक व्यक्ति को सूचना देने के लिए चयनित होने का समान अवसर दिया जाता है।

प्रतिदर्श त्रुटि प्रतिदर्श अनुमान के मान और सम्बद्ध जनसंख्या प्राचल के मान के अंतर के कारण होती है।

गैर-प्रतिदर्श त्रुटियाँ आँकड़ा अधिग्रहण में, अप्रतिसाद के कारण या चयन में पूर्वाग्रह के कारण उत्पन्न हो सकती हैं।

भारत की जनगणना और राष्ट्रीय नमूना सर्वेक्षण दो महत्वपूर्ण राष्ट्रीय स्तर की एजेंसियाँ हैं जो कई महत्वपूर्ण आर्थिक और सामाजिक मुद्दों पर आँकड़े एकत्रित, संसाधित और सारणीबद्ध करती हैं।

अभ्यास

1. निम्नलिखित प्रश्नों के लिए कम-से-कम चार उपयुक्त बहुविकल्पी विकल्प बनाइए:

(i) नया पोशाक खरीदते समय निम्नलिखित में से कौन-सी बात सबसे अधिक महत्वपूर्ण है?

(ii) आप कितनी बार कंप्यूटर का उपयोग करते हैं?

(iii) आप नियमित रूप से कौन-से समाचार-पत्र पढ़ते हैं?

(iv) पेट्रोल की कीमत में वृद्धि उचित है।

(v) आपके परिवार की मासिक आय कितनी है?

2. पाँच द्वि-मार्गी प्रश्न (‘हाँ’ या ‘नहीं’) बनाइए।

3. निम्नलिखित कथनों के सत्य या असत्य होने की घोषणा कीजिए।

(i) आँकड़ों के कई स्रोत होते हैं।

(ii) जब जनसंख्या साक्षर हो और एक बड़े क्षेत्र में फैली हो, तो टेलीफोन सर्वे डेटा एकत्र करने की सबसे उपयुक्त विधि है।

(iii) जांचकर्ता द्वारा एकत्र किया गया डेटा द्वितीयक डेटा कहलाता है।

(iv) प्रतिदर्शों के यादृच्छिक चयन के बाहर चयन में एक निश्चित पूर्वाग्रह शामिल होता है।

(v) गैर-प्रतिदर्श त्रुटियों को बड़े प्रतिदर्श लेकर न्यूनतम किया जा सकता है।

4. आप निम्नलिखित प्रश्नों के बारे में क्या सोचते हैं? क्या आपको इन प्रश्नों में कोई समस्या दिखाई देती है? वर्णन कीजिए।

(i) आप सबसे नज़दीकी बाज़ार से कितनी दूर रहते हैं?

(ii) यदि प्लास्टिक थैलियाँ हमारे कूड़े-कचरे की केवल 5 प्रतिशत हैं, तो क्या उन्हें प्रतिबंधित किया जाना चाहिए?

(iii) क्या आप पेट्रोल की कीमत में वृद्धि के विरोध में नहीं होंगे?

(iv) क्या आप रासायनिक उर्वरकों के उपयोग से सहमत हैं?

(v) क्या आप अपने खेतों में उर्वरक उपयोग करते हैं?

(vi) आपके खेत में प्रति हेक्टेयर उपज क्या है?

5. आप बच्चों के बीच वेजिटेबल अट्टा नूडल्स की लोकप्रियता पर शोध करना चाहते हैं। इस जानकारी को एकत्र करने के लिए एक उपयुक्त प्रश्नावली तैयार कीजिए।

6. 200 खेतों वाले एक गाँव में फसल पैटर्न जानने के लिए एक अध्ययन किया गया। सर्वेक्षण किए गए 50 खेतों में से 50% ने केवल गेहूँ उगाया। जनसंख्या और प्रतिदर्श आकार क्या है?

7. प्रतिदर्श, जनसंख्या और चर के दो-दो उदाहरण दीजिए।

8. निम्नलिखित में से कौन-सी विधि बेहतर परिणाम देती है और क्यों?

(a) जनगणना

(b) प्रतिदर्श

9. निम्नलिखित में से कौन-सी त्रुटि अधिक गंभीर है और क्यों?

(a) प्रतिदर्श त्रुटि

(b) गैर-प्रतिदर्श त्रुटि

१०. मान लीजिए आपकी कक्षा में १० विद्यार्थी हैं। आप उनमें से तीन को चुनना चाहते हैं। कितने नमूने सम्भव हैं?

११. चर्चा कीजिए कि आप १० में से ३ विद्यार्थियों को चुनने के लिए लॉटरी विधि का प्रयोग कैसे करेंगे।

१२. क्या लॉटरी विधि सदैव आपको यादृच्छिक नमूना देती है? व्याख्या कीजिए।

१३. यादृच्छिक संख्या सारणियों का प्रयोग करके १० में से ३ विद्यार्थियों का यादृच्छिक नमूना चुनने की प्रक्रिया की व्याख्या कीजिए।

१४. क्या नमूने सर्वेक्षणों की तुलना में बेहतर परिणाम देते हैं? अपने उत्तर के कारण दीजिए।

अध्याय 02 डेटा का संग्रह

1. परिचय

2. डेटा के स्रोत क्या हैं?

3. हम डेटा कैसे एकत्र करते हैं?

उपकरण की तैयारी

डेटा संग्रह की विधि

पायलट सर्वेक्षण

4. जनगणना और प्रतिदर्श सर्वेक्षण

जनगणना या पूर्ण गणना

जनसंख्या और प्रतिदर्श

यादृच्छिक प्रतिदर्शन

गैर-यादृच्छिक नमूना चयन

5. नमूना और गैर-नमूना त्रुटियाँ

नमूना त्रुटियाँ

गैर-नमूना त्रुटियाँ

6. भारत की जनगणना और NSSO

7. निष्कर्ष

अभ्यास

RRB GROUP D

RRB NTPC

RPF SI

RPF CONSTABLE

RRB JE

RRB ALP

RRB TECHNICIAN

NCERT Books

Important Resources

Forums