अध्याय 03 डेटा का संगठन

1. भूमिका

पिछले अध्याय में आपने सीखा कि आँकड़े कैसे एकत्र किए जाते हैं। आपको यह भी पता चला कि जनगणना और प्रतिदर्श में क्या अंतर होता है। इस अध्याय में आप जानेंगे कि आपके द्वारा एकत्र किए गए आँकड़ों को किस प्रकार वर्गीकृत किया जाता है। कच्चे आँकड़ों को वर्गीकृत करने का उद्देश्य उनमें क्रम लाना होता है ताकि उन्हें आगे सांख्यिकीय विश्लेषण के लिए आसानी से प्रयोग किया जा सके।

क्या आपने कभी अपने स्थानीय कबाड़ी को देखा है जिसे आप पुराने अख़बार, टूटे-फूटे घरेलू सामान, खाली काँच की बोतलें, प्लास्टिक आदि बेचते हैं? वह ये चीज़ें आपसे खरीदता है और उन्हें उन लोगों को बेच देता है जो इनका पुनर्चक्रण करते हैं। लेकिन इतना सारा कबाड़ उसकी दुकान में होने पर, यदि वह उन्हें ठीक से संगठित न करे, तो अपना व्यापार चलाना बहुत मुश्किल हो जाएगा। अपनी स्थिति को आसान बनाने के लिए वह विभिन्न कबाड़ों को उपयुक्त रूप से समूहों या “वर्गों” में बाँटता है। वह पुराने अख़बारों को एक साथ रखता है और उन्हें रस्सी से बाँध देता है। फिर सभी खाली काँच की बोतलों को एक बोरी में इकट्ठा करता है। वह धातुओं की वस्तुओं को अपनी दुकान के एक कोने में ढेर लगाता है और उन्हें “लोहा”, “ताँबा”, “एल्युमिनियम”, “पीतल” आदि जैसे समूहों में बाँटता है। इस प्रकार वह अपने कबाड़ को विभिन्न वर्गों - “अख़बार”, “प्लास्टिक”, “काँच”, “धातु” आदि - में बाँटता है और उनमें क्रम लाता है। एक बार जब उसका कबाड़ व्यवस्थित और वर्गीकृत हो जाता है, तो किसी खास वस्तु को खोजना, जो कोई खरीददार माँगे, आसान हो जाता है।

इसी प्रकार जब आप अपनी स्कूल की किताबों को एक निश्चित क्रम में व्यवस्थित करते हैं, तो उन्हें संभालना आसान हो जाता है। आप उन्हें विषयों के अनुसार वर्गीकृत कर सकते हैं जहाँ प्रत्येक विषय एक समूह या वर्ग बन जाता है। इसलिए, जब आपको किसी विशेष इतिहास की किताब की आवश्यकता होती है, उदाहरण के लिए, तो आपको बस “इतिहास” समूह में वह किताब खोजनी होती है। अन्यथा, आपको अपनी पूरी संग्रह में उस विशेष किताब को खोजना पड़ता।

जबकि वस्तुओं या चीजों का वर्गीकरण हमारा बहुमूल्य समय और प्रयास बचाता है, यह एक arbitrary तरीके से नहीं किया जाता है। कबाड़ीवाला अपने कबाड़ को पुन: प्रयुक्त वस्तुओं के बाजारों के अनुसार समूहों में बाँटता है। उदाहरण के लिए, “काँच” समूह के अंतर्गत वह खाली बोतलें, टूटे हुए दर्पण और खिड़कियों के काँच आदि रखता है। इसी प्रकार जब आप अपनी इतिहास की किताबों को “इतिहास” समूह में रखते हैं, तो आप उस समूह में किसी अन्य विषय की किताब नहीं रखेंगे। अन्यथा समूह बनाने का पूरा उद्देश्य समाप्त हो जाएगा। वर्गीकरण, इसलिए, किसी मानदंड के आधार पर चीजों को समूहों या वर्गों में व्यवस्थित करना है।

गतिविधि

  • अपने स्थानीय डाकघर जाकर पता करें कि पत्रों को कैसे छाँटा जाता है। क्या आप जानते हैं कि पत्र में दिया गया पिन-कोड क्या दर्शाता है? अपने डाकिया से पूछें।

2. कच्चा आँकड़ा

कबड़ीवाले के कबाड़ की तरह, अवर्गीकृत डेटा या कच्चा डेटा अत्यधिक असंगठित होता है। वे अक्सर बहुत बड़े और संभालने में कठिन होते हैं। इनसे सार्थक निष्कर्ष निकालना एक थकाऊ कार्य है क्योंकि ये आसानी से सांख्यिकीय विधियों के अधीन नहीं होते। इसलिए किसी भी व्यवस्थित सांख्यिकीय विश्लेषण से पहले ऐसे डेटा की उचित संगठना और प्रस्तुति आवश्यक है। इसलिए डेटा एकत्र करने के बाद अगला चरण उन्हें संगठित करना और वर्गीकृत रूप में प्रस्तुत करना है।

मान लीजिए आप विद्यार्थियों की गणित में प्रदर्शन जानना चाहते हैं और आपने अपने स्कूल के 100 विद्यार्थियों के गणित में अंकों का डेटा एकत्र किया है। यदि आप उन्हें एक सारणी के रूप में प्रस्तुत करें, तो वे कुछ इस तरह दिखाई दे सकते हैं जैसे तालिका 3.1।

तालिका 3.1 एक परीक्षा में 100 विद्यार्थियों द्वारा प्राप्त गणित में अंक

47 45 10 60 51 56 66 100 49 40
60 59 56 55 62 48 59 55 51 41
42 69 64 66 50 59 57 65 62 50
64 30 37 75 17 56 20 14 55 90
62 51 55 14 25 34 90 49 56 54
70 47 49 82 40 82 60 85 65 66
49 44 64 69 70 48 12 28 55 65
49 40 25 41 71 80 0 56 14 22
66 53 46 70 43 61 59 12 30 35
45 44 57 76 82 39 32 14 90 25

  1. या आप अपने पड़ोस की 50 घरों पर खाद्य पर मासिक खर्च का डेटा इकट्ठा कर सकते हैं ताकि उनका खाद्य पर औसत खर्च पता चले। ऐसा डेटा इकट्ठा करने पर, यदि आप उसे तालिका के रूप में प्रस्तुत करें, तो वह तालिका 3.2 जैसा दिखेगा। तालिका 3.1 और 3.2 दोनों में आपको कच्चा या वर्गीकृत नहीं किया गया डेटा मिलेगा। दोनों तालिकाओं में आप देखेंगे कि संख्याएं किसी भी क्रम में व्यवस्थित नहीं हैं। अब यदि आपसे तालिका 3.1 से गणित में सबसे ऊंचे अंक पूछे जाएं, तो आपको पहले 100 विद्यार्थियों के अंक या तो बढ़ते क्रम में या घटते क्रम में व्यवस्थित करने होंगे। यह एक थकाने वाला कार्य है। यह और भी थकाने वाला हो जाता है, यदि 100 की जगह आपके पास 1,000 विद्यार्थियों के अंक हों। इसी प्रकार, तालिका 3.2 में आप देखेंगे कि 50 घरों का औसत मासिक खर्च निकालना आपके लिए कठिन है। और यह कठिनाई कई गुना बढ़ जाती है, यदि संख्या बड़ी हो – जैसे 5,000 घर। जैसे हमारे कबाड़ीवाले को बड़े और व्यवस्थित नहीं किए गए कबाड़ में कोई विशेष वस्तु ढूंढने में परेशानी होती है, वैसे ही आपको बड़े और वर्गीकृत नहीं किए गए डेटा से कोई भी जानकारी निकालने में समान परेशानी का सामना करना पड़ता है। एक शब्द में, इसलिए, बड़े और वर्गीकृत नहीं किए गए डेटा से जानकारी निकालना एक थकाने वाला कार्य है।

The provided text appears to be a fragment of HTML markup language, possibly a template or a portion of a webpage. It includes what looks like a placeholder or a marker for dynamic content insertion: {{Safesubst:}} is a Wikimedia-specific template function used for safe substitution of variables or content. The text also contains numerous pipe symbols (|) which could be part of a table formatting or delimiter syntax. However, without actual content or context, its purpose is unclear. It could be:

  1. A fragment of a larger HTML table or form
  2. A malformed or incomplete table
  3. A template with empty variables

The repetition of pipes (|) without content suggests it might be:

  • A table structure with no data
  • A template waiting for substitution
  • Corrupted or incomplete data

Without more context or surrounding HTML, its function is ambiguous. It might be:

  • A placeholder for dynamic content
  • An incomplete table
  • A formatting error

If you intended to include a table or data, it seems to be missing. Please provide more context or check the formatting.

कच्चे आंकड़े चरों पर प्रेक्षणों से बने होते हैं। तालिका 3.1 और 3.2 में दिए गए कच्चे आंकड़े किसी विशिष्ट चर या चरों के समूह पर प्रेक्षणों से बने होते हैं। उदाहरण के लिए तालिका 3.1 देखिए जिसमें 100 विद्यार्थियों द्वारा गणित में प्राप्त अंक दिए गए हैं। हम इन अंकों का अर्थ कैसे निकाल सकते हैं? इन अंकों को देखते हुए गणित की शिक्षिका सोच रही होगी—मेरे विद्यार्थियों ने कैसा प्रदर्शन किया है? कितने अनुत्तीर्ण हुए हैं? हम आंकड़ों को कैसे वर्गीकृत करते हैं, यह इस बात पर निर्भर करता है कि हमारा उद्देश्य क्या है। इस स्थिति में शिक्षिका यह गहराई से समझना चाहती है कि इन विद्यार्थियों ने कैसा प्रदर्शन किया है। वह संभवतः बारंबारता बंटन बनाना चुनेगी। इसकी चर्चा अगले खंड में की गई है।

गतिविधि

  • अपने परिवार के कुल साप्ताहिक व्यय का एक वर्ष का आंकड़ा एकत्र कीजिए और उसे एक तालिका में व्यवस्थित कीजिए। देखिए आपके पास कितने प्रेक्षण हैं। आंकड़ों को मासिक रूप से व्यवस्थित कीजिए और प्रेक्षणों की संख्या ज्ञात कीजिए।

3. आंकड़ों का वर्गीकरण

वर्गीकरण के समूह या वर्ग विभिन्न तरीकों से किए जाते हैं। अपनी पुस्तकों को विषयों के अनुसार—“इतिहास”, “भूगोल”, “गणित”, “विज्ञान” आदि—वर्गीकृत करने के बजाय आप उन्हें लेखक के नाम के अनुसार वर्णमाला क्रम में भी वर्गीकृत कर सकते हैं। या आप उन्हें प्रकाशन वर्ष के अनुसार भी वर्गीकृत कर सकते हैं। आप उन्हें जिस तरह वर्गीकृत करना चाहेंगे, वह आपकी आवश्यकता पर निर्भर करेगा।

इसी प्रकार कच्चे आंकड़ों को विभिन्न प्रकार से उद्देश्य के अनुसार वर्गीकृत किया जाता है। इन्हें समय के अनुसार समूहित किया जा सकता है। ऐसी वर्गीकरण को कालानुक्रमिक वर्गीकरण (Chronological Classification) कहा जाता है। इस वर्गीकरण में आंकड़ों को वर्ष, तिमाही, माह, सप्ताह आदि के संदर्भ में आरोही या अवरोही क्रम में वर्गीकृत किया जाता है। निम्नलिखित उदाहरण भारत की जनसंख्या को वर्षों के संदर्भ में वर्गीकृत करता है। ‘जनसंख्या’ चर एक समय श्रृंखला (Time Series) है क्योंकि यह विभिन्न वर्षों के लिए मानों की एक श्रृंखला दर्शाता है।

उदाहरण 1

भारत की जनसंख्या (करोड़ों में)

वर्ष जनसंख्या (करोड़ों में)
1951 35.7
1961 43.8
1971 54.6
1981 68.4
1991 81.8
2001 102.7
2011 121.0

स्थानिक वर्गीकरण (Spatial Classification) में आंकड़ों को देश, राज्य, शहर, जिला आदि भौगोलिक स्थानों के संदर्भ में वर्गीकृत किया जाता है।

उदाहरण 2 विभिन्न देशों में गेहूं की पैदावार दिखाता है।

उदाहरण 2

विभिन्न देशों में गेहूं की पैदावार (2013)

देश गेहूं की पैदावार (किग्रा/हेक्टेयर)
कनाडा 3594
चीन 5055
फ्रांस 7254
जर्मनी 7998
भारत 3154
पाकिस्तान 2787

स्रोत: इंडियन एग्रीकल्चरल स्टेटिस्टिक्स एट अ ग्लांस, 2015

गतिविधियाँ

  • उदाहरण 1 में उन वर्षों का पता लगाएँ जब भारत की जनसंख्या न्यूनतम और अधिकतम थी,
  • उदाहरण 2 में उस देश को खोजें जिसकी गेहूँ की पैदावार भारत की तुलना में थोड़ी अधिक है। वह प्रतिशत के रूप में कितनी होगी?
  • उदाहरण 2 के देशों को पैदावार के आरोही क्रम में व्यवस्थित करें। पैदावार के अवरोही क्रम के लिए भी वही अभ्यास करें।

कभी-कभी आप ऐसी विशेषताओं से मिलते हैं जिन्हें मात्रात्मक रूप से व्यक्त नहीं किया जा सकता। ऐसी विशेषताओं को गुणवत्तापूर्ण या गुणधर्म कहा जाता है। उदाहरण के लिए, राष्ट्रीयता, साक्षरता, धर्म, लिंग, वैवाहिक स्थिति आदि। इन्हें मापा नहीं जा सकता। फिर भी इन गुणधर्मों को किसी गुणात्मक विशेषता की उपस्थिति या अनुपस्थिति के आधार पर वर्गीकृत किया जा सकता है। गुणधर्मों पर आधारित ऐसे आँकड़ों का वर्गीकरण गुणात्मक वर्गीकरण कहलाता है। निम्नलिखित उदाहरण में हम पाते हैं कि किसी देश की जनसंख्या को गुणात्मक चर “लिंग” के आधार पर समूहबद्ध किया गया है। एक प्रेक्षण या तो पुरुष हो सकता है या महिला। इन दो विशेषताओं को वैवाहिक स्थिति के आधार पर आगे वर्गीकृत किया जा सकता है जैसा नीचे दिया गया है:

उदाहरण 3

प्रथम चरण का वर्गीकरण एक गुण की उपस्थिति और अनुपस्थिति, अर्थात् पुरुष या अपुरुष (स्त्री), के आधार पर किया जाता है। द्वितीय चरण में, प्रत्येक वर्ग - पुरुष और स्त्री - को एक अन्य गुण, अर्थात् विवाहित या अविवाहित होने, की उपस्थिति और अनुपस्थिति के आधार पर और उपविभाजित किया जाता है। ऊँचाई, वजन, आयु, आय, छात्रों के अंक आदि विशेषताएँ प्रकृति में मात्रात्मक होती हैं। जब ऐसी विशेषताओं के संग्रहित आँकड़ों को वर्गों में समूहीकृत किया जाता है, तो यह मात्रात्मक वर्गीकरण बन जाता है।

गतिविधि

  • आसपास की वस्तुओं को जीवित या अजीवित के रूप में समूहीकृत किया जा सकता है। क्या यह मात्रात्मक वर्गीकरण है?

उदाहरण 4

100 छात्रों के गणित में अंकों का बारंबारता बंटन

अंक बारंबारता
0-10 1
10-20 8
20-30 6
30-40 7
40-50 21
50-60 23
60-70 19
70-80 6
80-90 5
90-100 4
योग 100

उदाहरण 4 में सारणी 3.1 में दिए गए 100 छात्रों के गणित के अंकों का मात्रात्मक वर्गीकरण दिखाया गया है।

गतिविधि

  • उदाहरण 4 की बारंबारता के मानों को कुल बारंबारता के अनुपात या प्रतिशत के रूप में व्यक्त करें। ध्यान दें कि इस प्रकार व्यक्त की गई बारंबारता को सापेक्ष बारंबारता कहा जाता है।
  • उदाहरण 4 में, किस वर्ग में आँकड़ों की अधिकतम सांद्रता है? इसे कुल प्रेक्षणों के प्रतिशत के रूप में व्यक्त करें। किस वर्ग में आँकड़ों की न्यूनतम सांद्रता है?

4. चर: सतत और विविक्त

एक सरल परिभाषा चर की, जिसे आपने पिछले अध्याय में पढ़ा है, यह नहीं बताती कि वह कैसे भिन्न होता है। चर विशिष्ट मानदंडों के आधार पर भिन्न होते हैं। इन्हें व्यापक रूप से दो प्रकारों में वर्गीकृत किया गया है:

(i) सतत और

(ii) विच्छिन्न।

एक सतत चर कोई भी संख्यात्मक मान ले सकता है। यह पूर्णांक मान $(1,2,3,4, \ldots)$, भिन्न मान $(1 / 2,2 / 3,3 / 4, \ldots)$, और ऐसे मान भी ले सकता है जो ठीक भिन्न नहीं होते $(\sqrt{2}=1.414$, $\sqrt{3}=1.732, \ldots, \sqrt{7}=2.645$ )। उदाहरण के लिए, किसी विद्यार्थी की ऊँचाई, जैसे वह बढ़ता है मान लीजिए 90 सेंटीमीटर से 150 सेंटीमीटर तक, इनके बीच के सभी मान लेगी। यह पूर्ण संख्याओं जैसे 90 सेंटीमीटर, 100 सेंटीमीटर, 108 सेंटीमीटर, 150 सेंटीमीटर जैसे मान ले सकती है। यह भिन्न मान भी ले सकती है जैसे 90.85 सेंटीमीटर, 102.34 सेंटीमीटर, 149.99 सेंटीमीटर आदि जो पूर्ण संख्याएँ नहीं हैं। इस प्रकार चर “ऊँचाई” हर संभावित मान को प्रकट करने में सक्षम है और इसके मानों को अनंत विभाजनों में भी तोड़ा जा सकता है। सतत चर के अन्य उदाहरण हैं वजन, समय, दूरी आदि।

एक सतत चर के विपरीत, एक विचरित चर केवल निश्चित मान ही ले सकता है। इसका मान केवल परिमित “छलांगों” से ही बदलता है। यह एक मान से दूसरे मान पर “छलांग” लगाता है लेकिन इन दोनों के बीच का कोई मध्यवर्ती मान नहीं लेता। उदाहरण के लिए, एक चर जैसे “कक्षा में विद्यार्थियों की संख्या”, विभिन्न कक्षाओं के लिए, केवल पूर्ण संख्याओं के मान ही ग्रहण करेगा। यह कोई भी भिन्नात्मक मान जैसे 0.5 नहीं ले सकता क्योंकि “आधा विद्यार्थी” व्यर्थ है। इसलिए यह 25 और 26 के बीच 25.5 जैसा मान नहीं ले सकता। इसके बजाय इसका मान या तो 25 हो सकता था या 26। हम देखते हैं कि जैसे ही इसका मान 25 से 26 बदलता है, इनके बीच के मान — भिन्न — इसके द्वारा नहीं लिए जाते। लेकिन हमें यह धारणा नहीं होनी चाहिए कि एक विचरित चर कोई भिन्नात्मक मान नहीं ले सकता। मान लीजिए $X$ एक चर है जो $1/8, 1/16, 1/32, 1/64, \ldots$ जैसे मान लेता है। क्या यह एक विचरित चर है? हाँ, क्योंकि यद्यपि $\mathrm{X}$ भिन्नात्मक मान लेता है, यह दो निकटतम भिन्नात्मक मानों के बीच का कोई भी मान नहीं ले सकता। यह $1/8$ से $1/16$ और $1/16$ से $1/32$ पर “छलांग” लगाता है। लेकिन यह $1/8$ और $1/16$ या $1/16$ और $1/32$ के बीच का कोई मान नहीं ले सकता।

गतिविधि

  • निम्नलिखित चरों को सतत और विचरित के रूप में भेद कीजिए: क्षेत्रफल, आयतन, तापमान, पासे पर आने वाली संख्या, फसल उत्पादन, जनसंख्या, वर्षा, सड़क पर कारों की संख्या और आयु।

उदाहरण 4 दिखाता है कि 100 छात्रों के अंकों को वर्गों में कैसे समूहित किया गया है। आप सोच रहे होंगे कि हमने यह तालिका 3.1 के कच्चे आंकड़ों से कैसे प्राप्त किया। लेकिन, इस प्रश्न को हल करने से पहले, आपको यह जानना होगा कि बारंबारता बंटन क्या होता है।

5. बारंबारता बंटन क्या है?

बारंबारता बंटन किसी मात्रात्मक चर के कच्चे आंकड़ों को वर्गीकृत करने का एक समग्र तरीका है। यह दिखाता है कि चर के विभिन्न मान (यहाँ, किसी छात्र द्वारा गणित में प्राप्त किए गए अंक) विभिन्न वर्गों में कैसे बंटे हैं, साथ ही उनके संगत वर्ग बारंबारताएँ। इस मामले में हमारे पास अंकों के दस वर्ग हैं: $0-10,10-20, \ldots$, 90-100। वर्ग बारंबारता शब्द का अर्थ है किसी विशेष वर्ग में मानों की संख्या। उदाहरण के लिए, वर्ग 30-40 में हमें तालिका 3.1 के कच्चे आंकड़ों से 7 अंक मिलते हैं। वे हैं $30,37,34,30,35,39,32$। इस प्रकार वर्ग: $30-40$ की बारंबारता 7 है। लेकिन आप सोच रहे होंगे कि कच्चे आंकड़ों में दो बार आ रहा $40-$ वर्ग 30-40 में क्यों नहीं शामिल किया गया। यदि इसे शामिल किया जाता तो वर्ग 30-40 की बारंबारता 7 के बजाय 9 होती। यह पहेली आपके लिए स्पष्ट हो जाएगी यदि आप इस अध्याय को धैर्यपूर्वक पढ़ते हैं। तो आगे बढ़िए। आप स्वयं उत्तर पा लेंगे।

प्रत्येक वर्ग एक आवृत्ति बंटन सारणी में वर्ग सीमाओं से घिरा होता है। वर्ग सीमाएँ एक वर्ग के दो छोर होती हैं। सबसे कम मान को निम्न वर्ग सीमा कहा जाता है और सबसे अधिक मान को उच्च वर्ग सीमा। उदाहरण के लिए, वर्ग: 60-70 के लिए वर्ग सीमाएँ 60 और 70 हैं। इसकी निम्न वर्ग सीमा 60 है और इसकी उच्च वर्ग सीमा 70 है। वर्ग अंतराल या वर्ग चौड़ाई उच्च वर्ग सीमा और निम्न वर्ग सीमा के बीच का अंतर होता है। वर्ग 60-70 के लिए, वर्ग अंतराल 10 है (उच्च वर्ग सीमा माइनस निम्न वर्ग सीमा)।

वर्ग मध्य-बिंदु या वर्ग चिह्न एक वर्ग का मध्य मान होता है। यह एक वर्ग की निम्न वर्ग सीमा और उच्च वर्ग सीमा के बीच आधे रास्ते पर स्थित होता है और निम्नलिखित तरीके से ज्ञात किया जा सकता है:

वर्ग मध्य-बिंदु या वर्ग चिह्न

$$ \text { = (उच्च वर्ग सीमा + निम्न वर्ग सीमा)/2 } $$

प्रत्येक वर्ग का वर्ग चिह्न या मध्य-मान वर्ग को दर्शाने के लिए प्रयोग किया जाता है। एक बार कच्चे आंकड़ों को वर्गों में समूहबद्ध कर दिया जाता है, तो व्यक्तिगत प्रेक्षण आगे की गणनाओं में प्रयोग नहीं किए जाते। इसके बजाय, वर्ग चिह्न का उपयोग किया जाता है।

TABLE 3.3 The Lower Class Limits, the Upper Class Limits and the Class Mark

वर्ग आवृत्ति निम्न वर्ग सीमा उच्च वर्ग सीमा वर्ग चिह्न
0-10 1 0 10 5
10-20 8 10 20 15
20-30 6 20 30 25
30-40 7 30 40 35
40-50 21 40 50 45
50-60 23 50 60 55
60-70 19 60 70 65
70-80 6 70 80 75
80-90 5 80 90 85
90-100 4 90 100 95

आवृत्ति वक्र एक आवृत्ति बंटन का आलेखीय चित्रण होता है। चित्र 3.1 हमारे उपरोक्त उदाहरण के आँकड़ों के आवृत्ति बंटन की आरेखीय प्रस्तुति दिखाता है। आवृत्ति वक्र प्राप्त करने के लिए हम वर्ग चिह्नों को $\mathrm{X}$-अक्ष पर और आवृत्ति को $\mathrm{Y}$-अक्ष पर लगाते हैं।

चित्र 3.1: आँकड़ों के आवृत्ति बंटन की आरेखीय प्रस्तुति।

आवृत्ति बंटन तैयार करना

आवृत्ति बंटन तैयार करते समय निम्नलिखित पाँच प्रश्नों का समाधान करना आवश्यक होता है:

  1. क्या हमें समान या असमान आकार की वर्ग अंतराल रखने चाहिए?
  2. हमें कितने वर्ग रखने चाहिए?
  3. प्रत्येक वर्ग का आकार क्या होना चाहिए?
  4. वर्ग सीमाओं का निर्धारण कैसे करें?
  5. प्रत्येक वर्ग के लिए आवृत्ति कैसे प्राप्त करें?

क्या हमें समान या असमान आकार की वर्ग अंतराल रखने चाहिए?

दो ऐसी परिस्थितियाँ होती हैं जिनमें असमान आकार के अंतरालों का प्रयोग किया जाता है। पहली, जब हमारे पास आय और अन्य इसी तरह के चरों पर आँकड़े हों जिनकी सीमा बहुत अधिक हो। उदाहरण के लिए, प्रतिदिन आय लगभग शून्य से लेकर सैकड़ों करोड़ रुपये तक हो सकती है। ऐसी परिस्थिति में समान वर्ग अंतराल उपयुक्त नहीं होते क्योंकि (i) यदि वर्ग अंतराल मध्यम आकार के और समान हों तो वर्गों की संख्या बहुत अधिक हो जाएगी। (ii) यदि वर्ग अंतराल बड़े हों तो हम या तो बहुत कम स्तर या बहुत अधिक स्तर की आय की सूचना को दबा देंगे।

दूसरी, यदि बड़ी संख्या में मान सीमा के एक छोटे भाग में केंद्रित हों तो समान वर्ग अंतरालों से कई मानों की सूचना की कमी हो जाएगी।

अन्य सभी परिस्थितियों में, बारंबारता बंटनों में समान आकार के वर्ग अंतरालों का प्रयोग किया जाता है।

हमें कितने वर्ग होने चाहिए?

वर्गों की संख्या सामान्यतः छः से पंद्रह के बीच होती है। यदि हम समान आकार के वर्ग अंतरालों का प्रयोग कर रहे हों तो वर्गों की संख्या को सीमा (चर के सबसे बड़े और सबसे छोटे मानों के बीच का अंतर) को वर्ग अंतराल के आकार से भाग देकर परिकलित किया जा सकता है।

गतिविधियाँ

निम्नलिखित की सीमा ज्ञात कीजिए:

  • उदाहरण 1 में भारत की जनसंख्या,
  • उदाहरण 2 में गेहूँ की पैदावार।

प्रत्येक वर्ग का आकार कितना होना चाहिए?

इस प्रश्न का उत्तर पिछले प्रश्न के उत्तर पर निर्भर करता है। चर की सीमा दी गई होने पर, एक बार जब हम वर्ग अंतराल तय कर लेते हैं तो हम वर्गों की संख्या निर्धारित कर सकते हैं। इस प्रकार हम पाते हैं कि ये दोनों निर्णय आपस में जुड़े हुए हैं। हम एक का निर्णय दूसरे के बिना नहीं ले सकते।

उदाहरण 4 में, हमारे पास वर्गों की संख्या 10 है। सीमा का मान 100 दिया गया है, इसलिए वर्ग अंतराल स्वचालित रूप से 10 हो जाते हैं। ध्यान दें कि वर्तमान संदर्भ में हमने समान परिमाण के वर्ग अंतराल चुने हैं। हालांकि, हम ऐसे वर्ग अंतराल भी चुन सकते थे जो समान परिमाण के नहीं होते। उस स्थिति में वर्ग असमान चौड़ाई वाले होते।

हमें वर्ग सीमाएँ कैसे निर्धारित करनी चाहिए?

वर्ग सीमाएँ निश्चित और स्पष्ट रूप से बताई जानी चाहिए। सामान्यतः, खुले वर्ग जैसे “70 और अधिक” या “10 से कम” वांछनीय नहीं होते हैं।

निचली और ऊपरी वर्ग सीमाएँ इस प्रकार निर्धारित की जानी चाहिए कि प्रत्येक वर्ग की बारंबारताएँ वर्ग अंतराल के मध्य में केंद्रित हों।

वर्ग अंतराल दो प्रकार के होते हैं:

(i) समावेशी वर्ग अंतराल: इस स्थिति में, किसी वर्ग की निचली और ऊपरी सीमा के बराबर मान उसी वर्ग की बारंबारता में शामिल किए जाते हैं।

(ii) अपवर्जी वर्ग अंतराल: इस स्थिति में, कोई वस्तु जो निचली या ऊपरी वर्ग सीमा के बराबर हो, उस वर्ग की बारंबारता से बाहर रखी जाती है।

विचरित चरों के मामले में, समावेशी और अपवर्जी दोनों प्रकार के वर्ग अंतराल प्रयुक्त किए जा सकते हैं।

लगातार चरों के मामले में समावेशी वर्ग अंतराल बहुत बार प्रयोग किए जाते हैं।

उदाहरण

मान लीजिए हमारे पास किसी परीक्षा में विद्यार्थियों द्वारा प्राप्त किए गए अंकों का डेटा है और सभी अंक पूर्ण संख्याओं में हैं (भिन्नात्मक अंकों की अनुमति नहीं है)। मान लीजिए विद्यार्थियों द्वारा प्राप्त अंक 0 से 100 तक भिन्न-भिन्न हैं।

यह विच्छिन्न चरों का मामला है क्योंकि भिन्नात्मक अंकों की अनुमति नहीं है। इस मामले में, यदि हम समान आकार के वर्ग अंतराल प्रयोग कर रहे हैं और 10 वर्ग अंतराल रखने का निर्णय लेते हैं तो वर्ग अंतराल निम्नलिखित दोनों रूपों में से किसी एक रूप में हो सकते हैं:

समावेशी रूप के वर्ग अंतराल:

$0-10$

$11-20$

$21-30$

$-$

$-$

$91-100$

असमावेशी रूप के वर्ग अंतराल: $0-10$

$10-20$

$20-30$

$-$

$-$

$90-100$

असमावेशी वर्ग अंतरालों के मामले में हमें पहले से निर्णय लेना होता है कि यदि हमें वर्ग सीमा के बराबर मान प्राप्त होता है तो उसके साथ क्या किया जाए। उदाहरण के लिए हम निर्णय ले सकते हैं कि 10, 30 आदि जैसे मानों को क्रमशः “0 से 10” और “20 से 30” वर्ग अंतरालों में रखा जाए। इसे निम्न सीमा असमावेशित कहा जा सकता है।

अथवा हम 10, 30 आदि जैसे मानों को क्रमशः “10 से 20” और “30 से 40” वर्ग अंतरालों में रख सकते हैं। इसे ऊपरी सीमा असमावेशित कहा जा सकता है।

लगातार चर का उदाहरण

मान लीजिए हमारे पास ऊँचाई (सेंटीमीटर) या वज़न (किलोग्राम) जैसे चर पर डेटा है। यह डेटा लगातार प्रकार का है। ऐसे मामलों में वर्ग अंतराल निम्नलिखित ढंग से परिभाषित किए जा सकते हैं:

$30 \mathrm{Kg}-39.999 \ldots \mathrm{Kg}$

$40 \mathrm{Kg}-49.999 \ldots \mathrm{Kg}$

$50 \mathrm{Kg}-59.999 \ldots \mathrm{Kg}$ आदि।

इन वर्ग अंतरालों को निम्नलिखित तरीके से समझा जाता है:

$30 \mathrm{Kg}$ और उससे ऊपर तथा $40 \mathrm{Kg}$ से कम

$40 \mathrm{Kg}$ और उससे ऊपर तथा $50 \mathrm{Kg}$ से कम

$50 \mathrm{Kg}$ और उससे ऊपर तथा $60 \mathrm{Kg}$ से कम, आदि।

TABLE 3.4 एक कंपनी के 550 कर्मचारियों की आय का बारंबारा वितरण

आय $(रु)$ कर्मचारियों की संख्या
800-899 50
900-999 100
1000-1099 200
1100-1199 150
1200-1299 40
1300-1399 10
कुल 550

वर्ग अंतराल में समायोजन

Table 3.4 में समावेशी विधि के सावधानीपूर्वक अवलोकन से यह स्पष्ट होता है कि यद्यपि चर “आय” एक सतत चर है, वर्ग बनाते समय ऐसी निरंतरता बनाए नहीं रखी जाती। हमें एक वर्ग की ऊपरी सीमा और अगले वर्ग की निचली सीमा के बीच “अंतराल” या असांतत्य दिखाई देता है। उदाहरण के लिए, पहले वर्ग की ऊपरी सीमा 899 और दूसरे वर्ग की निचली सीमा 900 के बीच हमें 1 का “अंतराल” दिखाई देता है। तब हम वर्गीकरण करते समय चर की निरंतरता कैसे सुनिश्चित करते हैं? यह वर्ग अंतराल में समायोजन करके प्राप्त किया जाता है। समायोजन निम्नलिखित तरीके से किया जाता है:

  1. दूसरे वर्ग की निचली सीमा और पहले वर्ग की ऊपरी सीमा के बीच का अंतर निकालें। उदाहरण के लिए, तालिका 3.4 में दूसरे वर्ग की निचली सीमा 900 है और पहले वर्ग की ऊपरी सीमा 899 है। इनके बीच का अंतर 1 है, अर्थात् $(900-899=1)$
  2. (1) में प्राप्त अंतर को दो से विभाजित करें, अर्थात् $(1 / 2=0.5)$
  3. (2) में प्राप्त मान को सभी वर्गों की निचली सीमाओं से घटाएँ (निचली वर्ग सीमा - 0.5)
  4. (2) में प्राप्त मान को सभी वर्गों की ऊपरी सीमाओं में जोड़ें (ऊपरी वर्ग सीमा +0.5$)$।

आवृत्ति बंटन में डेटा की निरंतरता बहाल करने वाले समायोजन के बाद, तालिका 3.4 को तालिका 3.5 में संशोधित किया गया है

वर्ग सीमाओं में समायोजन के बाद, समता (1) जो वर्ग-चिह्न का मान निर्धारित करती है, निम्नलिखित के रूप में संशोधित हो जाती है:

समायोजित वर्ग चिह्न = (समायोजित ऊपरी वर्ग सीमा + समायोजित निचली वर्ग सीमा)/2.

तालिका 3.5 एक कंपनी के 550 कर्मचारियों की आय का आवृत्ति बंटन

आय (रु) कर्मचारियों की संख्या
799.5-899.5 50
899.5-999.5 100
999.5-1099.5 200
1099.5-1199.5 150
1199.5-1299.5 40
1299.5-1399.5 10
कुल 550

हमें प्रत्येक वर्ग के लिए आवृत्ति कैसे प्राप्त करनी चाहिए?

सरल शब्दों में, एक प्रेक्षण की बारंबारता का अर्थ है वह प्रेक्षण कच्चे आंकड़ों में कितनी बार आता है। हमारी तालिका 3.1 में हम देखते हैं कि मान 40 तीन बार आता है; 0 और 10 केवल एक-एक बार आते हैं; 49 पाँच बार आता है आदि। इस प्रकार 40 की बारंबारता 3 है, 0 की 1 है, 10 की 1 है, 49 की 5 है आदि। परंतु जब आंकड़ों को वर्गों में समूहबद्ध किया जाता है जैसे उदाहरण 3 में, वर्ग बारंबारता का अर्थ है उस विशेष वर्ग में मानों की संख्या। वर्ग बारंबारता की गिनती संबंधित वर्ग के सामने टैली चिह्नों द्वारा की जाती है।

टैली चिह्न लगाकर वर्ग बारंबारता ज्ञात करना

प्रत्येक विद्यार्थी के लिए जिसके अंक उस वर्ग में आते हैं, एक टैली (/) चिह्न वर्ग के सामने लगाया जाता है। उदाहरण के लिए, यदि किसी विद्यार्थी को 57 अंक मिले हैं, तो हम वर्ग $50-60$ के सामने एक टैली (/) लगाते हैं। यदि अंक 71 हैं, तो वर्ग 70-80 के सामने एक टैली लगाई जाती है। यदि किसी को 40 अंक मिले हैं, तो वर्ग 40-50 के सामने एक टैली लगाई जाती है। तालिका 3.6 तालिका 3.1 से गणित में 100 विद्यार्थियों के अंकों की टैली चिह्नन दिखाती है।

तालिका 3.6 गणित में 100 विद्यार्थियों के अंकों का टैली चिह्नन

गिनती करना आसान हो जाता है जब चार टैलियों को //// के रूप में रखा जाता है और पाँचवीं टैली को उनके ऊपर IN के रूप में लगाया जाता है। फिर टैलियों को पाँच के समूहों में गिना जाता है। इसलिए यदि किसी वर्ग में 16 टैलियाँ हों, तो सुविधा के लिए हम उन्हें $M N / T N$ IN/ / के रूप में रखते हैं। इस प्रकार किसी वर्ग की बारंबारता उस वर्ग के सामने बनी टैलियों की संख्या के बराबर होती है।

सूचना की हानि

आंकड़ों को बारंबारता बंटन के रूप में वर्गीकृत करने में एक स्वाभाविक कमी होती है। यद्यपि यह कच्चे आंकड़ों को संक्षिप्त और समझने योग्य बनाता है, पर इसमें वे विवरण नहीं दिखते जो कच्चे आंकड़ों में मौजूद होते हैं। कच्चे आंकड़ों को वर्गीकृत करने में सूचना की हानि होती है, यद्यपि इसे वर्गीकृत आंकड़े के रूप में संक्षेप में प्रस्तुत करने से बहुत कुछ प्राप्त होता है। एक बार जब आंकड़ों को वर्गों में समूहबद्ध कर दिया जाता है, तो कोई भी व्यक्तिगत प्रेक्षण आगे की सांख्यिकीय गणनाओं में कोई महत्व नहीं रखता। उदाहरण 4 में, वर्ग 20-30 में 6 प्रेक्षण हैं: $25,25,20,22,25$ और 28। इसलिए जब इन आंकड़ों को बारंबारता बंटन में वर्ग $20-30$ के रूप में समूहबद्ध किया जाता है, तो बाद वाला केवल उस वर्ग में रिकॉर्डों की संख्या देता है (अर्थात् बारंबारता $=6$) पर उनके वास्तविक मान नहीं देता। इस वर्ग के सभी मानों को वर्ग अंतराल या वर्ग चिह्न के मध्य मान के बराबर माना जाता है (अर्थात् 25)। आगे की सांख्यिकीय गणनाएं केवल वर्ग चिह्न के मानों पर आधारित होती हैं न कि उस वर्ग में मौजूद प्रेक्षणों के मानों पर। यह बात अन्य वर्गों के लिए भी सच है। इस प्रकार सांख्यिकीय विधियों में प्रेक्षणों के वास्तविक मानों के स्थान पर वर्ग चिह्न के प्रयोग से पर्याप्त सूचना की हानि होती है। तथापि, कच्चे आंकड़ों को अधिक समझने योग्य बनाने की क्षमता इसकी भरपाई से कहीं अधिक करती है।

असमान वर्गों के साथ बारंबारता बंटन

अब तक आप समान वर्ग अंतरालों की बारंबारता बंटन से परिचित हैं। आप जानते हैं कि इन्हें कच्चे आँकड़ों से कैसे बनाया जाता है। पर कुछ मामलों में असमान वर्ग अंतरालों वाली बारंबारता बंटन अधिक उपयुक्त होती है। यदि आप उदाहरण 4 की बारंबारता बंटन को तालिका 3.6 की तरह देखें, तो आप देखेंगे कि अधिकांश प्रेक्षण वर्गों 40-50, 50-60 और 60-70 में केंद्रित हैं। इनकी संगत बारंबारताएँ 21, 23 और 19 हैं। इसका अर्थ है कि 100 विद्यार्थियों में से 63 $(21+23+19)$ विद्यार्थी इन वर्गों में केंद्रित हैं। इस प्रकार, 63 प्रतिशत 40-70 की मध्यम सीमा में हैं। शेष 37 प्रतिशत आँकड़े वर्गों $0-10,10-20,20-30,30-40$, 70-80, 80-90 और 90-100 में हैं। ये वर्ग प्रेक्षणों से विरल आबादित हैं। आगे आप यह भी देखेंगे कि इन वर्गों में प्रेक्षण अपने-अपने वर्ग चिह्नों से अन्य वर्गों की तुलना में अधिक विचलित होते हैं। पर यदि वर्ग इस प्रकार बनाए जाएँ कि वर्ग चिह्न, जहाँ तक संभव हो, उस मान के आसपास हों जिसके चारों ओर वर्ग के प्रेक्षण केंद्रित होते हैं, तो असमान वर्ग अंतराल अधिक उपयुक्त है।

TABLE 3.7 Frequency Distribution of Unequal Classes

वर्ग प्रेक्षण आवृत्ति वर्ग चिह्न
0-10 0 1 5
10-20 10,14,17,12,14,12,14,14 8 15
20-30 25,25,20,22,25,28 6 25
30-40 30,37,34,39,32,30,35 7 35
40-45 42,44,40,44,41,40,43,40,41 9 42.5
45-50 47,49,49,45,45,47,49,46,48,48,49,49 12 47.5
50-55 51,53,51,50,51,50,54 7 52.5
55-60 59,56,55,57,55,56,59,56,59,57,59,55,56,55,56,55 16 57.5
60-65 60,64,62,64,64,60,62,61,60,62 10 62.5
65-70 66,69,66,69,66,65,65,66,65 9 67.5
70-80 70,75,70,76,70,71 6 75
80-90 82,82,82,80,85 5 85
90-100 90,100,90,90 4 95
कुल 100

तालिका 3.7 तालिका 3.6 की उसी आवृत्ति बंटन को असमान वर्गों के संदर्भ में दिखाती है। प्रत्येक वर्ग 40-50, 50-60 और 60-70 को दो-दो वर्गों में विभाजित किया गया है: वर्ग 40-50 को $40-45$ और 45-50 में बाँटा गया है। वर्ग 50-60 को 50-55 और 55-60 में बाँटा गया है। और वर्ग 60-70 को 60-65 और 65-70 में बाँटा गया है। नए वर्ग 40-45, 45-50, 50-55, 55-60, 60-65 और 65-70 की वर्ग अंतराल 5 है। अन्य वर्ग: 0-10, 10-20, 20-30, 30-40, 70-80, 80-90 और 90-100 अपने पुराने वर्ग अंतराल 10 को बरकरार रखते हैं। इस तालिका का अंतिम स्तंभ इन वर्गों के लिए वर्ग चिह्नों के नए मान दिखाता है। इनकी तुलना तालिका 3.6 में वर्ग चिह्नों के पुराने मानों से करें। ध्यान दें कि इन वर्गों में प्रेक्षण अपने पुराने वर्ग चिह्न मानों की तुलना में नए वर्ग चिह्न मानों से अधिक विचलित होते हैं। इस प्रकार नए वर्ग चिह्न मान इन वर्गों में आँकड़ों के लिए पुराने मानों की तुलना में अधिक प्रतिनिधिक हैं।

आकृति 3.2 तालिका 3.7 के बंटन की आवृत्ति वक्र दिखाती है।

आकृति 3.2: आवृत्ति वक्र

तालिका के वर्ग चिह्नों को X-अक्ष पर और आवृत्तियों को Y-अक्ष पर आलेखित किया गया है।

गतिविधि

  • यदि आप आकृति 3.2 की तुलना आकृति 3.1 से करें, तो आप क्या प्रेक्षित करते हैं? क्या आपको इनमें कोई अंतर दिखता है? क्या आप इस अंतर की व्याख्या कर सकते हैं?

आवृत्ति सरणी

अब तक हमने एक सतत चर के आँकड़ों के वर्गीकरण की चर्चा गणित में 100 विद्यार्थियों के प्रतिशत अंकों के उदाहरण से की है। एक विचर चर के आँकड़ों के वर्गीकरण को बारंबारता सरणी (Frequency Array) कहा जाता है। चूँकि विचर चर मान ग्रहण करता है और दो पूर्णांक मानों के बीच की भिन्नात्मक मध्यवर्ती मान नहीं लेता, इसलिए प्रत्येक पूर्णांक मान के अनुरूप बारंबारताएँ होती हैं।

तालिका 3.8 में दिया गया उदाहरण एक बारंबारता सरणी को दर्शाता है।

तालिका 3.8 परिवारों के आकार की बारंबारता सरणी

परिवार का आकार परिवारों की संख्या
1 5
2 15
3 25
4 35
5 10
6 5
7 3
8 2
योग 100

चर “परिवार का आकार” एक विचर चर है जो तालिका में दिखाए अनुसार केवल पूर्णांक मान ही ग्रहण करता है।

6. द्विचर बारंबारता बंटन

अक्सर जब हम किसी समष्टि से एक प्रतिदर्श लेते हैं, तो प्रतिदर्श के प्रत्येक तत्व से एक से अधिक प्रकार की सूचनाएँ एकत्र करते हैं। उदाहरण के लिए, मान लीजिए हमने किसी शहर में आधारित कंपनियों की सूची से 20 कंपनियों का प्रतिदर्श लिया है। मान लीजिए प्रत्येक कंपनी से बिक्री और विज्ञापन पर व्यय की सूचना एकत्र करते हैं। इस स्थिति में हमारे पास द्विचर प्रतिदर्श आँकड़े हैं। ऐसे द्विचर आँकड़ों को द्विचर बारंबारता बंटन द्वारा संक्षेप में प्रस्तुत किया जा सकता है।

द्विचर बारंबारता बंटन को दो चरों के बारंबारता बंटन के रूप में परिभाषित किया जा सकता है।

तालिका 3.9 में 20 कंपनियों की दो चरों—बिक्री और विज्ञापन व्यय (रु. लाख में)—की आवृत्ति बंटन दिखाया गया है। बिक्री के मान विभिन्न स्तंभों में वर्गीकृत हैं और विज्ञापन व्यय के मान विभिन्न पंक्तियों में वर्गीकृत हैं। प्रत्येक सेल संगत पंक्ति और स्तंभ मानों की आवृत्ति दिखाता है। उदाहरण के लिए, 3 ऐसी फर्में हैं जिनकी बिक्री रु 135 से रु 145 लाख के बीच है और उनका विज्ञापन व्यय रु 64 से रु 66 हजार के बीच है। द्विचर बंटन का प्रयोग सहसंबंध पर अध्याय 8 में लिया जाएगा।

7. निष्कर्ष

प्राथमिक और द्वितीय स्रोतों से एकत्रित आंकड़े कच्चे या अवर्गीकृत होते हैं। एक बार आंकड़े एकत्र हो जाने पर, अगला कदम उन्हें आगे के सांख्यिकीय विश्लेषण के लिए वर्गीकृत करना होता है। वर्गीकरण आंकड़ों में क्रम लाता है। यह अध्याय आपको यह जानने में सक्षम बनाता है कि आंकड़ों को आवृत्ति बंटन के माध्यम से व्यापक रूप से कैसे वर्गीकृत किया जा सकता है। एक बार जब आप वर्गीकरण की तकनीकों को जान लेते हैं, तो आपके लिए सतत और विच्छिन्न चरों दोनों के लिए आवृत्ति बंटन बनाना आसान हो जाएगा।

तालिका 3.9 20 फर्मों की बिक्री (लाख रु में) और विज्ञापन व्यय (हजार रु में) का द्विचर आवृत्ति बंटन

115–125 125–135 135–145 145–155 155–165 165–175 कुल
62-64 2 1 3
64-66 1 3 4
66-68 1 1 2 1 5
68-70 2 2 4
70-72 1 1 1 1 4
कुल 4 5 6 3 1 1 20

सारांश

  • वर्गीकरण कच्चे डेटा में क्रम लाता है।
  • एक बारंबारता बंटन दिखाता है कि किसी चर के विभिन्न मान विभिन्न वर्गों में कैसे बँटे हैं, साथ ही उनके संगत वर्ग बारंबारताएँ।
  • विशिष्ट विधि में या तो ऊपरी वर्ग सीमा या निचली वर्ग सीमा को बाहर रखा जाता है।
  • समावेशी विधि में ऊपरी और निचली दोनों वर्ग सीमाएँ शामिल की जाती हैं।
  • एक बारंबारता बंटन में, आगे की सांख्यिकीय गणनाएँ केवल वर्ग चिह्न मानों पर आधारित होती हैं, प्रेक्षणों के मानों के बजाय।
  • वर्गों को इस प्रकार बनाना चाहिए कि प्रत्येक वर्ग का वर्ग चिह्न यथासंभव उस मान के निकट आए, जिसके आसपास वर्ग में प्रेक्षण एकत्रित होते हैं।

अभ्यास

1. निम्नलिखित में से कौन-सा विकल्प सत्य है?

(i) वर्ग मध्यबिंदु बराबर होता है:

(a) ऊपरी वर्ग सीमा और निचली वर्ग सीमा का औसत।

(b) ऊपरी वर्ग सीमा और निचली वर्ग सीमा का गुणनफल।

(c) ऊपरी वर्ग सीमा और निचली वर्ग सीमा का अनुपात।

(d) उपर्युक्त में से कोई नहीं।

(ii) दो चरों का बारंबारता बंटन कहलाता है

(a) एकचर बंटन

(b) द्विविधीय बंटन

(c) बहुविधीय बंटन

(d) उपर्युक्त में से कोई नहीं

(iii) वर्गीकृत आँकड़ों में सांख्यिकीय गणनाएँ आधारित होती हैं

(a) प्रेक्षणों के वास्तविक मानों पर

(b) उच्च वर्ग सीमाओं पर

(c) निम्न वर्ग सीमाओं पर

(d) वर्ग मध्य-बिंदुओं पर

(iv) परास है

(a) सबसे बड़े और सबसे छोटे प्रेक्षणों के बीच का अंतर

(b) सबसे छोटे और सबसे बड़े प्रेक्षणों के बीच का अंतर

(c) सबसे बड़े और सबसे छोटे प्रेक्षणों का औसत

(d) सबसे बड़े को सबसे छोटे प्रेक्षण से अनुपात

2. क्या वस्तुओं को वर्गीकृत करने का कोई लाभ हो सकता है? अपने दैनिक जीवन के किसी उदाहरण के साथ समझाइए।

3. चर क्या होता है? विवृत (डिस्क्रीट) और सतत चर के बीच अंतर स्पष्ट कीजिए।

4. आँकड़ों की वर्गीकरण में प्रयुक्त ‘अनावर्ती’ और ‘आवर्ती’ विधियों की व्याख्या कीजिए।

5. सारणी 3.2 में दिए गए 50 परिवारों के भोजन पर मासिक घरेलू व्यय (रुपयों में) से संबंधित आँकड़ों का प्रयोग कीजिए और

(i) भोजन पर मासिक घरेलू व्यय की परास प्राप्त कीजिए।

(ii) परास को उपयुक्त संख्या में वर्ग अंतरालों में विभाजित कीजिए और व्यय का बारंबारता बंटन प्राप्त कीजिए।

(iii) उन परिवारों की संख्या ज्ञात कीजिए जिनका भोजन पर मासिक व्यय

(a) रु 2000 से कम है

(b) रु 3000 से अधिक है

(c) रु 1500 और रु 2500 के बीच है

6. एक शहर में 45 परिवारों से उनके द्वारा प्रयुक्त सेल फोनों की संख्या के लिए सर्वेक्षण किया गया। नीचे दर्ज उनके उत्तरों के आधार पर एक बारंबार सरणी तैयार कीजिए।

1 3 2 2 2 2 1 2 1 2 2 3 3 3 3
3 3 2 3 2 2 6 1 6 2 1 5 1 5 3
2 4 2 7 4 2 4 3 4 2 0 3 1 4 3

7. वर्गीकृत आंकड़ों में ‘सूचना की हानि’ क्या होती है?

8. क्या आप सहमत हैं कि वर्गीकृत आंकड़े कच्चे आंकड़ों से बेहतर होते हैं? क्यों?

9. एकचर और द्विचर बारंबारता बंटन के बीच अंतर स्पष्ट कीजिए।

10. निम्नलिखित आंकड़ों से 7 के वर्ग अंतराल को लेकर समावेशी विधि द्वारा बारंबारता बंटन तैयार कीजिए।

28 17 15 22 29 21 23 27 18 12 7 2 9 4
1 8 3 10 5 20 16 12 8 4 33 27 21 15
3 36 27 18 9 2 4 6 32 31 29 18 14 13
15 11 9 7 1 5 37 32 28 26 24 20 19 25
19 20 6 9

11. “The quick brown fox jumps over the lazy dog” उपरोक्त वाक्य को ध्यान से देखिए और प्रत्येक शब्द में अक्षरों की संख्या को नोट कीजिए। अक्षरों की संख्या को चर मानते हुए इस आंकड़े के लिए बारंबारता सरणी तैयार कीजिए।

सुझाया गया गतिविधि

  • अपनी पुरानी अंकपत्रिकाओं से पिछली कक्षा की अर्धवार्षिक या वार्षिक परीक्षाओं में गणित विषय में प्राप्त किए गए अंक खोजें। उन्हें वर्षवार व्यवस्थित करें। जांचें कि आपने इस विषय में प्राप्त किए गए अंक एक चर हैं या नहीं। यह भी देखें कि क्या वर्षों के दौरान आपने गणित में सुधार किया है।