अध्याय 03 डेटा का संगठन
1. भूमिका
पिछले अध्याय में आपने सीखा कि आँकड़े कैसे एकत्र किए जाते हैं। आपको यह भी पता चला कि जनगणना और प्रतिदर्श में क्या अंतर होता है। इस अध्याय में आप जानेंगे कि आपके द्वारा एकत्र किए गए आँकड़ों को किस प्रकार वर्गीकृत किया जाता है। कच्चे आँकड़ों को वर्गीकृत करने का उद्देश्य उनमें क्रम लाना होता है ताकि उन्हें आगे सांख्यिकीय विश्लेषण के लिए आसानी से प्रयोग किया जा सके।
क्या आपने कभी अपने स्थानीय कबाड़ी को देखा है जिसे आप पुराने अख़बार, टूटे-फूटे घरेलू सामान, खाली काँच की बोतलें, प्लास्टिक आदि बेचते हैं? वह ये चीज़ें आपसे खरीदता है और उन्हें उन लोगों को बेच देता है जो इनका पुनर्चक्रण करते हैं। लेकिन इतना सारा कबाड़ उसकी दुकान में होने पर, यदि वह उन्हें ठीक से संगठित न करे, तो अपना व्यापार चलाना बहुत मुश्किल हो जाएगा। अपनी स्थिति को आसान बनाने के लिए वह विभिन्न कबाड़ों को उपयुक्त रूप से समूहों या “वर्गों” में बाँटता है। वह पुराने अख़बारों को एक साथ रखता है और उन्हें रस्सी से बाँध देता है। फिर सभी खाली काँच की बोतलों को एक बोरी में इकट्ठा करता है। वह धातुओं की वस्तुओं को अपनी दुकान के एक कोने में ढेर लगाता है और उन्हें “लोहा”, “ताँबा”, “एल्युमिनियम”, “पीतल” आदि जैसे समूहों में बाँटता है। इस प्रकार वह अपने कबाड़ को विभिन्न वर्गों - “अख़बार”, “प्लास्टिक”, “काँच”, “धातु” आदि - में बाँटता है और उनमें क्रम लाता है। एक बार जब उसका कबाड़ व्यवस्थित और वर्गीकृत हो जाता है, तो किसी खास वस्तु को खोजना, जो कोई खरीददार माँगे, आसान हो जाता है।
इसी प्रकार जब आप अपनी स्कूल की किताबों को एक निश्चित क्रम में व्यवस्थित करते हैं, तो उन्हें संभालना आसान हो जाता है। आप उन्हें विषयों के अनुसार वर्गीकृत कर सकते हैं जहाँ प्रत्येक विषय एक समूह या वर्ग बन जाता है। इसलिए, जब आपको किसी विशेष इतिहास की किताब की आवश्यकता होती है, उदाहरण के लिए, तो आपको बस “इतिहास” समूह में वह किताब खोजनी होती है। अन्यथा, आपको अपनी पूरी संग्रह में उस विशेष किताब को खोजना पड़ता।
जबकि वस्तुओं या चीजों का वर्गीकरण हमारा बहुमूल्य समय और प्रयास बचाता है, यह एक arbitrary तरीके से नहीं किया जाता है। कबाड़ीवाला अपने कबाड़ को पुन: प्रयुक्त वस्तुओं के बाजारों के अनुसार समूहों में बाँटता है। उदाहरण के लिए, “काँच” समूह के अंतर्गत वह खाली बोतलें, टूटे हुए दर्पण और खिड़कियों के काँच आदि रखता है। इसी प्रकार जब आप अपनी इतिहास की किताबों को “इतिहास” समूह में रखते हैं, तो आप उस समूह में किसी अन्य विषय की किताब नहीं रखेंगे। अन्यथा समूह बनाने का पूरा उद्देश्य समाप्त हो जाएगा। वर्गीकरण, इसलिए, किसी मानदंड के आधार पर चीजों को समूहों या वर्गों में व्यवस्थित करना है।
गतिविधि
- अपने स्थानीय डाकघर जाकर पता करें कि पत्रों को कैसे छाँटा जाता है। क्या आप जानते हैं कि पत्र में दिया गया पिन-कोड क्या दर्शाता है? अपने डाकिया से पूछें।
2. कच्चा आँकड़ा
कबड़ीवाले के कबाड़ की तरह, अवर्गीकृत डेटा या कच्चा डेटा अत्यधिक असंगठित होता है। वे अक्सर बहुत बड़े और संभालने में कठिन होते हैं। इनसे सार्थक निष्कर्ष निकालना एक थकाऊ कार्य है क्योंकि ये आसानी से सांख्यिकीय विधियों के अधीन नहीं होते। इसलिए किसी भी व्यवस्थित सांख्यिकीय विश्लेषण से पहले ऐसे डेटा की उचित संगठना और प्रस्तुति आवश्यक है। इसलिए डेटा एकत्र करने के बाद अगला चरण उन्हें संगठित करना और वर्गीकृत रूप में प्रस्तुत करना है।
मान लीजिए आप विद्यार्थियों की गणित में प्रदर्शन जानना चाहते हैं और आपने अपने स्कूल के 100 विद्यार्थियों के गणित में अंकों का डेटा एकत्र किया है। यदि आप उन्हें एक सारणी के रूप में प्रस्तुत करें, तो वे कुछ इस तरह दिखाई दे सकते हैं जैसे तालिका 3.1।
तालिका 3.1 एक परीक्षा में 100 विद्यार्थियों द्वारा प्राप्त गणित में अंक
| 47 | 45 | 10 | 60 | 51 | 56 | 66 | 100 | 49 | 40 |
| 60 | 59 | 56 | 55 | 62 | 48 | 59 | 55 | 51 | 41 |
| 42 | 69 | 64 | 66 | 50 | 59 | 57 | 65 | 62 | 50 |
| 64 | 30 | 37 | 75 | 17 | 56 | 20 | 14 | 55 | 90 |
| 62 | 51 | 55 | 14 | 25 | 34 | 90 | 49 | 56 | 54 |
| 70 | 47 | 49 | 82 | 40 | 82 | 60 | 85 | 65 | 66 |
| 49 | 44 | 64 | 69 | 70 | 48 | 12 | 28 | 55 | 65 |
| 49 | 40 | 25 | 41 | 71 | 80 | 0 | 56 | 14 | 22 |
| 66 | 53 | 46 | 70 | 43 | 61 | 59 | 12 | 30 | 35 |
| 45 | 44 | 57 | 76 | 82 | 39 | 32 | 14 | 90 | 25 |
- या आप अपने पड़ोस की 50 घरों पर खाद्य पर मासिक खर्च का डेटा इकट्ठा कर सकते हैं ताकि उनका खाद्य पर औसत खर्च पता चले। ऐसा डेटा इकट्ठा करने पर, यदि आप उसे तालिका के रूप में प्रस्तुत करें, तो वह तालिका 3.2 जैसा दिखेगा। तालिका 3.1 और 3.2 दोनों में आपको कच्चा या वर्गीकृत नहीं किया गया डेटा मिलेगा। दोनों तालिकाओं में आप देखेंगे कि संख्याएं किसी भी क्रम में व्यवस्थित नहीं हैं। अब यदि आपसे तालिका 3.1 से गणित में सबसे ऊंचे अंक पूछे जाएं, तो आपको पहले 100 विद्यार्थियों के अंक या तो बढ़ते क्रम में या घटते क्रम में व्यवस्थित करने होंगे। यह एक थकाने वाला कार्य है। यह और भी थकाने वाला हो जाता है, यदि 100 की जगह आपके पास 1,000 विद्यार्थियों के अंक हों। इसी प्रकार, तालिका 3.2 में आप देखेंगे कि 50 घरों का औसत मासिक खर्च निकालना आपके लिए कठिन है। और यह कठिनाई कई गुना बढ़ जाती है, यदि संख्या बड़ी हो – जैसे 5,000 घर। जैसे हमारे कबाड़ीवाले को बड़े और व्यवस्थित नहीं किए गए कबाड़ में कोई विशेष वस्तु ढूंढने में परेशानी होती है, वैसे ही आपको बड़े और वर्गीकृत नहीं किए गए डेटा से कोई भी जानकारी निकालने में समान परेशानी का सामना करना पड़ता है। एक शब्द में, इसलिए, बड़े और वर्गीकृत नहीं किए गए डेटा से जानकारी निकालना एक थकाने वाला कार्य है।
The provided text appears to be a fragment of HTML markup language, possibly a template or a portion of a webpage. It includes what looks like a placeholder or a marker for dynamic content insertion: {{Safesubst:}} is a Wikimedia-specific template function used for safe substitution of variables or content. The text also contains numerous pipe symbols (|) which could be part of a table formatting or delimiter syntax. However, without actual content or context, its purpose is unclear. It could be:
- A fragment of a larger HTML table or form
- A malformed or incomplete table
- A template with empty variables
The repetition of pipes (|) without content suggests it might be:
- A table structure with no data
- A template waiting for substitution
- Corrupted or incomplete data
Without more context or surrounding HTML, its function is ambiguous. It might be:
- A placeholder for dynamic content
- An incomplete table
- A formatting error
If you intended to include a table or data, it seems to be missing. Please provide more context or check the formatting.
कच्चे आंकड़े चरों पर प्रेक्षणों से बने होते हैं। तालिका 3.1 और 3.2 में दिए गए कच्चे आंकड़े किसी विशिष्ट चर या चरों के समूह पर प्रेक्षणों से बने होते हैं। उदाहरण के लिए तालिका 3.1 देखिए जिसमें 100 विद्यार्थियों द्वारा गणित में प्राप्त अंक दिए गए हैं। हम इन अंकों का अर्थ कैसे निकाल सकते हैं? इन अंकों को देखते हुए गणित की शिक्षिका सोच रही होगी—मेरे विद्यार्थियों ने कैसा प्रदर्शन किया है? कितने अनुत्तीर्ण हुए हैं? हम आंकड़ों को कैसे वर्गीकृत करते हैं, यह इस बात पर निर्भर करता है कि हमारा उद्देश्य क्या है। इस स्थिति में शिक्षिका यह गहराई से समझना चाहती है कि इन विद्यार्थियों ने कैसा प्रदर्शन किया है। वह संभवतः बारंबारता बंटन बनाना चुनेगी। इसकी चर्चा अगले खंड में की गई है।
गतिविधि
- अपने परिवार के कुल साप्ताहिक व्यय का एक वर्ष का आंकड़ा एकत्र कीजिए और उसे एक तालिका में व्यवस्थित कीजिए। देखिए आपके पास कितने प्रेक्षण हैं। आंकड़ों को मासिक रूप से व्यवस्थित कीजिए और प्रेक्षणों की संख्या ज्ञात कीजिए।
3. आंकड़ों का वर्गीकरण
वर्गीकरण के समूह या वर्ग विभिन्न तरीकों से किए जाते हैं। अपनी पुस्तकों को विषयों के अनुसार—“इतिहास”, “भूगोल”, “गणित”, “विज्ञान” आदि—वर्गीकृत करने के बजाय आप उन्हें लेखक के नाम के अनुसार वर्णमाला क्रम में भी वर्गीकृत कर सकते हैं। या आप उन्हें प्रकाशन वर्ष के अनुसार भी वर्गीकृत कर सकते हैं। आप उन्हें जिस तरह वर्गीकृत करना चाहेंगे, वह आपकी आवश्यकता पर निर्भर करेगा।
इसी प्रकार कच्चे आंकड़ों को विभिन्न प्रकार से उद्देश्य के अनुसार वर्गीकृत किया जाता है। इन्हें समय के अनुसार समूहित किया जा सकता है। ऐसी वर्गीकरण को कालानुक्रमिक वर्गीकरण (Chronological Classification) कहा जाता है। इस वर्गीकरण में आंकड़ों को वर्ष, तिमाही, माह, सप्ताह आदि के संदर्भ में आरोही या अवरोही क्रम में वर्गीकृत किया जाता है। निम्नलिखित उदाहरण भारत की जनसंख्या को वर्षों के संदर्भ में वर्गीकृत करता है। ‘जनसंख्या’ चर एक समय श्रृंखला (Time Series) है क्योंकि यह विभिन्न वर्षों के लिए मानों की एक श्रृंखला दर्शाता है।
उदाहरण 1
भारत की जनसंख्या (करोड़ों में)
| वर्ष | जनसंख्या (करोड़ों में) |
|---|---|
| 1951 | 35.7 |
| 1961 | 43.8 |
| 1971 | 54.6 |
| 1981 | 68.4 |
| 1991 | 81.8 |
| 2001 | 102.7 |
| 2011 | 121.0 |
स्थानिक वर्गीकरण (Spatial Classification) में आंकड़ों को देश, राज्य, शहर, जिला आदि भौगोलिक स्थानों के संदर्भ में वर्गीकृत किया जाता है।
उदाहरण 2 विभिन्न देशों में गेहूं की पैदावार दिखाता है।
उदाहरण 2
विभिन्न देशों में गेहूं की पैदावार (2013)
| देश | गेहूं की पैदावार (किग्रा/हेक्टेयर) |
|---|---|
| कनाडा | 3594 |
| चीन | 5055 |
| फ्रांस | 7254 |
| जर्मनी | 7998 |
| भारत | 3154 |
| पाकिस्तान | 2787 |
स्रोत: इंडियन एग्रीकल्चरल स्टेटिस्टिक्स एट अ ग्लांस, 2015
गतिविधियाँ
- उदाहरण 1 में उन वर्षों का पता लगाएँ जब भारत की जनसंख्या न्यूनतम और अधिकतम थी,
- उदाहरण 2 में उस देश को खोजें जिसकी गेहूँ की पैदावार भारत की तुलना में थोड़ी अधिक है। वह प्रतिशत के रूप में कितनी होगी?
- उदाहरण 2 के देशों को पैदावार के आरोही क्रम में व्यवस्थित करें। पैदावार के अवरोही क्रम के लिए भी वही अभ्यास करें।
कभी-कभी आप ऐसी विशेषताओं से मिलते हैं जिन्हें मात्रात्मक रूप से व्यक्त नहीं किया जा सकता। ऐसी विशेषताओं को गुणवत्तापूर्ण या गुणधर्म कहा जाता है। उदाहरण के लिए, राष्ट्रीयता, साक्षरता, धर्म, लिंग, वैवाहिक स्थिति आदि। इन्हें मापा नहीं जा सकता। फिर भी इन गुणधर्मों को किसी गुणात्मक विशेषता की उपस्थिति या अनुपस्थिति के आधार पर वर्गीकृत किया जा सकता है। गुणधर्मों पर आधारित ऐसे आँकड़ों का वर्गीकरण गुणात्मक वर्गीकरण कहलाता है। निम्नलिखित उदाहरण में हम पाते हैं कि किसी देश की जनसंख्या को गुणात्मक चर “लिंग” के आधार पर समूहबद्ध किया गया है। एक प्रेक्षण या तो पुरुष हो सकता है या महिला। इन दो विशेषताओं को वैवाहिक स्थिति के आधार पर आगे वर्गीकृत किया जा सकता है जैसा नीचे दिया गया है:
उदाहरण 3
प्रथम चरण का वर्गीकरण एक गुण की उपस्थिति और अनुपस्थिति, अर्थात् पुरुष या अपुरुष (स्त्री), के आधार पर किया जाता है। द्वितीय चरण में, प्रत्येक वर्ग - पुरुष और स्त्री - को एक अन्य गुण, अर्थात् विवाहित या अविवाहित होने, की उपस्थिति और अनुपस्थिति के आधार पर और उपविभाजित किया जाता है। ऊँचाई, वजन, आयु, आय, छात्रों के अंक आदि विशेषताएँ प्रकृति में मात्रात्मक होती हैं। जब ऐसी विशेषताओं के संग्रहित आँकड़ों को वर्गों में समूहीकृत किया जाता है, तो यह मात्रात्मक वर्गीकरण बन जाता है।
गतिविधि
- आसपास की वस्तुओं को जीवित या अजीवित के रूप में समूहीकृत किया जा सकता है। क्या यह मात्रात्मक वर्गीकरण है?
उदाहरण 4
100 छात्रों के गणित में अंकों का बारंबारता बंटन
| अंक | बारंबारता |
|---|---|
| 0-10 | 1 |
| 10-20 | 8 |
| 20-30 | 6 |
| 30-40 | 7 |
| 40-50 | 21 |
| 50-60 | 23 |
| 60-70 | 19 |
| 70-80 | 6 |
| 80-90 | 5 |
| 90-100 | 4 |
| योग | 100 |
उदाहरण 4 में सारणी 3.1 में दिए गए 100 छात्रों के गणित के अंकों का मात्रात्मक वर्गीकरण दिखाया गया है।
गतिविधि
- उदाहरण 4 की बारंबारता के मानों को कुल बारंबारता के अनुपात या प्रतिशत के रूप में व्यक्त करें। ध्यान दें कि इस प्रकार व्यक्त की गई बारंबारता को सापेक्ष बारंबारता कहा जाता है।
- उदाहरण 4 में, किस वर्ग में आँकड़ों की अधिकतम सांद्रता है? इसे कुल प्रेक्षणों के प्रतिशत के रूप में व्यक्त करें। किस वर्ग में आँकड़ों की न्यूनतम सांद्रता है?
4. चर: सतत और विविक्त
एक सरल परिभाषा चर की, जिसे आपने पिछले अध्याय में पढ़ा है, यह नहीं बताती कि वह कैसे भिन्न होता है। चर विशिष्ट मानदंडों के आधार पर भिन्न होते हैं। इन्हें व्यापक रूप से दो प्रकारों में वर्गीकृत किया गया है:
(i) सतत और
(ii) विच्छिन्न।
एक सतत चर कोई भी संख्यात्मक मान ले सकता है। यह पूर्णांक मान $(1,2,3,4, \ldots)$, भिन्न मान $(1 / 2,2 / 3,3 / 4, \ldots)$, और ऐसे मान भी ले सकता है जो ठीक भिन्न नहीं होते $(\sqrt{2}=1.414$, $\sqrt{3}=1.732, \ldots, \sqrt{7}=2.645$ )। उदाहरण के लिए, किसी विद्यार्थी की ऊँचाई, जैसे वह बढ़ता है मान लीजिए 90 सेंटीमीटर से 150 सेंटीमीटर तक, इनके बीच के सभी मान लेगी। यह पूर्ण संख्याओं जैसे 90 सेंटीमीटर, 100 सेंटीमीटर, 108 सेंटीमीटर, 150 सेंटीमीटर जैसे मान ले सकती है। यह भिन्न मान भी ले सकती है जैसे 90.85 सेंटीमीटर, 102.34 सेंटीमीटर, 149.99 सेंटीमीटर आदि जो पूर्ण संख्याएँ नहीं हैं। इस प्रकार चर “ऊँचाई” हर संभावित मान को प्रकट करने में सक्षम है और इसके मानों को अनंत विभाजनों में भी तोड़ा जा सकता है। सतत चर के अन्य उदाहरण हैं वजन, समय, दूरी आदि।
एक सतत चर के विपरीत, एक विचरित चर केवल निश्चित मान ही ले सकता है। इसका मान केवल परिमित “छलांगों” से ही बदलता है। यह एक मान से दूसरे मान पर “छलांग” लगाता है लेकिन इन दोनों के बीच का कोई मध्यवर्ती मान नहीं लेता। उदाहरण के लिए, एक चर जैसे “कक्षा में विद्यार्थियों की संख्या”, विभिन्न कक्षाओं के लिए, केवल पूर्ण संख्याओं के मान ही ग्रहण करेगा। यह कोई भी भिन्नात्मक मान जैसे 0.5 नहीं ले सकता क्योंकि “आधा विद्यार्थी” व्यर्थ है। इसलिए यह 25 और 26 के बीच 25.5 जैसा मान नहीं ले सकता। इसके बजाय इसका मान या तो 25 हो सकता था या 26। हम देखते हैं कि जैसे ही इसका मान 25 से 26 बदलता है, इनके बीच के मान — भिन्न — इसके द्वारा नहीं लिए जाते। लेकिन हमें यह धारणा नहीं होनी चाहिए कि एक विचरित चर कोई भिन्नात्मक मान नहीं ले सकता। मान लीजिए $X$ एक चर है जो $1/8, 1/16, 1/32, 1/64, \ldots$ जैसे मान लेता है। क्या यह एक विचरित चर है? हाँ, क्योंकि यद्यपि $\mathrm{X}$ भिन्नात्मक मान लेता है, यह दो निकटतम भिन्नात्मक मानों के बीच का कोई भी मान नहीं ले सकता। यह $1/8$ से $1/16$ और $1/16$ से $1/32$ पर “छलांग” लगाता है। लेकिन यह $1/8$ और $1/16$ या $1/16$ और $1/32$ के बीच का कोई मान नहीं ले सकता।
गतिविधि
- निम्नलिखित चरों को सतत और विचरित के रूप में भेद कीजिए: क्षेत्रफल, आयतन, तापमान, पासे पर आने वाली संख्या, फसल उत्पादन, जनसंख्या, वर्षा, सड़क पर कारों की संख्या और आयु।
उदाहरण 4 दिखाता है कि 100 छात्रों के अंकों को वर्गों में कैसे समूहित किया गया है। आप सोच रहे होंगे कि हमने यह तालिका 3.1 के कच्चे आंकड़ों से कैसे प्राप्त किया। लेकिन, इस प्रश्न को हल करने से पहले, आपको यह जानना होगा कि बारंबारता बंटन क्या होता है।
5. बारंबारता बंटन क्या है?
बारंबारता बंटन किसी मात्रात्मक चर के कच्चे आंकड़ों को वर्गीकृत करने का एक समग्र तरीका है। यह दिखाता है कि चर के विभिन्न मान (यहाँ, किसी छात्र द्वारा गणित में प्राप्त किए गए अंक) विभिन्न वर्गों में कैसे बंटे हैं, साथ ही उनके संगत वर्ग बारंबारताएँ। इस मामले में हमारे पास अंकों के दस वर्ग हैं: $0-10,10-20, \ldots$, 90-100। वर्ग बारंबारता शब्द का अर्थ है किसी विशेष वर्ग में मानों की संख्या। उदाहरण के लिए, वर्ग 30-40 में हमें तालिका 3.1 के कच्चे आंकड़ों से 7 अंक मिलते हैं। वे हैं $30,37,34,30,35,39,32$। इस प्रकार वर्ग: $30-40$ की बारंबारता 7 है। लेकिन आप सोच रहे होंगे कि कच्चे आंकड़ों में दो बार आ रहा $40-$ वर्ग 30-40 में क्यों नहीं शामिल किया गया। यदि इसे शामिल किया जाता तो वर्ग 30-40 की बारंबारता 7 के बजाय 9 होती। यह पहेली आपके लिए स्पष्ट हो जाएगी यदि आप इस अध्याय को धैर्यपूर्वक पढ़ते हैं। तो आगे बढ़िए। आप स्वयं उत्तर पा लेंगे।
प्रत्येक वर्ग एक आवृत्ति बंटन सारणी में वर्ग सीमाओं से घिरा होता है। वर्ग सीमाएँ एक वर्ग के दो छोर होती हैं। सबसे कम मान को निम्न वर्ग सीमा कहा जाता है और सबसे अधिक मान को उच्च वर्ग सीमा। उदाहरण के लिए, वर्ग: 60-70 के लिए वर्ग सीमाएँ 60 और 70 हैं। इसकी निम्न वर्ग सीमा 60 है और इसकी उच्च वर्ग सीमा 70 है। वर्ग अंतराल या वर्ग चौड़ाई उच्च वर्ग सीमा और निम्न वर्ग सीमा के बीच का अंतर होता है। वर्ग 60-70 के लिए, वर्ग अंतराल 10 है (उच्च वर्ग सीमा माइनस निम्न वर्ग सीमा)।
वर्ग मध्य-बिंदु या वर्ग चिह्न एक वर्ग का मध्य मान होता है। यह एक वर्ग की निम्न वर्ग सीमा और उच्च वर्ग सीमा के बीच आधे रास्ते पर स्थित होता है और निम्नलिखित तरीके से ज्ञात किया जा सकता है:
वर्ग मध्य-बिंदु या वर्ग चिह्न
$$ \text { = (उच्च वर्ग सीमा + निम्न वर्ग सीमा)/2 } $$
प्रत्येक वर्ग का वर्ग चिह्न या मध्य-मान वर्ग को दर्शाने के लिए प्रयोग किया जाता है। एक बार कच्चे आंकड़ों को वर्गों में समूहबद्ध कर दिया जाता है, तो व्यक्तिगत प्रेक्षण आगे की गणनाओं में प्रयोग नहीं किए जाते। इसके बजाय, वर्ग चिह्न का उपयोग किया जाता है।
TABLE 3.3 The Lower Class Limits, the Upper Class Limits and the Class Mark
| वर्ग | आवृत्ति | निम्न वर्ग सीमा | उच्च वर्ग सीमा | वर्ग चिह्न |
|---|---|---|---|---|
| 0-10 | 1 | 0 | 10 | 5 |
| 10-20 | 8 | 10 | 20 | 15 |
| 20-30 | 6 | 20 | 30 | 25 |
| 30-40 | 7 | 30 | 40 | 35 |
| 40-50 | 21 | 40 | 50 | 45 |
| 50-60 | 23 | 50 | 60 | 55 |
| 60-70 | 19 | 60 | 70 | 65 |
| 70-80 | 6 | 70 | 80 | 75 |
| 80-90 | 5 | 80 | 90 | 85 |
| 90-100 | 4 | 90 | 100 | 95 |
आवृत्ति वक्र एक आवृत्ति बंटन का आलेखीय चित्रण होता है। चित्र 3.1 हमारे उपरोक्त उदाहरण के आँकड़ों के आवृत्ति बंटन की आरेखीय प्रस्तुति दिखाता है। आवृत्ति वक्र प्राप्त करने के लिए हम वर्ग चिह्नों को $\mathrm{X}$-अक्ष पर और आवृत्ति को $\mathrm{Y}$-अक्ष पर लगाते हैं।
चित्र 3.1: आँकड़ों के आवृत्ति बंटन की आरेखीय प्रस्तुति।
आवृत्ति बंटन तैयार करना
आवृत्ति बंटन तैयार करते समय निम्नलिखित पाँच प्रश्नों का समाधान करना आवश्यक होता है:
- क्या हमें समान या असमान आकार की वर्ग अंतराल रखने चाहिए?
- हमें कितने वर्ग रखने चाहिए?
- प्रत्येक वर्ग का आकार क्या होना चाहिए?
- वर्ग सीमाओं का निर्धारण कैसे करें?
- प्रत्येक वर्ग के लिए आवृत्ति कैसे प्राप्त करें?
क्या हमें समान या असमान आकार की वर्ग अंतराल रखने चाहिए?
दो ऐसी परिस्थितियाँ होती हैं जिनमें असमान आकार के अंतरालों का प्रयोग किया जाता है। पहली, जब हमारे पास आय और अन्य इसी तरह के चरों पर आँकड़े हों जिनकी सीमा बहुत अधिक हो। उदाहरण के लिए, प्रतिदिन आय लगभग शून्य से लेकर सैकड़ों करोड़ रुपये तक हो सकती है। ऐसी परिस्थिति में समान वर्ग अंतराल उपयुक्त नहीं होते क्योंकि (i) यदि वर्ग अंतराल मध्यम आकार के और समान हों तो वर्गों की संख्या बहुत अधिक हो जाएगी। (ii) यदि वर्ग अंतराल बड़े हों तो हम या तो बहुत कम स्तर या बहुत अधिक स्तर की आय की सूचना को दबा देंगे।
दूसरी, यदि बड़ी संख्या में मान सीमा के एक छोटे भाग में केंद्रित हों तो समान वर्ग अंतरालों से कई मानों की सूचना की कमी हो जाएगी।
अन्य सभी परिस्थितियों में, बारंबारता बंटनों में समान आकार के वर्ग अंतरालों का प्रयोग किया जाता है।
हमें कितने वर्ग होने चाहिए?
वर्गों की संख्या सामान्यतः छः से पंद्रह के बीच होती है। यदि हम समान आकार के वर्ग अंतरालों का प्रयोग कर रहे हों तो वर्गों की संख्या को सीमा (चर के सबसे बड़े और सबसे छोटे मानों के बीच का अंतर) को वर्ग अंतराल के आकार से भाग देकर परिकलित किया जा सकता है।
गतिविधियाँ
निम्नलिखित की सीमा ज्ञात कीजिए:
- उदाहरण 1 में भारत की जनसंख्या,
- उदाहरण 2 में गेहूँ की पैदावार।
प्रत्येक वर्ग का आकार कितना होना चाहिए?
इस प्रश्न का उत्तर पिछले प्रश्न के उत्तर पर निर्भर करता है। चर की सीमा दी गई होने पर, एक बार जब हम वर्ग अंतराल तय कर लेते हैं तो हम वर्गों की संख्या निर्धारित कर सकते हैं। इस प्रकार हम पाते हैं कि ये दोनों निर्णय आपस में जुड़े हुए हैं। हम एक का निर्णय दूसरे के बिना नहीं ले सकते।
उदाहरण 4 में, हमारे पास वर्गों की संख्या 10 है। सीमा का मान 100 दिया गया है, इसलिए वर्ग अंतराल स्वचालित रूप से 10 हो जाते हैं। ध्यान दें कि वर्तमान संदर्भ में हमने समान परिमाण के वर्ग अंतराल चुने हैं। हालांकि, हम ऐसे वर्ग अंतराल भी चुन सकते थे जो समान परिमाण के नहीं होते। उस स्थिति में वर्ग असमान चौड़ाई वाले होते।
हमें वर्ग सीमाएँ कैसे निर्धारित करनी चाहिए?
वर्ग सीमाएँ निश्चित और स्पष्ट रूप से बताई जानी चाहिए। सामान्यतः, खुले वर्ग जैसे “70 और अधिक” या “10 से कम” वांछनीय नहीं होते हैं।
निचली और ऊपरी वर्ग सीमाएँ इस प्रकार निर्धारित की जानी चाहिए कि प्रत्येक वर्ग की बारंबारताएँ वर्ग अंतराल के मध्य में केंद्रित हों।
वर्ग अंतराल दो प्रकार के होते हैं:
(i) समावेशी वर्ग अंतराल: इस स्थिति में, किसी वर्ग की निचली और ऊपरी सीमा के बराबर मान उसी वर्ग की बारंबारता में शामिल किए जाते हैं।
(ii) अपवर्जी वर्ग अंतराल: इस स्थिति में, कोई वस्तु जो निचली या ऊपरी वर्ग सीमा के बराबर हो, उस वर्ग की बारंबारता से बाहर रखी जाती है।
विचरित चरों के मामले में, समावेशी और अपवर्जी दोनों प्रकार के वर्ग अंतराल प्रयुक्त किए जा सकते हैं।
लगातार चरों के मामले में समावेशी वर्ग अंतराल बहुत बार प्रयोग किए जाते हैं।
उदाहरण
मान लीजिए हमारे पास किसी परीक्षा में विद्यार्थियों द्वारा प्राप्त किए गए अंकों का डेटा है और सभी अंक पूर्ण संख्याओं में हैं (भिन्नात्मक अंकों की अनुमति नहीं है)। मान लीजिए विद्यार्थियों द्वारा प्राप्त अंक 0 से 100 तक भिन्न-भिन्न हैं।
यह विच्छिन्न चरों का मामला है क्योंकि भिन्नात्मक अंकों की अनुमति नहीं है। इस मामले में, यदि हम समान आकार के वर्ग अंतराल प्रयोग कर रहे हैं और 10 वर्ग अंतराल रखने का निर्णय लेते हैं तो वर्ग अंतराल निम्नलिखित दोनों रूपों में से किसी एक रूप में हो सकते हैं:
समावेशी रूप के वर्ग अंतराल:
$0-10$
$11-20$
$21-30$
$-$
$-$
$91-100$
असमावेशी रूप के वर्ग अंतराल: $0-10$
$10-20$
$20-30$
$-$
$-$
$90-100$
असमावेशी वर्ग अंतरालों के मामले में हमें पहले से निर्णय लेना होता है कि यदि हमें वर्ग सीमा के बराबर मान प्राप्त होता है तो उसके साथ क्या किया जाए। उदाहरण के लिए हम निर्णय ले सकते हैं कि 10, 30 आदि जैसे मानों को क्रमशः “0 से 10” और “20 से 30” वर्ग अंतरालों में रखा जाए। इसे निम्न सीमा असमावेशित कहा जा सकता है।
अथवा हम 10, 30 आदि जैसे मानों को क्रमशः “10 से 20” और “30 से 40” वर्ग अंतरालों में रख सकते हैं। इसे ऊपरी सीमा असमावेशित कहा जा सकता है।
लगातार चर का उदाहरण
मान लीजिए हमारे पास ऊँचाई (सेंटीमीटर) या वज़न (किलोग्राम) जैसे चर पर डेटा है। यह डेटा लगातार प्रकार का है। ऐसे मामलों में वर्ग अंतराल निम्नलिखित ढंग से परिभाषित किए जा सकते हैं:
$30 \mathrm{Kg}-39.999 \ldots \mathrm{Kg}$
$40 \mathrm{Kg}-49.999 \ldots \mathrm{Kg}$
$50 \mathrm{Kg}-59.999 \ldots \mathrm{Kg}$ आदि।
इन वर्ग अंतरालों को निम्नलिखित तरीके से समझा जाता है:
$30 \mathrm{Kg}$ और उससे ऊपर तथा $40 \mathrm{Kg}$ से कम
$40 \mathrm{Kg}$ और उससे ऊपर तथा $50 \mathrm{Kg}$ से कम
$50 \mathrm{Kg}$ और उससे ऊपर तथा $60 \mathrm{Kg}$ से कम, आदि।
TABLE 3.4 एक कंपनी के 550 कर्मचारियों की आय का बारंबारा वितरण
| आय $(रु)$ | कर्मचारियों की संख्या |
|---|---|
| 800-899 | 50 |
| 900-999 | 100 |
| 1000-1099 | 200 |
| 1100-1199 | 150 |
| 1200-1299 | 40 |
| 1300-1399 | 10 |
| कुल | 550 |
वर्ग अंतराल में समायोजन
Table 3.4 में समावेशी विधि के सावधानीपूर्वक अवलोकन से यह स्पष्ट होता है कि यद्यपि चर “आय” एक सतत चर है, वर्ग बनाते समय ऐसी निरंतरता बनाए नहीं रखी जाती। हमें एक वर्ग की ऊपरी सीमा और अगले वर्ग की निचली सीमा के बीच “अंतराल” या असांतत्य दिखाई देता है। उदाहरण के लिए, पहले वर्ग की ऊपरी सीमा 899 और दूसरे वर्ग की निचली सीमा 900 के बीच हमें 1 का “अंतराल” दिखाई देता है। तब हम वर्गीकरण करते समय चर की निरंतरता कैसे सुनिश्चित करते हैं? यह वर्ग अंतराल में समायोजन करके प्राप्त किया जाता है। समायोजन निम्नलिखित तरीके से किया जाता है:
- दूसरे वर्ग की निचली सीमा और पहले वर्ग की ऊपरी सीमा के बीच का अंतर निकालें। उदाहरण के लिए, तालिका 3.4 में दूसरे वर्ग की निचली सीमा 900 है और पहले वर्ग की ऊपरी सीमा 899 है। इनके बीच का अंतर 1 है, अर्थात् $(900-899=1)$
- (1) में प्राप्त अंतर को दो से विभाजित करें, अर्थात् $(1 / 2=0.5)$
- (2) में प्राप्त मान को सभी वर्गों की निचली सीमाओं से घटाएँ (निचली वर्ग सीमा - 0.5)
- (2) में प्राप्त मान को सभी वर्गों की ऊपरी सीमाओं में जोड़ें (ऊपरी वर्ग सीमा +0.5$)$।
आवृत्ति बंटन में डेटा की निरंतरता बहाल करने वाले समायोजन के बाद, तालिका 3.4 को तालिका 3.5 में संशोधित किया गया है
वर्ग सीमाओं में समायोजन के बाद, समता (1) जो वर्ग-चिह्न का मान निर्धारित करती है, निम्नलिखित के रूप में संशोधित हो जाती है:
समायोजित वर्ग चिह्न = (समायोजित ऊपरी वर्ग सीमा + समायोजित निचली वर्ग सीमा)/2.
तालिका 3.5 एक कंपनी के 550 कर्मचारियों की आय का आवृत्ति बंटन
| आय (रु) | कर्मचारियों की संख्या |
|---|---|
| 799.5-899.5 | 50 |
| 899.5-999.5 | 100 |
| 999.5-1099.5 | 200 |
| 1099.5-1199.5 | 150 |
| 1199.5-1299.5 | 40 |
| 1299.5-1399.5 | 10 |
| कुल | 550 |
हमें प्रत्येक वर्ग के लिए आवृत्ति कैसे प्राप्त करनी चाहिए?
सरल शब्दों में, एक प्रेक्षण की बारंबारता का अर्थ है वह प्रेक्षण कच्चे आंकड़ों में कितनी बार आता है। हमारी तालिका 3.1 में हम देखते हैं कि मान 40 तीन बार आता है; 0 और 10 केवल एक-एक बार आते हैं; 49 पाँच बार आता है आदि। इस प्रकार 40 की बारंबारता 3 है, 0 की 1 है, 10 की 1 है, 49 की 5 है आदि। परंतु जब आंकड़ों को वर्गों में समूहबद्ध किया जाता है जैसे उदाहरण 3 में, वर्ग बारंबारता का अर्थ है उस विशेष वर्ग में मानों की संख्या। वर्ग बारंबारता की गिनती संबंधित वर्ग के सामने टैली चिह्नों द्वारा की जाती है।
टैली चिह्न लगाकर वर्ग बारंबारता ज्ञात करना
प्रत्येक विद्यार्थी के लिए जिसके अंक उस वर्ग में आते हैं, एक टैली (/) चिह्न वर्ग के सामने लगाया जाता है। उदाहरण के लिए, यदि किसी विद्यार्थी को 57 अंक मिले हैं, तो हम वर्ग $50-60$ के सामने एक टैली (/) लगाते हैं। यदि अंक 71 हैं, तो वर्ग 70-80 के सामने एक टैली लगाई जाती है। यदि किसी को 40 अंक मिले हैं, तो वर्ग 40-50 के सामने एक टैली लगाई जाती है। तालिका 3.6 तालिका 3.1 से गणित में 100 विद्यार्थियों के अंकों की टैली चिह्नन दिखाती है।
तालिका 3.6 गणित में 100 विद्यार्थियों के अंकों का टैली चिह्नन
गिनती करना आसान हो जाता है जब चार टैलियों को //// के रूप में रखा जाता है और पाँचवीं टैली को उनके ऊपर IN के रूप में लगाया जाता है। फिर टैलियों को पाँच के समूहों में गिना जाता है। इसलिए यदि किसी वर्ग में 16 टैलियाँ हों, तो सुविधा के लिए हम उन्हें $M N / T N$ IN/ / के रूप में रखते हैं। इस प्रकार किसी वर्ग की बारंबारता उस वर्ग के सामने बनी टैलियों की संख्या के बराबर होती है।
सूचना की हानि
आंकड़ों को बारंबारता बंटन के रूप में वर्गीकृत करने में एक स्वाभाविक कमी होती है। यद्यपि यह कच्चे आंकड़ों को संक्षिप्त और समझने योग्य बनाता है, पर इसमें वे विवरण नहीं दिखते जो कच्चे आंकड़ों में मौजूद होते हैं। कच्चे आंकड़ों को वर्गीकृत करने में सूचना की हानि होती है, यद्यपि इसे वर्गीकृत आंकड़े के रूप में संक्षेप में प्रस्तुत करने से बहुत कुछ प्राप्त होता है। एक बार जब आंकड़ों को वर्गों में समूहबद्ध कर दिया जाता है, तो कोई भी व्यक्तिगत प्रेक्षण आगे की सांख्यिकीय गणनाओं में कोई महत्व नहीं रखता। उदाहरण 4 में, वर्ग 20-30 में 6 प्रेक्षण हैं: $25,25,20,22,25$ और 28। इसलिए जब इन आंकड़ों को बारंबारता बंटन में वर्ग $20-30$ के रूप में समूहबद्ध किया जाता है, तो बाद वाला केवल उस वर्ग में रिकॉर्डों की संख्या देता है (अर्थात् बारंबारता $=6$) पर उनके वास्तविक मान नहीं देता। इस वर्ग के सभी मानों को वर्ग अंतराल या वर्ग चिह्न के मध्य मान के बराबर माना जाता है (अर्थात् 25)। आगे की सांख्यिकीय गणनाएं केवल वर्ग चिह्न के मानों पर आधारित होती हैं न कि उस वर्ग में मौजूद प्रेक्षणों के मानों पर। यह बात अन्य वर्गों के लिए भी सच है। इस प्रकार सांख्यिकीय विधियों में प्रेक्षणों के वास्तविक मानों के स्थान पर वर्ग चिह्न के प्रयोग से पर्याप्त सूचना की हानि होती है। तथापि, कच्चे आंकड़ों को अधिक समझने योग्य बनाने की क्षमता इसकी भरपाई से कहीं अधिक करती है।
असमान वर्गों के साथ बारंबारता बंटन
अब तक आप समान वर्ग अंतरालों की बारंबारता बंटन से परिचित हैं। आप जानते हैं कि इन्हें कच्चे आँकड़ों से कैसे बनाया जाता है। पर कुछ मामलों में असमान वर्ग अंतरालों वाली बारंबारता बंटन अधिक उपयुक्त होती है। यदि आप उदाहरण 4 की बारंबारता बंटन को तालिका 3.6 की तरह देखें, तो आप देखेंगे कि अधिकांश प्रेक्षण वर्गों 40-50, 50-60 और 60-70 में केंद्रित हैं। इनकी संगत बारंबारताएँ 21, 23 और 19 हैं। इसका अर्थ है कि 100 विद्यार्थियों में से 63 $(21+23+19)$ विद्यार्थी इन वर्गों में केंद्रित हैं। इस प्रकार, 63 प्रतिशत 40-70 की मध्यम सीमा में हैं। शेष 37 प्रतिशत आँकड़े वर्गों $0-10,10-20,20-30,30-40$, 70-80, 80-90 और 90-100 में हैं। ये वर्ग प्रेक्षणों से विरल आबादित हैं। आगे आप यह भी देखेंगे कि इन वर्गों में प्रेक्षण अपने-अपने वर्ग चिह्नों से अन्य वर्गों की तुलना में अधिक विचलित होते हैं। पर यदि वर्ग इस प्रकार बनाए जाएँ कि वर्ग चिह्न, जहाँ तक संभव हो, उस मान के आसपास हों जिसके चारों ओर वर्ग के प्रेक्षण केंद्रित होते हैं, तो असमान वर्ग अंतराल अधिक उपयुक्त है।
TABLE 3.7 Frequency Distribution of Unequal Classes
| वर्ग | प्रेक्षण | आवृत्ति | वर्ग चिह्न |
|---|---|---|---|
| 0-10 | 0 | 1 | 5 |
| 10-20 | 10,14,17,12,14,12,14,14 | 8 | 15 |
| 20-30 | 25,25,20,22,25,28 | 6 | 25 |
| 30-40 | 30,37,34,39,32,30,35 | 7 | 35 |
| 40-45 | 42,44,40,44,41,40,43,40,41 | 9 | 42.5 |
| 45-50 | 47,49,49,45,45,47,49,46,48,48,49,49 | 12 | 47.5 |
| 50-55 | 51,53,51,50,51,50,54 | 7 | 52.5 |
| 55-60 | 59,56,55,57,55,56,59,56,59,57,59,55,56,55,56,55 | 16 | 57.5 |
| 60-65 | 60,64,62,64,64,60,62,61,60,62 | 10 | 62.5 |
| 65-70 | 66,69,66,69,66,65,65,66,65 | 9 | 67.5 |
| 70-80 | 70,75,70,76,70,71 | 6 | 75 |
| 80-90 | 82,82,82,80,85 | 5 | 85 |
| 90-100 | 90,100,90,90 | 4 | 95 |
| कुल | 100 |
तालिका 3.7 तालिका 3.6 की उसी आवृत्ति बंटन को असमान वर्गों के संदर्भ में दिखाती है। प्रत्येक वर्ग 40-50, 50-60 और 60-70 को दो-दो वर्गों में विभाजित किया गया है: वर्ग 40-50 को $40-45$ और 45-50 में बाँटा गया है। वर्ग 50-60 को 50-55 और 55-60 में बाँटा गया है। और वर्ग 60-70 को 60-65 और 65-70 में बाँटा गया है। नए वर्ग 40-45, 45-50, 50-55, 55-60, 60-65 और 65-70 की वर्ग अंतराल 5 है। अन्य वर्ग: 0-10, 10-20, 20-30, 30-40, 70-80, 80-90 और 90-100 अपने पुराने वर्ग अंतराल 10 को बरकरार रखते हैं। इस तालिका का अंतिम स्तंभ इन वर्गों के लिए वर्ग चिह्नों के नए मान दिखाता है। इनकी तुलना तालिका 3.6 में वर्ग चिह्नों के पुराने मानों से करें। ध्यान दें कि इन वर्गों में प्रेक्षण अपने पुराने वर्ग चिह्न मानों की तुलना में नए वर्ग चिह्न मानों से अधिक विचलित होते हैं। इस प्रकार नए वर्ग चिह्न मान इन वर्गों में आँकड़ों के लिए पुराने मानों की तुलना में अधिक प्रतिनिधिक हैं।
आकृति 3.2 तालिका 3.7 के बंटन की आवृत्ति वक्र दिखाती है।
आकृति 3.2: आवृत्ति वक्र
तालिका के वर्ग चिह्नों को X-अक्ष पर और आवृत्तियों को Y-अक्ष पर आलेखित किया गया है।
गतिविधि
- यदि आप आकृति 3.2 की तुलना आकृति 3.1 से करें, तो आप क्या प्रेक्षित करते हैं? क्या आपको इनमें कोई अंतर दिखता है? क्या आप इस अंतर की व्याख्या कर सकते हैं?
आवृत्ति सरणी
अब तक हमने एक सतत चर के आँकड़ों के वर्गीकरण की चर्चा गणित में 100 विद्यार्थियों के प्रतिशत अंकों के उदाहरण से की है। एक विचर चर के आँकड़ों के वर्गीकरण को बारंबारता सरणी (Frequency Array) कहा जाता है। चूँकि विचर चर मान ग्रहण करता है और दो पूर्णांक मानों के बीच की भिन्नात्मक मध्यवर्ती मान नहीं लेता, इसलिए प्रत्येक पूर्णांक मान के अनुरूप बारंबारताएँ होती हैं।
तालिका 3.8 में दिया गया उदाहरण एक बारंबारता सरणी को दर्शाता है।
तालिका 3.8 परिवारों के आकार की बारंबारता सरणी
| परिवार का आकार | परिवारों की संख्या |
|---|---|
| 1 | 5 |
| 2 | 15 |
| 3 | 25 |
| 4 | 35 |
| 5 | 10 |
| 6 | 5 |
| 7 | 3 |
| 8 | 2 |
| योग | 100 |
चर “परिवार का आकार” एक विचर चर है जो तालिका में दिखाए अनुसार केवल पूर्णांक मान ही ग्रहण करता है।
6. द्विचर बारंबारता बंटन
अक्सर जब हम किसी समष्टि से एक प्रतिदर्श लेते हैं, तो प्रतिदर्श के प्रत्येक तत्व से एक से अधिक प्रकार की सूचनाएँ एकत्र करते हैं। उदाहरण के लिए, मान लीजिए हमने किसी शहर में आधारित कंपनियों की सूची से 20 कंपनियों का प्रतिदर्श लिया है। मान लीजिए प्रत्येक कंपनी से बिक्री और विज्ञापन पर व्यय की सूचना एकत्र करते हैं। इस स्थिति में हमारे पास द्विचर प्रतिदर्श आँकड़े हैं। ऐसे द्विचर आँकड़ों को द्विचर बारंबारता बंटन द्वारा संक्षेप में प्रस्तुत किया जा सकता है।
द्विचर बारंबारता बंटन को दो चरों के बारंबारता बंटन के रूप में परिभाषित किया जा सकता है।
तालिका 3.9 में 20 कंपनियों की दो चरों—बिक्री और विज्ञापन व्यय (रु. लाख में)—की आवृत्ति बंटन दिखाया गया है। बिक्री के मान विभिन्न स्तंभों में वर्गीकृत हैं और विज्ञापन व्यय के मान विभिन्न पंक्तियों में वर्गीकृत हैं। प्रत्येक सेल संगत पंक्ति और स्तंभ मानों की आवृत्ति दिखाता है। उदाहरण के लिए, 3 ऐसी फर्में हैं जिनकी बिक्री रु 135 से रु 145 लाख के बीच है और उनका विज्ञापन व्यय रु 64 से रु 66 हजार के बीच है। द्विचर बंटन का प्रयोग सहसंबंध पर अध्याय 8 में लिया जाएगा।
7. निष्कर्ष
प्राथमिक और द्वितीय स्रोतों से एकत्रित आंकड़े कच्चे या अवर्गीकृत होते हैं। एक बार आंकड़े एकत्र हो जाने पर, अगला कदम उन्हें आगे के सांख्यिकीय विश्लेषण के लिए वर्गीकृत करना होता है। वर्गीकरण आंकड़ों में क्रम लाता है। यह अध्याय आपको यह जानने में सक्षम बनाता है कि आंकड़ों को आवृत्ति बंटन के माध्यम से व्यापक रूप से कैसे वर्गीकृत किया जा सकता है। एक बार जब आप वर्गीकरण की तकनीकों को जान लेते हैं, तो आपके लिए सतत और विच्छिन्न चरों दोनों के लिए आवृत्ति बंटन बनाना आसान हो जाएगा।
तालिका 3.9 20 फर्मों की बिक्री (लाख रु में) और विज्ञापन व्यय (हजार रु में) का द्विचर आवृत्ति बंटन
| 115–125 | 125–135 | 135–145 | 145–155 | 155–165 | 165–175 | कुल | |
|---|---|---|---|---|---|---|---|
| 62-64 | 2 | 1 | 3 | ||||
| 64-66 | 1 | 3 | 4 | ||||
| 66-68 | 1 | 1 | 2 | 1 | 5 | ||
| 68-70 | 2 | 2 | 4 | ||||
| 70-72 | 1 | 1 | 1 | 1 | 4 | ||
| कुल | 4 | 5 | 6 | 3 | 1 | 1 | 20 |
सारांश
- वर्गीकरण कच्चे डेटा में क्रम लाता है।
- एक बारंबारता बंटन दिखाता है कि किसी चर के विभिन्न मान विभिन्न वर्गों में कैसे बँटे हैं, साथ ही उनके संगत वर्ग बारंबारताएँ।
- विशिष्ट विधि में या तो ऊपरी वर्ग सीमा या निचली वर्ग सीमा को बाहर रखा जाता है।
- समावेशी विधि में ऊपरी और निचली दोनों वर्ग सीमाएँ शामिल की जाती हैं।
- एक बारंबारता बंटन में, आगे की सांख्यिकीय गणनाएँ केवल वर्ग चिह्न मानों पर आधारित होती हैं, प्रेक्षणों के मानों के बजाय।
- वर्गों को इस प्रकार बनाना चाहिए कि प्रत्येक वर्ग का वर्ग चिह्न यथासंभव उस मान के निकट आए, जिसके आसपास वर्ग में प्रेक्षण एकत्रित होते हैं।
अभ्यास
1. निम्नलिखित में से कौन-सा विकल्प सत्य है?
(i) वर्ग मध्यबिंदु बराबर होता है:
(a) ऊपरी वर्ग सीमा और निचली वर्ग सीमा का औसत।
(b) ऊपरी वर्ग सीमा और निचली वर्ग सीमा का गुणनफल।
(c) ऊपरी वर्ग सीमा और निचली वर्ग सीमा का अनुपात।
(d) उपर्युक्त में से कोई नहीं।
(ii) दो चरों का बारंबारता बंटन कहलाता है
(a) एकचर बंटन
(b) द्विविधीय बंटन
(c) बहुविधीय बंटन
(d) उपर्युक्त में से कोई नहीं
(iii) वर्गीकृत आँकड़ों में सांख्यिकीय गणनाएँ आधारित होती हैं
(a) प्रेक्षणों के वास्तविक मानों पर
(b) उच्च वर्ग सीमाओं पर
(c) निम्न वर्ग सीमाओं पर
(d) वर्ग मध्य-बिंदुओं पर
(iv) परास है
(a) सबसे बड़े और सबसे छोटे प्रेक्षणों के बीच का अंतर
(b) सबसे छोटे और सबसे बड़े प्रेक्षणों के बीच का अंतर
(c) सबसे बड़े और सबसे छोटे प्रेक्षणों का औसत
(d) सबसे बड़े को सबसे छोटे प्रेक्षण से अनुपात
2. क्या वस्तुओं को वर्गीकृत करने का कोई लाभ हो सकता है? अपने दैनिक जीवन के किसी उदाहरण के साथ समझाइए।
3. चर क्या होता है? विवृत (डिस्क्रीट) और सतत चर के बीच अंतर स्पष्ट कीजिए।
4. आँकड़ों की वर्गीकरण में प्रयुक्त ‘अनावर्ती’ और ‘आवर्ती’ विधियों की व्याख्या कीजिए।
5. सारणी 3.2 में दिए गए 50 परिवारों के भोजन पर मासिक घरेलू व्यय (रुपयों में) से संबंधित आँकड़ों का प्रयोग कीजिए और
(i) भोजन पर मासिक घरेलू व्यय की परास प्राप्त कीजिए।
(ii) परास को उपयुक्त संख्या में वर्ग अंतरालों में विभाजित कीजिए और व्यय का बारंबारता बंटन प्राप्त कीजिए।
(iii) उन परिवारों की संख्या ज्ञात कीजिए जिनका भोजन पर मासिक व्यय
(a) रु 2000 से कम है
(b) रु 3000 से अधिक है
(c) रु 1500 और रु 2500 के बीच है
6. एक शहर में 45 परिवारों से उनके द्वारा प्रयुक्त सेल फोनों की संख्या के लिए सर्वेक्षण किया गया। नीचे दर्ज उनके उत्तरों के आधार पर एक बारंबार सरणी तैयार कीजिए।
| 1 | 3 | 2 | 2 | 2 | 2 | 1 | 2 | 1 | 2 | 2 | 3 | 3 | 3 | 3 |
| 3 | 3 | 2 | 3 | 2 | 2 | 6 | 1 | 6 | 2 | 1 | 5 | 1 | 5 | 3 |
| 2 | 4 | 2 | 7 | 4 | 2 | 4 | 3 | 4 | 2 | 0 | 3 | 1 | 4 | 3 |
7. वर्गीकृत आंकड़ों में ‘सूचना की हानि’ क्या होती है?
8. क्या आप सहमत हैं कि वर्गीकृत आंकड़े कच्चे आंकड़ों से बेहतर होते हैं? क्यों?
9. एकचर और द्विचर बारंबारता बंटन के बीच अंतर स्पष्ट कीजिए।
10. निम्नलिखित आंकड़ों से 7 के वर्ग अंतराल को लेकर समावेशी विधि द्वारा बारंबारता बंटन तैयार कीजिए।
| 28 | 17 | 15 | 22 | 29 | 21 | 23 | 27 | 18 | 12 | 7 | 2 | 9 | 4 |
| 1 | 8 | 3 | 10 | 5 | 20 | 16 | 12 | 8 | 4 | 33 | 27 | 21 | 15 |
| 3 | 36 | 27 | 18 | 9 | 2 | 4 | 6 | 32 | 31 | 29 | 18 | 14 | 13 |
| 15 | 11 | 9 | 7 | 1 | 5 | 37 | 32 | 28 | 26 | 24 | 20 | 19 | 25 |
| 19 | 20 | 6 | 9 |
11. “The quick brown fox jumps over the lazy dog” उपरोक्त वाक्य को ध्यान से देखिए और प्रत्येक शब्द में अक्षरों की संख्या को नोट कीजिए। अक्षरों की संख्या को चर मानते हुए इस आंकड़े के लिए बारंबारता सरणी तैयार कीजिए।
सुझाया गया गतिविधि
- अपनी पुरानी अंकपत्रिकाओं से पिछली कक्षा की अर्धवार्षिक या वार्षिक परीक्षाओं में गणित विषय में प्राप्त किए गए अंक खोजें। उन्हें वर्षवार व्यवस्थित करें। जांचें कि आपने इस विषय में प्राप्त किए गए अंक एक चर हैं या नहीं। यह भी देखें कि क्या वर्षों के दौरान आपने गणित में सुधार किया है।