SATHEE: अध्याय 03 डेटा का संगठन

अध्याय 03 डेटा का संगठन

1. भूमिका

पिछले अध्याय में आपने सीखा कि आँकड़े कैसे एकत्र किए जाते हैं। आपको यह भी पता चला कि जनगणना और प्रतिदर्श में क्या अंतर होता है। इस अध्याय में आप जानेंगे कि आपके द्वारा एकत्र किए गए आँकड़ों को किस प्रकार वर्गीकृत किया जाता है। कच्चे आँकड़ों को वर्गीकृत करने का उद्देश्य उनमें क्रम लाना होता है ताकि उन्हें आगे सांख्यिकीय विश्लेषण के लिए आसानी से प्रयोग किया जा सके।

क्या आपने कभी अपने स्थानीय कबाड़ी को देखा है जिसे आप पुराने अख़बार, टूटे-फूटे घरेलू सामान, खाली काँच की बोतलें, प्लास्टिक आदि बेचते हैं? वह ये चीज़ें आपसे खरीदता है और उन्हें उन लोगों को बेच देता है जो इनका पुनर्चक्रण करते हैं। लेकिन इतना सारा कबाड़ उसकी दुकान में होने पर, यदि वह उन्हें ठीक से संगठित न करे, तो अपना व्यापार चलाना बहुत मुश्किल हो जाएगा। अपनी स्थिति को आसान बनाने के लिए वह विभिन्न कबाड़ों को उपयुक्त रूप से समूहों या “वर्गों” में बाँटता है। वह पुराने अख़बारों को एक साथ रखता है और उन्हें रस्सी से बाँध देता है। फिर सभी खाली काँच की बोतलों को एक बोरी में इकट्ठा करता है। वह धातुओं की वस्तुओं को अपनी दुकान के एक कोने में ढेर लगाता है और उन्हें “लोहा”, “ताँबा”, “एल्युमिनियम”, “पीतल” आदि जैसे समूहों में बाँटता है। इस प्रकार वह अपने कबाड़ को विभिन्न वर्गों - “अख़बार”, “प्लास्टिक”, “काँच”, “धातु” आदि - में बाँटता है और उनमें क्रम लाता है। एक बार जब उसका कबाड़ व्यवस्थित और वर्गीकृत हो जाता है, तो किसी खास वस्तु को खोजना, जो कोई खरीददार माँगे, आसान हो जाता है।

इसी प्रकार जब आप अपनी स्कूल की किताबों को एक निश्चित क्रम में व्यवस्थित करते हैं, तो उन्हें संभालना आसान हो जाता है। आप उन्हें विषयों के अनुसार वर्गीकृत कर सकते हैं जहाँ प्रत्येक विषय एक समूह या वर्ग बन जाता है। इसलिए, जब आपको किसी विशेष इतिहास की किताब की आवश्यकता होती है, उदाहरण के लिए, तो आपको बस “इतिहास” समूह में वह किताब खोजनी होती है। अन्यथा, आपको अपनी पूरी संग्रह में उस विशेष किताब को खोजना पड़ता।

जबकि वस्तुओं या चीजों का वर्गीकरण हमारा बहुमूल्य समय और प्रयास बचाता है, यह एक arbitrary तरीके से नहीं किया जाता है। कबाड़ीवाला अपने कबाड़ को पुन: प्रयुक्त वस्तुओं के बाजारों के अनुसार समूहों में बाँटता है। उदाहरण के लिए, “काँच” समूह के अंतर्गत वह खाली बोतलें, टूटे हुए दर्पण और खिड़कियों के काँच आदि रखता है। इसी प्रकार जब आप अपनी इतिहास की किताबों को “इतिहास” समूह में रखते हैं, तो आप उस समूह में किसी अन्य विषय की किताब नहीं रखेंगे। अन्यथा समूह बनाने का पूरा उद्देश्य समाप्त हो जाएगा। वर्गीकरण, इसलिए, किसी मानदंड के आधार पर चीजों को समूहों या वर्गों में व्यवस्थित करना है।

गतिविधि

अपने स्थानीय डाकघर जाकर पता करें कि पत्रों को कैसे छाँटा जाता है। क्या आप जानते हैं कि पत्र में दिया गया पिन-कोड क्या दर्शाता है? अपने डाकिया से पूछें।

2. कच्चा आँकड़ा

कबड़ीवाले के कबाड़ की तरह, अवर्गीकृत डेटा या कच्चा डेटा अत्यधिक असंगठित होता है। वे अक्सर बहुत बड़े और संभालने में कठिन होते हैं। इनसे सार्थक निष्कर्ष निकालना एक थकाऊ कार्य है क्योंकि ये आसानी से सांख्यिकीय विधियों के अधीन नहीं होते। इसलिए किसी भी व्यवस्थित सांख्यिकीय विश्लेषण से पहले ऐसे डेटा की उचित संगठना और प्रस्तुति आवश्यक है। इसलिए डेटा एकत्र करने के बाद अगला चरण उन्हें संगठित करना और वर्गीकृत रूप में प्रस्तुत करना है।

मान लीजिए आप विद्यार्थियों की गणित में प्रदर्शन जानना चाहते हैं और आपने अपने स्कूल के 100 विद्यार्थियों के गणित में अंकों का डेटा एकत्र किया है। यदि आप उन्हें एक सारणी के रूप में प्रस्तुत करें, तो वे कुछ इस तरह दिखाई दे सकते हैं जैसे तालिका 3.1।

तालिका 3.1 एक परीक्षा में 100 विद्यार्थियों द्वारा प्राप्त गणित में अंक


47	45	10	60	51	56	66	100	49	40
60	59	56	55	62	48	59	55	51	41
42	69	64	66	50	59	57	65	62	50
64	30	37	75	17	56	20	14	55	90
62	51	55	14	25	34	90	49	56	54
70	47	49	82	40	82	60	85	65	66
49	44	64	69	70	48	12	28	55	65
49	40	25	41	71	80	0	56	14	22
66	53	46	70	43	61	59	12	30	35
45	44	57	76	82	39	32	14	90	25

या आप अपने पड़ोस की 50 घरों पर खाद्य पर मासिक खर्च का डेटा इकट्ठा कर सकते हैं ताकि उनका खाद्य पर औसत खर्च पता चले। ऐसा डेटा इकट्ठा करने पर, यदि आप उसे तालिका के रूप में प्रस्तुत करें, तो वह तालिका 3.2 जैसा दिखेगा। तालिका 3.1 और 3.2 दोनों में आपको कच्चा या वर्गीकृत नहीं किया गया डेटा मिलेगा। दोनों तालिकाओं में आप देखेंगे कि संख्याएं किसी भी क्रम में व्यवस्थित नहीं हैं। अब यदि आपसे तालिका 3.1 से गणित में सबसे ऊंचे अंक पूछे जाएं, तो आपको पहले 100 विद्यार्थियों के अंक या तो बढ़ते क्रम में या घटते क्रम में व्यवस्थित करने होंगे। यह एक थकाने वाला कार्य है। यह और भी थकाने वाला हो जाता है, यदि 100 की जगह आपके पास 1,000 विद्यार्थियों के अंक हों। इसी प्रकार, तालिका 3.2 में आप देखेंगे कि 50 घरों का औसत मासिक खर्च निकालना आपके लिए कठिन है। और यह कठिनाई कई गुना बढ़ जाती है, यदि संख्या बड़ी हो – जैसे 5,000 घर। जैसे हमारे कबाड़ीवाले को बड़े और व्यवस्थित नहीं किए गए कबाड़ में कोई विशेष वस्तु ढूंढने में परेशानी होती है, वैसे ही आपको बड़े और वर्गीकृत नहीं किए गए डेटा से कोई भी जानकारी निकालने में समान परेशानी का सामना करना पड़ता है। एक शब्द में, इसलिए, बड़े और वर्गीकृत नहीं किए गए डेटा से जानकारी निकालना एक थकाने वाला कार्य है।

The provided text appears to be a fragment of HTML markup language, possibly a template or a portion of a webpage. It includes what looks like a placeholder or a marker for dynamic content insertion: {{Safesubst:}} is a Wikimedia-specific template function used for safe substitution of variables or content. The text also contains numerous pipe symbols (|) which could be part of a table formatting or delimiter syntax. However, without actual content or context, its purpose is unclear. It could be:

A fragment of a larger HTML table or form
A malformed or incomplete table
A template with empty variables

The repetition of pipes (|) without content suggests it might be:

A table structure with no data
A template waiting for substitution
Corrupted or incomplete data

Without more context or surrounding HTML, its function is ambiguous. It might be:

A placeholder for dynamic content
An incomplete table
A formatting error

If you intended to include a table or data, it seems to be missing. Please provide more context or check the formatting.

कच्चे आंकड़े चरों पर प्रेक्षणों से बने होते हैं। तालिका 3.1 और 3.2 में दिए गए कच्चे आंकड़े किसी विशिष्ट चर या चरों के समूह पर प्रेक्षणों से बने होते हैं। उदाहरण के लिए तालिका 3.1 देखिए जिसमें 100 विद्यार्थियों द्वारा गणित में प्राप्त अंक दिए गए हैं। हम इन अंकों का अर्थ कैसे निकाल सकते हैं? इन अंकों को देखते हुए गणित की शिक्षिका सोच रही होगी—मेरे विद्यार्थियों ने कैसा प्रदर्शन किया है? कितने अनुत्तीर्ण हुए हैं? हम आंकड़ों को कैसे वर्गीकृत करते हैं, यह इस बात पर निर्भर करता है कि हमारा उद्देश्य क्या है। इस स्थिति में शिक्षिका यह गहराई से समझना चाहती है कि इन विद्यार्थियों ने कैसा प्रदर्शन किया है। वह संभवतः बारंबारता बंटन बनाना चुनेगी। इसकी चर्चा अगले खंड में की गई है।

गतिविधि

अपने परिवार के कुल साप्ताहिक व्यय का एक वर्ष का आंकड़ा एकत्र कीजिए और उसे एक तालिका में व्यवस्थित कीजिए। देखिए आपके पास कितने प्रेक्षण हैं। आंकड़ों को मासिक रूप से व्यवस्थित कीजिए और प्रेक्षणों की संख्या ज्ञात कीजिए।

3. आंकड़ों का वर्गीकरण

वर्गीकरण के समूह या वर्ग विभिन्न तरीकों से किए जाते हैं। अपनी पुस्तकों को विषयों के अनुसार—“इतिहास”, “भूगोल”, “गणित”, “विज्ञान” आदि—वर्गीकृत करने के बजाय आप उन्हें लेखक के नाम के अनुसार वर्णमाला क्रम में भी वर्गीकृत कर सकते हैं। या आप उन्हें प्रकाशन वर्ष के अनुसार भी वर्गीकृत कर सकते हैं। आप उन्हें जिस तरह वर्गीकृत करना चाहेंगे, वह आपकी आवश्यकता पर निर्भर करेगा।

इसी प्रकार कच्चे आंकड़ों को विभिन्न प्रकार से उद्देश्य के अनुसार वर्गीकृत किया जाता है। इन्हें समय के अनुसार समूहित किया जा सकता है। ऐसी वर्गीकरण को कालानुक्रमिक वर्गीकरण (Chronological Classification) कहा जाता है। इस वर्गीकरण में आंकड़ों को वर्ष, तिमाही, माह, सप्ताह आदि के संदर्भ में आरोही या अवरोही क्रम में वर्गीकृत किया जाता है। निम्नलिखित उदाहरण भारत की जनसंख्या को वर्षों के संदर्भ में वर्गीकृत करता है। ‘जनसंख्या’ चर एक समय श्रृंखला (Time Series) है क्योंकि यह विभिन्न वर्षों के लिए मानों की एक श्रृंखला दर्शाता है।

उदाहरण 1

भारत की जनसंख्या (करोड़ों में)

वर्ष	जनसंख्या (करोड़ों में)
1951	35.7
1961	43.8
1971	54.6
1981	68.4
1991	81.8
2001	102.7
2011	121.0

स्थानिक वर्गीकरण (Spatial Classification) में आंकड़ों को देश, राज्य, शहर, जिला आदि भौगोलिक स्थानों के संदर्भ में वर्गीकृत किया जाता है।

उदाहरण 2 विभिन्न देशों में गेहूं की पैदावार दिखाता है।

उदाहरण 2

विभिन्न देशों में गेहूं की पैदावार (2013)

देश	गेहूं की पैदावार (किग्रा/हेक्टेयर)
कनाडा	3594
चीन	5055
फ्रांस	7254
जर्मनी	7998
भारत	3154
पाकिस्तान	2787

स्रोत: इंडियन एग्रीकल्चरल स्टेटिस्टिक्स एट अ ग्लांस, 2015

गतिविधियाँ

उदाहरण 1 में उन वर्षों का पता लगाएँ जब भारत की जनसंख्या न्यूनतम और अधिकतम थी,

उदाहरण 2 में उस देश को खोजें जिसकी गेहूँ की पैदावार भारत की तुलना में थोड़ी अधिक है। वह प्रतिशत के रूप में कितनी होगी?

उदाहरण 2 के देशों को पैदावार के आरोही क्रम में व्यवस्थित करें। पैदावार के अवरोही क्रम के लिए भी वही अभ्यास करें।

कभी-कभी आप ऐसी विशेषताओं से मिलते हैं जिन्हें मात्रात्मक रूप से व्यक्त नहीं किया जा सकता। ऐसी विशेषताओं को गुणवत्तापूर्ण या गुणधर्म कहा जाता है। उदाहरण के लिए, राष्ट्रीयता, साक्षरता, धर्म, लिंग, वैवाहिक स्थिति आदि। इन्हें मापा नहीं जा सकता। फिर भी इन गुणधर्मों को किसी गुणात्मक विशेषता की उपस्थिति या अनुपस्थिति के आधार पर वर्गीकृत किया जा सकता है। गुणधर्मों पर आधारित ऐसे आँकड़ों का वर्गीकरण गुणात्मक वर्गीकरण कहलाता है। निम्नलिखित उदाहरण में हम पाते हैं कि किसी देश की जनसंख्या को गुणात्मक चर “लिंग” के आधार पर समूहबद्ध किया गया है। एक प्रेक्षण या तो पुरुष हो सकता है या महिला। इन दो विशेषताओं को वैवाहिक स्थिति के आधार पर आगे वर्गीकृत किया जा सकता है जैसा नीचे दिया गया है:

उदाहरण 3

प्रथम चरण का वर्गीकरण एक गुण की उपस्थिति और अनुपस्थिति, अर्थात् पुरुष या अपुरुष (स्त्री), के आधार पर किया जाता है। द्वितीय चरण में, प्रत्येक वर्ग - पुरुष और स्त्री - को एक अन्य गुण, अर्थात् विवाहित या अविवाहित होने, की उपस्थिति और अनुपस्थिति के आधार पर और उपविभाजित किया जाता है। ऊँचाई, वजन, आयु, आय, छात्रों के अंक आदि विशेषताएँ प्रकृति में मात्रात्मक होती हैं। जब ऐसी विशेषताओं के संग्रहित आँकड़ों को वर्गों में समूहीकृत किया जाता है, तो यह मात्रात्मक वर्गीकरण बन जाता है।

गतिविधि

आसपास की वस्तुओं को जीवित या अजीवित के रूप में समूहीकृत किया जा सकता है। क्या यह मात्रात्मक वर्गीकरण है?

उदाहरण 4

100 छात्रों के गणित में अंकों का बारंबारता बंटन

अंक	बारंबारता
0-10	1
10-20	8
20-30	6
30-40	7
40-50	21
50-60	23
60-70	19
70-80	6
80-90	5
90-100	4
योग	100

उदाहरण 4 में सारणी 3.1 में दिए गए 100 छात्रों के गणित के अंकों का मात्रात्मक वर्गीकरण दिखाया गया है।

गतिविधि

उदाहरण 4 की बारंबारता के मानों को कुल बारंबारता के अनुपात या प्रतिशत के रूप में व्यक्त करें। ध्यान दें कि इस प्रकार व्यक्त की गई बारंबारता को सापेक्ष बारंबारता कहा जाता है।

उदाहरण 4 में, किस वर्ग में आँकड़ों की अधिकतम सांद्रता है? इसे कुल प्रेक्षणों के प्रतिशत के रूप में व्यक्त करें। किस वर्ग में आँकड़ों की न्यूनतम सांद्रता है?

4. चर: सतत और विविक्त

एक सरल परिभाषा चर की, जिसे आपने पिछले अध्याय में पढ़ा है, यह नहीं बताती कि वह कैसे भिन्न होता है। चर विशिष्ट मानदंडों के आधार पर भिन्न होते हैं। इन्हें व्यापक रूप से दो प्रकारों में वर्गीकृत किया गया है:

(i) सतत और

(ii) विच्छिन्न।

एक सतत चर कोई भी संख्यात्मक मान ले सकता है। यह पूर्णांक मान $(1,2,3,4, \ldots)$, भिन्न मान $(1 / 2,2 / 3,3 / 4, \ldots)$, और ऐसे मान भी ले सकता है जो ठीक भिन्न नहीं होते $(\sqrt{2}=1.414$, $\sqrt{3}=1.732, \ldots, \sqrt{7}=2.645$ )। उदाहरण के लिए, किसी विद्यार्थी की ऊँचाई, जैसे वह बढ़ता है मान लीजिए 90 सेंटीमीटर से 150 सेंटीमीटर तक, इनके बीच के सभी मान लेगी। यह पूर्ण संख्याओं जैसे 90 सेंटीमीटर, 100 सेंटीमीटर, 108 सेंटीमीटर, 150 सेंटीमीटर जैसे मान ले सकती है। यह भिन्न मान भी ले सकती है जैसे 90.85 सेंटीमीटर, 102.34 सेंटीमीटर, 149.99 सेंटीमीटर आदि जो पूर्ण संख्याएँ नहीं हैं। इस प्रकार चर “ऊँचाई” हर संभावित मान को प्रकट करने में सक्षम है और इसके मानों को अनंत विभाजनों में भी तोड़ा जा सकता है। सतत चर के अन्य उदाहरण हैं वजन, समय, दूरी आदि।

एक सतत चर के विपरीत, एक विचरित चर केवल निश्चित मान ही ले सकता है। इसका मान केवल परिमित “छलांगों” से ही बदलता है। यह एक मान से दूसरे मान पर “छलांग” लगाता है लेकिन इन दोनों के बीच का कोई मध्यवर्ती मान नहीं लेता। उदाहरण के लिए, एक चर जैसे “कक्षा में विद्यार्थियों की संख्या”, विभिन्न कक्षाओं के लिए, केवल पूर्ण संख्याओं के मान ही ग्रहण करेगा। यह कोई भी भिन्नात्मक मान जैसे 0.5 नहीं ले सकता क्योंकि “आधा विद्यार्थी” व्यर्थ है। इसलिए यह 25 और 26 के बीच 25.5 जैसा मान नहीं ले सकता। इसके बजाय इसका मान या तो 25 हो सकता था या 26। हम देखते हैं कि जैसे ही इसका मान 25 से 26 बदलता है, इनके बीच के मान — भिन्न — इसके द्वारा नहीं लिए जाते। लेकिन हमें यह धारणा नहीं होनी चाहिए कि एक विचरित चर कोई भिन्नात्मक मान नहीं ले सकता। मान लीजिए $X$ एक चर है जो $1/8, 1/16, 1/32, 1/64, \ldots$ जैसे मान लेता है। क्या यह एक विचरित चर है? हाँ, क्योंकि यद्यपि $\mathrm{X}$ भिन्नात्मक मान लेता है, यह दो निकटतम भिन्नात्मक मानों के बीच का कोई भी मान नहीं ले सकता। यह $1/8$ से $1/16$ और $1/16$ से $1/32$ पर “छलांग” लगाता है। लेकिन यह $1/8$ और $1/16$ या $1/16$ और $1/32$ के बीच का कोई मान नहीं ले सकता।

गतिविधि

निम्नलिखित चरों को सतत और विचरित के रूप में भेद कीजिए: क्षेत्रफल, आयतन, तापमान, पासे पर आने वाली संख्या, फसल उत्पादन, जनसंख्या, वर्षा, सड़क पर कारों की संख्या और आयु।

उदाहरण 4 दिखाता है कि 100 छात्रों के अंकों को वर्गों में कैसे समूहित किया गया है। आप सोच रहे होंगे कि हमने यह तालिका 3.1 के कच्चे आंकड़ों से कैसे प्राप्त किया। लेकिन, इस प्रश्न को हल करने से पहले, आपको यह जानना होगा कि बारंबारता बंटन क्या होता है।

5. बारंबारता बंटन क्या है?

बारंबारता बंटन किसी मात्रात्मक चर के कच्चे आंकड़ों को वर्गीकृत करने का एक समग्र तरीका है। यह दिखाता है कि चर के विभिन्न मान (यहाँ, किसी छात्र द्वारा गणित में प्राप्त किए गए अंक) विभिन्न वर्गों में कैसे बंटे हैं, साथ ही उनके संगत वर्ग बारंबारताएँ। इस मामले में हमारे पास अंकों के दस वर्ग हैं: $0-10,10-20, \ldots$, 90-100। वर्ग बारंबारता शब्द का अर्थ है किसी विशेष वर्ग में मानों की संख्या। उदाहरण के लिए, वर्ग 30-40 में हमें तालिका 3.1 के कच्चे आंकड़ों से 7 अंक मिलते हैं। वे हैं $30,37,34,30,35,39,32$। इस प्रकार वर्ग: $30-40$ की बारंबारता 7 है। लेकिन आप सोच रहे होंगे कि कच्चे आंकड़ों में दो बार आ रहा $40-$ वर्ग 30-40 में क्यों नहीं शामिल किया गया। यदि इसे शामिल किया जाता तो वर्ग 30-40 की बारंबारता 7 के बजाय 9 होती। यह पहेली आपके लिए स्पष्ट हो जाएगी यदि आप इस अध्याय को धैर्यपूर्वक पढ़ते हैं। तो आगे बढ़िए। आप स्वयं उत्तर पा लेंगे।

प्रत्येक वर्ग एक आवृत्ति बंटन सारणी में वर्ग सीमाओं से घिरा होता है। वर्ग सीमाएँ एक वर्ग के दो छोर होती हैं। सबसे कम मान को निम्न वर्ग सीमा कहा जाता है और सबसे अधिक मान को उच्च वर्ग सीमा। उदाहरण के लिए, वर्ग: 60-70 के लिए वर्ग सीमाएँ 60 और 70 हैं। इसकी निम्न वर्ग सीमा 60 है और इसकी उच्च वर्ग सीमा 70 है। वर्ग अंतराल या वर्ग चौड़ाई उच्च वर्ग सीमा और निम्न वर्ग सीमा के बीच का अंतर होता है। वर्ग 60-70 के लिए, वर्ग अंतराल 10 है (उच्च वर्ग सीमा माइनस निम्न वर्ग सीमा)।

वर्ग मध्य-बिंदु या वर्ग चिह्न एक वर्ग का मध्य मान होता है। यह एक वर्ग की निम्न वर्ग सीमा और उच्च वर्ग सीमा के बीच आधे रास्ते पर स्थित होता है और निम्नलिखित तरीके से ज्ञात किया जा सकता है:

वर्ग मध्य-बिंदु या वर्ग चिह्न

$$ \text { = (उच्च वर्ग सीमा + निम्न वर्ग सीमा)/2 } $$

प्रत्येक वर्ग का वर्ग चिह्न या मध्य-मान वर्ग को दर्शाने के लिए प्रयोग किया जाता है। एक बार कच्चे आंकड़ों को वर्गों में समूहबद्ध कर दिया जाता है, तो व्यक्तिगत प्रेक्षण आगे की गणनाओं में प्रयोग नहीं किए जाते। इसके बजाय, वर्ग चिह्न का उपयोग किया जाता है।

TABLE 3.3 The Lower Class Limits, the Upper Class Limits and the Class Mark

वर्ग	आवृत्ति	निम्न वर्ग सीमा	उच्च वर्ग सीमा	वर्ग चिह्न
0-10	1	0	10	5
10-20	8	10	20	15
20-30	6	20	30	25
30-40	7	30	40	35
40-50	21	40	50	45
50-60	23	50	60	55
60-70	19	60	70	65
70-80	6	70	80	75
80-90	5	80	90	85
90-100	4	90	100	95

आवृत्ति वक्र एक आवृत्ति बंटन का आलेखीय चित्रण होता है। चित्र 3.1 हमारे उपरोक्त उदाहरण के आँकड़ों के आवृत्ति बंटन की आरेखीय प्रस्तुति दिखाता है। आवृत्ति वक्र प्राप्त करने के लिए हम वर्ग चिह्नों को $\mathrm{X}$-अक्ष पर और आवृत्ति को $\mathrm{Y}$-अक्ष पर लगाते हैं।

चित्र 3.1: आँकड़ों के आवृत्ति बंटन की आरेखीय प्रस्तुति।

आवृत्ति बंटन तैयार करना

आवृत्ति बंटन तैयार करते समय निम्नलिखित पाँच प्रश्नों का समाधान करना आवश्यक होता है:

क्या हमें समान या असमान आकार की वर्ग अंतराल रखने चाहिए?
हमें कितने वर्ग रखने चाहिए?
प्रत्येक वर्ग का आकार क्या होना चाहिए?
वर्ग सीमाओं का निर्धारण कैसे करें?
प्रत्येक वर्ग के लिए आवृत्ति कैसे प्राप्त करें?

क्या हमें समान या असमान आकार की वर्ग अंतराल रखने चाहिए?

दो ऐसी परिस्थितियाँ होती हैं जिनमें असमान आकार के अंतरालों का प्रयोग किया जाता है। पहली, जब हमारे पास आय और अन्य इसी तरह के चरों पर आँकड़े हों जिनकी सीमा बहुत अधिक हो। उदाहरण के लिए, प्रतिदिन आय लगभग शून्य से लेकर सैकड़ों करोड़ रुपये तक हो सकती है। ऐसी परिस्थिति में समान वर्ग अंतराल उपयुक्त नहीं होते क्योंकि (i) यदि वर्ग अंतराल मध्यम आकार के और समान हों तो वर्गों की संख्या बहुत अधिक हो जाएगी। (ii) यदि वर्ग अंतराल बड़े हों तो हम या तो बहुत कम स्तर या बहुत अधिक स्तर की आय की सूचना को दबा देंगे।

दूसरी, यदि बड़ी संख्या में मान सीमा के एक छोटे भाग में केंद्रित हों तो समान वर्ग अंतरालों से कई मानों की सूचना की कमी हो जाएगी।

अन्य सभी परिस्थितियों में, बारंबारता बंटनों में समान आकार के वर्ग अंतरालों का प्रयोग किया जाता है।

हमें कितने वर्ग होने चाहिए?

वर्गों की संख्या सामान्यतः छः से पंद्रह के बीच होती है। यदि हम समान आकार के वर्ग अंतरालों का प्रयोग कर रहे हों तो वर्गों की संख्या को सीमा (चर के सबसे बड़े और सबसे छोटे मानों के बीच का अंतर) को वर्ग अंतराल के आकार से भाग देकर परिकलित किया जा सकता है।

गतिविधियाँ

निम्नलिखित की सीमा ज्ञात कीजिए:

उदाहरण 1 में भारत की जनसंख्या,

उदाहरण 2 में गेहूँ की पैदावार।

प्रत्येक वर्ग का आकार कितना होना चाहिए?

इस प्रश्न का उत्तर पिछले प्रश्न के उत्तर पर निर्भर करता है। चर की सीमा दी गई होने पर, एक बार जब हम वर्ग अंतराल तय कर लेते हैं तो हम वर्गों की संख्या निर्धारित कर सकते हैं। इस प्रकार हम पाते हैं कि ये दोनों निर्णय आपस में जुड़े हुए हैं। हम एक का निर्णय दूसरे के बिना नहीं ले सकते।

उदाहरण 4 में, हमारे पास वर्गों की संख्या 10 है। सीमा का मान 100 दिया गया है, इसलिए वर्ग अंतराल स्वचालित रूप से 10 हो जाते हैं। ध्यान दें कि वर्तमान संदर्भ में हमने समान परिमाण के वर्ग अंतराल चुने हैं। हालांकि, हम ऐसे वर्ग अंतराल भी चुन सकते थे जो समान परिमाण के नहीं होते। उस स्थिति में वर्ग असमान चौड़ाई वाले होते।

हमें वर्ग सीमाएँ कैसे निर्धारित करनी चाहिए?

वर्ग सीमाएँ निश्चित और स्पष्ट रूप से बताई जानी चाहिए। सामान्यतः, खुले वर्ग जैसे “70 और अधिक” या “10 से कम” वांछनीय नहीं होते हैं।

निचली और ऊपरी वर्ग सीमाएँ इस प्रकार निर्धारित की जानी चाहिए कि प्रत्येक वर्ग की बारंबारताएँ वर्ग अंतराल के मध्य में केंद्रित हों।

वर्ग अंतराल दो प्रकार के होते हैं:

(i) समावेशी वर्ग अंतराल: इस स्थिति में, किसी वर्ग की निचली और ऊपरी सीमा के बराबर मान उसी वर्ग की बारंबारता में शामिल किए जाते हैं।

(ii) अपवर्जी वर्ग अंतराल: इस स्थिति में, कोई वस्तु जो निचली या ऊपरी वर्ग सीमा के बराबर हो, उस वर्ग की बारंबारता से बाहर रखी जाती है।

विचरित चरों के मामले में, समावेशी और अपवर्जी दोनों प्रकार के वर्ग अंतराल प्रयुक्त किए जा सकते हैं।

लगातार चरों के मामले में समावेशी वर्ग अंतराल बहुत बार प्रयोग किए जाते हैं।

उदाहरण

मान लीजिए हमारे पास किसी परीक्षा में विद्यार्थियों द्वारा प्राप्त किए गए अंकों का डेटा है और सभी अंक पूर्ण संख्याओं में हैं (भिन्नात्मक अंकों की अनुमति नहीं है)। मान लीजिए विद्यार्थियों द्वारा प्राप्त अंक 0 से 100 तक भिन्न-भिन्न हैं।

यह विच्छिन्न चरों का मामला है क्योंकि भिन्नात्मक अंकों की अनुमति नहीं है। इस मामले में, यदि हम समान आकार के वर्ग अंतराल प्रयोग कर रहे हैं और 10 वर्ग अंतराल रखने का निर्णय लेते हैं तो वर्ग अंतराल निम्नलिखित दोनों रूपों में से किसी एक रूप में हो सकते हैं:

समावेशी रूप के वर्ग अंतराल:

$0-10$

$11-20$

$21-30$

$-$

$91-100$

असमावेशी रूप के वर्ग अंतराल: $0-10$

$10-20$

$20-30$

$-$

$90-100$

असमावेशी वर्ग अंतरालों के मामले में हमें पहले से निर्णय लेना होता है कि यदि हमें वर्ग सीमा के बराबर मान प्राप्त होता है तो उसके साथ क्या किया जाए। उदाहरण के लिए हम निर्णय ले सकते हैं कि 10, 30 आदि जैसे मानों को क्रमशः “0 से 10” और “20 से 30” वर्ग अंतरालों में रखा जाए। इसे निम्न सीमा असमावेशित कहा जा सकता है।

अथवा हम 10, 30 आदि जैसे मानों को क्रमशः “10 से 20” और “30 से 40” वर्ग अंतरालों में रख सकते हैं। इसे ऊपरी सीमा असमावेशित कहा जा सकता है।

लगातार चर का उदाहरण

मान लीजिए हमारे पास ऊँचाई (सेंटीमीटर) या वज़न (किलोग्राम) जैसे चर पर डेटा है। यह डेटा लगातार प्रकार का है। ऐसे मामलों में वर्ग अंतराल निम्नलिखित ढंग से परिभाषित किए जा सकते हैं:

$30 \mathrm{Kg}-39.999 \ldots \mathrm{Kg}$

$40 \mathrm{Kg}-49.999 \ldots \mathrm{Kg}$

$50 \mathrm{Kg}-59.999 \ldots \mathrm{Kg}$ आदि।

इन वर्ग अंतरालों को निम्नलिखित तरीके से समझा जाता है:

$30 \mathrm{Kg}$ और उससे ऊपर तथा $40 \mathrm{Kg}$ से कम

$40 \mathrm{Kg}$ और उससे ऊपर तथा $50 \mathrm{Kg}$ से कम

$50 \mathrm{Kg}$ और उससे ऊपर तथा $60 \mathrm{Kg}$ से कम, आदि।

TABLE 3.4 एक कंपनी के 550 कर्मचारियों की आय का बारंबारा वितरण

आय $(रु)$	कर्मचारियों की संख्या
800-899	50
900-999	100
1000-1099	200
1100-1199	150
1200-1299	40
1300-1399	10
कुल	550

वर्ग अंतराल में समायोजन

Table 3.4 में समावेशी विधि के सावधानीपूर्वक अवलोकन से यह स्पष्ट होता है कि यद्यपि चर “आय” एक सतत चर है, वर्ग बनाते समय ऐसी निरंतरता बनाए नहीं रखी जाती। हमें एक वर्ग की ऊपरी सीमा और अगले वर्ग की निचली सीमा के बीच “अंतराल” या असांतत्य दिखाई देता है। उदाहरण के लिए, पहले वर्ग की ऊपरी सीमा 899 और दूसरे वर्ग की निचली सीमा 900 के बीच हमें 1 का “अंतराल” दिखाई देता है। तब हम वर्गीकरण करते समय चर की निरंतरता कैसे सुनिश्चित करते हैं? यह वर्ग अंतराल में समायोजन करके प्राप्त किया जाता है। समायोजन निम्नलिखित तरीके से किया जाता है:

दूसरे वर्ग की निचली सीमा और पहले वर्ग की ऊपरी सीमा के बीच का अंतर निकालें। उदाहरण के लिए, तालिका 3.4 में दूसरे वर्ग की निचली सीमा 900 है और पहले वर्ग की ऊपरी सीमा 899 है। इनके बीच का अंतर 1 है, अर्थात् $(900-899=1)$
(1) में प्राप्त अंतर को दो से विभाजित करें, अर्थात् $(1 / 2=0.5)$
(2) में प्राप्त मान को सभी वर्गों की निचली सीमाओं से घटाएँ (निचली वर्ग सीमा - 0.5)
(2) में प्राप्त मान को सभी वर्गों की ऊपरी सीमाओं में जोड़ें (ऊपरी वर्ग सीमा +0.5$)$।

आवृत्ति बंटन में डेटा की निरंतरता बहाल करने वाले समायोजन के बाद, तालिका 3.4 को तालिका 3.5 में संशोधित किया गया है

वर्ग सीमाओं में समायोजन के बाद, समता (1) जो वर्ग-चिह्न का मान निर्धारित करती है, निम्नलिखित के रूप में संशोधित हो जाती है:

समायोजित वर्ग चिह्न = (समायोजित ऊपरी वर्ग सीमा + समायोजित निचली वर्ग सीमा)/2.

तालिका 3.5 एक कंपनी के 550 कर्मचारियों की आय का आवृत्ति बंटन

आय (रु)	कर्मचारियों की संख्या
799.5-899.5	50
899.5-999.5	100
999.5-1099.5	200
1099.5-1199.5	150
1199.5-1299.5	40
1299.5-1399.5	10
कुल	550

हमें प्रत्येक वर्ग के लिए आवृत्ति कैसे प्राप्त करनी चाहिए?

सरल शब्दों में, एक प्रेक्षण की बारंबारता का अर्थ है वह प्रेक्षण कच्चे आंकड़ों में कितनी बार आता है। हमारी तालिका 3.1 में हम देखते हैं कि मान 40 तीन बार आता है; 0 और 10 केवल एक-एक बार आते हैं; 49 पाँच बार आता है आदि। इस प्रकार 40 की बारंबारता 3 है, 0 की 1 है, 10 की 1 है, 49 की 5 है आदि। परंतु जब आंकड़ों को वर्गों में समूहबद्ध किया जाता है जैसे उदाहरण 3 में, वर्ग बारंबारता का अर्थ है उस विशेष वर्ग में मानों की संख्या। वर्ग बारंबारता की गिनती संबंधित वर्ग के सामने टैली चिह्नों द्वारा की जाती है।

टैली चिह्न लगाकर वर्ग बारंबारता ज्ञात करना

प्रत्येक विद्यार्थी के लिए जिसके अंक उस वर्ग में आते हैं, एक टैली (/) चिह्न वर्ग के सामने लगाया जाता है। उदाहरण के लिए, यदि किसी विद्यार्थी को 57 अंक मिले हैं, तो हम वर्ग $50-60$ के सामने एक टैली (/) लगाते हैं। यदि अंक 71 हैं, तो वर्ग 70-80 के सामने एक टैली लगाई जाती है। यदि किसी को 40 अंक मिले हैं, तो वर्ग 40-50 के सामने एक टैली लगाई जाती है। तालिका 3.6 तालिका 3.1 से गणित में 100 विद्यार्थियों के अंकों की टैली चिह्नन दिखाती है।

तालिका 3.6 गणित में 100 विद्यार्थियों के अंकों का टैली चिह्नन

गिनती करना आसान हो जाता है जब चार टैलियों को //// के रूप में रखा जाता है और पाँचवीं टैली को उनके ऊपर IN के रूप में लगाया जाता है। फिर टैलियों को पाँच के समूहों में गिना जाता है। इसलिए यदि किसी वर्ग में 16 टैलियाँ हों, तो सुविधा के लिए हम उन्हें $M N / T N$ IN/ / के रूप में रखते हैं। इस प्रकार किसी वर्ग की बारंबारता उस वर्ग के सामने बनी टैलियों की संख्या के बराबर होती है।

सूचना की हानि

आंकड़ों को बारंबारता बंटन के रूप में वर्गीकृत करने में एक स्वाभाविक कमी होती है। यद्यपि यह कच्चे आंकड़ों को संक्षिप्त और समझने योग्य बनाता है, पर इसमें वे विवरण नहीं दिखते जो कच्चे आंकड़ों में मौजूद होते हैं। कच्चे आंकड़ों को वर्गीकृत करने में सूचना की हानि होती है, यद्यपि इसे वर्गीकृत आंकड़े के रूप में संक्षेप में प्रस्तुत करने से बहुत कुछ प्राप्त होता है। एक बार जब आंकड़ों को वर्गों में समूहबद्ध कर दिया जाता है, तो कोई भी व्यक्तिगत प्रेक्षण आगे की सांख्यिकीय गणनाओं में कोई महत्व नहीं रखता। उदाहरण 4 में, वर्ग 20-30 में 6 प्रेक्षण हैं: $25,25,20,22,25$ और 28। इसलिए जब इन आंकड़ों को बारंबारता बंटन में वर्ग $20-30$ के रूप में समूहबद्ध किया जाता है, तो बाद वाला केवल उस वर्ग में रिकॉर्डों की संख्या देता है (अर्थात् बारंबारता $=6$) पर उनके वास्तविक मान नहीं देता। इस वर्ग के सभी मानों को वर्ग अंतराल या वर्ग चिह्न के मध्य मान के बराबर माना जाता है (अर्थात् 25)। आगे की सांख्यिकीय गणनाएं केवल वर्ग चिह्न के मानों पर आधारित होती हैं न कि उस वर्ग में मौजूद प्रेक्षणों के मानों पर। यह बात अन्य वर्गों के लिए भी सच है। इस प्रकार सांख्यिकीय विधियों में प्रेक्षणों के वास्तविक मानों के स्थान पर वर्ग चिह्न के प्रयोग से पर्याप्त सूचना की हानि होती है। तथापि, कच्चे आंकड़ों को अधिक समझने योग्य बनाने की क्षमता इसकी भरपाई से कहीं अधिक करती है।

असमान वर्गों के साथ बारंबारता बंटन

अब तक आप समान वर्ग अंतरालों की बारंबारता बंटन से परिचित हैं। आप जानते हैं कि इन्हें कच्चे आँकड़ों से कैसे बनाया जाता है। पर कुछ मामलों में असमान वर्ग अंतरालों वाली बारंबारता बंटन अधिक उपयुक्त होती है। यदि आप उदाहरण 4 की बारंबारता बंटन को तालिका 3.6 की तरह देखें, तो आप देखेंगे कि अधिकांश प्रेक्षण वर्गों 40-50, 50-60 और 60-70 में केंद्रित हैं। इनकी संगत बारंबारताएँ 21, 23 और 19 हैं। इसका अर्थ है कि 100 विद्यार्थियों में से 63 $(21+23+19)$ विद्यार्थी इन वर्गों में केंद्रित हैं। इस प्रकार, 63 प्रतिशत 40-70 की मध्यम सीमा में हैं। शेष 37 प्रतिशत आँकड़े वर्गों $0-10,10-20,20-30,30-40$, 70-80, 80-90 और 90-100 में हैं। ये वर्ग प्रेक्षणों से विरल आबादित हैं। आगे आप यह भी देखेंगे कि इन वर्गों में प्रेक्षण अपने-अपने वर्ग चिह्नों से अन्य वर्गों की तुलना में अधिक विचलित होते हैं। पर यदि वर्ग इस प्रकार बनाए जाएँ कि वर्ग चिह्न, जहाँ तक संभव हो, उस मान के आसपास हों जिसके चारों ओर वर्ग के प्रेक्षण केंद्रित होते हैं, तो असमान वर्ग अंतराल अधिक उपयुक्त है।

TABLE 3.7 Frequency Distribution of Unequal Classes

वर्ग	प्रेक्षण	आवृत्ति	वर्ग चिह्न
0-10	0	1	5
10-20	10,14,17,12,14,12,14,14	8	15
20-30	25,25,20,22,25,28	6	25
30-40	30,37,34,39,32,30,35	7	35
40-45	42,44,40,44,41,40,43,40,41	9	42.5
45-50	47,49,49,45,45,47,49,46,48,48,49,49	12	47.5
50-55	51,53,51,50,51,50,54	7	52.5
55-60	59,56,55,57,55,56,59,56,59,57,59,55,56,55,56,55	16	57.5
60-65	60,64,62,64,64,60,62,61,60,62	10	62.5
65-70	66,69,66,69,66,65,65,66,65	9	67.5
70-80	70,75,70,76,70,71	6	75
80-90	82,82,82,80,85	5	85
90-100	90,100,90,90	4	95
	कुल	100

तालिका 3.7 तालिका 3.6 की उसी आवृत्ति बंटन को असमान वर्गों के संदर्भ में दिखाती है। प्रत्येक वर्ग 40-50, 50-60 और 60-70 को दो-दो वर्गों में विभाजित किया गया है: वर्ग 40-50 को $40-45$ और 45-50 में बाँटा गया है। वर्ग 50-60 को 50-55 और 55-60 में बाँटा गया है। और वर्ग 60-70 को 60-65 और 65-70 में बाँटा गया है। नए वर्ग 40-45, 45-50, 50-55, 55-60, 60-65 और 65-70 की वर्ग अंतराल 5 है। अन्य वर्ग: 0-10, 10-20, 20-30, 30-40, 70-80, 80-90 और 90-100 अपने पुराने वर्ग अंतराल 10 को बरकरार रखते हैं। इस तालिका का अंतिम स्तंभ इन वर्गों के लिए वर्ग चिह्नों के नए मान दिखाता है। इनकी तुलना तालिका 3.6 में वर्ग चिह्नों के पुराने मानों से करें। ध्यान दें कि इन वर्गों में प्रेक्षण अपने पुराने वर्ग चिह्न मानों की तुलना में नए वर्ग चिह्न मानों से अधिक विचलित होते हैं। इस प्रकार नए वर्ग चिह्न मान इन वर्गों में आँकड़ों के लिए पुराने मानों की तुलना में अधिक प्रतिनिधिक हैं।

आकृति 3.2 तालिका 3.7 के बंटन की आवृत्ति वक्र दिखाती है।

आकृति 3.2: आवृत्ति वक्र

तालिका के वर्ग चिह्नों को X-अक्ष पर और आवृत्तियों को Y-अक्ष पर आलेखित किया गया है।

गतिविधि

यदि आप आकृति 3.2 की तुलना आकृति 3.1 से करें, तो आप क्या प्रेक्षित करते हैं? क्या आपको इनमें कोई अंतर दिखता है? क्या आप इस अंतर की व्याख्या कर सकते हैं?

आवृत्ति सरणी

अब तक हमने एक सतत चर के आँकड़ों के वर्गीकरण की चर्चा गणित में 100 विद्यार्थियों के प्रतिशत अंकों के उदाहरण से की है। एक विचर चर के आँकड़ों के वर्गीकरण को बारंबारता सरणी (Frequency Array) कहा जाता है। चूँकि विचर चर मान ग्रहण करता है और दो पूर्णांक मानों के बीच की भिन्नात्मक मध्यवर्ती मान नहीं लेता, इसलिए प्रत्येक पूर्णांक मान के अनुरूप बारंबारताएँ होती हैं।

तालिका 3.8 में दिया गया उदाहरण एक बारंबारता सरणी को दर्शाता है।

तालिका 3.8 परिवारों के आकार की बारंबारता सरणी

परिवार का आकार	परिवारों की संख्या
1	5
2	15
3	25
4	35
5	10
6	5
7	3
8	2
योग	100

चर “परिवार का आकार” एक विचर चर है जो तालिका में दिखाए अनुसार केवल पूर्णांक मान ही ग्रहण करता है।

6. द्विचर बारंबारता बंटन

अक्सर जब हम किसी समष्टि से एक प्रतिदर्श लेते हैं, तो प्रतिदर्श के प्रत्येक तत्व से एक से अधिक प्रकार की सूचनाएँ एकत्र करते हैं। उदाहरण के लिए, मान लीजिए हमने किसी शहर में आधारित कंपनियों की सूची से 20 कंपनियों का प्रतिदर्श लिया है। मान लीजिए प्रत्येक कंपनी से बिक्री और विज्ञापन पर व्यय की सूचना एकत्र करते हैं। इस स्थिति में हमारे पास द्विचर प्रतिदर्श आँकड़े हैं। ऐसे द्विचर आँकड़ों को द्विचर बारंबारता बंटन द्वारा संक्षेप में प्रस्तुत किया जा सकता है।

द्विचर बारंबारता बंटन को दो चरों के बारंबारता बंटन के रूप में परिभाषित किया जा सकता है।

तालिका 3.9 में 20 कंपनियों की दो चरों—बिक्री और विज्ञापन व्यय (रु. लाख में)—की आवृत्ति बंटन दिखाया गया है। बिक्री के मान विभिन्न स्तंभों में वर्गीकृत हैं और विज्ञापन व्यय के मान विभिन्न पंक्तियों में वर्गीकृत हैं। प्रत्येक सेल संगत पंक्ति और स्तंभ मानों की आवृत्ति दिखाता है। उदाहरण के लिए, 3 ऐसी फर्में हैं जिनकी बिक्री रु 135 से रु 145 लाख के बीच है और उनका विज्ञापन व्यय रु 64 से रु 66 हजार के बीच है। द्विचर बंटन का प्रयोग सहसंबंध पर अध्याय 8 में लिया जाएगा।

7. निष्कर्ष

प्राथमिक और द्वितीय स्रोतों से एकत्रित आंकड़े कच्चे या अवर्गीकृत होते हैं। एक बार आंकड़े एकत्र हो जाने पर, अगला कदम उन्हें आगे के सांख्यिकीय विश्लेषण के लिए वर्गीकृत करना होता है। वर्गीकरण आंकड़ों में क्रम लाता है। यह अध्याय आपको यह जानने में सक्षम बनाता है कि आंकड़ों को आवृत्ति बंटन के माध्यम से व्यापक रूप से कैसे वर्गीकृत किया जा सकता है। एक बार जब आप वर्गीकरण की तकनीकों को जान लेते हैं, तो आपके लिए सतत और विच्छिन्न चरों दोनों के लिए आवृत्ति बंटन बनाना आसान हो जाएगा।

तालिका 3.9 20 फर्मों की बिक्री (लाख रु में) और विज्ञापन व्यय (हजार रु में) का द्विचर आवृत्ति बंटन

	115–125	125–135	135–145	145–155	155–165	165–175	कुल
62-64	2	1					3
64-66	1		3				4
66-68	1	1	2	1			5
68-70		2		2			4
70-72		1	1		1	1	4
कुल	4	5	6	3	1	1	20

सारांश

वर्गीकरण कच्चे डेटा में क्रम लाता है।

एक बारंबारता बंटन दिखाता है कि किसी चर के विभिन्न मान विभिन्न वर्गों में कैसे बँटे हैं, साथ ही उनके संगत वर्ग बारंबारताएँ।

विशिष्ट विधि में या तो ऊपरी वर्ग सीमा या निचली वर्ग सीमा को बाहर रखा जाता है।

समावेशी विधि में ऊपरी और निचली दोनों वर्ग सीमाएँ शामिल की जाती हैं।

एक बारंबारता बंटन में, आगे की सांख्यिकीय गणनाएँ केवल वर्ग चिह्न मानों पर आधारित होती हैं, प्रेक्षणों के मानों के बजाय।

वर्गों को इस प्रकार बनाना चाहिए कि प्रत्येक वर्ग का वर्ग चिह्न यथासंभव उस मान के निकट आए, जिसके आसपास वर्ग में प्रेक्षण एकत्रित होते हैं।

अभ्यास

1. निम्नलिखित में से कौन-सा विकल्प सत्य है?

(i) वर्ग मध्यबिंदु बराबर होता है:

(a) ऊपरी वर्ग सीमा और निचली वर्ग सीमा का औसत।

(b) ऊपरी वर्ग सीमा और निचली वर्ग सीमा का गुणनफल।

(d) उपर्युक्त में से कोई नहीं।

(ii) दो चरों का बारंबारता बंटन कहलाता है

(a) एकचर बंटन

(b) द्विविधीय बंटन

(d) उपर्युक्त में से कोई नहीं

(iii) वर्गीकृत आँकड़ों में सांख्यिकीय गणनाएँ आधारित होती हैं

(a) प्रेक्षणों के वास्तविक मानों पर

(b) उच्च वर्ग सीमाओं पर

(d) वर्ग मध्य-बिंदुओं पर

(iv) परास है

(a) सबसे बड़े और सबसे छोटे प्रेक्षणों के बीच का अंतर

(b) सबसे छोटे और सबसे बड़े प्रेक्षणों के बीच का अंतर

(d) सबसे बड़े को सबसे छोटे प्रेक्षण से अनुपात

2. क्या वस्तुओं को वर्गीकृत करने का कोई लाभ हो सकता है? अपने दैनिक जीवन के किसी उदाहरण के साथ समझाइए।

3. चर क्या होता है? विवृत (डिस्क्रीट) और सतत चर के बीच अंतर स्पष्ट कीजिए।

4. आँकड़ों की वर्गीकरण में प्रयुक्त ‘अनावर्ती’ और ‘आवर्ती’ विधियों की व्याख्या कीजिए।

5. सारणी 3.2 में दिए गए 50 परिवारों के भोजन पर मासिक घरेलू व्यय (रुपयों में) से संबंधित आँकड़ों का प्रयोग कीजिए और

(i) भोजन पर मासिक घरेलू व्यय की परास प्राप्त कीजिए।

(ii) परास को उपयुक्त संख्या में वर्ग अंतरालों में विभाजित कीजिए और व्यय का बारंबारता बंटन प्राप्त कीजिए।

(iii) उन परिवारों की संख्या ज्ञात कीजिए जिनका भोजन पर मासिक व्यय

(a) रु 2000 से कम है

(b) रु 3000 से अधिक है

6. एक शहर में 45 परिवारों से उनके द्वारा प्रयुक्त सेल फोनों की संख्या के लिए सर्वेक्षण किया गया। नीचे दर्ज उनके उत्तरों के आधार पर एक बारंबार सरणी तैयार कीजिए।


1	3	2	2	2	2	1	2	1	2	2	3	3	3	3
3	3	2	3	2	2	6	1	6	2	1	5	1	5	3
2	4	2	7	4	2	4	3	4	2	0	3	1	4	3

7. वर्गीकृत आंकड़ों में ‘सूचना की हानि’ क्या होती है?

8. क्या आप सहमत हैं कि वर्गीकृत आंकड़े कच्चे आंकड़ों से बेहतर होते हैं? क्यों?

9. एकचर और द्विचर बारंबारता बंटन के बीच अंतर स्पष्ट कीजिए।

10. निम्नलिखित आंकड़ों से 7 के वर्ग अंतराल को लेकर समावेशी विधि द्वारा बारंबारता बंटन तैयार कीजिए।


28	17	15	22	29	21	23	27	18	12	7	2	9	4
1	8	3	10	5	20	16	12	8	4	33	27	21	15
3	36	27	18	9	2	4	6	32	31	29	18	14	13
15	11	9	7	1	5	37	32	28	26	24	20	19	25
19	20	6	9

11. “The quick brown fox jumps over the lazy dog” उपरोक्त वाक्य को ध्यान से देखिए और प्रत्येक शब्द में अक्षरों की संख्या को नोट कीजिए। अक्षरों की संख्या को चर मानते हुए इस आंकड़े के लिए बारंबारता सरणी तैयार कीजिए।

सुझाया गया गतिविधि

अपनी पुरानी अंकपत्रिकाओं से पिछली कक्षा की अर्धवार्षिक या वार्षिक परीक्षाओं में गणित विषय में प्राप्त किए गए अंक खोजें। उन्हें वर्षवार व्यवस्थित करें। जांचें कि आपने इस विषय में प्राप्त किए गए अंक एक चर हैं या नहीं। यह भी देखें कि क्या वर्षों के दौरान आपने गणित में सुधार किया है।

अध्याय 03 डेटा का संगठन

1. भूमिका

2. कच्चा आँकड़ा

3. आंकड़ों का वर्गीकरण

4. चर: सतत और विविक्त

5. बारंबारता बंटन क्या है?

आवृत्ति बंटन तैयार करना

क्या हमें समान या असमान आकार की वर्ग अंतराल रखने चाहिए?

हमें कितने वर्ग होने चाहिए?

प्रत्येक वर्ग का आकार कितना होना चाहिए?

हमें वर्ग सीमाएँ कैसे निर्धारित करनी चाहिए?

लगातार चर का उदाहरण

वर्ग अंतराल में समायोजन

हमें प्रत्येक वर्ग के लिए आवृत्ति कैसे प्राप्त करनी चाहिए?

टैली चिह्न लगाकर वर्ग बारंबारता ज्ञात करना

सूचना की हानि

असमान वर्गों के साथ बारंबारता बंटन

आवृत्ति सरणी

6. द्विचर बारंबारता बंटन

7. निष्कर्ष

अभ्यास

RRB GROUP D

RRB NTPC

RPF SI

RPF CONSTABLE

RRB JE

RRB ALP

RRB TECHNICIAN

NCERT Books

Important Resources

Forums


47	45	10	60	51	56	66	100	49	40
60	59	56	55	62	48	59	55	51	41
42	69	64	66	50	59	57	65	62	50
64	30	37	75	17	56	20	14	55	90
62	51	55	14	25	34	90	49	56	54
70	47	49	82	40	82	60	85	65	66
49	44	64	69	70	48	12	28	55	65
49	40	25	41	71	80	0	56	14	22
66	53	46	70	43	61	59	12	30	35
45	44	57	76	82	39	32	14	90	25


28	17	15	22	29	21	23	27	18	12	7	2	9	4
1	8	3	10	5	20	16	12	8	4	33	27	21	15
3	36	27	18	9	2	4	6	32	31	29	18	14	13
15	11	9	7	1	5	37	32	28	26	24	20	19	25
19	20	6	9


47	45	10	60	51	56	66	100	49	40
60	59	56	55	62	48	59	55	51	41
42	69	64	66	50	59	57	65	62	50
64	30	37	75	17	56	20	14	55	90
62	51	55	14	25	34	90	49	56	54
70	47	49	82	40	82	60	85	65	66
49	44	64	69	70	48	12	28	55	65
49	40	25	41	71	80	0	56	14	22
66	53	46	70	43	61	59	12	30	35
45	44	57	76	82	39	32	14	90	25


28	17	15	22	29	21	23	27	18	12	7	2	9	4
1	8	3	10	5	20	16	12	8	4	33	27	21	15
3	36	27	18	9	2	4	6	32	31	29	18	14	13
15	11	9	7	1	5	37	32	28	26	24	20	19	25
19	20	6	9


47	45	10	60	51	56	66	100	49	40
60	59	56	55	62	48	59	55	51	41
42	69	64	66	50	59	57	65	62	50
64	30	37	75	17	56	20	14	55	90
62	51	55	14	25	34	90	49	56	54
70	47	49	82	40	82	60	85	65	66
49	44	64	69	70	48	12	28	55	65
49	40	25	41	71	80	0	56	14	22
66	53	46	70	43	61	59	12	30	35
45	44	57	76	82	39	32	14	90	25


28	17	15	22	29	21	23	27	18	12	7	2	9	4
1	8	3	10	5	20	16	12	8	4	33	27	21	15
3	36	27	18	9	2	4	6	32	31	29	18	14	13
15	11	9	7	1	5	37	32	28	26	24	20	19	25
19	20	6	9