अध्याय 03 माहितीचे संघटन

1. प्रस्तावना

मागील अध्यायात तुम्ही माहिती कशी गोळा केली जाते याबद्दल शिकलात. तुम्हाला जनगणना आणि नमुना यातील फरकही कळला. या अध्यायात, तुम्ही गोळा केलेली माहिती कशी वर्गीकृत करायची ते तुम्हाला कळेल. कच्च्या माहितीचे वर्गीकरण करण्याचा हेतू म्हणजे त्यात क्रमवारी आणणे जेणेकरून त्या पुढील सांख्यिकीय विश्लेषणासाठी सहजपणे वापरता येतील.

तुम्ही कधी तुमच्या स्थानिक जुन्या वस्तू विकणाऱ्या दुकानदार किंवा कबडीवाल्याकडे लक्ष दिले आहे का, ज्याला तुम्ही जुन्या वृत्तपत्रे, तुटलेली घरगुती वस्तू, रिकामी काचेच्या बाटल्या, प्लास्टिक इत्यादी विकता? तो तुमच्याकडून ह्या वस्तू विकत घेतो आणि त्यांची पुनर्वापर करणाऱ्यांना विकतो. पण त्याच्या दुकानात इतक्या जुन्या वस्तू असल्याने, जर त्याने त्यांची योग्य रीतीने मांडणी केली नसती तर त्याच्या व्यवसायाचे व्यवस्थापन करणे खूप कठीण झाले असते. त्याची परिस्थिती सोपी करण्यासाठी तो विविध जुन्या वस्तू योग्य गटात किंवा “वर्गात” ठेवतो. तो जुन्या वृत्तपत्रांना एकत्र ठेवतो आणि दोरीने बांधतो. नंतर सर्व रिकाम्या काचेच्या बाटल्या एका पोत्यात गोळा करतो. तो धातूच्या वस्तू दुकानाच्या एका कोपऱ्यात रचतो आणि त्यांना “लोखंड”, “तांबे”, “अॅल्युमिनियम”, “पितळ” इत्यादी गटांमध्ये वर्गीकृत करतो. अशाप्रकारे तो त्याच्या जुन्या वस्तूंचे वेगवेगळ्या वर्गांमध्ये - “वृत्तपत्रे”, “प्लास्टिक”, “काच”, “धातू” इत्यादी - गट करतो आणि त्यात क्रमवारी आणतो. एकदा त्याच्या जुन्या वस्तूंची मांडणी आणि वर्गीकरण झाल्यानंतर, खरेदीदाराला हवी असलेली विशिष्ट वस्तू शोधणे त्याच्यासाठी सोपे जाते.

त्याचप्रमाणे जेव्हा तुम्ही तुमची शाळेतील पुस्तके एका विशिष्ट क्रमाने मांडता, तेव्हा ती हाताळणे तुमच्यासाठी सोपे जाते. तुम्ही त्यांचे विषयानुसार वर्गीकरण करू शकता जिथे प्रत्येक विषय एक गट किंवा वर्ग बनतो. म्हणून, उदाहरणार्थ, जेव्हा तुम्हाला इतिहासावरील एक विशिष्ट पुस्तक हवे असेल, तेव्हा तुम्हाला फक्त “इतिहास” या गटात ते पुस्तक शोधायचे असते. अन्यथा, तुम्ही शोधत असलेले विशिष्ट पुस्तक शोधण्यासाठी तुमच्या संपूर्ण संग्रहातून शोधावे लागेल.

जरी वस्तू किंवा गोष्टींचे वर्गीकरण आपला मौल्यवान वेळ आणि श्रम वाचवते, तरी ते अनियंत्रित पद्धतीने केले जात नाही. कबडीवाला पुनर्वापराच्या वस्तूंच्या बाजाराप्रमाणे त्याच्या जुन्या वस्तूंचे गट करतो. उदाहरणार्थ, “काच” या गटाखाली तो रिकाम्या बाटल्या, तुटलेले आरसे आणि खिडकीचे काचपट्ट इत्यादी ठेवतो. त्याचप्रमाणे जेव्हा तुम्ही तुमची इतिहासाची पुस्तके “इतिहास” या गटाखाली वर्गीकृत करता, तेव्हा तुम्ही त्या गटात वेगळ्या विषयाचे पुस्तक ठेवणार नाही. अन्यथा गट करण्याचा संपूर्ण हेतूच नष्ट होईल. म्हणून, वर्गीकरण म्हणजे काही निकषांवर आधारित गोष्टींचे गट किंवा वर्गांमध्ये मांडणे किंवा संघटित करणे.

कृती

  • तुमच्या स्थानिक पोस्ट ऑफिसला भेट द्या आणि पत्रे कशी क्रमवारी लावली जातात ते शोधा. पत्रातील पिन-कोड काय सूचित करतो हे तुम्हाला माहिती आहे का? तुमच्या पोस्टमनाला विचारा.

2. कच्ची माहिती

कबडीवाल्याच्या जुन्या वस्तूंप्रमाणेच, अवर्गीकृत माहिती किंवा कच्ची माहिती खूपच अव्यवस्थित असते. ती बहुतेक खूप मोठी आणि हाताळण्यासाठी त्रासदायक असते. त्यातून अर्थपूर्ण निष्कर्ष काढणे हे एक कंटाळवाणे काम आहे कारण ती सांख्यिकीय पद्धतींना सहजपणे मान देत नाही. म्हणून कोणतेही पद्धतशीर सांख्यिकीय विश्लेषण सुरू करण्यापूर्वी अशा माहितीचे योग्य संघटन आणि सादरीकरण आवश्यक असते. म्हणून माहिती गोळा केल्यानंतर पुढील चरण म्हणजे ती वर्गीकृत स्वरूपात संघटित करणे आणि सादर करणे.

समजा तुम्हाला गणितातील विद्यार्थ्यांची कामगिरी जाणून घ्यायची आहे आणि तुम्ही तुमच्या शाळेतील 100 विद्यार्थ्यांच्या गणितातील गुणांवरील माहिती गोळा केली आहे. जर तुम्ही ती सारणीच्या रूपात सादर केली, तर ती कदाचित सारणी 3.1 प्रमाणे दिसेल.

सारणी 3.1 परीक्षेत 100 विद्यार्थ्यांनी मिळवलेले गणितातील गुण

47 45 10 60 51 56 66 100 49 40
60 59 56 55 62 48 59 55 51 41
42 69 64 66 50 59 57 65 62 50
64 30 37 75 17 56 20 14 55 90
62 51 55 14 25 34 90 49 56 54
70 47 49 82 40 82 60 85 65 66
49 44 64 69 70 48 12 28 55 65
49 40 25 41 71 80 0 56 14 22
66 53 46 70 43 61 59 12 30 35
45 44 57 76 82 39 32 14 90 25

किंवा तुम्ही तुमच्या परिसरातील 50 कुटुंबांच्या अन्नावरील मासिक खर्चाची माहिती गोळा केली असती, त्यांचा अन्नावरील सरासरी खर्च जाणून घेण्यासाठी. त्या प्रकरणात गोळा केलेली माहिती, जर तुम्ही सारणीच्या रूपात सादर केली असती, तर ती सारणी 3.2 सारखी दिसली असती. सारणी 3.1 आणि 3.2 दोन्ही कच्ची किंवा अवर्गीकृत माहिती आहेत. दोन्ही सारण्यांमध्ये तुम्हाला असे दिसेल की संख्या कोणत्याही क्रमाने मांडलेल्या नाहीत. आता जर तुम्हाला सारणी 3.1 मधून गणितातील सर्वोच्च गुण विचारले गेले, तर तुम्हाला प्रथम 100 विद्यार्थ्यांचे गुण चढत्या किंवा उतरत्या क्रमाने मांडावे लागतील. हे एक कंटाळवाणे काम आहे. जर 100 ऐवजी तुमच्याकडे 1,000 विद्यार्थ्यांचे गुण हाताळायचे असतील तर ते आणखी कंटाळवाणे होते. त्याचप्रमाणे, सारणी 3.2 मध्ये, तुम्ही लक्षात घ्याल की 50 कुटुंबांचा सरासरी मासिक खर्च निश्चित करणे तुमच्यासाठी कठीण आहे. आणि ही अडचण अनेक पटीने वाढेल जर संख्या मोठी असेल - समजा, 5,000 कुटुंबे. आपल्या कबडीवाल्याप्रमाणे, ज्याला त्याच्या जुन्या वस्तू मोठ्या आणि अव्यवस्थित झाल्यावर एक विशिष्ट वस्तू शोधण्यास त्रास होईल, तुम्हीही मोठ्या कच्च्या माहितीतून कोणतीही माहिती मिळवण्याचा प्रयत्न करता तेव्हा तशाच परिस्थितीचा सामना कराल. एका शब्दात, म्हणून, मोठ्या अवर्गीकृत माहितीतून माहिती काढणे हे एक कंटाळवाणे काम आहे.

सारणी 3.2 50 कुटुंबांचा अन्नावरील मासिक कुटुंब खर्च (रुपयांमध्ये)

1904 1559 3473 1735 2760
2041 1612 1753 1855 4439
5090 1085 1823 2346 1523
1211 1360 1110 2152 1183
1218 1315 1105 2628 2712
4248 1812 1264 1183 1171
1007 1180 1953 1137 2048
2025 1583 1324 2621 3676
1397 1832 1962 2177 2575
1293 1365 1146 3222 1396

कच्च्या माहितीचा सारांश दिला जातो आणि वर्गीकरणाद्वारे ती समजण्यासारखी बनवली जाते. जेव्हा समान वैशिष्ट्यांची तथ्ये त्याच वर्गात ठेवली जातात, तेव्हा ती सहजपणे शोधणे, तुलना करणे आणि कोणतीही अडचण न येता निष्कर्ष काढणे शक्य करते. तुम्ही अध्याय 2 मध्ये अभ्यास केला आहे की भारत सरकार दर दहा वर्षांनी लोकसंख्येची जनगणना करते. जनगणना 2001 मध्ये सुमारे 20 कोटी व्यक्तींचा संपर्क साधला गेला. जनगणनेची कच्ची माहिती इतकी मोठी आणि खंडित आहे की त्यातून कोणताही अर्थपूर्ण निष्कर्ष काढणे जवळजवळ अशक्य काम वाटते. पण जेव्हा तीच माहिती लिंग, शिक्षण, वैवाहिक स्थिती, व्यवसाय इत्यादींनुसार वर्गीकृत केली जाते, तेव्हा भारताच्या लोकसंख्येची रचना आणि स्वरूप सहज समजते.

कच्च्या माहितीमध्ये चलांवरील निरीक्षणे असतात. सारणी 3.1 आणि 3.2 मध्ये दिलेली कच्ची माहिती एका विशिष्ट किंवा चलांच्या गटावरील निरीक्षणे असतात. उदाहरणार्थ सारणी 3.1 पहा ज्यामध्ये 100 विद्यार्थ्यांनी मिळवलेले गणितातील गुण आहेत. आपण या गुणांचा अर्थ कसा लावू शकतो? गणिताचे शिक्षक या गुणांकडे पाहून विचार करत असतील - माझ्या विद्यार्थ्यांनी कसे केले? कितीजण उत्तीर्ण झाले नाहीत? आपण माहितीचे वर्गीकरण कसे करतो हे आपल्या मनातील हेतूवर अवलंबून असते. या प्रकरणात, शिक्षिका काही खोलीत समजून घेऊ इच्छितात - या विद्यार्थ्यांनी कसे केले. ती कदाचित वारंवारता वितरण तयार करणे निवडेल. हे पुढील विभागात चर्चा केले आहे.

कृती

  • एका वर्षासाठी तुमच्या कुटुंबाचा एकूण साप्ताहिक खर्चाची माहिती गोळा करा आणि ती सारणीमध्ये मांडा. तुमच्याकडे किती निरीक्षणे आहेत ते पहा. माहितीची मासिक मांडणी करा आणि निरीक्षणांची संख्या शोधा.

3. माहितीचे वर्गीकरण

वर्गीकरणाचे गट किंवा वर्ग विविध प्रकारे केले जातात. तुमची पुस्तके विषयानुसार - “इतिहास”, “भूगोल”, “गणित”, “विज्ञान” इत्यादी - वर्गीकृत करण्याऐवजी, तुम्ही ती लेखकानुसार वर्णक्रमानुसार वर्गीकृत करू शकता होते. किंवा, तुम्ही ती प्रकाशनाच्या वर्षानुसारही वर्गीकृत करू शकता होते. तुम्ही त्यांचे वर्गीकरण कसे करू इच्छिता हे तुमच्या गरजेवर अवलंबून असेल.

त्याचप्रमाणे कच्च्या माहितीचे वर्गीकरण हेतूनुसार विविध प्रकारे केले जाते. त्यांना वेळेनुसार गट केले जाऊ शकते. अशा वर्गीकरणाला कालक्रमानुसार वर्गीकरण म्हणतात. अशा वर्गीकरणात, माहितीचे वर्ष, तिमाही, महिने, आठवडे इत्यादी वेळेच्या संदर्भात चढत्या किंवा उतरत्या क्रमाने वर्गीकरण केले जाते. खालील उदाहरण भारताची लोकसंख्या वर्षांच्या दृष्टीने वर्गीकृत केली आहे ते दर्शवते. ‘लोकसंख्या’ हे चल एक कालमालिका आहे कारण ते वेगवेगळ्या वर्षांसाठी मूल्यांची मालिका दर्शवते.

उदाहरण 1

भारताची लोकसंख्या (कोटींमध्ये)

वर्ष लोकसंख्या (कोटी)
1951 35.7
1961 43.8
1971 54.6
1981 68.4
1991 81.8
2001 102.7
2011 121.0

स्थानिक वर्गीकरणात माहितीचे देश, राज्ये, शहरे, जिल्हे इत्यादी भौगोलिक स्थानांच्या संदर्भात वर्गीकरण केले जाते.

उदाहरण 2 वेगवेगळ्या देशांमधील गहू उत्पादन दर्शवते.

उदाहरण 2

वेगवेगळ्या देशांसाठी गहू उत्पादन (2013)

देश गहू उत्पादन (किलो/हेक्टर)
कॅनडा 3594
चीन 5055
फ्रान्स 7254
जर्मनी 7998
भारत 3154
पाकिस्तान 2787

स्रोत: Indian Agricultural Statistics at a Glance, 2015

कृती

  • उदाहरण 1 मध्ये, भारताची लोकसंख्या किमान आणि कमाल कोणत्या वर्षांत होती ते शोधा.
  • उदाहरण 2 मध्ये, ज्या देशाचे गहू उत्पादन भारतापेक्षा थोडे अधिक आहे तो देश शोधा. ते टक्केवारीत किती असेल?
  • उदाहरण 2 मधील देश उत्पादनाच्या चढत्या क्रमाने मांडा. उत्पादनाच्या उतरत्या क्रमासाठीही हेच करा.

कधीकधी तुम्हाला अशा वैशिष्ट्यांपैकी भेटतात ज्यांना परिमाणात्मकरित्या व्यक्त करता येत नाही. अशा वैशिष्ट्यांना गुणधर्म किंवा गुणात्मक वैशिष्ट्ये म्हणतात. उदाहरणार्थ, राष्ट्रीयत्व, साक्षरता, धर्म, लिंग, वैवाहिक स्थिती इत्यादी. त्यांचे मापन करता येत नाही. तरीही या गुणधर्मांचे वर्गीकरण एका गुणात्मक वैशिष्ट्याच्या उपस्थिती किंवा अनुपस्थितीच्या आधारावर केले जाऊ शकते. गुणधर्मांवरील माहितीच्या अशा वर्गीकरणाला गुणात्मक वर्गीकरण म्हणतात. खालील उदाहरणात, आपल्याला एका देशाची लोकसंख्या गुणात्मक चल “लिंग” च्या आधारे गटबद्ध केलेली आढळते. एक निरीक्षण पुरुष किंवा स्त्री असू शकते. ही दोन वैशिष्ट्ये वैवाहिक स्थितीच्या आधारे पुढीलप्रमाणे उपविभागित केली जाऊ शकतात:

उदाहरण 3

पहिल्या टप्प्यावरील वर्गीकरण एका गुणधर्माच्या उपस्थिती आणि अनुपस्थितीवर आधारित आहे, म्हणजे पुरुष किंवा नसलेला पुरुष (स्त्री). दुसऱ्या टप्प्यावर, प्रत्येक वर्ग - पुरुष आणि स्त्री, दुसऱ्या गुणधर्माच्या उपस्थिती किंवा अनुपस्थितीच्या आधारे पुढे उपविभागित केला जातो, म्हणजे विवाहित आहे की अविवाहित. उंची, वजन, वय, उत्पन्न, विद्यार्थ्यांचे गुण इत्यादी वैशिष्ट्ये परिमाणात्मक स्वरूपाची असतात. जेव्हा अशा वैशिष्ट्यांची गोळा केलेली माहिती वर्गांमध्ये गट केली जाते, तेव्हा ते एक परिमाणात्मक वर्गीकरण बनते.

कृती

  • आजूबाजूला असलेल्या वस्तूंचे सजीव किंवा निर्जीव असे गट केले जाऊ शकतात. हे एक परिमाणात्मक वर्गीकरण आहे का?

उदाहरण 4

100 विद्यार्थ्यांच्या गणितातील गुणांचे वारंवारता वितरण

गुण वारंवारता
0-10 1
10-20 8
20-30 6
30-40 7
40-50 21
50-60 23
60-70 19
70-80 6
80-90 5
90-100 4
एकूण 100

उदाहरण 4 सारणी 3.1 मध्ये दिलेल्या 100 विद्यार्थ्यांच्या गणितातील गुणांचे परिमाणात्मक वर्गीकरण दर्शवते.

कृती

  • उदाहरण 4 च्या वारंवारतेची मूल्ये एकूण वारंवारतेच्या प्रमाण किंवा टक्केवारी म्हणून व्यक्त करा. लक्षात घ्या की अशा प्रकारे व्यक्त केलेल्या वारंवारतेला सापेक्ष वारंवारता म्हणतात.
  • उदाहरण 4 मध्ये, कोणत्या वर्गात माहितीची कमाल एकाग्रता आहे? ती एकूण निरीक्षणांच्या टक्केवारीत व्यक्त करा. कोणत्या वर्गात माहितीची किमान एकाग्रता आहे?

4. चल: सतत आणि विभक्त

चलाची एक सोपी व्याख्या, जी तुम्ही मागील अध्यायात वाचली आहे, ती तुम्हाला ते कसे बदलते हे सांगत नाही. चल विशिष्ट निकषाच्या आधारे भिन्न असतात. त्यांचे मोठ्या प्रमाणावर दोन प्रकारांमध्ये वर्गीकरण केले जाते:

(i) सतत आणि

(ii) विभक्त.

एक सतत चल कोणतेही संख्यात्मक मूल्य घेऊ शकते. ते पूर्णांक मूल्ये $(1,2,3,4, \ldots)$, अपूर्णांक मूल्ये $(1 / 2,2 / 3,3 / 4, \ldots)$, आणि अचूक अपूर्णांक नसलेली मूल्ये $(\sqrt{2}=1.414$, $\sqrt{3}=1.732, \ldots, \sqrt{7}=2.645$ ) घेऊ शकते. उदाहरणार्थ, एका विद्यार्थ्याची उंची, जसजशी तो/ती वाढतो समजा $90 \mathrm{~cm}$ ते $150 \mathrm{~cm}$, त्यांच्यामध्ये असलेली सर्व मूल्ये घेईल. ती $90 \mathrm{~cm}, 100 \mathrm{~cm}, 108 \mathrm{~cm}, 150 \mathrm{~cm}$ सारखी पूर्ण संख्या मूल्ये घेऊ शकते. ती 90.85 $\mathrm{cm}, 102.34 \mathrm{~cm}, 149.99 \mathrm{~cm}$ इत्यादी अपूर्णांक मूल्येही घेऊ शकते जी पूर्ण संख्या नाहीत. अशाप्रकारे “उंची” हे चल प्रत्येक कल्पनीय मूल्यात प्रकट होण्यास सक्षम आहे आणि त्याची मूल्ये अनंत प्रवर्गांमध्ये देखील विभागली जाऊ शकतात. सतत चलाची इतर उदाहरणे म्हणजे वजन, वेळ, अंतर इत्यादी.

सतत चलाच्या विपरीत, एक विभक्त चल फक्त काही विशिष्ट मूल्ये घेऊ शकते. त्याचे मूल्य केवळ मर्यादित “उडी” मुळे बदलते. ते एका मूल्यापासून दुसऱ्या मूल्यापर्यंत “उडी” मारते पण त्यांच्यामध्ये कोणतेही मध्यवर्ती मूल्य घेत नाही. उदाहरणार्थ, “वर्गातील विद्यार्थ्यांची संख्या” सारखे चल, वेगवेगळ्या वर्गांसाठी, फक्त पूर्ण संख्या असणारी मूल्ये घेईल. ते 0.5 सारखे कोणतेही अपूर्णांक मूल्य घेऊ शकत नाही कारण “अर्धा विद्यार्थी” हे असंगत आहे. म्हणून ते 25 आणि 26 च्या दरम्यान 25.5 सारखे मूल्य घेऊ शकत नाही. त्याऐवजी त्याचे मूल्य एकतर 25 किंवा 26 असू शकले असते. आपण जे पाहतो ते म्हणजे त्याचे मूल्य 25 वरून 26 वर बदलताना, त्यांच्यामध्ये असलेली मूल्ये - अपूर्णांक ते घेत नाहीत. पण आपल्याला असे समजू नये की विभक्त चल कोणतेही अपूर्णांक मूल्य घेऊ शकत नाही. समजा $X$ हे एक चल आहे जे $1 / 8,1$ / $16,1 / 32,1 / 64, \ldots$ सारखी मूल्ये घेते. हे एक विभक्त चल आहे का? होय, कारण जरी $\mathrm{X}$ अपूर्णांक मूल्ये घेत असले तरी ते दोन समीप अपूर्णांक मूल्यांमध्ये कोणतेही मूल्य घेऊ शकत नाही. ते $1 /$ 8 वरून $1 / 16$ वर आणि $1 / 16$ वरून $1 / 32$ वर बदलते किंवा “उडी” मारते. पण ते $1 / 8$ आणि $1 / 16$ च्या दरम्यान किंवा $1 / 16$ आणि $1 / 32$ च्या दरम्यानचे मूल्य घेऊ शकत नाही.

कृती

  • खालील चलांमध्ये सतत आणि विभक्त असे फरक करा: क्षेत्रफळ, घनफळ, तापमान, फास्यावर येणारी संख्या, पीक उत्पादन, लोकसंख्या, पाऊस, रस्त्यावरील कारची संख्या आणि वय.

उदाहरण 4 दर्शवते की 100 विद्यार्थ्यांचे गुण कशा प्रकारे वर्गांमध्ये गट केले गेले आहेत. तुम्ही विचार करत असाल की सारणी 3.1 च्या कच्च्या माहितीतून हे आपल्याला कसे मिळाले. पण, आपण हा प्रश्न हाताळण्यापूर्वी, तुम्हाला वारंवारता वितरण म्हणजे काय हे माहित असणे आवश्यक आहे.

5. वारंवारता वितरण म्हणजे काय?

वारंवारता वितरण हा एका परिमाणात्मक चलाची कच्ची माहिती वर्गीकृत करण्याचा एक सर्वसमावेशक मार्ग आहे. ते दर्शवते की चलाची (येथे, विद्यार्थ्याने मिळवलेले गणितातील गुण) वेगवेगळी मूल्ये वेगवेगळ्या वर्गांमध्ये त्यांच्या संबंधित वर्ग वारंवारतेसह कशी वितरित केली जातात. या प्रकरणात आपल्याकडे गुणांचे दहा वर्ग आहेत: $0-10,10-20, \ldots$, 90-100. वर्ग वारंवारता या शब्दाचा अर्थ विशिष्ट वर्गातील मूल्यांची संख्या.