अध्याय 03 माहितीचे संघटन

1. प्रस्तावना

मागील अध्यायात तुम्ही माहिती कशी गोळा केली जाते याबद्दल शिकलात. तुम्हाला जनगणना आणि नमुना यातील फरक देखील कळला. या अध्यायात, तुम्ही गोळा केलेली माहिती कशी वर्गीकृत करायची ते तुम्हाला कळेल. कच्च्या माहितीचे वर्गीकरण करण्याचा हेतू म्हणजे त्यात क्रमवारी आणणे जेणेकरून त्या पुढील सांख्यिकीय विश्लेषणासाठी सहजपणे वापरल्या जाऊ शकतील.

तुम्ही कधी तुमच्या स्थानिक जुन्या वस्तू विकणाऱ्या दुकानदार किंवा कबडीवाल्याकडे लक्ष दिले आहे का, ज्याला तुम्ही जुन्या वर्तमानपत्रे, तुटलेली घरगुती वस्तू, रिकामी काचेची बाटल्या, प्लास्टिक इत्यादी विकता? तो तुमच्याकडून ह्या वस्तू विकत घेतो आणि त्यांची पुनर्वापर करणाऱ्यांना विकतो. पण त्याच्या दुकानात इतक्या जुन्या वस्तू असल्याने, जर त्याने त्यांची योग्य रीतीने मांडणी केली नसती तर त्याच्या व्यवसायाचे व्यवस्थापन करणे खूप कठीण झाले असते. त्याची परिस्थिती सोपी करण्यासाठी तो विविध जुन्या वस्तूंचे योग्य गट किंवा “वर्ग” करतो. तो जुन्या वर्तमानपत्रांना एकत्र ठेवतो आणि दोरीने बांधतो. नंतर सर्व रिकाम्या काचेच्या बाटल्या एका पोत्यात गोळा करतो. तो धातूच्या वस्तू दुकानाच्या एका कोपऱ्यात ढीग करतो आणि त्यांचे “लोखंड”, “तांबे”, “अॅल्युमिनियम”, “पितळ” इत्यादी गटांमध्ये वर्गीकरण करतो. अशाप्रकारे तो त्याच्या जुन्या वस्तूंचे वेगवेगळ्या वर्गांमध्ये - “वर्तमानपत्रे”, “प्लास्टिक”, “काच”, “धातू” इत्यादी - गट करतो आणि त्यात क्रमवारी आणतो. एकदा त्याच्या जुन्या वस्तूंची मांडणी आणि वर्गीकरण झाल्यानंतर, खरेदीदाराला हवी असलेली विशिष्ट वस्तू शोधणे त्याच्यासाठी सोपे जाते.

त्याचप्रमाणे जेव्हा तुम्ही तुमची शालेय पुस्तके एका विशिष्ट क्रमाने मांडता, तेव्हा ती हाताळणे तुमच्यासाठी सोपे जाते. तुम्ही त्यांचे विषयानुसार वर्गीकरण करू शकता जिथे प्रत्येक विषय एक गट किंवा वर्ग बनतो. म्हणून, उदाहरणार्थ, जेव्हा तुम्हाला इतिहासावरील एक विशिष्ट पुस्तक हवे असेल, तेव्हा तुम्हाला फक्त “इतिहास” या गटात ते पुस्तक शोधायचे असते. अन्यथा, तुम्ही शोधत असलेले विशिष्ट पुस्तक शोधण्यासाठी तुमच्या संपूर्ण संग्रहातून शोधावे लागेल.

वस्तू किंवा गोष्टींचे वर्गीकरण आपला मौल्यवान वेळ आणि श्रम वाचवते, पण ते कोणत्याही अनियंत्रित पद्धतीने केले जात नाही. कबडीवाला पुनर्वापराच्या वस्तूंच्या बाजारपेठेनुसार त्याच्या जुन्या वस्तूंचे गट करतो. उदाहरणार्थ, “काच” या गटाखाली तो रिकाम्या बाटल्या, तुटलेले आरसे आणि खिडकीचे काचपट्ट इत्यादी ठेवतो. त्याचप्रमाणे जेव्हा तुम्ही तुमची इतिहासाची पुस्तके “इतिहास” या गटाखाली वर्गीकृत करता, तेव्हा तुम्ही त्या गटात वेगळ्या विषयाचे पुस्तक ठेवणार नाही. अन्यथा गट करण्याचा संपूर्ण हेतूच नष्ट होईल. म्हणूनच, वर्गीकरण म्हणजे काही निकषांवर आधारित गोष्टींचे गट किंवा वर्गांमध्ये मांडणे किंवा संघटित करणे होय.

कृती

  • तुमच्या स्थानिक पोस्ट ऑफिसला भेट द्या आणि पत्रे कशी क्रमवारी लावली जातात ते शोधा. पत्रातील पिन कोड काय सूचित करतो हे तुम्हाला माहिती आहे का? तुमच्या पोस्टमनाला विचारा.

2. कच्ची माहिती

कबडीवाल्याच्या जुन्या वस्तूंप्रमाणेच, अवर्गीकृत माहिती किंवा कच्ची माहिती खूपच अव्यवस्थित असते. ती बहुतेक खूप मोठी आणि हाताळण्यासाठी त्रासदायक असते. त्यातून अर्थपूर्ण निष्कर्ष काढणे हे एक कंटाळवाणे काम आहे कारण ती सांख्यिकीय पद्धतींना सहजपणे वश होत नाही. म्हणून कोणत्याही पद्धतशीर सांख्यिकीय विश्लेषणापूर्वी अशा माहितीचे योग्य संघटन आणि सादरीकरण आवश्यक असते. म्हणून माहिती गोळा केल्यानंतर पुढची पायरी म्हणजे तिचे वर्गीकृत स्वरूपात संघटन आणि सादरीकरण करणे.

समजा तुम्हाला गणितातील विद्यार्थ्यांची कामगिरी जाणून घ्यायची आहे आणि तुम्ही तुमच्या शाळेतील 100 विद्यार्थ्यांच्या गणितातील गुणांवरील माहिती गोळा केली आहे. जर तुम्ही ती सारणीच्या रूपात सादर केली, तर ती सारणी 3.1 प्रमाणे दिसेल.

सारणी 3.1 परीक्षेत 100 विद्यार्थ्यांनी मिळवलेले गणितातील गुण

47 45 10 60 51 56 66 100 49 40
60 59 56 55 62 48 59 55 51 41
42 69 64 66 50 59 57 65 62 50
64 30 37 75 17 56 20 14 55 90
62 51 55 14 25 34 90 49 56 54
70 47 49 82 40 82 60 85 65 66
49 44 64 69 70 48 12 28 55 65
49 40 25 41 71 80 0 56 14 22
66 53 46 70 43 61 59 12 30 35
45 44 57 76 82 39 32 14 90 25

किंवा तुम्ही तुमच्या परिसरातील 50 कुटुंबांच्या अन्नावरील मासिक खर्चाची माहिती गोळा केली असती, त्यांचा अन्नावरील सरासरी खर्च जाणून घेण्यासाठी. त्या प्रकरणात गोळा केलेली माहिती, जर तुम्ही सारणीच्या रूपात सादर केली असती, तर ती सारणी 3.2 सारखी दिसली असती. सारणी 3.1 आणि 3.2 दोन्ही कच्ची किंवा अवर्गीकृत माहिती आहेत. दोन्ही सारण्यांमध्ये तुम्हाला असे आढळेल की संख्या कोणत्याही क्रमाने मांडलेल्या नाहीत. आता जर तुम्हाला सारणी 3.1 मधून गणितातील सर्वोच्च गुण विचारले गेले, तर तुम्हाला प्रथम 100 विद्यार्थ्यांचे गुण चढत्या किंवा उतरत्या क्रमाने मांडावे लागतील. हे एक कंटाळवाणे काम आहे. जर 100 ऐवजी तुमच्याकडे 1,000 विद्यार्थ्यांचे गुण हाताळायचे असतील तर हे अधिक कंटाळवाणे होते. त्याचप्रमाणे, सारणी 3.2 मध्ये, तुम्ही लक्षात घ्याल की 50 कुटुंबांचा सरासरी मासिक खर्च निश्चित करणे तुमच्यासाठी कठीण आहे. आणि ही अडचण अनेक पटीने वाढेल जर संख्या मोठी असेल - समजा, 5,000 कुटुंबे. आपल्या कबडीवाल्याप्रमाणे, ज्याला एखादी विशिष्ट वस्तू शोधण्यास त्रास होईल जेव्हा त्याच्या जुन्या वस्तू मोठ्या प्रमाणात आणि अव्यवस्थित होतात, तेव्हा तुम्हीही तशाच परिस्थितीचा सामना कराल जेव्हा तुम्ही मोठ्या प्रमाणातील कच्च्या माहितीतून कोणतीही माहिती मिळवण्याचा प्रयत्न कराल. एका शब्दात, म्हणून, मोठ्या अवर्गीकृत माहितीतून माहिती काढणे हे एक कंटाळवाणे काम आहे.

सारणी 3.2 50 कुटुंबांचा अन्नावरील मासिक कुटुंब खर्च (रुपयांमध्ये)

1904 1559 3473 1735 2760
2041 1612 1753 1855 4439
5090 1085 1823 2346 1523
1211 1360 1110 2152 1183
1218 1315 1105 2628 2712
4248 1812 1264 1183 1171
1007 1180 1953 1137 2048
2025 1583 1324 2621 3676
1397 1832 1962 2177 2575
1293 1365 1146 3222 1396

कच्च्या माहितीचा सारांश दिला जातो आणि वर्गीकरणाद्वारे ती समजण्यासारखी बनवली जाते. जेव्हा समान वैशिष्ट्यांची तथ्ये त्याच वर्गात ठेवली जातात, तेव्हा ती सहजपणे शोधणे, तुलना करणे आणि कोणतीही अडचण न येता निष्कर्ष काढणे शक्य होते. तुम्ही अध्याय 2 मध्ये अभ्यास केला आहे की भारत सरकार दर दहा वर्षांनी लोकगणना करते. 2001 च्या जनगणनेत सुमारे 20 कोटी लोकांशी संपर्क साधला गेला. जनगणनेची कच्ची माहिती इतकी मोठी आणि खंडित आहे की त्यातून कोणताही अर्थपूर्ण निष्कर्ष काढणे जवळजवळ अशक्य काम वाटते. पण जेव्हा तीच माहिती लिंग, शिक्षण, वैवाहिक स्थिती, व्यवसाय इत्यादीनुसार वर्गीकृत केली जाते, तेव्हा भारताच्या लोकसंख्येची रचना आणि स्वरूप सहज समजते.

कच्च्या माहितीमध्ये चलांवरील निरीक्षणे असतात. सारणी 3.1 आणि 3.2 मध्ये दिलेली कच्ची माहिती एका विशिष्ट किंवा चलांच्या गटावरील निरीक्षणे असतात. उदाहरणार्थ सारणी 3.1 पहा ज्यामध्ये 100 विद्यार्थ्यांनी मिळवलेले गणितातील गुण आहेत. आपण या गुणांचा अर्थ कसा लावू शकतो? गणिताचे शिक्षक या गुणांकडे पाहून विचार करत असतील - माझ्या विद्यार्थ्यांनी कसे केले? कितीजण उत्तीर्ण झाले नाहीत? आपण माहितीचे वर्गीकरण कसे करतो हे आपल्या मनातील हेतूवर अवलंबून असते. या प्रकरणात, शिक्षिका काही खोलीत समजून घेऊ इच्छितात - या विद्यार्थ्यांनी कसे केले. ती कदाचित वारंवारता वितरण तयार करणे निवडेल. याची चर्चा पुढील भागात केली आहे.

कृती

  • एका वर्षासाठी तुमच्या कुटुंबाचा एकूण साप्ताहिक खर्चाची माहिती गोळा करा आणि ती सारणीमध्ये मांडा. तुमच्याकडे किती निरीक्षणे आहेत ते पहा. माहितीचे मासिक मांडणी करा आणि निरीक्षणांची संख्या शोधा.

3. माहितीचे वर्गीकरण

वर्गीकरणाचे गट किंवा वर्ग विविध प्रकारे केले जातात. तुमची पुस्तके विषयानुसार - “इतिहास”, “भूगोल”, “गणित”, “विज्ञान” इत्यादी - वर्गीकृत करण्याऐवजी, तुम्ही ती लेखकानुसार वर्णक्रमानुसार वर्गीकृत केली असती. किंवा, तुम्ही ती प्रकाशनाच्या वर्षानुसार देखील वर्गीकृत केली असती. तुम्ही त्यांचे वर्गीकरण कसे करू इच्छिता हे तुमच्या गरजेवर अवलंबून असेल.

त्याचप्रमाणे कच्च्या माहितीचे वर्गीकरण हेतूनुसार विविध प्रकारे केले जाते. त्यांचे वेळेनुसार गट केले जाऊ शकतात. अशा वर्गीकरणास कालक्रमानुसार वर्गीकरण म्हणतात. अशा वर्गीकरणात, माहितीचे वर्ष, तिमाही, महिने, आठवडे इत्यादी वेळेच्या संदर्भात चढत्या किंवा उतरत्या क्रमाने वर्गीकरण केले जाते. खालील उदाहरण भारताची लोकसंख्या वर्षांच्या दृष्टीने वर्गीकृत केली आहे. ‘लोकसंख्या’ हे चल एक कालमालिका आहे कारण ते वेगवेगळ्या वर्षांसाठी मूल्यांची मालिका दर्शवते.

उदाहरण 1

भारताची लोकसंख्या (कोटींमध्ये)

वर्ष लोकसंख्या (कोटी)
1951 35.7
1961 43.8
1971 54.6
1981 68.4
1991 81.8
2001 102.7
2011 121.0

स्थानिक वर्गीकरणात माहितीचे देश, राज्ये, शहरे, जिल्हे इत्यादी भौगोलिक स्थानांच्या संदर्भात वर्गीकरण केले जाते.

उदाहरण 2 वेगवेगळ्या देशांमधील गहू उत्पादन दर्शवते.

उदाहरण 2

वेगवेगळ्या देशांसाठी गहू उत्पादन (2013)

देश गहू उत्पादन (किलो/हेक्टर)
कॅनडा 3594
चीन 5055
फ्रान्स 7254
जर्मनी 7998
भारत 3154
पाकिस्तान 2787

स्रोत: Indian Agricultural Statistics at a Glance, 2015

कृती

  • उदाहरण 1 मध्ये, भारताची लोकसंख्या किमान आणि कमाल असलेली वर्षे शोधा.
  • उदाहरण 2 मध्ये, अशा देशाचा शोध घ्या ज्याचे गहू उत्पादन भारतापेक्षा थोडे अधिक आहे. ते टक्केवारीच्या दृष्टीने किती असेल?
  • उदाहरण 2 मधील देश उत्पादनाच्या चढत्या क्रमाने मांडा. उत्पादनाच्या उतरत्या क्रमासाठीही हाच व्यायाम करा.

कधीकधी तुमच्यासमोर अशी वैशिष्ट्ये येतात जी परिमाणात्मकरित्या व्यक्त करता येत नाहीत. अशा वैशिष्ट्यांना गुणधर्म म्हणतात. उदाहरणार्थ, राष्ट्रीयत्व, साक्षरता, धर्म, लिंग, वैवाहिक स्थिती इत्यादी. त्यांचे मोजमाप करता येत नाही. तरीही या गुणधर्मांचे वर्गीकरण गुणात्मक वैशिष्ट्याच्या उपस्थिती किंवा अनुपस्थितीच्या आधारे केले जाऊ शकते. गुणधर्मांवरील माहितीच्या अशा वर्गीकरणास गुणात्मक वर्गीकरण म्हणतात. खालील उदाहरणात, आपल्याला एका देशाची लोकसंख्या गुणात्मक चल “लिंग” च्या आधारे गटबद्ध केलेली आढळते. एक निरीक्षण पुरुष किंवा स्त्री असू शकते. ही दोन वैशिष्ट्ये वैवाहिक स्थितीच्या आधारे पुढीलप्रमाणे उपविभागित केली जाऊ शकतात:

उदाहरण 3

पहिल्या टप्प्यावरील वर्गीकरण गुणधर्माच्या उपस्थिती आणि अनुपस्थितीवर आधारित आहे, म्हणजे पुरुष किंवा पुरुष नसलेले (स्त्री). दुसऱ्या टप्प्यावर, प्रत्येक वर्ग - पुरुष आणि स्त्री, दुसऱ्या गुणधर्माच्या उपस्थिती किंवा अनुपस्थितीच्या आधारे पुढील उपविभागित केले जातात, म्हणजे विवाहित आहेत की अविवाहित. उंची, वजन, वय, उत्पन्न, विद्यार्थ्यांचे गुण इत्यादी वैशिष्ट्ये परिमाणात्मक स्वरूपाची असतात. जेव्हा अशा वैशिष्ट्यांची गोळा केलेली माहिती वर्गांमध्ये गटबद्ध केली जाते, तेव्हा ते एक परिमाणात्मक वर्गीकरण बनते.

कृती

  • आजूबाजूला असलेल्या वस्तूंचे सजीव किंवा निर्जीव असे गट करता येतील. हे एक परिमाणात्मक वर्गीकरण आहे का?

उदाहरण 4

100 विद्यार्थ्यांच्या गणितातील गुणांचे वारंवारता वितरण

गुण वारंवारता
0-10 1
10-20 8
20-30 6
30-40 7
40-50 21
50-60 23
60-70 19
70-80 6
80-90 5
90-100 4
एकूण 100

उदाहरण 4 सारणी 3.1 मध्ये दिलेल्या 100 विद्यार्थ्यांच्या गणितातील गुणांचे परिमाणात्मक वर्गीकरण दर्शवते.

कृती

  • उदाहरण 4 मधील वारंवारतेची मूल्ये एकूण वारंवारतेच्या प्रमाण किंवा टक्केवारी म्हणून व्यक्त करा. लक्षात घ्या की अशा प्रकारे व्यक्त केलेल्या वारंवारतेला सापेक्ष वारंवारता म्हणतात.
  • उदाहरण 4 मध्ये, कोणत्या वर्गात माहितीची कमाल एकाग्रता आहे? ते एकूण निरीक्षणांच्या टक्केवारी म्हणून व्यक्त करा. कोणत्या वर्गात माहितीची किमान एकाग्रता आहे?

4. चल: सतत आणि विभक्त

चलाची एक सोपी व्याख्या, जी तुम्ही मागील अध्यायात वाचली आहे, ती तुम्हाला ते कसे बदलते हे सांगत नाही. चल विशिष्ट निकषांवर आधारित भिन्न असतात. त्यांचे मोठ्या प्रमाणावर दोन प्रकारांमध्ये वर्गीकरण केले जाते:

(i) सतत आणि अखंड

(ii) विभक्त गणित.

एक सतत चल कोणतेही संख्यात्मक मूल्य घेऊ शकते. ते पूर्णांक मूल्ये $(1,2,3,4, \ldots)$, अपूर्णांक मूल्ये $(1 / 2,2 / 3,3 / 4, \ldots)$, आणि अचूक अपूर्णांक नसलेली मूल्ये $(\sqrt{2}=1.414$, $\sqrt{3}=1.732, \ldots, \sqrt{7}=2.645$ ) घेऊ शकते. उदाहरणार्थ, एका विद्यार्थ्याची उंची, जसजशी तो/ती वाढतो/वाढते समजा $90 \mathrm{~cm}$ ते $150 \mathrm{~cm}$, त्यांच्यामध्ये असलेली सर्व मूल्ये घेईल. ते $90 \mathrm{~cm}, 100 \mathrm{~cm}, 108 \mathrm{~cm}, 150 \mathrm{~cm}$ सारखी पूर्ण संख्या मूल्ये घेऊ शकते. ते 90.85 $\mathrm{cm}, 102.34 \mathrm{~cm}, 149.99 \mathrm{~cm}$ इत्यादी अपूर्णांक मूल्ये देखील घेऊ शकते जी पूर्ण संख्या नाहीत. अशाप्रकारे “उंची” हे चल प्रत्येक कल्पनीय मूल्यात प्रकट होण्यास सक्षम आहे आणि त्याची मूल्ये अनंत प्रवर्गांमध्ये देखील विभागली जाऊ शकतात. सतत चलाची इतर उदाहरणे म्हणजे वजन, वेळ, अंतर इत्यादी.

सतत चलाच्या विपरीत, एक विभक्त चल फक्त काही विशिष्ट मूल्ये घेऊ शकते. त्याचे मूल्य फक्त मर्यादित “उडी” मुळे बदलते. ते एका मूल्यापासून दुसऱ्या मूल्यापर्यंत “उडी” मारते पण त्यांच्यामध्ये कोणतेही मध्यवर्ती मूल्य घेत नाही. उदाहरणार्थ, “वर्गातील विद्यार्थ्यांची संख्या” सारखे चल, वेगवेगळ्या वर्गांसाठी, फक्त पूर्ण संख्या असणारी मूल्ये घेईल. ते 0.5 सारखे कोणतेही अपूर्णांक मूल्य घेऊ शकत नाही कारण “अर्धा विद्यार्थी” हे असंगत आहे. म्हणून ते 25 आणि 26 च्या दरम्यान 25.5 सारखे मूल्य घेऊ शकत नाही. त्याऐवजी त्याचे मूल्य एकतर 25 किंवा 26 असू शकते. आपण जे पाहतो ते म्हणजे त्याचे मूल्य 25 वरून 26 वर बदलताना, त्यांच्यामध्ये असलेली मूल्ये - अपूर्णांक ते घेत नाहीत. पण आपल्याला असे समजू नये की विभक्त चल कोणतेही अपूर्णांक मूल्य घेऊ शकत नाही. समजा $X$ हे एक चल आहे जे $1 / 8,1$ / $16,1 / 32,1 / 64, \ldots$ सारखी मूल्ये घेते. हे एक विभक्त चल आहे का? होय, कारण $\mathrm{X}$ अपूर्णांक मूल्ये घेत असले तरी ते दोन समीप अपूर्णांक मूल्यांमध्ये कोणतेही मूल्य घेऊ शकत नाही. ते $1 /$ 8 वरून $1 / 16$ वर आणि $1 / 16$ वरून $1 / 32$ वर बदलते किंवा “उडी” मारते. पण ते $1 / 8$ आणि $1 / 16$ च्या दरम्यान किंवा $1 / 16$ आणि $1 / 32$ च्या दरम्यानचे मूल्य घेऊ शकत नाही.

कृती

  • खालील चलांमध्ये सतत आणि विभक्त असे फरक करा: क्षेत्रफळ, घनफळ, तापमान, फास्यावर येणारी संख्या, पीक उत्पादन, लोकसंख्या, पाऊस, रस्त्यावरील कारची संख्या आणि वय.

उदाहरण 4 दर्शवते की 100 विद्यार्थ्यांचे गुण कशा प्रकारे वर्गांमध्ये गटबद्ध केले जातात. तुम्ही विचार करत असाल की सारणी 3.1 च्या कच्च्या माहितीतून आपल्याला ते कसे मिळाले. पण, आपण हा प्रश्न सोडवण्यापूर्वी, तुम्हाला वारंवारता वितरण म्हणजे काय हे माहित असणे आवश्यक आहे.

5. वारंवारता वितरण म्हणजे काय?

वारंवारता वितरण हा परिमाणात्मक चलाच्या कच्च्या माहितीचे वर्गीकरण करण्याचा एक सर्वसमावेशक मार्ग आहे. ते दर्शवते की चलाची (येथे, विद्यार्थ्याने मिळवलेले गणितातील गुण) वेगवेगळी मूल्ये वेगवेगळ्या वर्गांमध्ये त्यांच्या संबंधित वर्ग वारंवारतेसह कशी वितरित केली जातात. या प्रकरणात आपल्याकडे गुणांचे दहा वर्ग आहेत: $0-10,10-20, \ldots$, 90-100. वर्ग वारंवारता या शब्दाचा अर्थ विशिष्ट वर्गातील मूल्यांची संख्या. उ