प्रकरण ०२ डेटा प्रोसेसिंग
तुम्ही मागील प्रकरणात शिकलात की डेटाचे संघटन आणि सादरीकरण त्यांना सुबोध बनवते. हे डेटा प्रक्रियेस सुलभ करते. डेटाचे विश्लेषण करण्यासाठी अनेक सांख्यिकीय तंत्रे वापरली जातात, उदा.
- केंद्रीय प्रवृत्तीची मापे
- विस्ताराची मापे
- संबंधाची मापे
केंद्रीय प्रवृत्तीची मापे निरीक्षणांच्या संचाचे आदर्श प्रतिनिधित्व करणारे मूल्य प्रदान करतात, तर विस्ताराची मापे डेटाच्या अंतर्गत भिन्नतांचा विचार करतात, बहुतेकदा केंद्रीय प्रवृत्तीच्या मापाभोवती. दुसरीकडे, संबंधाची मापे कोणत्याही दोन किंवा अधिक संबंधित घटनांमधील संबंधाची पातळी प्रदान करतात, जसे की पाऊस आणि पुराची घटना किंवा खतांचा वापर आणि पिकांची उत्पादकता. या प्रकरणात, तुम्ही केंद्रीय प्रवृत्तीची मापे शिकाल.
केंद्रीय प्रवृत्तीची मापे
मोजता येणारी वैशिष्ट्ये जसे की पाऊस, उंची, लोकसंख्येची घनता, शैक्षणिक प्राप्तीची पातळी किंवा वयोगट बदलतात. जर आपल्याला त्यांना समजून घ्यायचे असेल, तर आपण कसे करू? कदाचित आपल्याला एकच मूल्य किंवा संख्या हवी असेल जी सर्व निरीक्षणांचे सर्वोत्तम प्रतिनिधित्व करते. हे एकल मूल्य सहसा वितरणाच्या मध्यभागी असते, अत्यंत टोकांवर नसते. वितरणाचे केंद्र शोधण्यासाठी वापरल्या जाणाऱ्या सांख्यिकीय तंत्रांना केंद्रीय प्रवृत्तीची मापे म्हणतात. केंद्रीय प्रवृत्ती दर्शविणारी संख्या ही संपूर्ण डेटा संचासाठी प्रतिनिधी आकृती असते कारण तो बिंदू आहे ज्याभोवती घटकांचा कल असतो.
केंद्रीय प्रवृत्तीची मापे यांना सांख्यिकीय सरासरी देखील म्हणतात. केंद्रीय प्रवृत्तीची अनेक मापे आहेत, जसे की मध्य, मध्यक आणि बहुलक.
मध्य
मध्य हे ते मूल्य आहे जे सर्व मूल्यांची बेरीज करून आणि निरीक्षणांच्या संख्येने भागून मिळवले जाते.
मध्यक
मध्यक हे रँकचे मूल्य आहे, जे क्रमवारीत मालिकेला दोन समान संख्यांमध्ये विभाजित करते. हे वास्तविक मूल्यापासून स्वतंत्र असते. डेटा चढत्या किंवा उतरत्या क्रमाने मांडणे आणि नंतर मध्य रँकिंग क्रमांकाचे मूल्य शोधणे हे मध्यकाची गणना करण्यात सर्वात महत्त्वाचे आहे. सम संख्यांच्या बाबतीत दोन मध्य रँकिंग मूल्यांची सरासरी ही मध्यक असेल.
बहुलक
बहुलक म्हणजे विशिष्ट बिंदू किंवा मूल्यावरील कमाल घटना किंवा वारंवारता. तुमच्या लक्षात येईल की यापैकी प्रत्येक माप हे वेगवेगळ्या प्रकारच्या डेटा संचांसाठी योग्य असलेले एकल प्रतिनिधी संख्या निश्चित करण्याची वेगवेगळी पद्धत आहे.
मध्य
मध्य म्हणजे चलाच्या वेगवेगळ्या मूल्यांची साधी अंकगणितीय सरासरी. अवर्गीकृत आणि वर्गीकृत डेटासाठी, मध्य मोजण्याच्या पद्धती आवश्यकपणे वेगळ्या असतात. मध्य थेट किंवा अप्रत्यक्ष पद्धतींद्वारे, दोन्ही वर्गीकृत आणि अवर्गीकृत डेटासाठी काढता येतो.
अवर्गीकृत डेटावरून मध्य मोजणे
थेट पद्धत
अवर्गीकृत डेटावरून थेट पद्धत वापरून मध्य मोजताना, प्रत्येक निरीक्षणासाठी मूल्ये जोडली जातात आणि एकूण निरीक्षणांच्या बेरजेने एकूण घटनांची संख्या भागली जाते. खालील सूत्र वापरून मध्य काढले जाते:
$$ \overline{\mathrm{X}}=\frac{\sum x}{\mathrm{~N}} $$
जिथे,
$$ \begin{aligned} \overline{\mathrm{X}} & =\text { Mean } \ \sum \quad & \text { Sum of a series of } \ & \text { measures } \end{aligned} $$
$x \quad=$ मापांच्या मालिकेतील एक कच्चा गुण $\sum \mathrm{x}=$ सर्व मापांची बेरीज $\mathrm{N} \quad$ = मापांची संख्या
उदाहरण 2.1 : टेबल 2.1 मध्ये दिलेल्या प्रदेशातील जिल्ह्यांच्या पावसाच्या आधारे मध्य प्रदेशातील माळवा पठारासाठी सरासरी पाऊस काढा:
$\hspace{1cm}$ टेबल 2.1 : सरासरी पावसाची गणना
| माळवा पठारातील जिल्हे |
सामान्य पाऊस मिमी मध्ये |
अप्रत्यक्ष पद्धत |
|---|---|---|
| x थेट पद्धत | $d=x-800^{*}$ | |
| इंदूर | 979 | 179 |
| देवास | 1083 | 283 |
| धार | 833 | 33 |
| रतलाम | 896 | 96 |
| उज्जैन | 891 | 91 |
| मंदसौर | 825 | 25 |
| शाजापूर | 977 | 177 |
| $\sum x$ आणि $\sum d$ | 6484 | 884 |
| $\frac{\sum x}{N}$ आणि $\frac{\sum d}{N}$ | 926.29 | 126.29 |
- जिथे 800 हे गृहीत मध्य आहे.
$\mathrm{d}$ हे गृहीत मध्यापासूनचे विचलन आहे.
टेबल 2.1 मध्ये दिलेल्या डेटासाठी मध्य खालीलप्रमाणे काढले जाते:
$$ \begin{aligned} \overline{\mathrm{X}} & =\frac{\sum x}{N} \ & =\frac{6,484}{7} \ & =926.29 \end{aligned} $$
मध्याच्या गणनेवरून हे लक्षात येऊ शकते की कच्चा पावसाचा डेटा थेट जोडला गेला आहे आणि बेरीज निरीक्षणांच्या संख्येने म्हणजेच जिल्ह्यांच्या संख्येने भागली आहे. म्हणून, याला थेट पद्धत म्हणतात.
अप्रत्यक्ष पद्धत
मोठ्या संख्येने निरीक्षणांसाठी, मध्य मोजण्यासाठी सामान्यतः अप्रत्यक्ष पद्धत वापरली जाते. निरीक्षणांची मूल्ये त्यातून एक स्थिर मूल्य वजा करून लहान संख्यांमध्ये कमी करण्यात ही पद्धत मदत करते. उदाहरणार्थ, टेबल 2.1 मध्ये दाखवल्याप्रमाणे, पावसाची मूल्ये 800 आणि $1100 \mathrm{~mm}$ दरम्यान आहेत. आपण ‘गृहीत मध्य’ निवडून आणि प्रत्येक मूल्यातून निवडलेली संख्या वजा करून ही मूल्ये कमी करू शकतो. या प्रकरणात, आपण 800 हे गृहीत मध्य म्हणून घेतले आहे. अशा ऑपरेशनला कोडिंग म्हणतात. नंतर या कमी केलेल्या संख्यांवरून (टेबल 2.1 चा स्तंभ 3) मध्य काढला जातो.
अप्रत्यक्ष पद्धत वापरून मध्य मोजण्यासाठी खालील सूत्र वापरले जाते:
$$ \overline{\mathrm{X}}=A+\frac{\sum d}{N} $$
जिथे,
$$ \begin{aligned} A & =\text { Subtracted constant } \ \sum d & =\text { Sum of the coded scores } \ N & =\text { Number of individual observations in a series } \end{aligned} $$
टेबल 2.1 मध्ये दाखवल्याप्रमाणे डेटासाठी मध्य खालील प्रकारे अप्रत्यक्ष पद्धत वापरून काढता येतो:
$$ \begin{aligned} \overline{\mathrm{X}} & =800+\frac{884}{7} \ & =800+\frac{884}{7} \ \overline{\mathrm{X}} & =926.29 \mathrm{~mm} \end{aligned} $$
लक्षात घ्या की दोन्ही पद्धतींपैकी कोणत्याही एका पद्धतीने गणना केली तरी मध्यमान समान येते.
वर्गीकृत डेटावरून मध्य मोजणे
वर्गीकृत डेटासाठी देखील थेट किंवा अप्रत्यक्ष पद्धत वापरून मध्य काढला जातो.
थेट पद्धत
जेव्हा गुण वारंवारता वितरणात गटबद्ध केले जातात, तेव्हा वैयक्तिक मूल्ये त्यांची ओळख गमावतात. ही मूल्ये त्या वर्ग ${ }^{\circ}$ मध्यांतरांच्या मध्यबिंदूंद्वारे दर्शविली जातात ज्यामध्ये ती स्थित आहेत. थेट पद्धत वापरून वर्गीकृत डेटावरून मध्य मोजताना, प्रत्येक वर्ग मध्यांतराचा मध्यबिंदू त्याच्या संबंधित वारंवारता $(f)$ ने गुणाकार केला जातो; $f x$ ($\mathrm{X}$ हे मध्यबिंदू आहेत) ची सर्व मूल्ये जोडून $\sum f x$ मिळवले जाते ज्याला शेवटी निरीक्षणांच्या संख्येने म्हणजेच $\mathrm{N}$ ने भागले जाते. म्हणून, खालील सूत्र वापरून मध्य काढला जातो:
$$ \overline{\mathrm{X}}=\frac{\sum f x}{N} $$
जिथे :
$$ \begin{aligned} \overline{\mathrm{X}} & =\text { Mean } \ f & =\text { Frequencies } \ x & =\text { Midpoints of class intervals } \ N & \left.=\text { Number of observations (it may also be defined as } \sum f\right) \end{aligned} $$
उदाहरण 2.2 : टेबल 2.2 मध्ये दिलेला डेटा वापरून कारखान्यातील कामगारांचा सरासरी मजुरी दर काढा:
टेबल 2.2 : कारखान्यातील कामगारांचा मजुरी दर
| मजुरी दर (रु./दिवस) | कामगारांची संख्या () |
|---|---|
| वर्ग | $\boldsymbol{f}$ |
| $50-70$ | 10 |
| $70-90$ | 20 |
| $90-110$ | 25 |
| $110-130$ | 35 |
| $130-150$ | 9 |
टेबल 2.3 : मध्याची गणना
| वर्ग | वारंवारता (f) |
मध्य- बिंदू $(x)$ |
$f x x$ | $d=x-100$ | $f d$ | $U=$ $(x-100)$ 20 |
$f u$ |
|---|---|---|---|---|---|---|---|
| $50-70$ | 10 | 60 | 600 | -40 | -400 | -2 | -20 |
| $70-90$ | 20 | 80 | 1,600 | -20 | -400 | -1 | -20 |
| $\mathbf{9 0 - 1 1 0}$ | $\mathbf{2 5}$ | $\mathbf{1 0 0}$ | 2,500 | $\mathbf{0}$ | 0 | 0 | 0 |
| $110-130$ | 35 | 120 | 4,200 | 20 | 700 | 1 | 35 |
| $130-150$ | 9 | 140 | 1,260 | 40 | 360 | 2 | 18 |
| $\sum f x$ | |||||||
| आणि | $\sum f=99$ | $\sum f x=$ | $\sum f d=$ | $\sum f u=$ | |||
| $\sum f x$ | 10,160 | 260 | 13 |
जिथे $\mathrm{N}=\sum f=99$
टेबल 2.3 वर्गीकृत डेटासाठी मध्य मोजण्याची प्रक्रिया प्रदान करते. दिलेल्या वारंवारता वितरणात, नव्वद-नऊ कामगारांना मजुरी दरांच्या पाच वर्गांमध्ये गटबद्ध केले आहे. या गटांचे मध्यबिंदू तिसऱ्या स्तंभात सूचीबद्ध केले आहेत. मध्य शोधण्यासाठी, प्रत्येक मध्यबिंदू $(\mathrm{X})$ ला वारंवारता $(f)$ ने गुणाकार केला आहे आणि त्यांची बेरीज ($\sum f_{x}$) $N$ ने भागली आहे.
दिलेले सूत्र वापरून मध्य खालीलप्रमाणे काढता येतो:
$$ \begin{aligned} \overline{\mathrm{X}} & =\frac{\sum f x}{N} \ & =\frac{10,160}{99} \ & =102.6 \end{aligned} $$
अप्रत्यक्ष पद्धत
वर्गीकृत डेटासाठी अप्रत्यक्ष पद्धतीसाठी खालील सूत्र वापरले जाऊ शकते. या सूत्राची तत्त्वे अवर्गीकृत डेटासाठी दिलेल्या अप्रत्यक्ष पद्धतीसारखीच आहेत. हे खालीलप्रमाणे व्यक्त केले जाते:
$$ \bar{x}=A \pm \frac{\sum f d}{N} $$
जिथे,
= गृहीत मध्य गटाचा मध्यबिंदू (टेबल 2.3 मधील गृहीत मध्य गट 90 – 110 आहे ज्याचा मध्यबिंदू 100 आहे.) f = वारंवारता d = गृहीत मध्य गटापासूनचे विचलन (A) N = प्रकरणांची बेरीज किंवा ∑ f i = मध्यांतर रुंदी (या प्रकरणात, ती 20 आहे)
टेबल 2.3 वरून थेट पद्धत वापरून मध्य मोजण्यासाठी खालील चरणे काढता येतात:
(i) 90 - 110 च्या गटात मध्य गृहीत धरला आहे. हे शक्यतो मालिकेच्या मध्यभागी जवळच्या वर्गातून गृहीत धरले जाते. ही प्रक्रिया गणनेची मात्रा कमी करते. टेबल 2.3 मध्ये, A (गृहीत मध्य) 100 आहे, वर्ग $90-110$ चा मध्यबिंदू.
(ii) पाचवा स्तंभ (u) प्रत्येक वर्गाच्या मध्यबिंदूची गृहीत मध्य गटाच्या मध्यबिंदूपासूनची विचलने सूचीबद्ध करतो $(90-110)$.
(iii) सहावा स्तंभ प्रत्येक $f$ ची त्याच्या संबंधित $d$ ने गुणाकार केलेली मूल्ये दर्शवतो ज्यामुळे $f d$ मिळते. नंतर, $f d$ ची धनात्मक आणि ऋणात्मक मूल्ये स्वतंत्रपणे जोडली जातात आणि त्यांचा परिपूर्ण फरक ($\sum f d$) शोधला जातो. लक्षात घ्या की $\sum f d$ शी जोडलेले चिन्ह A नंतरच्या सूत्रात बदलले जाते, जिथे $\pm$ दिले आहे.
अप्रत्यक्ष पद्धत वापरून मध्य खालीलप्रमाणे काढला जातो:
$$ \begin{aligned} \overline{\boldsymbol{x}} & =\boldsymbol{A} \pm \frac{\sum \boldsymbol{f} \boldsymbol{d}}{\boldsymbol{N}} \ & =100+\frac{260}{99} \ & =100+2.6 \ & =102.6 \end{aligned} $$
नोंद : अप्रत्यक्ष मध्य पद्धत समान आणि असमान वर्ग मध्यांतरांसाठी कार्य करेल.
मध्यक
मध्यक हे एक स्थितीत्मक सरासरी आहे. याची व्याख्या “वितरणातील असा बिंदू म्हणून केली जाऊ शकते ज्याच्या प्रत्येक बाजूला समान संख्येने प्रकरणे आहेत”. मध्यक हे $\mathrm{M}$ चिन्ह वापरून व्यक्त केले जाते.
अवर्गीकृत डेटासाठी मध्यक मोजणे
जेव्हा गुण अवर्गीकृत असतात, तेव्हा ते चढत्या किंवा उतरत्या क्रमाने मांडले जातात. क्रमवारीत मालिकेतील मध्यवर्ती निरीक्षण किंवा मूल्य शोधून मध्यक सापडते. चढत्या किंवा उतरत्या क्रमाने मांडलेल्या मालिकेच्या कोणत्याही टोकापासून मध्यवर्ती मूल्य शोधले जाऊ शकते. मध्यक मोजण्यासाठी खालील समीकरण वापरले जाते:
($\left(\frac{\mathrm{N}+1}{2}\right)$) व्या घटकाचे मूल्य
उदाहरण 2.3: खालील गोष्टी वापरून हिमालयातील पर्वत शिखरांची मध्यक उंची काढा:
$8,126 \mathrm{~m}, 8,611 \mathrm{~m}, 7,817 \mathrm{~m}, 8,172 \mathrm{~m}, 8,076 \mathrm{~m}, 8,848 \mathrm{~m}, 8,598 \mathrm{~m}$.
गणना : मध्यक (M) खालील चरणांमध्ये काढले जाऊ शकते:
(i) दिलेला डेटा चढत्या किंवा उतरत्या क्रमाने मांडा.
(ii) मालिकेतील मध्यवर्ती मूल्य शोधण्यासाठी सूत्र लागू करा. अशाप्रकारे:
($\frac{\mathrm{N}+1}{2}$) व्या घटकाचे मूल्य
$=\left(\frac{7+1}{2}\right)$ व्या घटकाचे मूल्य
$=\left(\frac{8}{2}\right)$ व्या घटकाचे मूल्य
क्रमवारीत मालिकेतील 4था घटक हा मध्यक असेल.
डेटाची चढत्या क्रमाने मांडणी -
7,$817 ; 8,076 ; 8,126 ; 8,172 ; 8,598 ; 8,611 ; 8,848$
म्हणून,
4था घटक
$$ \mathrm{M}=8,172 \mathrm{~m} $$
वर्गीकृत डेटासाठी मध्यक मोजणे
जेव्हा गुण गटबद्ध केले जातात, तेव्हा आपल्याला त्या बिंदूचे मूल्य शोधावे लागते जिथे एखादी व्यक्ती किंवा निरीक्षण गटात मध्यवर्ती स्थितीत आहे. हे खालील सूत्र वापरून काढता येते:
$$ M=\boldsymbol{l}+\frac{\boldsymbol{i}}{\boldsymbol{f}}\left(\frac{\boldsymbol{N}}{2}-\boldsymbol{c}\right) $$
जिथे,
M = वर्गीकृत डेटासाठी मध्यक
l = मध्यक वर्गाची खालची मर्यादा
i = मध्यांतर
f = मध्यक वर्गाची वारंवारता
N = एकूण वारंवारता किंवा निरीक्षणांची संख्या
c = पूर्व-मध्यक वर्गाची संचित वारंवारता.
उदाहरण 2.4 : खालील वितरणासाठी मध्यक काढा:
| वर्ग | $50-60$ | $60-70$ | $70-80$ | $80-90$ | $90-100$ | $100-110$ |
|---|---|---|---|---|---|---|
| $\boldsymbol{f}$ | 3 | 7 | 11 | 16 | 8 | 5 |
टेबल 2.4 : मध्यकाची गणना
| वर्ग | वारंवारता (f) |
संचित वारंवारता (iv) |
मध्यक वर्गाची गणना |
|---|---|---|---|
| $50-60$ $60-70$ $70-80$ $\mathbf{8 0 - 9 0}$ (मध्यक गट) $90-100$ $100-110$ |
3 7 11 $16 \boldsymbol{f}$ 8 5 5 |
3 10 $21 c$ $\mathbf{3 7}$ 45 50 |
$M=\frac{N}{2}$ $=\frac{50}{4}$ |
| $\sum_{\mathbf{N}=\mathbf{5 0}} f$ किंवा |
मध्यक खालील दिलेल्या चरणांमध्ये काढले जाते:
(i) टेबल 2.4 मध्ये दर्शविल्याप्रमाणे वारंवारता सारणी तयार केली जाते.
(ii) संचित वारंवारता (F) टेबल 2.4 च्या स्तंभ 3 मध्ये दिल्याप्रमाणे सलग मध्यांतर गटांची प्रत्येक सामान्य वारंवारता जोडून मिळवली जाते.
(iii) मध्यक संख्या $\frac{N}{2}$ म्हणजेच या प्रकरणात $\frac{50}{2}=\mathbf{2 5}$ करून मिळवली जाते, जी टेबल 2.4 च्या स्तंभ 4 मध्ये दर्शविली आहे.
(iv) संचित वारंवारता वितरण (F) मध्ये वरपासून खालपर्यंत मोजा जोपर्यंत $\frac{N}{2}$ पेक्षा मोठे मूल्य येत नाही. या उदाहरणात, $\frac{N}{2}$ 25 आहे, जे 40-44 च्या वर्ग मध्यांतरात येते ज्याची संचित वारंवारता 37 आहे, अशाप्रकारे पूर्व-मध्यक वर्गाची संचित वारंवारता 21 आहे आणि मध्यक वर्गाची वास्तविक वारंवारता 16 आहे.
(v) नंतर चरण 4 मध्ये निश्चित केलेली सर्व मूल्ये खालील समीकरणात बदलून मध्यक काढले जाते:
$$ M=l+\frac{i}{f}(m-c) $$
$$ \begin{aligned} & =80+\frac{10}{16}(25-21) \ & =80+\frac{5}{8} \times 4 \ & =80+\frac{5}{2} \ & =80+2.5 \ M & =82.5 \end{aligned} $$
बहुलक
वितरणात सर्वात जास्त वेळा येणाऱ्या मूल्याला बहुलक म्हणतात. याचे प्रतीक $\mathbf{Z}$ किंवा $\mathbf{M}_{\mathbf{0}}$ आहे. बहुलक हे एक असे माप आहे जे मध्य आणि मध्यकाच्या तुलनेत कमी प्रमाणात वापरले जाते. दिलेल्या डेटा संचामध्ये एकापेक्षा जास्त प्रकारचे बहुलक असू शकतात.
अवर्गीकृत डेटासाठी बहुलक मोजणे
दिलेल्या डेटा संचांवरून बहुलक मोजताना सर्व मापे प्रथम चढत्या किंवा उतरत्या क्रमाने मांडली जातात. यामुळे सर्वात जास्त वेळा येणारे माप सहज ओळखण्यास मदत होते.
उदाहरण 2.5 : दहा विद्यार्थ्यांसाठी भूगोलातील खालील चाचणी गुणांसाठी बहुलक काढा:
$$ 61,10,88,37,61,72,55,61,46,22 $$
गणना : बहुलक शोधण्यासाठी मापे खालीलप्रमाणे चढत्या क्रमाने मांडली जातात:
$10,22,37,46,55, \mathbf{6 1}, \mathbf{6 1}, \mathbf{6 1}, 72,88$.
मालिकेत तीन वेळा येणारे माप 61 हे दिलेल्या डेटासेटमधील बहुलक आहे. डेटासेटमध्ये इतर कोणतीही संख्या अशाच प्रकारे नसल्यामुळे, त्यात एकबहुलकी असण्याचा गुणधर्म आहे.
उदाहरण 2.6 : इतर दहा विद्यार्थ्यांचा वेगळा नमुना वापरून बहुलक काढा, ज्यांनी गुण मिळवले:
$82,11,57,82,08,11,82,95,41,11$.
गणना : दिलेली मापे खाली दर्शविल्याप्रमाणे चढत्या क्रमाने मांडा:
$$ 08,11,11,11,41,57,82,82,82,95 $$
हे सहज लक्षात येऊ शकते की 11 आणि 82 ची मापे दोन्ही वितरणात तीन वेळा येत आहेत. म्हणून, डेटासेट द्विबहुलकी दिसतो. जर तीन मूल्यांची समान आणि सर्वोच्च वारंवारता असेल, तर मालिका त्रिबहुलकी असते. त्याचप्रमाणे, मालिकेत अनेक मापांची पुनरावृत्ती झाल्यास ती बहुबहुलकी बनते. तथापि, जेव्हा मालिकेत कोणतेही माप पुनरावृत्ती होत नाही तेव्हा त्याला बहुलक नसलेले म्हणून नियुक्त केले जाते.
मध्य, मध्यक आणि बहुलक यांची तुलना
सामान्य वितरण वक्राच्या मदतीने केंद्रीय प्रवृत्तीच्या तीनही मापांची सहज तुलना करता येते. सामान्य वक्र हे वारंवारता वितरणाचा संदर्भ देते ज्यामध्ये गुणांचा आलेख बहुतेक वेळा घंटेच्या आकाराचा वक्र म्हणून ओळखला जातो. अनेक मानवी गुण जसे की बुद्धिमत्ता, व्यक्तिमत्त्व गुण आणि विद्यार्थ्यांची कामगिरी यांचे सामान्य वितरण असते. घंटेच्या आकाराचा वक्र जसे दिसतो तसे दिसते, कारण तो सममितीय असतो. दुसऱ्या शब्दांत, बहुतेक निरीक्षणे मध्यम मूल्यावर आणि त्याभोवती असतात. अत्यंत मूल्यांकडे जाताना, निरीक्षणांची संख्या सममितीय पद्धतीने कमी होते. सामान्य वक्रामध्ये डेटा चलनक्षमता जास्त किंवा कमी असू शकते. सामान्य वितरण वक्राचे उदाहरण आकृती 2.3 मध्ये दिले आहे.
आकृती 2.3 : सामान्य वितरण वक्र
सामान्य वितरणात एक महत्त्वाचे वैशिष्ट्य आहे. मध्य, मध्यक आणि बहुलक हे समान गुण (आकृती 2.3 मध्ये 100 गुण) असतात कारण सामान्य वितरण सममितीय असते. सर्वोच्च वारंवारता असलेला गुण वितरणाच्या मध्यभागी येतो आणि अर्धे गुण मध्यभागाच्या वर आणि अर्धे गुण मध्यभागाच्या खाली येतात. बहुतेक गुण वितरणाच्या मध्यभागी किंवा मध्यभोवती येतात. खूप जास्त आणि खूप कमी गुण वारंवार येत नाहीत आणि म्हणून ते दुर्मिळ मानले जातात.
जर डेटा काही प्रकारे तिरपा किंवा विकृत असेल, तर मध्य, मध्यक आणि बहुलक एकरूप होणार नाहीत आणि तिरप्या डेटाचा परिणाम विचारात घेणे आवश्यक आहे (आकृती 2.4 आणि 2.5$)$.
आकृती 2.4 : धनात्मक तिरपेपणा
आकृती $2.5:$ ऋणात्मक तिरपेपणा
व्यायाम
1. खालील दिलेल्या चार पर्यायांमधून योग्य उत्तर निवडा:
(i) केंद्रीय प्रवृत्तीचे असे माप जे अत्यंत मूल्यांद्वारे प्रभावित होत नाही:
(अ) मध्य
(आ) मध्य आणि बहुलक
(इ) बहुलक
(ई) मध्यक
(ii) केंद्रीय प्रवृत्तीचे असे माप जे कोणत्याही वितरणाच्या उंचीशी नेहमी जुळते:
(अ) मध्यक
(आ) मध्यक आणि बहुलक
(इ) मध्य
(ई) बहुलक
2. खालील प्रश्नांची उत्तरे सुमारे 30 शब्दांत द्या:
(i) मध्याची व्याख्या करा.
(ii) बहुलक वापरण्याचे फायदे काय आहेत?
3. खालील प्रश्नांची उत्तरे सुमारे 125 शब्दांत द्या:
(i) सामान्य वितरण आणि तिरप्या वितरणात मध्य, मध्यक आणि बहुलक यांची सापेक्ष स्थिती