प्रकरण ०२ डेटा प्रोसेसिंग

तुम्ही मागील प्रकरणात शिकलात की डेटाचे संघटन आणि सादरीकरण त्यांना सुबोध बनवते. हे डेटा प्रक्रियेस सुलभ करते. डेटाचे विश्लेषण करण्यासाठी अनेक सांख्यिकीय तंत्रे वापरली जातात, उदा.

  1. केंद्रीय प्रवृत्तीची मापे
  2. विस्ताराची मापे
  3. संबंधाची मापे

केंद्रीय प्रवृत्तीची मापे निरीक्षणांच्या संचाचे आदर्श प्रतिनिधित्व करणारे मूल्य प्रदान करतात, तर विस्ताराची मापे डेटाच्या अंतर्गत भिन्नतांचा विचार करतात, बहुतेकदा केंद्रीय प्रवृत्तीच्या मापाभोवती. दुसरीकडे, संबंधाची मापे कोणत्याही दोन किंवा अधिक संबंधित घटनांमधील संबंधाची पातळी प्रदान करतात, जसे की पाऊस आणि पुराची घटना किंवा खतांचा वापर आणि पिकांची उत्पादकता. या प्रकरणात, तुम्ही केंद्रीय प्रवृत्तीची मापे शिकाल.

केंद्रीय प्रवृत्तीची मापे

मोजता येणारी वैशिष्ट्ये जसे की पाऊस, उंची, लोकसंख्येची घनता, शैक्षणिक प्राप्तीची पातळी किंवा वयोगट बदलतात. जर आपल्याला त्यांना समजून घ्यायचे असेल, तर आपण कसे करू? कदाचित आपल्याला एकच मूल्य किंवा संख्या हवी असेल जी सर्व निरीक्षणांचे सर्वोत्तम प्रतिनिधित्व करते. हे एकल मूल्य सहसा वितरणाच्या मध्यभागी असते, अत्यंत टोकांवर नसते. वितरणाचे केंद्र शोधण्यासाठी वापरल्या जाणाऱ्या सांख्यिकीय तंत्रांना केंद्रीय प्रवृत्तीची मापे म्हणतात. केंद्रीय प्रवृत्ती दर्शविणारी संख्या ही संपूर्ण डेटा संचासाठी प्रतिनिधी आकृती असते कारण तो बिंदू आहे ज्याभोवती घटकांचा कल असतो.

केंद्रीय प्रवृत्तीची मापे यांना सांख्यिकीय सरासरी देखील म्हणतात. केंद्रीय प्रवृत्तीची अनेक मापे आहेत, जसे की मध्य, मध्यक आणि बहुलक.

मध्य

मध्य हे ते मूल्य आहे जे सर्व मूल्यांची बेरीज करून आणि निरीक्षणांच्या संख्येने भागून मिळवले जाते.

मध्यक

मध्यक हे रँकचे मूल्य आहे, जे क्रमवारीत मालिकेला दोन समान संख्यांमध्ये विभाजित करते. हे वास्तविक मूल्यापासून स्वतंत्र असते. डेटा चढत्या किंवा उतरत्या क्रमाने मांडणे आणि नंतर मध्य रँकिंग क्रमांकाचे मूल्य शोधणे हे मध्यकाची गणना करण्यात सर्वात महत्त्वाचे आहे. सम संख्यांच्या बाबतीत दोन मध्य रँकिंग मूल्यांची सरासरी ही मध्यक असेल.

बहुलक

बहुलक म्हणजे विशिष्ट बिंदू किंवा मूल्यावरील कमाल घटना किंवा वारंवारता. तुमच्या लक्षात येईल की यापैकी प्रत्येक माप हे वेगवेगळ्या प्रकारच्या डेटा संचांसाठी योग्य असलेले एकल प्रतिनिधी संख्या निश्चित करण्याची वेगवेगळी पद्धत आहे.

मध्य

मध्य म्हणजे चलाच्या वेगवेगळ्या मूल्यांची साधी अंकगणितीय सरासरी. अवर्गीकृत आणि वर्गीकृत डेटासाठी, मध्य मोजण्याच्या पद्धती आवश्यकपणे वेगळ्या असतात. मध्य थेट किंवा अप्रत्यक्ष पद्धतींद्वारे, दोन्ही वर्गीकृत आणि अवर्गीकृत डेटासाठी काढता येतो.

अवर्गीकृत डेटावरून मध्य मोजणे

थेट पद्धत

अवर्गीकृत डेटावरून थेट पद्धत वापरून मध्य मोजताना, प्रत्येक निरीक्षणासाठी मूल्ये जोडली जातात आणि एकूण निरीक्षणांच्या बेरजेने एकूण घटनांची संख्या भागली जाते. खालील सूत्र वापरून मध्य काढले जाते:

$$ \overline{\mathrm{X}}=\frac{\sum x}{\mathrm{~N}} $$

जिथे,

$$ \begin{aligned} \overline{\mathrm{X}} & =\text { Mean } \ \sum \quad & \text { Sum of a series of } \ & \text { measures } \end{aligned} $$

$x \quad=$ मापांच्या मालिकेतील एक कच्चा गुण $\sum \mathrm{x}=$ सर्व मापांची बेरीज $\mathrm{N} \quad$ = मापांची संख्या

उदाहरण 2.1 : टेबल 2.1 मध्ये दिलेल्या प्रदेशातील जिल्ह्यांच्या पावसाच्या आधारे मध्य प्रदेशातील माळवा पठारासाठी सरासरी पाऊस काढा:

$\hspace{1cm}$ टेबल 2.1 : सरासरी पावसाची गणना

माळवा पठारातील
जिल्हे
सामान्य पाऊस
मिमी मध्ये
अप्रत्यक्ष पद्धत
x थेट पद्धत $d=x-800^{*}$
इंदूर 979 179
देवास 1083 283
धार 833 33
रतलाम 896 96
उज्जैन 891 91
मंदसौर 825 25
शाजापूर 977 177
$\sum x$ आणि $\sum d$ 6484 884
$\frac{\sum x}{N}$ आणि $\frac{\sum d}{N}$ 926.29 126.29
  • जिथे 800 हे गृहीत मध्य आहे.
    $\mathrm{d}$ हे गृहीत मध्यापासूनचे विचलन आहे.

टेबल 2.1 मध्ये दिलेल्या डेटासाठी मध्य खालीलप्रमाणे काढले जाते:

$$ \begin{aligned} \overline{\mathrm{X}} & =\frac{\sum x}{N} \ & =\frac{6,484}{7} \ & =926.29 \end{aligned} $$

मध्याच्या गणनेवरून हे लक्षात येऊ शकते की कच्चा पावसाचा डेटा थेट जोडला गेला आहे आणि बेरीज निरीक्षणांच्या संख्येने म्हणजेच जिल्ह्यांच्या संख्येने भागली आहे. म्हणून, याला थेट पद्धत म्हणतात.

अप्रत्यक्ष पद्धत

मोठ्या संख्येने निरीक्षणांसाठी, मध्य मोजण्यासाठी सामान्यतः अप्रत्यक्ष पद्धत वापरली जाते. निरीक्षणांची मूल्ये त्यातून एक स्थिर मूल्य वजा करून लहान संख्यांमध्ये कमी करण्यात ही पद्धत मदत करते. उदाहरणार्थ, टेबल 2.1 मध्ये दाखवल्याप्रमाणे, पावसाची मूल्ये 800 आणि $1100 \mathrm{~mm}$ दरम्यान आहेत. आपण ‘गृहीत मध्य’ निवडून आणि प्रत्येक मूल्यातून निवडलेली संख्या वजा करून ही मूल्ये कमी करू शकतो. या प्रकरणात, आपण 800 हे गृहीत मध्य म्हणून घेतले आहे. अशा ऑपरेशनला कोडिंग म्हणतात. नंतर या कमी केलेल्या संख्यांवरून (टेबल 2.1 चा स्तंभ 3) मध्य काढला जातो.

अप्रत्यक्ष पद्धत वापरून मध्य मोजण्यासाठी खालील सूत्र वापरले जाते:

$$ \overline{\mathrm{X}}=A+\frac{\sum d}{N} $$

जिथे,

$$ \begin{aligned} A & =\text { Subtracted constant } \ \sum d & =\text { Sum of the coded scores } \ N & =\text { Number of individual observations in a series } \end{aligned} $$

टेबल 2.1 मध्ये दाखवल्याप्रमाणे डेटासाठी मध्य खालील प्रकारे अप्रत्यक्ष पद्धत वापरून काढता येतो:

$$ \begin{aligned} \overline{\mathrm{X}} & =800+\frac{884}{7} \ & =800+\frac{884}{7} \ \overline{\mathrm{X}} & =926.29 \mathrm{~mm} \end{aligned} $$

लक्षात घ्या की दोन्ही पद्धतींपैकी कोणत्याही एका पद्धतीने गणना केली तरी मध्यमान समान येते.

वर्गीकृत डेटावरून मध्य मोजणे

वर्गीकृत डेटासाठी देखील थेट किंवा अप्रत्यक्ष पद्धत वापरून मध्य काढला जातो.

थेट पद्धत

जेव्हा गुण वारंवारता वितरणात गटबद्ध केले जातात, तेव्हा वैयक्तिक मूल्ये त्यांची ओळख गमावतात. ही मूल्ये त्या वर्ग ${ }^{\circ}$ मध्यांतरांच्या मध्यबिंदूंद्वारे दर्शविली जातात ज्यामध्ये ती स्थित आहेत. थेट पद्धत वापरून वर्गीकृत डेटावरून मध्य मोजताना, प्रत्येक वर्ग मध्यांतराचा मध्यबिंदू त्याच्या संबंधित वारंवारता $(f)$ ने गुणाकार केला जातो; $f x$ ($\mathrm{X}$ हे मध्यबिंदू आहेत) ची सर्व मूल्ये जोडून $\sum f x$ मिळवले जाते ज्याला शेवटी निरीक्षणांच्या संख्येने म्हणजेच $\mathrm{N}$ ने भागले जाते. म्हणून, खालील सूत्र वापरून मध्य काढला जातो:

$$ \overline{\mathrm{X}}=\frac{\sum f x}{N} $$

जिथे :

$$ \begin{aligned} \overline{\mathrm{X}} & =\text { Mean } \ f & =\text { Frequencies } \ x & =\text { Midpoints of class intervals } \ N & \left.=\text { Number of observations (it may also be defined as } \sum f\right) \end{aligned} $$

उदाहरण 2.2 : टेबल 2.2 मध्ये दिलेला डेटा वापरून कारखान्यातील कामगारांचा सरासरी मजुरी दर काढा:

टेबल 2.2 : कारखान्यातील कामगारांचा मजुरी दर

मजुरी दर (रु./दिवस) कामगारांची संख्या ()
वर्ग $\boldsymbol{f}$
$50-70$ 10
$70-90$ 20
$90-110$ 25
$110-130$ 35
$130-150$ 9

टेबल 2.3 : मध्याची गणना

वर्ग वारंवारता
(f)
मध्य-
बिंदू
$(x)$
$f x x$ $d=x-100$ $f d$ $U=$
$(x-100)$
20
$f u$
$50-70$ 10 60 600 -40 -400 -2 -20
$70-90$ 20 80 1,600 -20 -400 -1 -20
$\mathbf{9 0 - 1 1 0}$ $\mathbf{2 5}$ $\mathbf{1 0 0}$ 2,500 $\mathbf{0}$ 0 0 0
$110-130$ 35 120 4,200 20 700 1 35
$130-150$ 9 140 1,260 40 360 2 18
$\sum f x$
आणि $\sum f=99$ $\sum f x=$ $\sum f d=$ $\sum f u=$
$\sum f x$ 10,160 260 13

जिथे $\mathrm{N}=\sum f=99$

टेबल 2.3 वर्गीकृत डेटासाठी मध्य मोजण्याची प्रक्रिया प्रदान करते. दिलेल्या वारंवारता वितरणात, नव्वद-नऊ कामगारांना मजुरी दरांच्या पाच वर्गांमध्ये गटबद्ध केले आहे. या गटांचे मध्यबिंदू तिसऱ्या स्तंभात सूचीबद्ध केले आहेत. मध्य शोधण्यासाठी, प्रत्येक मध्यबिंदू $(\mathrm{X})$ ला वारंवारता $(f)$ ने गुणाकार केला आहे आणि त्यांची बेरीज ($\sum f_{x}$) $N$ ने भागली आहे.

दिलेले सूत्र वापरून मध्य खालीलप्रमाणे काढता येतो:

$$ \begin{aligned} \overline{\mathrm{X}} & =\frac{\sum f x}{N} \ & =\frac{10,160}{99} \ & =102.6 \end{aligned} $$

अप्रत्यक्ष पद्धत

वर्गीकृत डेटासाठी अप्रत्यक्ष पद्धतीसाठी खालील सूत्र वापरले जाऊ शकते. या सूत्राची तत्त्वे अवर्गीकृत डेटासाठी दिलेल्या अप्रत्यक्ष पद्धतीसारखीच आहेत. हे खालीलप्रमाणे व्यक्त केले जाते:

$$ \bar{x}=A \pm \frac{\sum f d}{N} $$

जिथे,

= गृहीत मध्य गटाचा मध्यबिंदू (टेबल 2.3 मधील गृहीत मध्य गट 90 – 110 आहे ज्याचा मध्यबिंदू 100 आहे.) f = वारंवारता d = गृहीत मध्य गटापासूनचे विचलन (A) N = प्रकरणांची बेरीज किंवा ∑ f i = मध्यांतर रुंदी (या प्रकरणात, ती 20 आहे)

टेबल 2.3 वरून थेट पद्धत वापरून मध्य मोजण्यासाठी खालील चरणे काढता येतात:

(i) 90 - 110 च्या गटात मध्य गृहीत धरला आहे. हे शक्यतो मालिकेच्या मध्यभागी जवळच्या वर्गातून गृहीत धरले जाते. ही प्रक्रिया गणनेची मात्रा कमी करते. टेबल 2.3 मध्ये, A (गृहीत मध्य) 100 आहे, वर्ग $90-110$ चा मध्यबिंदू.

(ii) पाचवा स्तंभ (u) प्रत्येक वर्गाच्या मध्यबिंदूची गृहीत मध्य गटाच्या मध्यबिंदूपासूनची विचलने सूचीबद्ध करतो $(90-110)$.

(iii) सहावा स्तंभ प्रत्येक $f$ ची त्याच्या संबंधित $d$ ने गुणाकार केलेली मूल्ये दर्शवतो ज्यामुळे $f d$ मिळते. नंतर, $f d$ ची धनात्मक आणि ऋणात्मक मूल्ये स्वतंत्रपणे जोडली जातात आणि त्यांचा परिपूर्ण फरक ($\sum f d$) शोधला जातो. लक्षात घ्या की $\sum f d$ शी जोडलेले चिन्ह A नंतरच्या सूत्रात बदलले जाते, जिथे $\pm$ दिले आहे.

अप्रत्यक्ष पद्धत वापरून मध्य खालीलप्रमाणे काढला जातो:

$$ \begin{aligned} \overline{\boldsymbol{x}} & =\boldsymbol{A} \pm \frac{\sum \boldsymbol{f} \boldsymbol{d}}{\boldsymbol{N}} \ & =100+\frac{260}{99} \ & =100+2.6 \ & =102.6 \end{aligned} $$

नोंद : अप्रत्यक्ष मध्य पद्धत समान आणि असमान वर्ग मध्यांतरांसाठी कार्य करेल.

मध्यक

मध्यक हे एक स्थितीत्मक सरासरी आहे. याची व्याख्या “वितरणातील असा बिंदू म्हणून केली जाऊ शकते ज्याच्या प्रत्येक बाजूला समान संख्येने प्रकरणे आहेत”. मध्यक हे $\mathrm{M}$ चिन्ह वापरून व्यक्त केले जाते.

अवर्गीकृत डेटासाठी मध्यक मोजणे

जेव्हा गुण अवर्गीकृत असतात, तेव्हा ते चढत्या किंवा उतरत्या क्रमाने मांडले जातात. क्रमवारीत मालिकेतील मध्यवर्ती निरीक्षण किंवा मूल्य शोधून मध्यक सापडते. चढत्या किंवा उतरत्या क्रमाने मांडलेल्या मालिकेच्या कोणत्याही टोकापासून मध्यवर्ती मूल्य शोधले जाऊ शकते. मध्यक मोजण्यासाठी खालील समीकरण वापरले जाते:

($\left(\frac{\mathrm{N}+1}{2}\right)$) व्या घटकाचे मूल्य

उदाहरण 2.3: खालील गोष्टी वापरून हिमालयातील पर्वत शिखरांची मध्यक उंची काढा:

$8,126 \mathrm{~m}, 8,611 \mathrm{~m}, 7,817 \mathrm{~m}, 8,172 \mathrm{~m}, 8,076 \mathrm{~m}, 8,848 \mathrm{~m}, 8,598 \mathrm{~m}$.

गणना : मध्यक (M) खालील चरणांमध्ये काढले जाऊ शकते:

(i) दिलेला डेटा चढत्या किंवा उतरत्या क्रमाने मांडा.

(ii) मालिकेतील मध्यवर्ती मूल्य शोधण्यासाठी सूत्र लागू करा. अशाप्रकारे:

($\frac{\mathrm{N}+1}{2}$) व्या घटकाचे मूल्य

$=\left(\frac{7+1}{2}\right)$ व्या घटकाचे मूल्य

$=\left(\frac{8}{2}\right)$ व्या घटकाचे मूल्य

क्रमवारीत मालिकेतील 4था घटक हा मध्यक असेल.

डेटाची चढत्या क्रमाने मांडणी -

7,$817 ; 8,076 ; 8,126 ; 8,172 ; 8,598 ; 8,611 ; 8,848$

म्हणून,

4था घटक

$$ \mathrm{M}=8,172 \mathrm{~m} $$

वर्गीकृत डेटासाठी मध्यक मोजणे

जेव्हा गुण गटबद्ध केले जातात, तेव्हा आपल्याला त्या बिंदूचे मूल्य शोधावे लागते जिथे एखादी व्यक्ती किंवा निरीक्षण गटात मध्यवर्ती स्थितीत आहे. हे खालील सूत्र वापरून काढता येते:

$$ M=\boldsymbol{l}+\frac{\boldsymbol{i}}{\boldsymbol{f}}\left(\frac{\boldsymbol{N}}{2}-\boldsymbol{c}\right) $$

जिथे,

M = वर्गीकृत डेटासाठी मध्यक
l = मध्यक वर्गाची खालची मर्यादा
i = मध्यांतर
f = मध्यक वर्गाची वारंवारता
N = एकूण वारंवारता किंवा निरीक्षणांची संख्या
c = पूर्व-मध्यक वर्गाची संचित वारंवारता.

उदाहरण 2.4 : खालील वितरणासाठी मध्यक काढा:

वर्ग $50-60$ $60-70$ $70-80$ $80-90$ $90-100$ $100-110$
$\boldsymbol{f}$ 3 7 11 16 8 5

टेबल 2.4 : मध्यकाची गणना

वर्ग वारंवारता
(f)
संचित
वारंवारता (iv)
मध्यक वर्गाची
गणना
$50-60$
$60-70$
$70-80$
$\mathbf{8 0 - 9 0}$
(मध्यक गट)
$90-100$
$100-110$
3
7
11
$16 \boldsymbol{f}$

8
5
5
3
10
$21 c$
$\mathbf{3 7}$
45
50
$M=\frac{N}{2}$
$=\frac{50}{4}$
$\sum_{\mathbf{N}=\mathbf{5 0}} f$ किंवा

मध्यक खालील दिलेल्या चरणांमध्ये काढले जाते:

(i) टेबल 2.4 मध्ये दर्शविल्याप्रमाणे वारंवारता सारणी तयार केली जाते.

(ii) संचित वारंवारता (F) टेबल 2.4 च्या स्तंभ 3 मध्ये दिल्याप्रमाणे सलग मध्यांतर गटांची प्रत्येक सामान्य वारंवारता जोडून मिळवली जाते.

(iii) मध्यक संख्या $\frac{N}{2}$ म्हणजेच या प्रकरणात $\frac{50}{2}=\mathbf{2 5}$ करून मिळवली जाते, जी टेबल 2.4 च्या स्तंभ 4 मध्ये दर्शविली आहे.

(iv) संचित वारंवारता वितरण (F) मध्ये वरपासून खालपर्यंत मोजा जोपर्यंत $\frac{N}{2}$ पेक्षा मोठे मूल्य येत नाही. या उदाहरणात, $\frac{N}{2}$ 25 आहे, जे 40-44 च्या वर्ग मध्यांतरात येते ज्याची संचित वारंवारता 37 आहे, अशाप्रकारे पूर्व-मध्यक वर्गाची संचित वारंवारता 21 आहे आणि मध्यक वर्गाची वास्तविक वारंवारता 16 आहे.

(v) नंतर चरण 4 मध्ये निश्चित केलेली सर्व मूल्ये खालील समीकरणात बदलून मध्यक काढले जाते:

$$ M=l+\frac{i}{f}(m-c) $$

$$ \begin{aligned} & =80+\frac{10}{16}(25-21) \ & =80+\frac{5}{8} \times 4 \ & =80+\frac{5}{2} \ & =80+2.5 \ M & =82.5 \end{aligned} $$

बहुलक

वितरणात सर्वात जास्त वेळा येणाऱ्या मूल्याला बहुलक म्हणतात. याचे प्रतीक $\mathbf{Z}$ किंवा $\mathbf{M}_{\mathbf{0}}$ आहे. बहुलक हे एक असे माप आहे जे मध्य आणि मध्यकाच्या तुलनेत कमी प्रमाणात वापरले जाते. दिलेल्या डेटा संचामध्ये एकापेक्षा जास्त प्रकारचे बहुलक असू शकतात.

अवर्गीकृत डेटासाठी बहुलक मोजणे

दिलेल्या डेटा संचांवरून बहुलक मोजताना सर्व मापे प्रथम चढत्या किंवा उतरत्या क्रमाने मांडली जातात. यामुळे सर्वात जास्त वेळा येणारे माप सहज ओळखण्यास मदत होते.

उदाहरण 2.5 : दहा विद्यार्थ्यांसाठी भूगोलातील खालील चाचणी गुणांसाठी बहुलक काढा:

$$ 61,10,88,37,61,72,55,61,46,22 $$

गणना : बहुलक शोधण्यासाठी मापे खालीलप्रमाणे चढत्या क्रमाने मांडली जातात:

$10,22,37,46,55, \mathbf{6 1}, \mathbf{6 1}, \mathbf{6 1}, 72,88$.

मालिकेत तीन वेळा येणारे माप 61 हे दिलेल्या डेटासेटमधील बहुलक आहे. डेटासेटमध्ये इतर कोणतीही संख्या अशाच प्रकारे नसल्यामुळे, त्यात एकबहुलकी असण्याचा गुणधर्म आहे.

उदाहरण 2.6 : इतर दहा विद्यार्थ्यांचा वेगळा नमुना वापरून बहुलक काढा, ज्यांनी गुण मिळवले:

$82,11,57,82,08,11,82,95,41,11$.

गणना : दिलेली मापे खाली दर्शविल्याप्रमाणे चढत्या क्रमाने मांडा:

$$ 08,11,11,11,41,57,82,82,82,95 $$

हे सहज लक्षात येऊ शकते की 11 आणि 82 ची मापे दोन्ही वितरणात तीन वेळा येत आहेत. म्हणून, डेटासेट द्विबहुलकी दिसतो. जर तीन मूल्यांची समान आणि सर्वोच्च वारंवारता असेल, तर मालिका त्रिबहुलकी असते. त्याचप्रमाणे, मालिकेत अनेक मापांची पुनरावृत्ती झाल्यास ती बहुबहुलकी बनते. तथापि, जेव्हा मालिकेत कोणतेही माप पुनरावृत्ती होत नाही तेव्हा त्याला बहुलक नसलेले म्हणून नियुक्त केले जाते.

मध्य, मध्यक आणि बहुलक यांची तुलना

सामान्य वितरण वक्राच्या मदतीने केंद्रीय प्रवृत्तीच्या तीनही मापांची सहज तुलना करता येते. सामान्य वक्र हे वारंवारता वितरणाचा संदर्भ देते ज्यामध्ये गुणांचा आलेख बहुतेक वेळा घंटेच्या आकाराचा वक्र म्हणून ओळखला जातो. अनेक मानवी गुण जसे की बुद्धिमत्ता, व्यक्तिमत्त्व गुण आणि विद्यार्थ्यांची कामगिरी यांचे सामान्य वितरण असते. घंटेच्या आकाराचा वक्र जसे दिसतो तसे दिसते, कारण तो सममितीय असतो. दुसऱ्या शब्दांत, बहुतेक निरीक्षणे मध्यम मूल्यावर आणि त्याभोवती असतात. अत्यंत मूल्यांकडे जाताना, निरीक्षणांची संख्या सममितीय पद्धतीने कमी होते. सामान्य वक्रामध्ये डेटा चलनक्षमता जास्त किंवा कमी असू शकते. सामान्य वितरण वक्राचे उदाहरण आकृती 2.3 मध्ये दिले आहे.

आकृती 2.3 : सामान्य वितरण वक्र

सामान्य वितरणात एक महत्त्वाचे वैशिष्ट्य आहे. मध्य, मध्यक आणि बहुलक हे समान गुण (आकृती 2.3 मध्ये 100 गुण) असतात कारण सामान्य वितरण सममितीय असते. सर्वोच्च वारंवारता असलेला गुण वितरणाच्या मध्यभागी येतो आणि अर्धे गुण मध्यभागाच्या वर आणि अर्धे गुण मध्यभागाच्या खाली येतात. बहुतेक गुण वितरणाच्या मध्यभागी किंवा मध्यभोवती येतात. खूप जास्त आणि खूप कमी गुण वारंवार येत नाहीत आणि म्हणून ते दुर्मिळ मानले जातात.

जर डेटा काही प्रकारे तिरपा किंवा विकृत असेल, तर मध्य, मध्यक आणि बहुलक एकरूप होणार नाहीत आणि तिरप्या डेटाचा परिणाम विचारात घेणे आवश्यक आहे (आकृती 2.4 आणि 2.5$)$.

आकृती 2.4 : धनात्मक तिरपेपणा

आकृती $2.5:$ ऋणात्मक तिरपेपणा

व्यायाम

1. खालील दिलेल्या चार पर्यायांमधून योग्य उत्तर निवडा:

(i) केंद्रीय प्रवृत्तीचे असे माप जे अत्यंत मूल्यांद्वारे प्रभावित होत नाही:

(अ) मध्य
(आ) मध्य आणि बहुलक
(इ) बहुलक
(ई) मध्यक

(ii) केंद्रीय प्रवृत्तीचे असे माप जे कोणत्याही वितरणाच्या उंचीशी नेहमी जुळते:

(अ) मध्यक
(आ) मध्यक आणि बहुलक
(इ) मध्य
(ई) बहुलक

2. खालील प्रश्नांची उत्तरे सुमारे 30 शब्दांत द्या:

(i) मध्याची व्याख्या करा.
(ii) बहुलक वापरण्याचे फायदे काय आहेत?

3. खालील प्रश्नांची उत्तरे सुमारे 125 शब्दांत द्या:

(i) सामान्य वितरण आणि तिरप्या वितरणात मध्य, मध्यक आणि बहुलक यांची सापेक्ष स्थिती