अध्याय ०६ सहसंबंध
१. परिचय
मागील अध्यायांमध्ये तुम्ही डेटाच्या मोठ्या संचातून सारांश मापे कशी तयार करायची आणि समान चलांमधील बदल कसे मोजायचे ते शिकलात. आता तुम्ही दोन चलांमधील संबंध कसा तपासायचा ते शिकणार आहात. उन्हाळ्याची उष्णता वाढताच, हिल स्टेशन्स जास्तीत जास्त पर्यटकांनी गजबजून जातात. आईस्क्रीमची विक्रीही वेगवान होते. म्हणजेच, तापमान हे पर्यटकांच्या संख्येशी आणि आईस्क्रीमच्या विक्रीशी संबंधित आहे. त्याचप्रमाणे, तुमच्या स्थानिक मंडीत टोमॅटोचा पुरवठा वाढला की त्याची किंमत घसरते. स्थानिक पिकाची उत्पादने बाजारात येऊ लागली की, टोमॅटोची किंमत प्रति $\mathrm{kg}$ ४० रुपयांवरून प्रति किलो ४ रुपये किंवा त्याहून कमी होते. म्हणजेच, पुरवठा हा किंमतीशी संबंधित आहे. सहसंबंध विश्लेषण ही अशा संबंधांची पद्धतशीरपणे तपासणी करण्याची एक पद्धत आहे. हे अशा प्रश्नांशी संबंधित आहे:
- दोन चलांमध्ये काही संबंध आहे का?
- एका चलाचे मूल्य बदलले की दुसऱ्या चलाचे मूल्यही बदलते का?
- दोन्ही चले एकाच दिशेने जातात का?
- संबंध किती प्रबळ आहे?
२. संबंधांचे प्रकार
चला विविध प्रकारचे संबंध पाहू. मागणी केलेल्या प्रमाणातील हालचाली आणि एखाद्या वस्तूची किंमत यांच्यातील संबंध हा मागणीच्या सिद्धांताचा अविभाज्य भाग आहे, जो तुम्ही इयत्ता बारावीत अभ्यासाल. कमी कृषी उत्पादकता ही कमी पावसाशी संबंधित आहे. अशा संबंधांच्या उदाहरणांना कारण आणि परिणाम अशी व्याख्या दिली जाऊ शकते. इतर फक्त योगायोग असू शकतात. अभयारण्यात प्रवासी पक्ष्यांचे आगमन आणि त्या भागातील जन्मदर यांच्यातील संबंधास कारण-परिणामाची व्याख्या देताच येणार नाही. हे संबंध केवळ योगायोगाचे आहेत. बुटाचा आकार आणि तुमच्या खिशातील पैसे यांच्यातील संबंध हे असेच दुसरे उदाहरण आहे. जरी संबंध अस्तित्वात असले तरीही त्यांचे स्पष्टीकरण देणे कठीण असते.
दुसऱ्या एका प्रसंगी, दोन चलांवर तिसऱ्या चलाचा परिणामामुळे त्या दोन चलांमध्ये संबध निर्माण होऊ शकतो. आईस्क्रीमची वेगवान विक्री ही बुडण्यामुळे होणाऱ्या मृत्यूंच्या उच्च संख्येशी संबंधित असू शकते. बळी पडलेले लोक आईस्क्रीम खाण्यामुळे बुडत नाहीत. वाढते तापमान आईस्क्रीमची विक्री वेगवान करते. शिवाय, उष्णतेपासून सुटका मिळवण्यासाठी मोठ्या संख्येने लोक स्विमिंग पूलकडे जाऊ लागतात. यामुळे बुडण्यामुळे होणाऱ्या मृत्यूंची संख्या वाढली असेल. अशाप्रकारे, आईस्क्रीमच्या विक्री आणि बुडण्यामुळे होणाऱ्या मृत्यूंमधील उच्च सहसंबंधामागे तापमान आहे.
सहसंबंध काय मोजतो?
सहसंबंध हा चलांमधील संबंधाची दिशा आणि तीव्रता यांचा अभ्यास आणि मापन करतो. सहसंबंध हे सह-परिवर्तन (covariation) मोजतो, कारणत्व (causation) नाही. सहसंबंधाचा अर्थ कारण-परिणाम संबंध असा कधीच लावता कामा नये. दोन चलांमध्ये $\mathrm{X}$ आणि Y यांच्यात सहसंबंधाची उपस्थिती म्हणजे फक्त इतकेच की, जेव्हा एका चलाचे मूल्य एका दिशेने बदलताना आढळते, तेव्हा दुसऱ्या चलाचे मूल्यही एका निश्चित पद्धतीने एकाच दिशेने (म्हणजे सकारात्मक बदल) किंवा विरुद्ध दिशेने (म्हणजे नकारात्मक बदल) बदलताना आढळते. सोपेपणासाठी आपण असे गृहीत धरू की, सहसंबंध अस्तित्वात असल्यास, तो रेषीय (linear) आहे, म्हणजे दोन चलांची सापेक्ष हालचाल आलेख कागदावर सरळ रेषा काढून दर्शवता येते.
सहसंबंधाचे प्रकार
सहसंबंधाचे सामान्यतः नकारात्मक आणि सकारात्मक असे वर्गीकरण केले जाते. जेव्हा चले एकाच दिशेने एकत्र हलतात तेव्हा सहसंबंध सकारात्मक असल्याचे म्हटले जाते. जेव्हा उत्पन्न वाढते, तेव्हा उपभोगही वाढतो. जेव्हा उत्पन्न कमी होते, तेव्हा उपभोगही कमी होतो. आईस्क्रीमची विक्री आणि तापमान एकाच दिशेने जातात. जेव्हा ते विरुद्ध दिशेने जातात तेव्हा सहसंबंध नकारात्मक असतो. जेव्हा सफरचंदाची किंमत कमी होते तेव्हा त्याची मागणी वाढते. जेव्हा किंमती वाढतात तेव्हा मागणी कमी होते. जेव्हा तुम्ही अभ्यासात जास्त वेळ घालवता, तेव्हा तुमच्या नापास होण्याची शक्यता कमी होते. जेव्हा तुम्ही तुमच्या अभ्यासात कमी तास घालवता, तेव्हा कमी गुण/श्रेणी मिळवण्याची शक्यता वाढते. ही नकारात्मक सहसंबंधाची उदाहरणे आहेत. चले विरुद्ध दिशेने जातात.
३. सहसंबंध मोजण्याच्या तंत्रां
सहसंबंधाचा अभ्यास करण्यासाठी वापरली जाणारी तीन महत्त्वाची साधने म्हणजे विखुरण आकृत्या (scatter diagrams), कार्ल पिअर्सनचे सहसंबंध गुणांक आणि स्पीयरमनचे श्रेणी सहसंबंध. विखुरण आकृती कोणतीही विशिष्ट संख्यात्मक मूल्य न देता संबंधाचे स्वरूप दृष्यरूपाने सादर करते. दोन चलांमधील रेषीय संबंधाचे संख्यात्मक माप कार्ल पिअर्सनच्या सहसंबंध गुणांकाद्वारे दिले जाते. एखादा संबंध रेषीय असल्याचे म्हटले जाते जर तो सरळ रेषेद्वारे दर्शवला जाऊ शकतो. स्पीयरमनचे सहसंबंध गुणांक हे वैयक्तिक वस्तूंना त्यांच्या गुणधर्मांनुसार दिलेल्या श्रेणींमधील रेषीय संबंध मोजते. गुणधर्म (Attributes) ही अशी चले आहेत जी संख्यात्मकरित्या मोजता येत नाहीत जसे की लोकांची बुद्धिमत्ता, शारीरिक देखावा, प्रामाणिकपणा इ.
विखुरण आकृती (Scatter Diagram)
विखुरण आकृती हे कोणतेही संख्यात्मक मूल्य मोजल्याशिवाय संबंधाचे स्वरूप दृष्यरूपाने तपासण्यासाठी एक उपयुक्त तंत्र आहे. या तंत्रात, दोन चलांची मूल्ये आलेख कागदावर बिंदू म्हणून चिन्हांकित केली जातात. विखुरण आकृतीवरून, संबंधाच्या स्वरूपाची बऱ्यापैकी चांगली कल्पना मिळू शकते. विखुरण आकृतीमध्ये, विखुरलेल्या बिंदूंची जवळीक आणि त्यांची एकूण दिशा यामुळे आपल्याला संबंधाची तपासणी करता येते. जर सर्व बिंदू एका रेषेवर असतील, तर सहसंबंध परिपूर्ण आहे आणि तो एकत्वात आहे असे म्हटले जाते. जर विखुरलेले बिंदू रेषेभोवती विस्तृतपणे पसरलेले असतील, तर सहसंबंध कमी आहे. जर विखुरलेले बिंदू रेषेजवळ किंवा रेषेवर असतील, तर सहसंबंध रेषीय आहे असे म्हटले जाते.
आकृती ६.१ ते आकृती ६.५ पर्यंतच्या विखुरण आकृत्या आपल्याला दोन चलांमधील संबंधाची कल्पना देतात. आकृती ६.१ मध्ये वर चढत्या रेषेभोवती विखुरलेले बिंदू दिसतात, जे चले एकाच दिशेने हलतात हे दर्शवतात. जेव्हा $\mathrm{X}$ वाढते तेव्हा $\mathrm{Y}$ देखील वाढेल. हा सकारात्मक सहसंबंध आहे. आकृती ६.२ मध्ये, बिंदू खाली उतरणाऱ्या रेषेभोवती विखुरलेले आढळतात. यावेळी चले विरुद्ध दिशेने जातात. जेव्हा $\mathrm{X}$ वाढते तेव्हा $\mathrm{Y}$ कमी होते आणि त्याउलट. हा नकारात्मक सहसंबंध आहे. आकृती ६.३ मध्ये वर चढणारी किंवा खाली उतरणारी अशी कोणतीही रेषा नाही ज्याभोवती बिंदू विखुरलेले आहेत. हे कोणत्याही सहसंबंधाचे उदाहरण आहे. आकृती ६.४ आणि आकृती ६.५ मध्ये, बिंदू यापुढे वर चढत्या किंवा खाली उतरत्या रेषेभोवती विखुरलेले नाहीत. बिंदू स्वतः रेषांवर आहेत. याला अनुक्रमे परिपूर्ण सकारात्मक सहसंबंध आणि परिपूर्ण नकारात्मक सहसंबंध असे संबोधले जाते.
कृती
- तुमच्या वर्गातील विद्यार्थ्यांची उंची, वजन आणि इयत्ता $X$ मधील कोणत्याही दोन विषयांमध्ये मिळवलेले गुण यांचा डेटा गोळा करा. यापैकी दोन दोन चल घेऊन त्यांची विखुरण आकृती काढा. तुम्हाला कोणत्या प्रकारचा संबंध आढळतो?
विखुरण आकृतीचे काळजीपूर्वक निरीक्षण केल्यास संबंधाचे स्वरूप आणि तीव्रता याची कल्पना येते.
कार्ल पिअर्सनचे सहसंबंध गुणांक
याला गुणाकार क्षण सहसंबंध गुणांक (product moment correlation coefficient) किंवा साधा सहसंबंध गुणांक असेही म्हणतात. हे दोन चलांमधील $\mathrm{X}$ आणि $Y$ रेषीय संबंधाच्या प्रमाणाचे अचूक संख्यात्मक मूल्य देते.
हे लक्षात घेणे महत्त्वाचे आहे की कार्ल पिअर्सनचा सहसंबंध गुणांक तेव्हाच वापरला पाहिजे जेव्हा चलांमध्ये रेषीय संबंध असेल. जेव्हा $\mathrm{X}$ आणि $\mathrm{Y}$ यांच्यात अरेषीय (non-linear) संबंध असेल, तेव्हा कार्ल पिअर्सनच्या सहसंबंध गुणांकाची गणना करणे गैरसमज निर्माण करू शकते. अशाप्रकारे, जर खरा संबंध आकृती ६.१, $6.2,6.4$ आणि ६.५ मधील विखुरण आकृत्या दाखवल्याप्रमाणे रेषीय प्रकारचा असेल, तर कार्ल पिअर्सनच्या सहसंबंध गुणांकाची गणना केली पाहिजे आणि तो आपल्याला चलांमधील संबंधाची दिशा आणि तीव्रता सांगेल. परंतु जर खरा संबंध आकृती ६.६ किंवा ६.७ मधील विखुरण आकृत्या दाखवल्याप्रमाणे असेल, तर त्याचा अर्थ $\mathrm{X}$ आणि $\mathrm{Y}$ यांच्यात अरेषीय संबंध आहे आणि आपण कार्ल पिअर्सनचा सहसंबंध गुणांक वापरण्याचा प्रयत्न करू नये.
म्हणून, कार्ल पिअर्सनचा सहसंबंध गुणांक मोजण्यापूर्वी चलांमधील संबंधाची विखुरण आकृती प्रथम तपासणे उचित आहे.
समजा $X _{1}, X _{2}, \ldots, X _{N}$ ही $N$ ची मूल्ये आहेत आणि $\mathrm{Y} _{1}, \mathrm{Y} _{2}, \ldots, \mathrm{Y} _{\mathrm{N}}$ ही Y ची संबंधित मूल्ये आहेत. पुढील सादरीकरणांमध्ये, सोपेपणासाठी एकक दर्शविणारे सबस्क्रिप्ट वगळले आहेत. $\mathrm{X}$ आणि $\mathrm{Y}$ ची अंकगणितीय माध्ये खालीलप्रमाणे परिभाषित केली आहेत
$$ \overline{\mathrm{X}}=\frac{\sum \mathrm{X}}{\mathrm{N}} ; \quad \overline{\mathrm{Y}}=\frac{\sum \mathrm{Y}}{\mathrm{N}} $$
आणि त्यांचे प्रचरण (variances) खालीलप्रमाणे आहेत
$$ \sigma^{2} x=\frac{\sum(X-\bar{X})^{2}}{N}=\frac{\sum X^{2}}{N}-\bar{X}^{2} $$
आणि $$\quad \sigma^{2} \mathrm{y}=\frac{\sum(\mathrm{Y}-\overline{\mathrm{Y}})^{2}}{\mathrm{~N}}=\frac{\sum \mathrm{Y}^{2}}{\mathrm{~N}}-\overline{\mathrm{Y}}^{2}$$
$\mathrm{X}$ आणि $\mathrm{Y}$ ची प्रमाणित विचलने (standard deviations) अनुक्रमे त्यांच्या प्रचरणांची धनात्मक वर्गमूळे आहेत. $\mathrm{X}$ आणि $\mathrm{Y}$ चे सहप्रचरण (covariance) खालीलप्रमाणे परिभाषित केले आहे
$\operatorname{Cov}(\mathrm{X}, \mathrm{Y})=\frac{\sum(\mathrm{X}-\overline{\mathrm{X}})(\mathrm{Y}-\overline{\mathrm{Y}})}{\mathrm{N}}=\frac{\sum \mathrm{xy}}{\mathrm{N}}$
जेथे $\mathrm{x}=\mathrm{X}-\overline{\mathrm{X}}$ आणि $\mathrm{y}=\mathrm{Y}-\overline{\mathrm{Y}}$ ही अनुक्रमे $i^{\text {th }}$ ची $\mathrm{X}$ आणि $\mathrm{Y}$ ची मूल्ये त्यांच्या माध्य मूल्यांपासूनची विचलने आहेत.
$\mathrm{X}$ आणि $\mathrm{Y}$ यांच्यातील सहप्रचरणाचे चिन्ह सहसंबंध गुणांकाचे चिन्ह ठरवते. प्रमाणित विचलने नेहमी धनात्मक असतात. जर सहप्रचरण शून्य असेल, तर सहसंबंध गुणांक नेहमी शून्य असतो. गुणाकार क्षण सहसंबंध किंवा कार्ल पिअर्सनचे सहसंबंध माप खालीलप्रमाणे दिले जाते
$$ \begin{equation*} \mathrm{r}={ }^{\Sigma \mathrm{xy}} / N \sigma _{\mathrm{x}} \sigma _{\mathrm{y}} \tag{1} \end{equation*} $$
किंवा
$$ \begin{equation*} \mathrm{r}=\frac{\sum(\mathrm{X}-\overline{\mathrm{X}})(\mathrm{Y}-\overline{\mathrm{Y}})}{\sqrt{\Sigma(\mathrm{X}-\overline{\mathrm{X}})^{2}} \sqrt{\Sigma(\mathrm{Y}-\overline{\mathrm{Y}})^{2}}} \tag{2} \end{equation*} $$
किंवा
$$ \begin{equation*} r=\frac{\frac{\sum X Y-\left(\sum X\right)\left(\sum Y\right)}{N}}{\sqrt{\sum X^{2}-\frac{\left(\sum X\right)^{2}}{N}} \sqrt{\sum Y^{2}-\frac{\left(\sum Y\right)^{2}}{N}}}\tag{3} \end{equation*} $$
किंवा
$$ \begin{equation*} r=\frac{N \sum XY-(\sum X)(\sum Y)}{\sqrt{N \sum X^2-(\sum X)^2} \cdot \sqrt{N \sum Y^2-(\sum Y)^2}}\tag{4} \end{equation*} $$
सहसंबंध गुणांकाचे गुणधर्म
चला आता सहसंबंध गुणांकाचे गुणधर्म पाहू
- $r$ ला कोणतेही एकक नसते. ही एक शुद्ध संख्या आहे. याचा अर्थ मापनाची एकके $r$ चा भाग नाहीत. उदाहरणार्थ, फूटमधील उंची आणि किलोग्रॅममधील वजन यांच्यातील $r$ समजा ०.७ असू शकतो.
- $r$ चे नकारात्मक मूल्य व्यस्त संबंध दर्शवते. एका चलातील बदल हा दुसऱ्या चलातील बदलाशी विरुद्ध दिशेने संबंधित असतो. जेव्हा एखाद्या वस्तूची किंमत वाढते, तेव्हा त्याची मागणी कमी होते. जेव्हा व्याजदर वाढतो तेव्हा निधीची मागणीही कमी होते. कारण आता निधी महाग झाले आहेत.
- जर $r$ सकारात्मक असेल तर दोन्ही चले एकाच दिशेने जातात. चहाच्या पर्यायी पेय असलेल्या कॉफीची किंमत वाढली की चहाची मागणीही वाढते. सिंचन सुविधांमध्ये सुधारणा ही उच्च उत्पन्नाशी संबंधित आहे. तापमान वाढले की आईस्क्रीमची विक्री वेगवान होते.
- सहसंबंध गुणांकाचे मूल्य वजा एक ते अधिक एक या दरम्यान असते, $-1 \leq r \leq 1$. जर कोणत्याही उदाहरणात $r$ चे मूल्य या श्रेणीबाहेर असेल तर ते गणनेतील त्रुटी दर्शवते.
- $r$ चे परिमाण उगम बदल (change of origin) आणि प्रमाण बदल (change of scale) यांनी अप्रभावित राहते. दोन चले $\mathrm{X}$ आणि $\mathrm{Y}$ दिली आहेत असे समजा, दोन नवीन चले परिभाषित करू.
$\mathrm{U}=\frac{\mathrm{X}-\mathrm{A}}{\mathrm{B}} ; \mathrm{V}=\frac{\mathrm{Y}-\mathrm{C}}{\mathrm{D}}$
जेथे $A$ आणि $C$ ही अनुक्रमे $\mathrm{X}$ आणि $\mathrm{Y}$ ची गृहीत माध्ये आहेत. $\mathrm{B}$ आणि $\mathrm{D}$ हे सामान्य घटक आहेत आणि समान चिन्हाचे आहेत. तर
$r _{x y}=r _{u v}$
हा गुणधर्म स्टेप डेव्हिएशन पद्धतीप्रमाणे अत्यंत सुलभ पद्धतीने सहसंबंध गुणांक मोजण्यासाठी वापरला जातो.
- जर $r=0$ असेल तर दोन्ही चले असंबद्ध आहेत. त्यांच्यात कोणताही रेषीय संबंध नाही. तथापि इतर प्रकारचे संबंध असू शकतात.
- जर $r=1$ किंवा $r=-1$ असेल तर सहसंबंध परिपूर्ण आहे आणि तंतोतंत रेषीय संबंध आहे.
- $r$ चे उच्च मूल्य प्रबळ रेषीय संबंध दर्शवते. जेव्हा ते +१ किंवा -१ च्या जवळ असते तेव्हा त्याचे मूल्य उच्च असल्याचे म्हटले जाते.
- $r$ चे कमी मूल्य (शून्याजवळ) कमकुवत रेषीय संबंध दर्शवते. परंतु अरेषीय संबंध असू शकतो.
जसे तुम्ही अध्याय १ मध्ये वाचले आहे, सांख्यिकीय पद्धती ह्या सामान्य ज्ञानाचा पर्याय नाहीत. येथे, आणखी एक उदाहरण आहे, जे सहसंबंधाची गणना आणि अर्थ लावण्यापूर्वी डेटा योग्यरित्या समजून घेण्याची गरज उठवते. काही गावांमध्ये साथीचा रोग पसरतो आणि सरकार प्रभावित गावांमध्ये डॉक्टरांची टीम पाठवते. मृत्यूंची संख्या आणि गावांमध्ये पाठवलेल्या डॉक्टरांची संख्या यांच्यातील सहसंबंध सकारात्मक आढळतो. सामान्यतः, डॉक्टरांद्वारे पुरवल्या जाणाऱ्या आरोग्यसेवा सुविधांमुळे मृत्यूंची संख्या कमी होण्याची अपेक्षा असते जी नकारात्मक सहसंबंध दर्शवते. इतर कारणांमुळे हे घडले. डेटा एका विशिष्ट कालावधीशी संबंधित आहे. अहवाल केलेल्या मृत्यूंपैकी बरेच टर्मिनल केसेस असू शकतात जेथे डॉक्टर काहीच करू शकत नाहीत. शिवाय, डॉक्टरांच्या उपस्थितीचा फायदा काही काळानंतरच दिसून येतो. असेही शक्य आहे की अहवाल केलेले मृत्यू साथीच्या रोगामुळे नसतील. एक सुनामी राज्यावर अचानक हल्ला करते आणि मृत्यूंची संख्या वाढते.
शेतकऱ्यांच्या शिक्षणाच्या वर्षांचा आणि प्रति एकर वार्षिक उत्पन्न यांच्यातील संबंध तपासून $r$ ची गणना स्पष्ट करू.
उदाहरण १
| शेतकऱ्यांच्या शिक्षणाच्या वर्षांची संख्या | प्रति एकर वार्षिक उत्पन्न ‘000 (रुपये) |
|---|---|
| 0 | 4 |
| 2 | 4 |
| 4 | 6 |
| 6 | 10 |
| 8 | 10 |
| 10 | 8 |
| 12 | 7 |
सूत्र १ ला $\sum \mathrm{Xy}, \sigma _{\mathrm{x}}, \sigma _{\mathrm{y}}$ चे मूल्य आवश्यक आहे
सारणी ६.१ वरून आपल्याला मिळते,
$$ \begin{aligned} & \sum \mathrm{xy}=42, \\ & \sigma _{\mathrm{x}}=\sqrt{\frac{\sum(\mathrm{X}-\overline{\mathrm{X}})^{2}}{\mathrm{~N}}}=\sqrt{\frac{112}{7}}, \\ & \sigma _{\mathrm{y}}=\sqrt{\frac{\sum(\mathrm{Y}-\overline{\mathrm{Y}})^{2}}{\mathrm{~N}}}=\sqrt{\frac{38}{7}} \end{aligned} $$
ही मूल्ये सूत्र (1) मध्ये बदलून
$$ \mathrm{r}=\frac{42}{7 \sqrt{\frac{112}{7}} \sqrt{\frac{38}{7}}}=0.644 $$
हेच मूल्य सूत्र (2) वरूनही मिळू शकते.
$$ \begin{gather*} \mathrm{r}=\frac{\sum(\mathrm{X}-\overline{\mathrm{X}})(\mathrm{Y}-\overline{\mathrm{Y}})}{\sqrt{\sum(\mathrm{X}-\overline{\mathrm{X}})^{2}} \sqrt{\sum(\mathrm{Y}-\overline{\mathrm{Y}})^{2}}} \tag{2}\\ \mathrm{r}=\frac{42}{\sqrt{112} \sqrt{38}}=0.644 \end{gather*} $$
अशाप्रकारे, शेतकऱ्यांच्या शिक्षणाची वर्षे आणि प्रति एकर वार्षिक उत्पन्न यांच्यात सकारात्मक सहसंबंध आहे. $r$ चे मूल्य देखील मोठे आहे. याचा अर्थ शेतकरी शिक्षणात जितकी जास्त वर्षे गुंतवणूक करतील, तितके प्रति एकर उत्पन्न जास्त असेल. हे शेतकऱ्यांच्या शिक्षणाचे महत्त्व रेखांकित करते.
सूत्र (3) वापरण्यासाठी
सारणी ६.१ शेतकऱ्यांच्या शिक्षणाच्या वर्षांचा आणि वार्षिक उत्पन्न यांच्यातील r ची गणना
| शिक्षणाची वर्षे (X) | $(X-\bar{X})$ | $(X-\bar{X})^{2}$ | प्रति एकर वार्षिक उत्पन्न ‘000 रुपये (Y) | $(Y-\bar{Y})$ | $(Y-\bar{Y})^{2}$ | $(X-\bar{X})(Y-\bar{Y})$ |
|---|---|---|---|---|---|---|
| 0 | -6 | 36 | 4 | -3 | 9 | 18 |
| 2 | -4 | 16 | 4 | -3 | 9 | 12 |
| 4 | -2 | 4 | 6 | -1 | 1 | 2 |
| 6 | 0 | 0 | 10 | 3 | 9 | 0 |
| 8 | 2 | 4 | 10 | 3 | 9 | 6 |
| 10 | 4 | 16 | 8 | 1 | 1 | 4 |
| 12 | 6 | 36 | 7 | 0 | 0 | 0 |
| $\Sigma X=42$ | $\sum (X-\overline{\mathrm{X}})^{2}=112$ | $\Sigma Y=49$ | $\Sigma(Y-\bar{Y})^{2}=38$ | $\Sigma(X-\bar{X})(Y-\bar{Y})=42$ |
$$ \begin{equation*} r=\frac{\sum X Y-\frac{(\Sigma X)\left(\sum Y\right)}{N}}{\sqrt{\Sigma X^{2}-\frac{(\Sigma X)^{2}}{N}} \sqrt{\Sigma \mathrm{Y}^{2}-\frac{(\Sigma Y)^{2}}{N}}}\tag{3} \end{equation*} $$
खालील पदावलींची मूल्ये मोजावी लागतील म्हणजे
$\Sigma \mathrm{XY}, \Sigma \mathrm{X}^{2}, \Sigma \mathrm{Y}^{2}$.
आता सूत्र (3) लागू करून $r$ चे मूल्य मिळवा.
$r$ च्या विविध मूल्यांचे अर्थ लावूया. इंग्रजी आणि सांख्यिकीमध्ये मिळवलेल्या गुणांमधील सहसंबंध गुणांक समजा ०.१ आहे. याचा अर्थ असा की जरी दोन्ही विषयांमध्ये मिळवलेले गुण सकारात्मक सहसंबंधित आहेत, तरी संबंधाची ताकद कमकुवत आहे. इंग्रजीत जास्त गुण मिळवणारे विद्यार्थी सांख्यिकीत तुलनेने कमी गुण मिळवत असू शकतात. जर $r$ चे मूल्य समजा ०.९ असते, तर इंग्रजीत जास्त गुण मिळवणारे विद्यार्थी निश्चितपणे सांख्यिकीत जास्त गुण मिळवतील.
नकारात्मक सहसंबंधाचे उदाहरण म्हणजे स्थानिक मंडीत भाजीपाल्याचे आगमन आणि भाजीपाल्याची किंमत यांच्यातील संबंध. जर $r$ -०.९ असेल, तर स्थानिक मंडीत भाजीपाल्याचा पुरवठा हा भाजीपाल्याच्या कमी किमतीसोबत असेल. जर ते -०.१ असते, तर मोठ्या प्रमाणात भाजीपाल्याचा पुरवठा हा कमी किमतीसोबत असेल, परंतु $r$ -०.९ असतानाच्या किमतीएवढी कमी नसेल. किमतीतील घटेचे प्रमाण $r$ च्या परिपूर्ण मूल्यावर अवलंबून असते. जर ते शून्य असते, तर बाजारात मोठ्या पुरवठ्यानंतरही किमतीत घट झाली नसती. जर वाढलेला पुरवठा चांगल्या वाहतूक नेटवर्कद्वारे इतर बाजारांमध्ये हस्तांतरित केला गेला तर ही देखील एक शक्यता आहे.
कृती
- खालील सारणी पहा. चालू किंमतीवर राष्ट्रीय उत्पन्नाची वार्षिक वाढ आणि जीडीपीची टक्केवारी म्हणून एकूण देशांतर्गत बचत यांच