अध्याय ०६ सहसंबंध
१. परिचय
मागील अध्यायांमध्ये तुम्ही डेटाच्या राशीतून सारांश मापे कशी तयार करायची आणि समान चलांमधील बदल कसे मोजायचे हे शिकलात. आता तुम्ही दोन चलांमधील संबंध कसा तपासायचा ते शिकणार आहात. उन्हाळ्याची उष्णता वाढताच, हिल स्टेशन्स जास्तीत जास्त पर्यटकांनी गजबजून जातात. आईस्क्रीमची विक्री चैतन्यमय होते. अशाप्रकारे, तापमान हे पर्यटकांच्या संख्येशी आणि आईस्क्रीमच्या विक्रीशी संबंधित आहे. त्याचप्रमाणे, तुमच्या स्थानिक मंडीत टोमॅटोचा पुरवठा वाढला की त्याची किंमत घसरते. स्थानिक पिकाचा बाजारात पुरवठा सुरू झाला की टोमॅटोची किंमत प्रति $\mathrm{kg}$ ४० रुपयांवरून प्रति किलो ४ रुपये किंवा त्याहून कमी होते. अशाप्रकारे पुरवठा हा किंमतीशी संबंधित आहे. सहसंबंध विश्लेषण हा अशा संबंधांची पद्धतशीरपणे तपासणी करण्याचा एक मार्ग आहे. हे पुढीलप्रमाणेच प्रश्नांशी संबंधित आहे:
- दोन चलांमध्ये काही संबंध आहे का?
- एका चलाचे मूल्य बदलले की दुसऱ्या चलाचे मूल्य देखील बदलते का?
- दोन्ही चले एकाच दिशेने जातात का?
- संबंध किती प्रबळ आहे?
२. संबंधांचे प्रकार
चला विविध प्रकारचे संबंध पाहू. मागणीच्या प्रमाणातील हालचाली आणि एखाद्या वस्तूची किंमत यांच्यातील संबंध हा मागणीच्या सिद्धांताचा अविभाज्य भाग आहे, जो तुम्ही इयत्ता बारावीत अभ्यासाल. कमी कृषी उत्पादकता ही कमी पावसाशी संबंधित आहे. संबंधांची अशी उदाहरणे कारण आणि परिणाम अशा अर्थाने दिली जाऊ शकतात. इतर फक्त योगायोग असू शकतात. अभयारण्यात प्रवासी पक्ष्यांचे आगमन आणि त्या भागातील जन्मदर यांच्यातील संबंधास कारण-परिणामाचा अर्थ लावता येत नाही. हे संबंध फक्त योगायोगाचे आहेत. बुटाचा आकार आणि तुमच्या खिशातील पैसे यांच्यातील संबंध हे दुसरे असे उदाहरण आहे. संबंध असले तरीही त्याचे स्पष्टीकरण देणे कठीण आहे.
दुसऱ्या एका प्रसंगी, दोन चलांवर तिसऱ्या चलाचा परिणामामुळे त्या दोन चलांमध्ये संबध निर्माण होऊ शकतो. आईस्क्रीमची चैतन्यमय विक्री ही बुडण्यामुळे होणाऱ्या मृत्यूंच्या उच्च संख्येशी संबंधित असू शकते. बळी पडलेले लोक आईस्क्रीम खाण्यामुळे बुडत नाहीत. तापमान वाढल्यामुळे आईस्क्रीमची विक्री चैतन्यमय होते. शिवाय, उष्णतेपासून सुटका मिळवण्यासाठी मोठ्या संख्येने लोक स्विमिंग पूलमध्ये जाऊ लागतात. यामुळे बुडण्यामुळे होणाऱ्या मृत्यूंची संख्या वाढली असावी. अशाप्रकारे, आईस्क्रीमच्या विक्री आणि बुडण्यामुळे होणाऱ्या मृत्यूंमधील उच्च सहसंबंधामागे तापमान आहे.
सहसंबंध काय मोजतो?
सहसंबंध हा चलांमधील संबंधाची दिशा आणि तीव्रता यांचा अभ्यास आणि मापन करतो. सहसंबंध हे सह-परिवर्तन (covariation) मोजतो, कारण-परिणाम (causation) नाही. सहसंबंधाचा अर्थ कधीही कारण-परिणाम संबंध असा लावू नये. दोन चलां $\mathrm{X}$ आणि Y मध्ये सहसंबंधाची उपस्थिती म्हणजे फक्त इतकेच की, जेव्हा एका चलाचे मूल्य एका दिशेने बदलताना आढळते, तेव्हा दुसऱ्या चलाचे मूल्य एकतर त्याच दिशेने (म्हणजे सकारात्मक बदल) किंवा विरुद्ध दिशेने (म्हणजे नकारात्मक बदल) निश्चित पद्धतीने बदलताना आढळते. सोपेपणासाठी आपण असे गृहीत धरू की, सहसंबंध अस्तित्वात असल्यास, तो रेषीय (linear) आहे, म्हणजे दोन्ही चलांची सापेक्ष हालचाल ग्राफ पेपरवर सरळ रेषा काढून दर्शवता येते.
सहसंबंधाचे प्रकार
सहसंबंध हा सामान्यतः नकारात्मक आणि सकारात्मक सहसंबंध अशा वर्गीकृत केला जातो. जेव्हा चले एकाच दिशेने एकत्र हलतात तेव्हा सहसंबंध सकारात्मक असल्याचे म्हटले जाते. जेव्हा उत्पन्न वाढते तेव्हा उपभोग देखील वाढतो. जेव्हा उत्पन्न कमी होते तेव्हा उपभोग देखील कमी होतो. आईस्क्रीमची विक्री आणि तापमान एकाच दिशेने जातात. जेव्हा ते विरुद्ध दिशेने जातात तेव्हा सहसंबंध नकारात्मक असतो. जेव्हा सफरचंदाची किंमत घसरते तेव्हा त्याची मागणी वाढते. जेव्हा किंमती वाढतात तेव्हा मागणी कमी होते. जेव्हा तुम्ही अभ्यासात जास्त वेळ घालवता तेव्हा तुमच्या नापास होण्याची शक्यता कमी होते. जेव्हा तुम्ही तुमच्या अभ्यासात कमी तास घालवता तेव्हा कमी गुण/श्रेणी मिळण्याची शक्यता वाढते. ही नकारात्मक सहसंबंधाची उदाहरणे आहेत. चले विरुद्ध दिशेने जातात.
३. सहसंबंध मोजण्याच्या तंत्रां
सहसंबंधाचा अभ्यास करण्यासाठी वापरली जाणारी तीन महत्त्वाची साधने म्हणजे विखुरण आकृती (scatter diagram), कार्ल पिअर्सनचा सहसंबंध गुणांक आणि स्पीयरमनचा श्रेणी सहसंबंध. विखुरण आकृती ही कोणतीही विशिष्ट संख्यात्मक मूल्य न देता संबंधाचे स्वरूप दृष्यदृष्ट्या सादर करते. दोन चलांमधील रेषीय संबंधाचे संख्यात्मक माप कार्ल पिअर्सनच्या सहसंबंध गुणांकाद्वारे दिले जाते. एखादा संबंध सरळ रेषेने दर्शवता आल्यास त्याला रेषीय संबंध असे म्हटले जाते. स्पीयरमनचा सहसंबंध गुणांक हा वैयक्तिक वस्तूंना त्यांच्या गुणधर्मांनुसार दिलेल्या श्रेणींमधील रेषीय संबंध मोजतो. गुणधर्म (Attributes) ही अशी चले आहेत जी संख्यात्मकरित्या मोजता येत नाहीत जसे की लोकांची बुद्धिमत्ता, शारीरिक देखावा, प्रामाणिकपणा इ.
विखुरण आकृती (Scatter Diagram)
कोणतेही संख्यात्मक मूल्य काढल्याशिवाय, संबंधाचे स्वरूप दृष्यदृष्ट्या तपासण्यासाठी विखुरण आकृती ही एक उपयुक्त तंत्र आहे. या तंत्रामध्ये, दोन चलांची मूल्ये ग्राफ पेपरवर बिंदू म्हणून चिन्हांकित केली जातात. विखुरण आकृतीवरून, संबंधाच्या स्वरूपाची बऱ्यापैकी चांगली कल्पना येऊ शकते. विखुरण आकृतीमध्ये, विखुरलेल्या बिंदूंची जवळीक आणि त्यांची एकूण दिशा यामुळे आपल्याला संबंधाची तपासणी करता येते. जर सर्व बिंदू एका रेषेवर असतील तर सहसंबंध परिपूर्ण आहे आणि एकता (unity) मध्ये आहे असे म्हटले जाते. जर विखुरलेले बिंदू रेषेभोवती विस्तृतपणे पसरलेले असतील तर सहसंबंध कमी असतो. विखुरलेले बिंदू रेषेजवळ किंवा रेषेवर असल्यास सहसंबंध रेषीय आहे असे म्हटले जाते.
आकृती ६.१ ते आकृती ६.५ पर्यंतच्या विखुरण आकृती आपल्याला दोन चलांमधील संबंधाची कल्पना देतात. आकृती ६.१ मध्ये वर चढणाऱ्या रेषेभोवती विखुरलेले बिंदू दाखवले आहेत जे चले एकाच दिशेने हलत आहेत हे दर्शवतात. जेव्हा $\mathrm{X}$ वाढते तेव्हा $\mathrm{Y}$ देखील वाढेल. हा सकारात्मक सहसंबंध आहे. आकृती ६.२ मध्ये बिंदू खाली उतरणाऱ्या रेषेभोवती विखुरलेले आढळतात. यावेळी चले विरुद्ध दिशेने जातात. जेव्हा $\mathrm{X}$ वाढते तेव्हा $\mathrm{Y}$ कमी होते आणि त्याउलट. हा नकारात्मक सहसंबंध आहे. आकृती ६.३ मध्ये वर चढणारी किंवा खाली उतरणारी अशी कोणतीही रेषा नाही ज्याभोवती बिंदू विखुरलेले आहेत. हे कोणताही सहसंबंध नसल्याचे उदाहरण आहे. आकृती ६.४ आणि आकृती ६.५ मध्ये, बिंदू आता वर चढणाऱ्या किंवा खाली पडणाऱ्या रेषेभोवती विखुरलेले नाहीत. बिंदू स्वतः रेषांवर आहेत. याला अनुक्रमे परिपूर्ण सकारात्मक सहसंबंध आणि परिपूर्ण नकारात्मक सहसंबंध असे संबोधले जाते.
कृती
- तुमच्या वर्गातील विद्यार्थ्यांची उंची, वजन आणि इयत्ता $X$ मधील कोणत्याही दोन विषयांमध्ये मिळवलेले गुण यांचा डेटा गोळा करा. ही चले दोन दोन घेऊन त्यांची विखुरण आकृती काढा. तुम्हाला कोणत्या प्रकारचा संबंध आढळतो?
विखुरण आकृतीचे काळजीपूर्वक निरीक्षण केल्यास संबंधाचे स्वरूप आणि तीव्रता याची कल्पना येते.
कार्ल पिअर्सनचा सहसंबंध गुणांक
याला गुणाकार क्षण सहसंबंध गुणांक (product moment correlation coefficient) किंवा साधा सहसंबंध गुणांक असेही म्हणतात. हे दोन चलां $\mathrm{X}$ आणि $Y$ मधील रेषीय संबंधाच्या प्रमाणाचे अचूक संख्यात्मक मूल्य देते.
हे लक्षात ठेवणे महत्त्वाचे आहे की कार्ल पिअर्सनचा सहसंबंध गुणांक हा फक्त तेव्हाच वापरला पाहिजे जेव्हा चलांमध्ये रेषीय संबंध असेल. जेव्हा $\mathrm{X}$ आणि $\mathrm{Y}$ मध्ये अरेषीय (non-linear) संबंध असेल, तेव्हा कार्ल पिअर्सनचा सहसंबंध गुणांक काढल्यास तो गैरसमज निर्माण करू शकतो. अशाप्रकारे, जर खरा संबंध आकृती ६.१, $6.2,6.4$ आणि ६.५ मधील विखुरण आकृतींनी दाखवल्याप्रमाणे रेषीय प्रकारचा असेल, तर कार्ल पिअर्सनचा सहसंबंध गुणांक काढला पाहिजे आणि तो आपल्याला चलांमधील संबंधाची दिशा आणि तीव्रता सांगेल. परंतु जर खरा संबंध आकृती ६.६ किंवा ६.७ मधील विखुरण आकृतींमध्ये दाखवल्याप्रमाणे असेल, तर याचा अर्थ $\mathrm{X}$ आणि $\mathrm{Y}$ मध्ये अरेषीय संबंध आहे आणि आपण कार्ल पिअर्सनचा सहसंबंध गुणांक वापरण्याचा प्रयत्न करू नये.
म्हणून, कार्ल पिअर्सनचा सहसंबंध गुणांक काढण्यापूर्वी चलांमधील संबंधाची विखुरण आकृती प्रथम तपासणे उचित आहे.
समजा $X _{1}, X _{2}, \ldots, X _{N}$ ही $N$ ची मूल्ये आहेत आणि $\mathrm{Y} _{1}, \mathrm{Y} _{2}, \ldots, \mathrm{Y} _{\mathrm{N}}$ ही Y ची संबंधित मूल्ये आहेत. पुढील सादरीकरणांमध्ये, सोपेपणासाठी एकक दर्शविणारे सबस्क्रिप्ट वगळले आहेत. $\mathrm{X}$ आणि $\mathrm{Y}$ ची अंकगणितीय माध्ये खालीलप्रमाणे परिभाषित केली आहेत
$$ \overline{\mathrm{X}}=\frac{\sum \mathrm{X}}{\mathrm{N}} ; \quad \overline{\mathrm{Y}}=\frac{\sum \mathrm{Y}}{\mathrm{N}} $$
आणि त्यांचे प्रचरण (variances) खालीलप्रमाणे आहेत
$$ \sigma^{2} x=\frac{\sum(X-\bar{X})^{2}}{N}=\frac{\sum X^{2}}{N}-\bar{X}^{2} $$
आणि $$\quad \sigma^{2} \mathrm{y}=\frac{\sum(\mathrm{Y}-\overline{\mathrm{Y}})^{2}}{\mathrm{~N}}=\frac{\sum \mathrm{Y}^{2}}{\mathrm{~N}}-\overline{\mathrm{Y}}^{2}$$
$\mathrm{X}$ आणि $\mathrm{Y}$ ची प्रमाण विचलने (standard deviations) अनुक्रमे त्यांच्या प्रचरणांची धनात्मक वर्गमूळे आहेत. $\mathrm{X}$ आणि $\mathrm{Y}$ चे सहप्रचरण (covariance) खालीलप्रमाणे परिभाषित केले आहे
$\operatorname{Cov}(\mathrm{X}, \mathrm{Y})=\frac{\sum(\mathrm{X}-\overline{\mathrm{X}})(\mathrm{Y}-\overline{\mathrm{Y}})}{\mathrm{N}}=\frac{\sum \mathrm{xy}}{\mathrm{N}}$
जेथे $\mathrm{x}=\mathrm{X}-\overline{\mathrm{X}}$ आणि $\mathrm{y}=\mathrm{Y}-\overline{\mathrm{Y}}$ ही अनुक्रमे $i^{\text {th }}$ ची $\mathrm{X}$ आणि $\mathrm{Y}$ ची मूल्ये त्यांच्या माध्य मूल्यांपासूनची विचलने आहेत.
$\mathrm{X}$ आणि $\mathrm{Y}$ मधील सहप्रचरणाचे चिन्ह सहसंबंध गुणांकाचे चिन्ह ठरवते. प्रमाण विचलने नेहमीच धनात्मक असतात. सहप्रचरण शून्य असल्यास, सहसंबंध गुणांक नेहमीच शून्य असतो. गुणाकार क्षण सहसंबंध किंवा कार्ल पिअर्सनचे सहसंबंध माप खालीलप्रमाणे दिले जाते
$$ \begin{equation*} \mathrm{r}={ }^{\Sigma \mathrm{xy}} / N \sigma _{\mathrm{x}} \sigma _{\mathrm{y}} \tag{1} \end{equation*} $$
किंवा
$$ \begin{equation*} \mathrm{r}=\frac{\sum(\mathrm{X}-\overline{\mathrm{X}})(\mathrm{Y}-\overline{\mathrm{Y}})}{\sqrt{\Sigma(\mathrm{X}-\overline{\mathrm{X}})^{2}} \sqrt{\Sigma(\mathrm{Y}-\overline{\mathrm{Y}})^{2}}} \tag{2} \end{equation*} $$
किंवा
$$ \begin{equation*} r=\frac{\frac{\sum X Y-\left(\sum X\right)\left(\sum Y\right)}{N}}{\sqrt{\sum X^{2}-\frac{\left(\sum X\right)^{2}}{N}} \sqrt{\sum Y^{2}-\frac{\left(\sum Y\right)^{2}}{N}}}\tag{3} \end{equation*} $$
किंवा
$$ \begin{equation*} r=\frac{N \sum XY-(\sum X)(\sum Y)}{\sqrt{N \sum X^2-(\sum X)^2} \cdot \sqrt{N \sum Y^2-(\sum Y)^2}}\tag{4} \end{equation*} $$
सहसंबंध गुणांकाचे गुणधर्म
चला आता सहसंबंध गुणांकाचे गुणधर्म पाहू
- $r$ ला कोणतेही एकक नसते. ही एक शुद्ध संख्या आहे. याचा अर्थ मापनाची एकके $r$ चा भाग नाहीत. उदाहरणार्थ, फूटमधील उंची आणि किलोग्रॅममधील वजन यांच्यातील $r$ समजा ०.७ असू शकतो.
- $r$ चे ऋण मूल्य व्यस्त संबंध दर्शवते. एका चलातील बदल हा दुसऱ्या चलातील बदलाशी विरुद्ध दिशेने संबंधित असतो. एखाद्या वस्तूची किंमत वाढली की त्याची मागणी कमी होते. व्याजदर वाढला की निधीची मागणी देखील कमी होते. कारण आता निधी महाग झाले आहेत.
- जर $r$ धनात्मक असेल तर दोन्ही चले एकाच दिशेने जातात. चहाच्या पर्यायी पेय असलेल्या कॉफीची किंमत वाढली की चहाची मागणी देखील वाढते. सिंचन सुविधांमध्ये सुधारणा ही उच्च उत्पन्नाशी संबंधित आहे. तापमान वाढले की आईस्क्रीमची विक्री चैतन्यमय होते.
- सहसंबंध गुणांकाचे मूल्य वजा एक ते अधिक एक या दरम्यान असते, $-1 \leq r \leq 1$. कोणत्याही उदाहरणात, जर $r$ चे मूल्य या श्रेणीबाहेर असेल तर ते गणनेतील त्रुटी दर्शवते.
- $r$ चे परिमाण मूळ बदलणे (change of origin) आणि प्रमाण बदलणे (change of scale) यांनी प्रभावित होत नाही. दोन चले $\mathrm{X}$ आणि $\mathrm{Y}$ दिली आहेत असे समजू या, दोन नवीन चले परिभाषित करू.
$\mathrm{U}=\frac{\mathrm{X}-\mathrm{A}}{\mathrm{B}} ; \mathrm{V}=\frac{\mathrm{Y}-\mathrm{C}}{\mathrm{D}}$
जेथे $A$ आणि $C$ ही अनुक्रमे $\mathrm{X}$ आणि $\mathrm{Y}$ ची गृहीत माध्ये आहेत. $\mathrm{B}$ आणि $\mathrm{D}$ हे सामान्य घटक आहेत आणि समान चिन्हाचे आहेत. तर
$r _{x y}=r _{u v}$
सोप्या पद्धतीने, जसे की पायरी विचलन पद्धतीत, सहसंबंध गुणांक काढण्यासाठी हा गुणधर्म वापरला जातो.
- जर $r=0$ असेल तर दोन्ही चले असंबद्ध (uncorrelated) आहेत. त्यांच्यामध्ये कोणताही रेषीय संबंध नाही. तथापि इतर प्रकारचे संबंध असू शकतात.
- जर $r=1$ किंवा $r=-1$ असेल तर सहसंबंध परिपूर्ण आहे आणि तंतोतंत रेषीय संबंध आहे.
- $r$ चे उच्च मूल्य प्रबळ रेषीय संबंध दर्शवते. जेव्हा ते +१ किंवा -१ च्या जवळ असते तेव्हा त्याचे मूल्य उच्च असल्याचे म्हटले जाते.
- $r$ चे कमी मूल्य (शून्याजवळ) कमकुवत रेषीय संबंध दर्शवते. परंतु अरेषीय संबंध असू शकतो.
जसे तुम्ही अध्याय १ मध्ये वाचले आहे, सामान्य ज्ञानाची जागा सांख्यिकीय पद्धतींनी घेऊ शकत नाही. येथे, आणखी एक उदाहरण आहे, जे सहसंबंधाची गणना आणि अर्थ लावण्यापूर्वी डेटा योग्यरित्या समजून घेण्याची गरज उठवते. काही गावांमध्ये साथीचा रोग पसरतो आणि सरकार प्रभावित गावांमध्ये डॉक्टरांची टीम पाठवते. मृत्यूंची संख्या आणि गावांमध्ये पाठवलेल्या डॉक्टरांची संख्या यांच्यातील सहसंबंध सकारात्मक आढळतो. सामान्यतः, डॉक्टरांद्वारे पुरवल्या जाणाऱ्या आरोग्यसेवा सुविधांमुळे मृत्यूंची संख्या कमी होण्याची अपेक्षा असते जी नकारात्मक सहसंबंध दर्शवते. इतर कारणांमुळे असे घडले. डेटा एका विशिष्ट कालावधीशी संबंधित आहे. अहवाल केलेल्या मृत्यूंपैकी बरेच टर्मिनल केसेस असू शकतात जेथे डॉक्टर काहीच करू शकत नाहीत. शिवाय, डॉक्टरांच्या उपस्थितीचा फायदा काही काळानंतरच दिसून येतो. असेही शक्य आहे की अहवाल केलेले मृत्यू साथीमुळे झाले नाहीत. राज्यावर अचानक सुनामीचा हल्ला होतो आणि मृत्यूंची संख्या वाढते.
शेतकऱ्यांच्या शिक्षणाच्या वर्षांचा आणि प्रति एकर वार्षिक उत्पन्नाचा संबंध तपासून $r$ ची गणना स्पष्ट करूया.
उदाहरण १
| शेतकऱ्यांच्या शिक्षणाच्या वर्षांची संख्या | प्रति एकर वार्षिक उत्पन्न ‘000 (रुपये) |
|---|---|
| 0 | 4 |
| 2 | 4 |
| 4 | 6 |
| 6 | 10 |
| 8 | 10 |
| 10 | 8 |
| 12 | 7 |
सूत्र १ ला $\sum \mathrm{Xy}, \sigma _{\mathrm{x}}, \sigma _{\mathrm{y}}$ चे मूल्य आवश्यक आहे
सारणी ६.१ वरून आपल्याला मिळते,
$$ \begin{aligned} & \sum \mathrm{xy}=42, \\ & \sigma _{\mathrm{x}}=\sqrt{\frac{\sum(\mathrm{X}-\overline{\mathrm{X}})^{2}}{\mathrm{~N}}}=\sqrt{\frac{112}{7}}, \\ & \sigma _{\mathrm{y}}=\sqrt{\frac{\sum(\mathrm{Y}-\overline{\mathrm{Y}})^{2}}{\mathrm{~N}}}=\sqrt{\frac{38}{7}} \end{aligned} $$
ही मूल्ये सूत्र (1) मध्ये बदलून
$$ \mathrm{r}=\frac{42}{7 \sqrt{\frac{112}{7}} \sqrt{\frac{38}{7}}}=0.644 $$
हेच मूल्य सूत्र (2) वरून देखील मिळू शकते.
$$ \begin{gather*} \mathrm{r}=\frac{\sum(\mathrm{X}-\overline{\mathrm{X}})(\mathrm{Y}-\overline{\mathrm{Y}})}{\sqrt{\sum(\mathrm{X}-\overline{\mathrm{X}})^{2}} \sqrt{\sum(\mathrm{Y}-\overline{\mathrm{Y}})^{2}}} \tag{2}\\ \mathrm{r}=\frac{42}{\sqrt{112} \sqrt{38}}=0.644 \end{gather*} $$
अशाप्रकारे, शेतकऱ्यांच्या शिक्षणाची वर्षे आणि प्रति एकर वार्षिक उत्पन्न यांच्यात सकारात्मक सहसंबंध आहे. $r$ चे मूल्य देखील मोठे आहे. याचा अर्थ शेतकरी शिक्षणात जितकी जास्त वर्षे गुंतवणूक करतील तितके प्रति एकर उत्पन्न जास्त असेल. हे शेतकऱ्यांच्या शिक्षणाचे महत्त्व रेखांकित करते.
सूत्र (3) वापरण्यासाठी
सारणी ६.१ शेतकऱ्यांच्या शिक्षणाच्या वर्षांचा आणि वार्षिक उत्पन्नाचा सहसंबंध गुणांक काढणे
| शिक्षणाची वर्षे (X) | $(X-\bar{X})$ | $(X-\bar{X})^{2}$ | प्रति एकर वार्षिक उत्पन्न ‘000 रुपये (Y) | $(Y-\bar{Y})$ | $(Y-\bar{Y})^{2}$ | $(X-\bar{X})(Y-\bar{Y})$ |
|---|---|---|---|---|---|---|
| 0 | -6 | 36 | 4 | -3 | 9 | 18 |
| 2 | -4 | 16 | 4 | -3 | 9 | 12 |
| 4 | -2 | 4 | 6 | -1 | 1 | 2 |
| 6 | 0 | 0 | 10 | 3 | 9 | 0 |
| 8 | 2 | 4 | 10 | 3 | 9 | 6 |
| 10 | 4 | 16 | 8 | 1 | 1 | 4 |
| 12 | 6 | 36 | 7 | 0 | 0 | 0 |
| $\Sigma X=42$ | $\sum (X-\overline{\mathrm{X}})^{2}=112$ | $\Sigma Y=49$ | $\Sigma(Y-\bar{Y})^{2}=38$ | $\Sigma(X-\bar{X})(Y-\bar{Y})=42$ |
$$ \begin{equation*} r=\frac{\sum X Y-\frac{(\Sigma X)\left(\sum Y\right)}{N}}{\sqrt{\Sigma X^{2}-\frac{(\Sigma X)^{2}}{N}} \sqrt{\Sigma \mathrm{Y}^{2}-\frac{(\Sigma Y)^{2}}{N}}}\tag{3} \end{equation*} $$
खालील पदावलींची मूल्ये काढावी लागतील म्हणजे
$\Sigma \mathrm{XY}, \Sigma \mathrm{X}^{2}, \Sigma \mathrm{Y}^{2}$.
आता सूत्र (3) लागू करून $r$ चे मूल्य मिळवा.
$r$ च्या विविध मूल्यांचा अर्थ समजून घेऊ या. इंग्रजी आणि सांख्यिकी या विषयांमध्ये मिळवलेल्या गुणांमधील सहसंबंध गुणांक समजा ०.१ आहे. याचा अर्थ असा की जरी दोन्ही विषयांमध्ये मिळवलेले गुण सकारात्मक सहसंबंधित आहेत, तरी संबंधाची ताकद कमकुवत आहे. इंग्रजीत जास्त गुण मिळवणारे विद्यार्थी सांख्यिकीत तुलनेने कमी गुण मिळवत असू शकतात. जर $r$ चे मूल्य समजा ०.९ असते, तर इंग्रजीत जास्त गुण मिळवणारे विद्यार्थी निश्चितपणे सांख्यिकीत जास्त गुण मिळवतील.
नकारात्मक सहसंबंधाचे उदाहरण म्हणजे स्थानिक मंडीत भाजीपाल्याचे आगमन आणि भाजीपाल्याची किंमत यांच्यातील संबंध. जर $r$ -०.९ असेल, तर स्थानिक मंडीत भाजीपाल्याचा पुरवठा हा भाजीपाल्याच्या कमी किमतीशी संबंधित असेल. जर ते -०.१ असते, तर मोठ्या प्रमाणात भाजीपाल्याचा पुरवठा हा कमी किमतीशी संबंधित असेल, परंतु $r$ -०.९ असतानाच्या किमतीएवढी कमी नसेल. किमतीतील घट किती होईल हे $r$ च्या परिपूर्ण मूल्यावर अवलंबून असते. जर ते शून्य असते, तर बाजारात मोठा पुरवठा असूनही किमतीत घट झाली नसती. जर वाढलेला पुरवठा चांगल्या वाहतूक नेटवर्कद्वारे इतर बाजारांमध्ये हस्तांतरित केला गेला तर ही देखील एक शक्यता आहे.
कृती
- खालील सारणी पहा. चालू किमतीवरील राष्ट्रीय उत्पन्नाची वार्षिक वाढ आणि जीडीपीची टक्केवारी म्हणून एकूण देशी बचत यांच्यातील $r$ काढा.
सहसंबंध गुणांक काढण्यासाठी पायरी विचलन पद्धत.
जेव्हा चलांची मूल्ये