अध्याय ०६ सहसंबंध

१. परिचय

मागील अध्यायांमध्ये तुम्ही डेटाच्या राशीतून सारांश मापे कशी तयार करायची आणि समान चलांमधील बदल कसे मोजायचे हे शिकलात. आता तुम्ही दोन चलांमधील संबंध कसा तपासायचा ते शिकणार आहात. उन्हाळ्याची उष्णता वाढताच, हिल स्टेशन्स जास्तीत जास्त पर्यटकांनी गजबजून जातात. आईस्क्रीमची विक्री चैतन्यमय होते. अशाप्रकारे, तापमान हे पर्यटकांच्या संख्येशी आणि आईस्क्रीमच्या विक्रीशी संबंधित आहे. त्याचप्रमाणे, तुमच्या स्थानिक मंडीत टोमॅटोचा पुरवठा वाढला की त्याची किंमत घसरते. स्थानिक पिकाचा बाजारात पुरवठा सुरू झाला की टोमॅटोची किंमत प्रति $\mathrm{kg}$ ४० रुपयांवरून प्रति किलो ४ रुपये किंवा त्याहून कमी होते. अशाप्रकारे पुरवठा हा किंमतीशी संबंधित आहे. सहसंबंध विश्लेषण हा अशा संबंधांची पद्धतशीरपणे तपासणी करण्याचा एक मार्ग आहे. हे पुढीलप्रमाणेच प्रश्नांशी संबंधित आहे:

  • दोन चलांमध्ये काही संबंध आहे का?
  • एका चलाचे मूल्य बदलले की दुसऱ्या चलाचे मूल्य देखील बदलते का?
  • दोन्ही चले एकाच दिशेने जातात का?
  • संबंध किती प्रबळ आहे?

२. संबंधांचे प्रकार

चला विविध प्रकारचे संबंध पाहू. मागणीच्या प्रमाणातील हालचाली आणि एखाद्या वस्तूची किंमत यांच्यातील संबंध हा मागणीच्या सिद्धांताचा अविभाज्य भाग आहे, जो तुम्ही इयत्ता बारावीत अभ्यासाल. कमी कृषी उत्पादकता ही कमी पावसाशी संबंधित आहे. संबंधांची अशी उदाहरणे कारण आणि परिणाम अशा अर्थाने दिली जाऊ शकतात. इतर फक्त योगायोग असू शकतात. अभयारण्यात प्रवासी पक्ष्यांचे आगमन आणि त्या भागातील जन्मदर यांच्यातील संबंधास कारण-परिणामाचा अर्थ लावता येत नाही. हे संबंध फक्त योगायोगाचे आहेत. बुटाचा आकार आणि तुमच्या खिशातील पैसे यांच्यातील संबंध हे दुसरे असे उदाहरण आहे. संबंध असले तरीही त्याचे स्पष्टीकरण देणे कठीण आहे.

दुसऱ्या एका प्रसंगी, दोन चलांवर तिसऱ्या चलाचा परिणामामुळे त्या दोन चलांमध्ये संबध निर्माण होऊ शकतो. आईस्क्रीमची चैतन्यमय विक्री ही बुडण्यामुळे होणाऱ्या मृत्यूंच्या उच्च संख्येशी संबंधित असू शकते. बळी पडलेले लोक आईस्क्रीम खाण्यामुळे बुडत नाहीत. तापमान वाढल्यामुळे आईस्क्रीमची विक्री चैतन्यमय होते. शिवाय, उष्णतेपासून सुटका मिळवण्यासाठी मोठ्या संख्येने लोक स्विमिंग पूलमध्ये जाऊ लागतात. यामुळे बुडण्यामुळे होणाऱ्या मृत्यूंची संख्या वाढली असावी. अशाप्रकारे, आईस्क्रीमच्या विक्री आणि बुडण्यामुळे होणाऱ्या मृत्यूंमधील उच्च सहसंबंधामागे तापमान आहे.

सहसंबंध काय मोजतो?

सहसंबंध हा चलांमधील संबंधाची दिशा आणि तीव्रता यांचा अभ्यास आणि मापन करतो. सहसंबंध हे सह-परिवर्तन (covariation) मोजतो, कारण-परिणाम (causation) नाही. सहसंबंधाचा अर्थ कधीही कारण-परिणाम संबंध असा लावू नये. दोन चलां $\mathrm{X}$ आणि Y मध्ये सहसंबंधाची उपस्थिती म्हणजे फक्त इतकेच की, जेव्हा एका चलाचे मूल्य एका दिशेने बदलताना आढळते, तेव्हा दुसऱ्या चलाचे मूल्य एकतर त्याच दिशेने (म्हणजे सकारात्मक बदल) किंवा विरुद्ध दिशेने (म्हणजे नकारात्मक बदल) निश्चित पद्धतीने बदलताना आढळते. सोपेपणासाठी आपण असे गृहीत धरू की, सहसंबंध अस्तित्वात असल्यास, तो रेषीय (linear) आहे, म्हणजे दोन्ही चलांची सापेक्ष हालचाल ग्राफ पेपरवर सरळ रेषा काढून दर्शवता येते.

सहसंबंधाचे प्रकार

सहसंबंध हा सामान्यतः नकारात्मक आणि सकारात्मक सहसंबंध अशा वर्गीकृत केला जातो. जेव्हा चले एकाच दिशेने एकत्र हलतात तेव्हा सहसंबंध सकारात्मक असल्याचे म्हटले जाते. जेव्हा उत्पन्न वाढते तेव्हा उपभोग देखील वाढतो. जेव्हा उत्पन्न कमी होते तेव्हा उपभोग देखील कमी होतो. आईस्क्रीमची विक्री आणि तापमान एकाच दिशेने जातात. जेव्हा ते विरुद्ध दिशेने जातात तेव्हा सहसंबंध नकारात्मक असतो. जेव्हा सफरचंदाची किंमत घसरते तेव्हा त्याची मागणी वाढते. जेव्हा किंमती वाढतात तेव्हा मागणी कमी होते. जेव्हा तुम्ही अभ्यासात जास्त वेळ घालवता तेव्हा तुमच्या नापास होण्याची शक्यता कमी होते. जेव्हा तुम्ही तुमच्या अभ्यासात कमी तास घालवता तेव्हा कमी गुण/श्रेणी मिळण्याची शक्यता वाढते. ही नकारात्मक सहसंबंधाची उदाहरणे आहेत. चले विरुद्ध दिशेने जातात.

३. सहसंबंध मोजण्याच्या तंत्रां

सहसंबंधाचा अभ्यास करण्यासाठी वापरली जाणारी तीन महत्त्वाची साधने म्हणजे विखुरण आकृती (scatter diagram), कार्ल पिअर्सनचा सहसंबंध गुणांक आणि स्पीयरमनचा श्रेणी सहसंबंध. विखुरण आकृती ही कोणतीही विशिष्ट संख्यात्मक मूल्य न देता संबंधाचे स्वरूप दृष्यदृष्ट्या सादर करते. दोन चलांमधील रेषीय संबंधाचे संख्यात्मक माप कार्ल पिअर्सनच्या सहसंबंध गुणांकाद्वारे दिले जाते. एखादा संबंध सरळ रेषेने दर्शवता आल्यास त्याला रेषीय संबंध असे म्हटले जाते. स्पीयरमनचा सहसंबंध गुणांक हा वैयक्तिक वस्तूंना त्यांच्या गुणधर्मांनुसार दिलेल्या श्रेणींमधील रेषीय संबंध मोजतो. गुणधर्म (Attributes) ही अशी चले आहेत जी संख्यात्मकरित्या मोजता येत नाहीत जसे की लोकांची बुद्धिमत्ता, शारीरिक देखावा, प्रामाणिकपणा इ.

विखुरण आकृती (Scatter Diagram)

कोणतेही संख्यात्मक मूल्य काढल्याशिवाय, संबंधाचे स्वरूप दृष्यदृष्ट्या तपासण्यासाठी विखुरण आकृती ही एक उपयुक्त तंत्र आहे. या तंत्रामध्ये, दोन चलांची मूल्ये ग्राफ पेपरवर बिंदू म्हणून चिन्हांकित केली जातात. विखुरण आकृतीवरून, संबंधाच्या स्वरूपाची बऱ्यापैकी चांगली कल्पना येऊ शकते. विखुरण आकृतीमध्ये, विखुरलेल्या बिंदूंची जवळीक आणि त्यांची एकूण दिशा यामुळे आपल्याला संबंधाची तपासणी करता येते. जर सर्व बिंदू एका रेषेवर असतील तर सहसंबंध परिपूर्ण आहे आणि एकता (unity) मध्ये आहे असे म्हटले जाते. जर विखुरलेले बिंदू रेषेभोवती विस्तृतपणे पसरलेले असतील तर सहसंबंध कमी असतो. विखुरलेले बिंदू रेषेजवळ किंवा रेषेवर असल्यास सहसंबंध रेषीय आहे असे म्हटले जाते.

आकृती ६.१ ते आकृती ६.५ पर्यंतच्या विखुरण आकृती आपल्याला दोन चलांमधील संबंधाची कल्पना देतात. आकृती ६.१ मध्ये वर चढणाऱ्या रेषेभोवती विखुरलेले बिंदू दाखवले आहेत जे चले एकाच दिशेने हलत आहेत हे दर्शवतात. जेव्हा $\mathrm{X}$ वाढते तेव्हा $\mathrm{Y}$ देखील वाढेल. हा सकारात्मक सहसंबंध आहे. आकृती ६.२ मध्ये बिंदू खाली उतरणाऱ्या रेषेभोवती विखुरलेले आढळतात. यावेळी चले विरुद्ध दिशेने जातात. जेव्हा $\mathrm{X}$ वाढते तेव्हा $\mathrm{Y}$ कमी होते आणि त्याउलट. हा नकारात्मक सहसंबंध आहे. आकृती ६.३ मध्ये वर चढणारी किंवा खाली उतरणारी अशी कोणतीही रेषा नाही ज्याभोवती बिंदू विखुरलेले आहेत. हे कोणताही सहसंबंध नसल्याचे उदाहरण आहे. आकृती ६.४ आणि आकृती ६.५ मध्ये, बिंदू आता वर चढणाऱ्या किंवा खाली पडणाऱ्या रेषेभोवती विखुरलेले नाहीत. बिंदू स्वतः रेषांवर आहेत. याला अनुक्रमे परिपूर्ण सकारात्मक सहसंबंध आणि परिपूर्ण नकारात्मक सहसंबंध असे संबोधले जाते.

कृती

  • तुमच्या वर्गातील विद्यार्थ्यांची उंची, वजन आणि इयत्ता $X$ मधील कोणत्याही दोन विषयांमध्ये मिळवलेले गुण यांचा डेटा गोळा करा. ही चले दोन दोन घेऊन त्यांची विखुरण आकृती काढा. तुम्हाला कोणत्या प्रकारचा संबंध आढळतो?

विखुरण आकृतीचे काळजीपूर्वक निरीक्षण केल्यास संबंधाचे स्वरूप आणि तीव्रता याची कल्पना येते.

कार्ल पिअर्सनचा सहसंबंध गुणांक

याला गुणाकार क्षण सहसंबंध गुणांक (product moment correlation coefficient) किंवा साधा सहसंबंध गुणांक असेही म्हणतात. हे दोन चलां $\mathrm{X}$ आणि $Y$ मधील रेषीय संबंधाच्या प्रमाणाचे अचूक संख्यात्मक मूल्य देते.

हे लक्षात ठेवणे महत्त्वाचे आहे की कार्ल पिअर्सनचा सहसंबंध गुणांक हा फक्त तेव्हाच वापरला पाहिजे जेव्हा चलांमध्ये रेषीय संबंध असेल. जेव्हा $\mathrm{X}$ आणि $\mathrm{Y}$ मध्ये अरेषीय (non-linear) संबंध असेल, तेव्हा कार्ल पिअर्सनचा सहसंबंध गुणांक काढल्यास तो गैरसमज निर्माण करू शकतो. अशाप्रकारे, जर खरा संबंध आकृती ६.१, $6.2,6.4$ आणि ६.५ मधील विखुरण आकृतींनी दाखवल्याप्रमाणे रेषीय प्रकारचा असेल, तर कार्ल पिअर्सनचा सहसंबंध गुणांक काढला पाहिजे आणि तो आपल्याला चलांमधील संबंधाची दिशा आणि तीव्रता सांगेल. परंतु जर खरा संबंध आकृती ६.६ किंवा ६.७ मधील विखुरण आकृतींमध्ये दाखवल्याप्रमाणे असेल, तर याचा अर्थ $\mathrm{X}$ आणि $\mathrm{Y}$ मध्ये अरेषीय संबंध आहे आणि आपण कार्ल पिअर्सनचा सहसंबंध गुणांक वापरण्याचा प्रयत्न करू नये.

म्हणून, कार्ल पिअर्सनचा सहसंबंध गुणांक काढण्यापूर्वी चलांमधील संबंधाची विखुरण आकृती प्रथम तपासणे उचित आहे.

समजा $X _{1}, X _{2}, \ldots, X _{N}$ ही $N$ ची मूल्ये आहेत आणि $\mathrm{Y} _{1}, \mathrm{Y} _{2}, \ldots, \mathrm{Y} _{\mathrm{N}}$ ही Y ची संबंधित मूल्ये आहेत. पुढील सादरीकरणांमध्ये, सोपेपणासाठी एकक दर्शविणारे सबस्क्रिप्ट वगळले आहेत. $\mathrm{X}$ आणि $\mathrm{Y}$ ची अंकगणितीय माध्ये खालीलप्रमाणे परिभाषित केली आहेत

$$ \overline{\mathrm{X}}=\frac{\sum \mathrm{X}}{\mathrm{N}} ; \quad \overline{\mathrm{Y}}=\frac{\sum \mathrm{Y}}{\mathrm{N}} $$

आणि त्यांचे प्रचरण (variances) खालीलप्रमाणे आहेत

$$ \sigma^{2} x=\frac{\sum(X-\bar{X})^{2}}{N}=\frac{\sum X^{2}}{N}-\bar{X}^{2} $$

आणि $$\quad \sigma^{2} \mathrm{y}=\frac{\sum(\mathrm{Y}-\overline{\mathrm{Y}})^{2}}{\mathrm{~N}}=\frac{\sum \mathrm{Y}^{2}}{\mathrm{~N}}-\overline{\mathrm{Y}}^{2}$$

$\mathrm{X}$ आणि $\mathrm{Y}$ ची प्रमाण विचलने (standard deviations) अनुक्रमे त्यांच्या प्रचरणांची धनात्मक वर्गमूळे आहेत. $\mathrm{X}$ आणि $\mathrm{Y}$ चे सहप्रचरण (covariance) खालीलप्रमाणे परिभाषित केले आहे

$\operatorname{Cov}(\mathrm{X}, \mathrm{Y})=\frac{\sum(\mathrm{X}-\overline{\mathrm{X}})(\mathrm{Y}-\overline{\mathrm{Y}})}{\mathrm{N}}=\frac{\sum \mathrm{xy}}{\mathrm{N}}$

जेथे $\mathrm{x}=\mathrm{X}-\overline{\mathrm{X}}$ आणि $\mathrm{y}=\mathrm{Y}-\overline{\mathrm{Y}}$ ही अनुक्रमे $i^{\text {th }}$ ची $\mathrm{X}$ आणि $\mathrm{Y}$ ची मूल्ये त्यांच्या माध्य मूल्यांपासूनची विचलने आहेत.

$\mathrm{X}$ आणि $\mathrm{Y}$ मधील सहप्रचरणाचे चिन्ह सहसंबंध गुणांकाचे चिन्ह ठरवते. प्रमाण विचलने नेहमीच धनात्मक असतात. सहप्रचरण शून्य असल्यास, सहसंबंध गुणांक नेहमीच शून्य असतो. गुणाकार क्षण सहसंबंध किंवा कार्ल पिअर्सनचे सहसंबंध माप खालीलप्रमाणे दिले जाते

$$ \begin{equation*} \mathrm{r}={ }^{\Sigma \mathrm{xy}} / N \sigma _{\mathrm{x}} \sigma _{\mathrm{y}} \tag{1} \end{equation*} $$

किंवा

$$ \begin{equation*} \mathrm{r}=\frac{\sum(\mathrm{X}-\overline{\mathrm{X}})(\mathrm{Y}-\overline{\mathrm{Y}})}{\sqrt{\Sigma(\mathrm{X}-\overline{\mathrm{X}})^{2}} \sqrt{\Sigma(\mathrm{Y}-\overline{\mathrm{Y}})^{2}}} \tag{2} \end{equation*} $$

किंवा

$$ \begin{equation*} r=\frac{\frac{\sum X Y-\left(\sum X\right)\left(\sum Y\right)}{N}}{\sqrt{\sum X^{2}-\frac{\left(\sum X\right)^{2}}{N}} \sqrt{\sum Y^{2}-\frac{\left(\sum Y\right)^{2}}{N}}}\tag{3} \end{equation*} $$

किंवा

$$ \begin{equation*} r=\frac{N \sum XY-(\sum X)(\sum Y)}{\sqrt{N \sum X^2-(\sum X)^2} \cdot \sqrt{N \sum Y^2-(\sum Y)^2}}\tag{4} \end{equation*} $$

सहसंबंध गुणांकाचे गुणधर्म

चला आता सहसंबंध गुणांकाचे गुणधर्म पाहू

  • $r$ ला कोणतेही एकक नसते. ही एक शुद्ध संख्या आहे. याचा अर्थ मापनाची एकके $r$ चा भाग नाहीत. उदाहरणार्थ, फूटमधील उंची आणि किलोग्रॅममधील वजन यांच्यातील $r$ समजा ०.७ असू शकतो.
  • $r$ चे ऋण मूल्य व्यस्त संबंध दर्शवते. एका चलातील बदल हा दुसऱ्या चलातील बदलाशी विरुद्ध दिशेने संबंधित असतो. एखाद्या वस्तूची किंमत वाढली की त्याची मागणी कमी होते. व्याजदर वाढला की निधीची मागणी देखील कमी होते. कारण आता निधी महाग झाले आहेत.
  • जर $r$ धनात्मक असेल तर दोन्ही चले एकाच दिशेने जातात. चहाच्या पर्यायी पेय असलेल्या कॉफीची किंमत वाढली की चहाची मागणी देखील वाढते. सिंचन सुविधांमध्ये सुधारणा ही उच्च उत्पन्नाशी संबंधित आहे. तापमान वाढले की आईस्क्रीमची विक्री चैतन्यमय होते.
  • सहसंबंध गुणांकाचे मूल्य वजा एक ते अधिक एक या दरम्यान असते, $-1 \leq r \leq 1$. कोणत्याही उदाहरणात, जर $r$ चे मूल्य या श्रेणीबाहेर असेल तर ते गणनेतील त्रुटी दर्शवते.
  • $r$ चे परिमाण मूळ बदलणे (change of origin) आणि प्रमाण बदलणे (change of scale) यांनी प्रभावित होत नाही. दोन चले $\mathrm{X}$ आणि $\mathrm{Y}$ दिली आहेत असे समजू या, दोन नवीन चले परिभाषित करू.

$\mathrm{U}=\frac{\mathrm{X}-\mathrm{A}}{\mathrm{B}} ; \mathrm{V}=\frac{\mathrm{Y}-\mathrm{C}}{\mathrm{D}}$

जेथे $A$ आणि $C$ ही अनुक्रमे $\mathrm{X}$ आणि $\mathrm{Y}$ ची गृहीत माध्ये आहेत. $\mathrm{B}$ आणि $\mathrm{D}$ हे सामान्य घटक आहेत आणि समान चिन्हाचे आहेत. तर

$r _{x y}=r _{u v}$

सोप्या पद्धतीने, जसे की पायरी विचलन पद्धतीत, सहसंबंध गुणांक काढण्यासाठी हा गुणधर्म वापरला जातो.

  • जर $r=0$ असेल तर दोन्ही चले असंबद्ध (uncorrelated) आहेत. त्यांच्यामध्ये कोणताही रेषीय संबंध नाही. तथापि इतर प्रकारचे संबंध असू शकतात.
  • जर $r=1$ किंवा $r=-1$ असेल तर सहसंबंध परिपूर्ण आहे आणि तंतोतंत रेषीय संबंध आहे.
  • $r$ चे उच्च मूल्य प्रबळ रेषीय संबंध दर्शवते. जेव्हा ते +१ किंवा -१ च्या जवळ असते तेव्हा त्याचे मूल्य उच्च असल्याचे म्हटले जाते.
  • $r$ चे कमी मूल्य (शून्याजवळ) कमकुवत रेषीय संबंध दर्शवते. परंतु अरेषीय संबंध असू शकतो.

जसे तुम्ही अध्याय १ मध्ये वाचले आहे, सामान्य ज्ञानाची जागा सांख्यिकीय पद्धतींनी घेऊ शकत नाही. येथे, आणखी एक उदाहरण आहे, जे सहसंबंधाची गणना आणि अर्थ लावण्यापूर्वी डेटा योग्यरित्या समजून घेण्याची गरज उठवते. काही गावांमध्ये साथीचा रोग पसरतो आणि सरकार प्रभावित गावांमध्ये डॉक्टरांची टीम पाठवते. मृत्यूंची संख्या आणि गावांमध्ये पाठवलेल्या डॉक्टरांची संख्या यांच्यातील सहसंबंध सकारात्मक आढळतो. सामान्यतः, डॉक्टरांद्वारे पुरवल्या जाणाऱ्या आरोग्यसेवा सुविधांमुळे मृत्यूंची संख्या कमी होण्याची अपेक्षा असते जी नकारात्मक सहसंबंध दर्शवते. इतर कारणांमुळे असे घडले. डेटा एका विशिष्ट कालावधीशी संबंधित आहे. अहवाल केलेल्या मृत्यूंपैकी बरेच टर्मिनल केसेस असू शकतात जेथे डॉक्टर काहीच करू शकत नाहीत. शिवाय, डॉक्टरांच्या उपस्थितीचा फायदा काही काळानंतरच दिसून येतो. असेही शक्य आहे की अहवाल केलेले मृत्यू साथीमुळे झाले नाहीत. राज्यावर अचानक सुनामीचा हल्ला होतो आणि मृत्यूंची संख्या वाढते.

शेतकऱ्यांच्या शिक्षणाच्या वर्षांचा आणि प्रति एकर वार्षिक उत्पन्नाचा संबंध तपासून $r$ ची गणना स्पष्ट करूया.

उदाहरण १

शेतकऱ्यांच्या शिक्षणाच्या वर्षांची संख्या प्रति एकर वार्षिक उत्पन्न ‘000 (रुपये)
0 4
2 4
4 6
6 10
8 10
10 8
12 7

सूत्र १ ला $\sum \mathrm{Xy}, \sigma _{\mathrm{x}}, \sigma _{\mathrm{y}}$ चे मूल्य आवश्यक आहे

सारणी ६.१ वरून आपल्याला मिळते,

$$ \begin{aligned} & \sum \mathrm{xy}=42, \\ & \sigma _{\mathrm{x}}=\sqrt{\frac{\sum(\mathrm{X}-\overline{\mathrm{X}})^{2}}{\mathrm{~N}}}=\sqrt{\frac{112}{7}}, \\ & \sigma _{\mathrm{y}}=\sqrt{\frac{\sum(\mathrm{Y}-\overline{\mathrm{Y}})^{2}}{\mathrm{~N}}}=\sqrt{\frac{38}{7}} \end{aligned} $$

ही मूल्ये सूत्र (1) मध्ये बदलून

$$ \mathrm{r}=\frac{42}{7 \sqrt{\frac{112}{7}} \sqrt{\frac{38}{7}}}=0.644 $$

हेच मूल्य सूत्र (2) वरून देखील मिळू शकते.

$$ \begin{gather*} \mathrm{r}=\frac{\sum(\mathrm{X}-\overline{\mathrm{X}})(\mathrm{Y}-\overline{\mathrm{Y}})}{\sqrt{\sum(\mathrm{X}-\overline{\mathrm{X}})^{2}} \sqrt{\sum(\mathrm{Y}-\overline{\mathrm{Y}})^{2}}} \tag{2}\\ \mathrm{r}=\frac{42}{\sqrt{112} \sqrt{38}}=0.644 \end{gather*} $$

अशाप्रकारे, शेतकऱ्यांच्या शिक्षणाची वर्षे आणि प्रति एकर वार्षिक उत्पन्न यांच्यात सकारात्मक सहसंबंध आहे. $r$ चे मूल्य देखील मोठे आहे. याचा अर्थ शेतकरी शिक्षणात जितकी जास्त वर्षे गुंतवणूक करतील तितके प्रति एकर उत्पन्न जास्त असेल. हे शेतकऱ्यांच्या शिक्षणाचे महत्त्व रेखांकित करते.

सूत्र (3) वापरण्यासाठी

सारणी ६.१ शेतकऱ्यांच्या शिक्षणाच्या वर्षांचा आणि वार्षिक उत्पन्नाचा सहसंबंध गुणांक काढणे

शिक्षणाची वर्षे (X) $(X-\bar{X})$ $(X-\bar{X})^{2}$ प्रति एकर वार्षिक उत्पन्न ‘000 रुपये (Y) $(Y-\bar{Y})$ $(Y-\bar{Y})^{2}$ $(X-\bar{X})(Y-\bar{Y})$
0 -6 36 4 -3 9 18
2 -4 16 4 -3 9 12
4 -2 4 6 -1 1 2
6 0 0 10 3 9 0
8 2 4 10 3 9 6
10 4 16 8 1 1 4
12 6 36 7 0 0 0
$\Sigma X=42$ $\sum (X-\overline{\mathrm{X}})^{2}=112$ $\Sigma Y=49$ $\Sigma(Y-\bar{Y})^{2}=38$ $\Sigma(X-\bar{X})(Y-\bar{Y})=42$

$$ \begin{equation*} r=\frac{\sum X Y-\frac{(\Sigma X)\left(\sum Y\right)}{N}}{\sqrt{\Sigma X^{2}-\frac{(\Sigma X)^{2}}{N}} \sqrt{\Sigma \mathrm{Y}^{2}-\frac{(\Sigma Y)^{2}}{N}}}\tag{3} \end{equation*} $$

खालील पदावलींची मूल्ये काढावी लागतील म्हणजे

$\Sigma \mathrm{XY}, \Sigma \mathrm{X}^{2}, \Sigma \mathrm{Y}^{2}$.

आता सूत्र (3) लागू करून $r$ चे मूल्य मिळवा.

$r$ च्या विविध मूल्यांचा अर्थ समजून घेऊ या. इंग्रजी आणि सांख्यिकी या विषयांमध्ये मिळवलेल्या गुणांमधील सहसंबंध गुणांक समजा ०.१ आहे. याचा अर्थ असा की जरी दोन्ही विषयांमध्ये मिळवलेले गुण सकारात्मक सहसंबंधित आहेत, तरी संबंधाची ताकद कमकुवत आहे. इंग्रजीत जास्त गुण मिळवणारे विद्यार्थी सांख्यिकीत तुलनेने कमी गुण मिळवत असू शकतात. जर $r$ चे मूल्य समजा ०.९ असते, तर इंग्रजीत जास्त गुण मिळवणारे विद्यार्थी निश्चितपणे सांख्यिकीत जास्त गुण मिळवतील.

नकारात्मक सहसंबंधाचे उदाहरण म्हणजे स्थानिक मंडीत भाजीपाल्याचे आगमन आणि भाजीपाल्याची किंमत यांच्यातील संबंध. जर $r$ -०.९ असेल, तर स्थानिक मंडीत भाजीपाल्याचा पुरवठा हा भाजीपाल्याच्या कमी किमतीशी संबंधित असेल. जर ते -०.१ असते, तर मोठ्या प्रमाणात भाजीपाल्याचा पुरवठा हा कमी किमतीशी संबंधित असेल, परंतु $r$ -०.९ असतानाच्या किमतीएवढी कमी नसेल. किमतीतील घट किती होईल हे $r$ च्या परिपूर्ण मूल्यावर अवलंबून असते. जर ते शून्य असते, तर बाजारात मोठा पुरवठा असूनही किमतीत घट झाली नसती. जर वाढलेला पुरवठा चांगल्या वाहतूक नेटवर्कद्वारे इतर बाजारांमध्ये हस्तांतरित केला गेला तर ही देखील एक शक्यता आहे.

कृती

  • खालील सारणी पहा. चालू किमतीवरील राष्ट्रीय उत्पन्नाची वार्षिक वाढ आणि जीडीपीची टक्केवारी म्हणून एकूण देशी बचत यांच्यातील $r$ काढा.

सहसंबंध गुणांक काढण्यासाठी पायरी विचलन पद्धत.

जेव्हा चलांची मूल्ये