अध्याय 06 सहसंबंध

1. परिचय

पिछले अध्यायों में आपने सीखा है कि बड़े पैमाने पर आँकड़ों से सारांश माप कैसे बनाए जाते हैं और समान चरों में होने वाले परिवर्तनों को कैसे देखा जाता है। अब आप सीखेंगे कि दो चरों के बीच संबंध की जाँच कैसे करें।
गर्मी बढ़ने के साथ हिल स्टेशनों पर अधिक से अधिक पर्यटक आते हैं। आइसक्रीम की बिक्री तेज हो जाती है। इस प्रकार तापमान का संबंध पर्यटकों की संख्या और आइसक्रीम की बिक्री से है। इसी तरह, जब आपके स्थानीय मंडी में टमाटर की आपूर्ति बढ़ती है, तो उसका मूल्य गिरता है। जब स्थानीय फसल बाजार में आने लगती है, तो टमाटर का मूल्य ₹40 प्रति $\mathrm{kg}$ से घटकर ₹4 प्रति kg या उससे भी कम हो जाता है। इस प्रकार आपूर्ति का संबंध मूल्य से है। सहसंबंध विश्लेषण ऐसे संबंधों की व्यवस्थित जाँच का एक साधन है। यह ऐसे प्रश्नों से संबंधित है:

  • क्या दो चरों के बीच कोई संबंध है?
  • यदि एक चर का मान बदलता है, तो क्या दूसरे का मान भी बदलता है?
  • क्या दोनों चर एक ही दिशा में बढ़ते हैं?
  • संबंध कितना मजबूत है?

2. संबंधों के प्रकार

आइए विभिन्न प्रकार के संबंधों को देखें। किसी वस्तु की मांग में आंदोलन और उसकी कीमत के बीच का संबंध मांग के सिद्धांत का एक अभिन्न हिस्सा है, जिसे आप कक्षा बारहवीं में पढ़ेंगे। कृषि उत्पादकता में कमी कम वर्षा से संबंधित है। संबंध के ऐसे उदाहरणों को कारण और प्रभाव की व्याख्या दी जा सकती है। अन्य केवल संयोग हो सकते हैं। किसी अभयारण्य में प्रवासी पक्षियों के आगमन और स्थानीय क्षेत्र में जन्म दर के बीच के संबंध को कोई कारण और प्रभाव की व्याख्या नहीं दी जा सकती। ये संबंध केवल संयोग हैं। जूतों के आकार और आपकी जेब में पैसों के बीच का संबंध भी ऐसा ही एक उदाहरण है। यदि संबंध मौजूद भी हैं, तो उन्हें समझाना कठिन है।

एक अन्य उदाहरण में, दो चरों पर किसी तीसरे चर का प्रभाव उन दोनों चरों के बीच एक संबंध को जन्म दे सकता है। आइसक्रीम की तेज बिक्री डूबने से होने वाली मौतों की अधिक संख्या से संबंधित हो सकती है। पीड़ित आइसक्रीम खाने से नहीं डूबते। तापमान में वृद्धि आइसक्रीम की तेज बिक्री को बढ़ाती है। इसके अतिरिक्त, अधिक संख्या में लोग गर्मी से बचने के लिए तैराकी पूल जाने लगते हैं। इससे डूबने से होने वाली मौतों की संख्या बढ़ सकती है। इस प्रकार, तापमान आइसक्रीम की बिक्री और डूबने से होने वाली मौतों के बीच उच्च सहसंबंध के पीछे का कारण है।

सहसंबंध क्या मापता है?

सहसंबंध चरों के बीच संबंध की दिशा और तीव्रता का अध्ययन और मापन करता है। सहसंबंध सह-परिवर्तन को मापता है, कारण-कार्य संबंध को नहीं। सहसंबंध को कभी भी कारण और प्रभाव संबंध का संकेत मानने की गलती नहीं करनी चाहिए। दो चरों $\mathrm{X}$ और Y के बीच सहसंबंध की उपस्थिति का सरल अर्थ यह है कि जब एक चर का मान एक दिशा में बदलता है, तो दूसरे चर का मान या तो उसी दिशा में (अर्थात् धनात्मक परिवर्तन) या विपरीत दिशा में (अर्थात् ऋणात्मक परिवर्तन) परिवर्तित होता है, परंतु एक निश्चित तरीके से। सरलता के लिए हम यहाँ यह मानते हैं कि सहसंबंध, यदि विद्यमान है, तो रेखीय है, अर्थात् दोनों चरों की सापेक्ष गति को ग्राफ पेपर पर एक सीधी रेखा खींचकर दर्शाया जा सकता है।

सहसंबंध के प्रकार

सहसंबंध को आमतौर पर ऋणात्मक और धनात्मक सहसंबंध में वर्गीकृत किया जाता है। सहसंबंध को धनात्मक कहा जाता है जब चर एक ही दिशा में साथ चलते हैं। जब आय बढ़ती है, खपत भी बढ़ती है। जब आय घटती है, खपत भी घटती है। आइसक्रीम की बिक्री और तापमान एक ही दिशा में चलते हैं। सहसंबंध ऋणात्मक होता है जब वे विपरीत दिशाओं में चलते हैं। जब सेब की कीमतें घटती हैं तो इसकी मांग बढ़ती है। जब कीमतें बढ़ती हैं तो इसकी मांग घटती है। जब आप अध्ययन में अधिक समय बिताते हैं, तो आपके फेल होने की संभावना घटती है। जब आप अपनी पढ़ाई में कम घंटे बिताते हैं, तो कम अंक/ग्रेड प्राप्त करने की संभावना बढ़ती है। ये ऋणात्मक सहसंबंध के उदाहरण हैं। चर विपरीत दिशा में चलते हैं।

3. सहसंबंध को मापने की तकनीकें

सहसंबंध का अध्ययन करने के लिए प्रयुक्त तीन महत्वपूर्ण उपकरण हैं: बिंदु-रेखा आरेख, कार्ल पियर्सन का सहसंबंध गुणांक और स्पीयरमैन की क्रम सहसंबंध।
बिंदु-रेखा आरेख दृष्टिगत रूप से संबंध के स्वरूप को प्रस्तुत करता है बिना किसी विशिष्ट संख्यात्मक मान के। दो चरों के बीच रैखिक संबंध का संख्यात्मक माप कार्ल पियर्सन का सहसंबंध गुणांक देता है। एक संबंध को रैखिक कहा जाता है यदि उसे सीधी रेखा द्वारा दर्शाया जा सके। स्पीयरमैन का सहसंबंध गुणांक उन क्रमों के बीच रैखिक संबंध मापता है जो व्यक्तिगत वस्तुओं को उनके गुणों के अनुसार दिए जाते हैं। गुण वे चर होते हैं जिन्हें संख्यात्मक रूप से मापा नहीं जा सकता, जैसे लोगों की बुद्धिमत्ता, शारीरिक सौंदर्य, ईमानदारी आदि।

बिंदु-रेखा आरेख

बिंदु-रेखा आरेख संबंध के स्वरूप की दृष्टिगत जांच के लिए एक उपयोगी तकनीक है, बिना किसी संख्यात्मक मान की गणना किए। इस तकनीक में, दो चरों के मानों को ग्राफ पेपर पर बिंदुओं के रूप में चिह्नित किया जाता है। बिंदु-रेखा आरेख से संबंध के स्वरूप की काफी अच्छी समझ प्राप्त की जा सकती है। बिंदु-रेखा आरेख में बिंदुओं की निकटता की डिग्री और उनकी समग्र दिशा हमें संबंध की जांच करने में सक्षम बनाती है। यदि सभी बिंदु एक रेखा पर स्थित हों, तो सहसंबंध पूर्ण होता है और इसे एकता में कहा जाता है। यदि बिंदु रेखा के चारों ओर व्यापक रूप से फैले हुए हैं, तो सहसंबंध कम होता है। यदि बिंदु किसी रेखा के निकट या रेखा पर स्थित हों, तो सहसंबंध को रैखिक कहा जाता है।

छवि 6.1 से छवि 6.5 तक फैले बिंदु-आरेख हमें दो चरों के बीच संबंध की एक झलक देते हैं। छवि 6.1 में ऊपर की ओर उठती रेखा के आसपास बिंदुओं का प्रसार दिखता है, जिससे पता चलता है कि चर एक ही दिशा में चल रहे हैं। जब $\mathrm{X}$ बढ़ता है तो $\mathrm{Y}$ भी बढ़ता है। यह धनात्मक सहसंबंध है। छवि 6.2 में बिंदु नीचे की ओर झुकी रेखा के आसपास बिखरे हुए हैं। इस बार चर विपरीत दिशा में चलते हैं। जब $\mathrm{X}$ बढ़ता है तो $\mathrm{Y}$ घटता है और इसका विपरीत भी सच है। यह ऋणात्मक सहसंबंध है। छवि 6.3 में न तो ऊपर उठती और न ही नीचे झुकी कोई रेखा है जिसके आसपास बिंदु बिखरे हों। यह सहसंबंध के अभाव का उदाहरण है। छवि 6.4 और छवि 6.5 में बिंदु अब ऊपर उठती या नीचे गिरती रेखा के आसपास नहीं बिखरे हैं, बल्कि स्वयं रेखा पर स्थित हैं। इन्हें क्रमशः पूर्ण धनात्मक सहसंबंध और पूर्ण ऋणात्मक सहसंबंध कहा जाता है।

गतिविधि

  • अपनी कक्षा के कक्षा $X$ के विद्यार्थियों की ऊँचाई, वजन और किन्हीं दो विषयों में प्राप्त अंकों का आँकड़ा एकत्र करें। इन चरों में से दो-दो को लेकर बिंदु-आरेख बनाइए। आपको किस प्रकार का संबंध दिखाई देता है?

बिंदु-आरेख का सावधानीपूर्वक अवलोकन संबंध की प्रकृति और तीव्रता का अनुमान देता है।

कार्ल पियर्सन का सहसंबंध गुणांक

इसे उत्पाद आघूर्ण सहसंबंध गुणांक या सरल सहसंबंध गुणांक भी कहा जाता है। यह दो चरों $\mathrm{X}$ और $Y$ के बीच रैखिक संबंध की डिग्री का एक सटीक संख्यात्मक मान देता है।

यह ध्यान देना महत्वपूर्ण है कि कार्ल पियर्सन का सहसंबंध गुणांक तभी प्रयोग किया जाना चाहिए जब चरों के बीच रैखिक संबंध हो। जब $\mathrm{X}$ और $\mathrm{Y}$ के बीच अरैखिक संबंध हो, तो कार्ल पियर्सन का सहसंबंध गुणांक गणना करना भ्रामक हो सकता है। इस प्रकार, यदि सच्चा संबंध रैखिक प्रकार का है जैसा कि आकृतियों 6.1, $6.2,6.4$ और 6.5 में दिखाए गए बिंदु-चित्रों द्वारा प्रदर्शित है, तो कार्ल पियर्सन का सहसंबंध गुणांक गणना किया जाना चाहिए और यह हमें चरों के बीच संबंध की दिशा और तीव्रता बताएगा। लेकिन यदि सच्चा संबंध आकृतियों 6.6 या 6.7 में दिखाए गए बिंदु-चित्रों के प्रकार का है, तो इसका अर्थ है कि $\mathrm{X}$ और $\mathrm{Y}$ के बीच अरैखिक संबंध है और हमें कार्ल पियर्सन के सहसंबंध गुणांक का प्रयोग करने का प्रयास नहीं करना चाहिए।

इसलिए, कार्ल पियर्सन के सहसंबंध गुणांक की गणना करने से पहले चरों के बीच संबंध के बिंदु-चित्र की जांच करना उचित है।

मान लीजिए $X _{1}, X _{2}, \ldots, X _{N}$ चर $X$ के $N$ मान हैं और $\mathrm{Y} _{1}, \mathrm{Y} _{2}, \ldots, \mathrm{Y} _{\mathrm{N}}$ चर Y के संगत मान हैं। आगे की प्रस्तुतियों में सरलता के लिए इकाई दर्शाने वाले अधोलेख हटा दिए गए हैं। $\mathrm{X}$ और $\mathrm{Y}$ के समांतर माध्य इस प्रकार परिभाषित हैं

$$ \overline{\mathrm{X}}=\frac{\sum \mathrm{X}}{\mathrm{N}} ; \quad \overline{\mathrm{Y}}=\frac{\sum \mathrm{Y}}{\mathrm{N}} $$

और उनके प्रसरण इस प्रकार हैं

$$ \sigma^{2} x=\frac{\sum(X-\bar{X})^{2}}{N}=\frac{\sum X^{2}}{N}-\bar{X}^{2} $$

और $$\quad \sigma^{2} \mathrm{y}=\frac{\sum(\mathrm{Y}-\overline{\mathrm{Y}})^{2}}{\mathrm{~N}}=\frac{\sum \mathrm{Y}^{2}}{\mathrm{~N}}-\overline{\mathrm{Y}}^{2}$$

$\mathrm{X}$ और $\mathrm{Y}$ के मानक विचलन, क्रमशः, उनके प्रसरण के धनात्मक वर्गमूल होते हैं। $\mathrm{X}$ और $\mathrm{Y}$ का सहप्रसरण इस प्रकार परिभाषित है

$\operatorname{Cov}(\mathrm{X}, \mathrm{Y})=\frac{\sum(\mathrm{X}-\overline{\mathrm{X}})(\mathrm{Y}-\overline{\mathrm{Y}})}{\mathrm{N}}=\frac{\sum \mathrm{xy}}{\mathrm{N}}$

जहाँ $\mathrm{x}=\mathrm{X}-\overline{\mathrm{X}}$ और $\mathrm{y}=\mathrm{Y}-\overline{\mathrm{Y}}$ क्रमशः $\mathrm{X}$ और $\mathrm{Y}$ के $i^{\text {th }}$ मानों के उनके माध्य मानों से विचलन हैं।

$\mathrm{X}$ और $\mathrm{Y}$ के बीच सहप्रसरण का चिह्न सहसंबंध गुणांक के चिह्न को निर्धारित करता है। मानक विचलन सदैव धनात्मक होते हैं। यदि सहप्रसरण शून्य है, तो सहसंबंध गुणांक सदैव शून्य होता है। गुणन क्षण सहसंबंध या कार्ल पियर्सन का सहसंबंध माप इस प्रकार दिया गया है

$$ \begin{equation*} \mathrm{r}={ }^{\Sigma \mathrm{xy}} / N \sigma _{\mathrm{x}} \sigma _{\mathrm{y}} \tag{1} \end{equation*} $$

या

$$ \begin{equation*} \mathrm{r}=\frac{\sum(\mathrm{X}-\overline{\mathrm{X}})(\mathrm{Y}-\overline{\mathrm{Y}})}{\sqrt{\Sigma(\mathrm{X}-\overline{\mathrm{X}})^{2}} \sqrt{\Sigma(\mathrm{Y}-\overline{\mathrm{Y}})^{2}}} \tag{2} \end{equation*} $$

या

$$ \begin{equation*} r=\frac{\frac{\sum X Y-\left(\sum X\right)\left(\sum Y\right)}{N}}{\sqrt{\sum X^{2}-\frac{\left(\sum X\right)^{2}}{N}} \sqrt{\sum Y^{2}-\frac{\left(\sum Y\right)^{2}}{N}}}\tag{3} \end{equation*} $$

या

$$ \begin{equation*} r=\frac{N \sum XY-(\sum X)(\sum Y)}{\sqrt{N \sum X^2-(\sum X)^2} \cdot \sqrt{N \sum Y^2-(\sum Y)^2}}\tag{4} \end{equation*} $$

सहसंबंध गुणांक के गुण

आइए अब हम सहसंबंध गुणांक के गुणों पर चर्चा करें

  • $r$ की कोई इकाई नहीं होती। यह एक शुद्ध संख्या है। इसका अर्थ है कि मापन की इकाइयाँ $r$ का हिस्सा नहीं होतीं। उदाहरण के लिए, फुट में ऊँचाई और किलोग्राम में वजन के बीच $r$ का मान 0.7 हो सकता है।
  • $r$ का ऋणात्मक मान एक व्युत्क्रम संबंध को दर्शाता है। एक चर में परिवर्तन दूसरे चर में विपरीत दिशा में परिवर्तन से जुड़ा होता है। जब किसी वस्तु की कीमत बढ़ती है, तो उसकी मांग घट जाती है। जब ब्याज दर बढ़ती है, तो निधियों की मांग भी घट जाती है। ऐसा इसलिए है क्योंकि अब निधियाँ महँगी हो गई हैं।
  • यदि $r$ धनात्मक है, तो दोनों चर एक ही दिशा में चलते हैं। जब चाय के प्रतिस्थापक कॉफी की कीमत बढ़ती है, तो चाय की मांग भी बढ़ जाती है। सिंचाई सुविधाओं में सुधार उच्च उपज से जुड़ा होता है। जब तापमान बढ़ता है, तो आइसक्रीम की बिक्री तेज हो जाती है।
  • सहसंबंध गुणांक का मान ऋण एक और धन एक के बीच होता है, $-1 \leq r \leq 1$। यदि किसी अभ्यास में $r$ का मान इस सीमा से बाहर हो तो यह गणना में त्रुटि का संकेत है।
  • $r$ का परिमाण मूल परिवर्तन और स्केल परिवर्तन से अप्रभावित रहता है। दो चर $\mathrm{X}$ और $\mathrm{Y}$ लेते हुए दो नए चर परिभाषित करते हैं।

$\mathrm{U}=\frac{\mathrm{X}-\mathrm{A}}{\mathrm{B}} ; \mathrm{V}=\frac{\mathrm{Y}-\mathrm{C}}{\mathrm{D}}$

जहाँ $A$ और $C$ क्रमशः $\mathrm{X}$ और $\mathrm{Y}$ के माना गया माध्य हैं। $\mathrm{B}$ और $\mathrm{D}$ सामान्य गुणक हैं और समान चिह्न वाले हैं। तब

$r _{x y}=r _{u v}$

यह गुणधर्म सहसंबंध गुणांक को अत्यंत सरलीकृत तरीके से गणना करने में प्रयुक्त होता है, जैसे कि पद विचलन विधि में।

  • यदि $r=0$ हो तो दो चर असहसंबंधित हैं। उनके बीच कोई रैखिक संबंध नहीं है। हालाँकि अन्य प्रकार के संबंध हो सकते हैं।
  • यदि $r=1$ या $r=-1$ हो तो सहसंबंध पूर्ण होता है और सटीक रैखिक संबंध होता है।
  • $r$ का उच्च मान प्रबल रैखिक संबंध को दर्शाता है। इसका मान उच्च कहा जाता है जब यह +1 या -1 के निकट हो।
  • $r$ का निम्न मान (शून्य के निकट) दुर्बल रैखिक संबंध को दर्शाता है। परंतु कोई अरैखिक संबंध हो सकता है।

जैसा कि आपने अध्याय 1 में पढ़ा है, सांख्यिकीय विधियां सामान्य बुद्धि का विकल्प नहीं हैं। यहाँ एक और उदाहरण है, जो सहसंबंध की गणना और व्याख्या करने से पहले डेटा को ठीक से समझने की आवश्यकता को रेखांकित करता है। कुछ गाँवों में एक महामारी फैलती है और सरकार प्रभावित गाँवों में डॉक्टरों की एक टीम भेजती है। गाँवों में भेजे गए डॉक्टरों की संख्या और मौतों की संख्या के बीच सहसंबंध सकारात्मक पाया गया है। सामान्यतः, डॉक्टरों द्वारा दी जाने वाली स्वास्थ्य सेवाओं से मौतों की संख्या में कमी आने की उम्मीद की जाती है, जिससे एक नकारात्मक सहसंबंध दिखाई देता है। यह अन्य कारणों से हुआ। डेटा एक विशिष्ट समय अवधि से संबंधित है। रिपोर्ट की गई कई मौतें ऐसी अंतिम अवस्था की थीं जहाँ डॉक्टर कुछ नहीं कर सकते थे। इसके अतिरिक्त, डॉक्टरों की उपस्थिति का लाभ कुछ समय बाद ही दिखाई देता है। यह भी संभव है कि रिपोर्ट की गई मौतें महामारी के कारण न हों। एक सुनामी अचानक राज्य में आती है और मृत्यु संख्या बढ़ जाती है।

आइए किसानों की स्कूली शिक्षा के वर्षों और प्रति एकड़ वार्षिक उपज के बीच संबंध की जाँच करके $r$ की गणना को दर्शाएं।

उदाहरण 1

किसानों की स्कूली शिक्षा के वर्षों की संख्या वार्षिक उपज प्रति एकड़ ‘Ooo (रु) में
0 4
2 4
4 6
6 10
8 10
10 8
12 7

सूत्र 1 को $\sum \mathrm{Xy}, \sigma _{\mathrm{x}}, \sigma _{\mathrm{y}}$ का मान चाहिए

तालिका 6.1 से हमें प्राप्त होता है,

$$ \begin{aligned} & \sum \mathrm{xy}=42, \\ & \sigma _{\mathrm{x}}=\sqrt{\frac{\sum(\mathrm{X}-\overline{\mathrm{X}})^{2}}{\mathrm{~N}}}=\sqrt{\frac{112}{7}}, \\ & \sigma _{\mathrm{y}}=\sqrt{\frac{\sum(\mathrm{Y}-\overline{\mathrm{Y}})^{2}}{\mathrm{~N}}}=\sqrt{\frac{38}{7}} \end{aligned} $$

इन मानों को सूत्र (1) में रखने पर

$$ \mathrm{r}=\frac{42}{7 \sqrt{\frac{112}{7}} \sqrt{\frac{38}{7}}}=0.644 $$

सूत्र (2) से भी वही मान प्राप्त किया जा सकता है।

$$ \begin{gather*} \mathrm{r}=\frac{\sum(\mathrm{X}-\overline{\mathrm{X}})(\mathrm{Y}-\overline{\mathrm{Y}})}{\sqrt{\sum(\mathrm{X}-\overline{\mathrm{X}})^{2}} \sqrt{\sum(\mathrm{Y}-\overline{\mathrm{Y}})^{2}}} \tag{2}\\ \mathrm{r}=\frac{42}{\sqrt{112} \sqrt{38}}=0.644 \end{gather*} $$

इस प्रकार, किसानों की शिक्षा के वर्ष और प्रति एकड़ वार्षिक उपज के बीच सकारात्मक सहसंबंध है। r का मान भी बड़ा है। इसका तात्पर्य है कि किसान जितने अधिक वर्ष शिक्षा में लगाते हैं, उपज प्रति एकड़ उतनी ही अधिक होगी। यह किसानों की शिक्षा के महत्व को रेखांकित करता है।

सूत्र (3) का उपयोग करने के लिए

TABLE 6.1 किसानों की स्कूली शिक्षा के वर्षों और वार्षिक उपज के बीच r की गणना

शिक्षा के वर्ष (X) $(X-\bar{X})$ $(X-\bar{X})^{2}$ प्रति एकड़ वार्षिक उत्पादन ‘000 रु में (Y) $(Y-\bar{Y})$ $(Y-\bar{Y})^{2}$ $(X-\bar{X})(Y-\bar{Y})$
0 -6 36 4 -3 9 18
2 -4 16 4 -3 9 12
4 -2 4 6 -1 1 2
6 0 0 10 3 9 0
8 2 4 10 3 9 6
10 4 16 8 1 1 4
12 6 36 7 0 0 0
$\Sigma X=42$ $\sum (X-\overline{\mathrm{X}})^{2}=112$ $\Sigma Y=49$ $\Sigma(Y-\bar{Y})^{2}=38$ $\Sigma(X-\bar{X})(Y-\bar{Y})=42$

$$ \begin{equation*} r=\frac{\sum X Y-\frac{(\Sigma X)\left(\sum Y\right)}{N}}{\sqrt{\Sigma X^{2}-\frac{(\Sigma X)^{2}}{N}} \sqrt{\Sigma \mathrm{Y}^{2}-\frac{(\Sigma Y)^{2}}{N}}}\tag{3} \end{equation*} $$

निम्नलिखित व्यंजकों के मानों की गणना करनी है अर्थात्

$\Sigma \mathrm{XY}, \Sigma \mathrm{X}^{2}, \Sigma \mathrm{Y}^{2}$.

अब $r$ का मान प्राप्त करने के लिए सूत्र (3) लगाइए।

आइए $r$ के विभिन्न मानों की व्याख्या जानें। अंग्रेज़ी और सांख्यिकी में प्राप्त अंकों के बीच सहसंबंध गुणांक, मान लीजिए, 0.1 है। इसका अर्थ है कि यद्यपि दोनों विषयों में प्राप्त अंक सकारात्मक रूप से सहसंबद्ध हैं, संबंध की ताकत कमज़ोर है। अंग्रेज़ी में अधिक अंक प्राप्त करने वाले विद्यार्थी सांख्यिकी में अपेक्षाकृत कम अंक प्राप्त कर सकते हैं। यदि $r$ का मान, मान लीजिए, 0.9 होता, तो अंग्रेज़ी में अधिक अंक प्राप्त करने वाले विद्यार्थी अनिवार्य रूप से सांख्यिकी में भी अधिक अंक प्राप्त करते।

एक नकारात्मक सहसंबंध का उदाहरण स्थानीय मंडी में सब्जियों के आगमन और सब्जियों की कीमत के बीच का संबंध है। यदि $r$ -0.9 है, तो स्थानीय मंडी में सब्जी की आपूर्ति के साथ सब्जियों की कीमत कम होगी। यदि यह -0.1 होता, तो बड़ी मात्रा में सब्जी की आपूर्ति के साथ कीमत कम होती, लेकिन उतनी कम नहीं जितनी तब होती जब $r$ -0.9 होता है। कीमत में गिरावट की मात्रा $r$ के परम मान पर निर्भर करती है। यदि यह शून्य होता, तो बाजार में बड़ी आपूर्ति के बावजूद कीमत में कोई गिरावट नहीं आती। यह भी एक संभावना है यदि आपूर्ति में वृद्धि को अन्य बाजारों में स्थानांतरित करने वाले एक अच्छे परिवहन नेटवर्क द्वारा संभाल लिया जाता है।

गतिविधि

  • निम्नलिखित सारणी को देखें। वर्तमान कीमत पर राष्ट्रीय आय की वार्षिक वृद्धि और सकल घरेलू बचत (GDP के प्रतिशत के रूप में) के बीच $r$ की गणना करें।

सहसंबंध गुणांक की गणना के लिए चरण विचलन विधि।

जब चरों के मान बड़े होते हैं, तो गणना के बोझ को काफी कम किया जा सकता है $r$ के एक गुणधर्म का उपयोग करके। यह है कि $r$ मूल और स्केल में परिवर्तन से स्वतंत्र होता है। इसे चरण विचलन विधि भी कहा जाता है। इसमें चरों $\mathrm{X}$ और $\mathrm{Y}$ का निम्नलिखित रूप में रूपांतरण शामिल होता है:

सारणी 6.2

वर्ष राष्ट्रीय आय की
वार्षिक वृद्धि
सकल घरेलू
बचत जीडीपी के
प्रतिशत में
1992-93 14 24
1993-94 17 23
1994-95 18 26
1995-96 17 27
1996-97 16 25
1997-98 12 25
1998-99 16 23
1999-00 11 25
2000-01 8 24
2001-02 10 23

स्रोत: आर्थिक सर्वेक्षण, (2004-05) पृ. 8,9

$\mathrm{U}=\frac{\mathrm{X}-\mathrm{A}}{\mathrm{B}} ; \mathrm{V}=\frac{\mathrm{Y}-\mathrm{C}}{\mathrm{D}}$

जहाँ $A$ और $B$ माना गया माध्य हैं, $h$ और $\mathrm{k}$ सामान्य गुणक हैं और समान चिन्ह रखते हैं।

तब $\mathrm{r} _{\mathrm{uv}}=\mathrm{r} _{\mathrm{XY}}$

इसे मूल्य सूचकांक और मुद्रा आपूर्ति के बीच सहसंबंध के विश्लेषण के अभ्यास से दर्शाया जा सकता है।

उदाहरण 2

मूल्य सूचकांक $(\mathrm{X})$ $ 120 \quad 150 \quad 190 \quad 220 \quad 230$

रूपये करोड़ में मुद्रा आपूर्ति $(\mathrm{Y})$ $\quad 1800 \quad 2000 \quad 2500 \quad 2700 \quad 3000$

सरलीकरण, चरण विचलन विधि का उपयोग करके नीचे दर्शाया गया है। मान लीजिए $\mathrm{A}=100 ; \mathrm{h}=10 ; \mathrm{B}=1700$ और $\mathrm{k}=100$

रूपांतरित चरों की सारणी इस प्रकार है:

मूल्य सूचकांक और मुद्रा आपूर्ति के बीच $r$ की गणना चरण विचलन विधि का उपयोग करके

TABLE 6.3

$U$ $V$
$\left(\frac{\mathrm{x}-100}{10}\right)$ $\left(\frac{\mathrm{y}-1700}{100}\right)$ $U^{2}$ $V^{2}$ $U V$
2 1 4 1 2
5 3 25 9 15
9 8 81 64 72
12 10 144 100 120
13 13 169 169 169

$\Sigma \mathrm{U}=41 ; \Sigma \mathrm{U}=35 ; \Sigma \mathrm{U}^{2}=423 ;$ $\Sigma \mathrm{V}^{2}=343 ; \Sigma \mathrm{UV}=378$

इन मानों को सूत्र (3) में प्रतिस्थापित करने पर

$$ \begin{aligned} & \mathrm{r}=\frac{\Sigma \mathrm{UV}-\frac{(\Sigma \mathrm{U})(\Sigma \mathrm{U})}{\mathrm{N}}}{\sqrt{\Sigma \mathrm{U}^{2}-\frac{(\Sigma \mathrm{U})^{2}}{\mathrm{~N}}} \sqrt{\Sigma \mathrm{V}^{2}-\frac{(\Sigma \mathrm{V})^{2}}{\mathrm{~N}}}} …(3) \end{aligned} $$

$$=\frac{378-\frac{41 \times 35}{5}}{\sqrt{423-\frac{(41)^2}{5}}\sqrt{343-\frac{(35)^2}{5}}}$$

$$ \begin{aligned} & =0.98 \end{aligned} $$

मूल्य सूचकांक और मुद्रा आपूर्ति के बीच मजबूत सकारात्मक सहसंबंध मौद्रिक नीति की एक महत्वपूर्ण आधारशिला है। जब मुद्रा आपूर्ति बढ़ती है तो मूल्य सूचकांक भी बढ़ता है।

गतिविधि

  • भारत की जनसंख्या और राष्ट्रीय आय से संबंधित आंकड़ों का उपयोग करते हुए, पद विचलन विधि का प्रयोग करके उनके बीच सहसंबंध की गणना करें।

स्पीयरमैन का रैंक सहसंबंध

स्पीयरमैन का रैंक सहसंबंध ब्रिटिश मनोवैज्ञानिक सी.ई. स्पीयरमैन द्वारा विकसित किया गया था। इसका उपयोग निम्नलिखित परिस्थितियों में किया जाता है:

  1. मान लीजिए हम किसी दूरदराज़ गाँव के विद्यार्थियों की ऊँचाई और वज़न के बीच सहसंबंध का अनुमान लगाने की कोशिश कर रहे हैं, जहाँ न तो मापने वाली छड़ें हैं और न ही तौलने की मशीनें। ऐसी स्थिति में हम ऊँचाई या वज़न को माप नहीं सकते, लेकिन हम निश्चित रूप से विद्यार्थियों को वज़न और ऊँचाई के अनुसार क्रमबद्ध कर सकते हैं। इन क्रमों का उपयोग स्पीयरमैन के क्रम सहसंबंध गुणांक की गणना करने के लिए किया जा सकता है।

  2. मान लीजिए हम ऐसी चीज़ों से निपट रहे हैं जैसे निष्पक्षता, ईमानदारी या सौंदर्य। इन्हें उसी तरह से मापा नहीं जा सकता जैसे हम आय, वज़न या ऊँचाई को मापते हैं। अधिकतम, इन चीज़ों को सापेक्ष रूप से मापा जा सकता है, उदाहरण के लिए, हम लोगों को सौंदर्य के अनुसार क्रमबद्ध कर सकते हैं (कुछ लोग तर्क देंगे कि यह भी संभव नहीं है क्योंकि सौंदर्य के मानदंड और मापदंड व्यक्ति से व्यक्ति और संस्कृति से संस्कृति तक भिन्न हो सकते हैं)। यदि हम चरों के बीच संबंध खोजना चाहते हैं, जिनमें से कम से कम एक इस प्रकार का है, तो स्पीयरमैन के क्रम सहसंबंध गुणांक का उपयोग किया जाना चाहिए।

  3. स्पीयरमैन के क्रम सहसंबंध गुणांक का उपयोग कुछ मामलों में किया जा सकता है जहाँ एक संबंध है जिसकी दिशा स्पष्ट है लेकिन जो रैखिक नहीं है जैसा कि आकृति 6.6 और 6.7 में दिखाए गए प्रकार के बिखर आरेखों में दिखाया गया है।

  4. स्पीयरमैन का सहसंबंध गुणांक चरम मानों से प्रभावित नहीं होता है। इस दृष्टि से यह कार्ल पियर्सन के सहसंबंध गुणांक से बेहतर है। इस प्रकार यदि डेटा में कुछ चरम मान हैं, तो स्पीयरमैन का सहसंबंध गुणांक बहुत उपयोगी हो सकता है।

रैंक सहसंबंध गुणांक और सरल सहसंबंध गुणांक की व्याख्या समान होती है। इसका सूत्र सरल सहसंबंध गुणांक से व्युत्पन्न किया गया है जहाँ व्यक्तिगत मानों को रैंकों से प्रतिस्थापित किया गया है। इन रैंकों का उपयोग सहसंबंध की गणना के लिए किया जाता है। यह गुणांक इन इकाइयों को दी गई रैंकों के बीच रैखिक संबंध की माप प्रदान करता है, न कि उनके मानों की। स्पीयरमैन का रैंक सहसंबंध सूत्र है

$$ \begin{equation*} r _{a}=1-\frac{6 \sum D^{2}}{n^{3}-n} \tag{4} \end{equation*} $$

जहाँ $n$ प्रेक्षणों की संख्या है और $\mathrm{D}$ एक चर को दी गई रैंकों से दूसरे चर को दी गई रैंकों का विचलन है।

सरल सहसंबंध गुणांक के सभी गुण यहाँ लागू होते हैं। पीयरसोन सहसंबंध गुणांक की तरह यह 1 और -1 के बीच होता है। हालाँकि, आमतौर पर यह सामान्य विधि जितना सटीक नहीं होता है। यह इस तथ्य के कारण है कि डेटा से संबंधित सभी जानकारी का उपयोग नहीं किया जाता है।

प्रथम अंतर क्रमागत मानों का अंतर होता है। श्रेणी में आइटमों के मानों के प्रथम अंतर, जिन्हें परिमाण के क्रम में व्यवस्थित किया गया है, लगभग कभी भी नियत नहीं होते हैं। आमतौर पर डेटा केंद्रीय मानों के आसपास समूहित होते हैं जहाँ सरणी के मध्य में छोटे अंतर होते हैं।

यदि प्रथम अंतर नियत होते, तो $r$ और $r _{\mathrm{k}}$ समान परिणाम देते। सामान्यतः $r _{\mathrm{k}}$ $r$ से कम या बराबर होता है।

रैंक सहसंबंध गुणांक की गणना

रैंक सहसंबंध की गणना को तीन परिस्थितियों में समझाया जाएगा।

  1. रैंक दी गई हैं।
  2. रैंक नहीं दी गई हैं; उन्हें आँकड़ों से निकालना होगा।
  3. रैंक दोहराई गई हैं।

स्थिति 1: जब रैंक दी गई हों

उदाहरण 3
एक सौंदर्य प्रतियोगिता में तीन न्यायाधीशों द्वारा पाँच प्रतियोगियों का मूल्यांकन किया गया। हमें यह पता लगाना है कि न्यायाधीशों का कौन-सा युग्म सौंदर्य की सामान्य धारणा के सर्वाधिक निकट है।

प्रतियोगी

न्यायाधीश 1 2 3 4 5
A 1 2 3 4 5
B 2 4 1 5 3
C 1 3 5 2 4

न्यायाधीशों के युग्मों की संख्या 3 है, इसलिए रैंक सहसंबंध की गणना तीन बार करनी होगी। सूत्र (4) का प्रयोग किया जाएगा।

$$ \begin{equation*} \mathrm{r} _{\mathrm{s}}=1-\frac{6 \Sigma \mathrm{D}^{2}}{\mathrm{n}^{3}-\mathrm{n}} \tag{4} \end{equation*} $$

A और B के बीच रैंक सहसंबंध इस प्रकार गणना की जाती है:

$A$ $B$ $D$ $D^{2}$
1 2 -1 1
2 4 -2 4
3 1 2 4
4 5 -1 1
5 3 2 4
योग 14

इन मानों को सूत्र (4) में रखने पर

$$ \begin{equation*} r _{s}=1-\frac{6 \Sigma D^{2}}{n^{3}-n} \tag{4} \end{equation*} $$

$=1-\frac{6 \times 14}{5^{3}-5}=1-\frac{84}{120}=1-0.7=0.3$

A और C के बीच रैंक सहसंबंध इस प्रकार गणना की जाती है:

$A$ $C$ $D$ $D^{2}$
1 1 0 0
2 3 -1 1
3 5 -2 4
4 2 2 4
5 4 1 1
कुल 10

इन मानों को सूत्र (4) में रखने पर रैंक सहसंबंध 0.5 है। इसी प्रकार, न्यायाधीशों $\mathrm{B}$ और $\mathrm{C}$ की रैंकिंग के बीच रैंक सहसंबंध 0.9 है। इस प्रकार, न्यायाधीशों $A$ और C की धारणाएं सबसे निकटतम हैं। न्यायाधीशों B और C की रुचियां बहुत भिन्न हैं।

स्थिति 2: जब रैंक नहीं दी गई हों

उदाहरण 4

हमें 5 विद्यार्थियों द्वारा अर्थशास्त्र और सांख्यिकी में प्राप्त किए गए अंकों का प्रतिशत दिया गया है। फिर रैंकिंग निकालनी होगी और रैंक सहसंबंध की गणना करनी होगी।

विद्यार्थी सांख्यिकी में
अंक
(X)
अर्थशास्त्र में
अंक
(Y)
A 85 60
B 60 48
C 55 49
D 65 50
E 75 55

विद्यार्थी सांख्यिकी में
रैंकिंग
$\left(R _{x}\right)$
अर्थशास्त्र में
रैंकिंग
$\left(R _{\gamma}\right)$
A 1 1
B 4 5
C 5 4
D 3 3
E 2 2

एक बार रैंकिंग पूरी हो जाने पर रैंक सहसंबंध की गणना के लिए सूत्र (4) का प्रयोग किया जाता है।

स्थिति 3: जब रैंक दोहराई गई हों और रैंक नहीं दी गई हों

उदाहरण 5

मान $\mathrm{X}$ और $\mathrm{Y}$ निम्न प्रकार दिए गए हैं

$X$ $Y$
1200 75
1150 65
1000 50
990 100
800 90
780 85
760 90
750 40
730 50
700 60
620 50
600 75

रैंक सहसंबंध निकालने के लिए मानों की रैंक निकाली जाती हैं। दोहराए गए मदों को सामान्य रैंक दी जाती हैं। सामान्य रैंक वह औसत रैंक होती है जो उन मदों को तब मिलती अगर वे एक-दूसरे से थोड़े अलग होते। अगले मद को वह रैंक दी जाती है जो पहले से निर्धारित रैंक के ठीक बाद आती है।

यहाँ $Y$ का मान 50 है 9वें, 10वें और 11वें स्थान पर। इसलिए तीनों को औसत रैंक यानी 10 दी गई है,

Rank of $X$ Rank of $Y$ Deviation
in Ranks
$D^{2}$
1 5.5 -4.5 20.25
2 7 -5 25.00
3 10 -7 49.00
4 1 3 9.00
5 2.5 2.5 6.25
6 4 2 4.00
7 2.5 4.5 20.25
8 12 -4 16.00
9 10 -1 1.00
10 8 2 4.00
11 10 1 1.00
12 5.5 6.5 42.25
198.00

जब रैंक दोहराई जाती हैं तो स्पीयरमैन का रैंक सहसंबंध गुणांक इस सूत्र से निकाला जाता है

$$ \begin{aligned} & \mathrm{r} _{\mathrm{s}}=1- \ \frac{6\left[\Sigma \mathrm{D}^{2}+\frac{\left(\mathrm{m} _{1}^{3}-\mathrm{m} _{1}\right)}{12}+\frac{\left(\mathrm{m} _{2}^{3}-\mathrm{m} _{2}\right)}{12}+\ldots\right]}{n\left(\mathrm{n}^{2}-1\right)} \end{aligned} $$

जहाँ $\mathrm{m} _{1}, \mathrm{~m} _{2}, \ldots$, रैंकों की पुनरावृत्तियों की संख्या हैं और $\frac{\mathrm{m}^{3}{ } _{1}-\mathrm{m} _{1}}{12} \ldots$, उनके संगत सुधार कारक। इस प्रकार इस डेटा के लिए आवश्यक सुधार

$\frac{3^{3}-3}{12}+\frac{2^{3}-2}{12}=\frac{30}{12}=2.5$

इन व्यंजकों के मान प्रतिस्थापित करने पर

$r _{s}=1-\frac{6(198+2.5)}{12^{3}-12}=(1-0.70)=0.30$

इस प्रकार, $\mathrm{X}$ और $\mathrm{Y}$ के बीच सकारात्मक रैंक सहसंबंध है। $\mathrm{X}$ और $\mathrm{Y}$ दोनों एक ही दिशा में चलते हैं। हालांकि, संबंध को प्रबल नहीं कहा जा सकता।

गतिविधि

  • कक्षा IX और X की परीक्षाओं में अपने 10 सहपाठियों द्वारा प्राप्त अंकों का डेटा एकत्र करें। उनके बीच रैंक सहसंबंध गुणांक की गणना करें। यदि आपके डेटा में कोई पुनरावृत्ति नहीं है, तो पुनरावृत्त रैंक वाले डेटा सेट को लेकर अभ्यास दोहराएं। ऐसी क्या परिस्थितियाँ हैं जिनमें रैंक सहसंबंध गुणांक को साधारण सहसंबंध गुणांक पर प्राथमिकता दी जाती है? यदि डेटा सटीक रूप से मापा गया हो, तो क्या आप अभी भी रैंक सहसंबंध गुणांक को प्राथमिकता देंगे? आप कब इस चयन के प्रति उदासीन हो सकते हैं? कक्षा में चर्चा करें।

4. निष्कर्ष

हमने दो चरों के बीच संबंध, विशेष रूप से रैखिक संबंध का अध्ययन करने की कुछ तकनीकों पर चर्चा की है। बिखरा हुआ आरेख संबंध की दृश्य प्रस्तुति देता है और यह केवल रैखिक संबंधों तक सीमित नहीं होता है। कार्ल पियर्सन का सहसंबंध गुणांक और स्पीयरमैन की रैंक सहसंबंध चरों के बीच रैखिक संबंध को मापते हैं। जब चरों को सटीक रूप से मापा नहीं जा सकता, तब रैंक सहसंबंध का उपयोग किया जा सकता है। ये माप हालांकि कारण-प्रभाव नहीं दर्शाते। सहसंबंध का ज्ञान हमें इस बात की जानकारी देता है कि जब सहसंबंधित चर बदलता है तो एक चर में परिवर्तन की दिशा और तीव्रता क्या होती है।

सारांश

  • सहसंबंध विश्लेषण दो चरों के बीच संबंध का अध्ययन करता है।
  • बिखरे हुए आरेख दो चरों के बीच संबंध की प्रकृति की दृश्य प्रस्तुति देते हैं।
  • कार्ल पियर्सन का सहसंबंध गुणांक $r$ केवल दो चरों के बीच रैखिक संबंध को संख्यात्मक रूप से मापता है। r -1 और 1 के बीच होता है।
  • जब चरों को सटीक रूप से मापा नहीं जा सकता तो स्पीयरमैन की रैंक सहसंबंध का उपयोग करके रैखिक संबंध को संख्यात्मक रूप से मापा जा सकता है।
  • दोहरी रैंकों के लिए संशोधन गुणांकों की आवश्यकता होती है।
  • सहसंबंध का अर्थ कारण-प्रभाव नहीं होता। इसका अर्थ केवल सह-परिवर्तन होता है।

अभ्यास

1. फुट में ऊंचाई और किलोग्राम में वजन के बीच सहसंबंध गुणांक की इकाई है

(i) $\mathrm{kg} /$ feet

(ii) प्रतिशत

(iii) अस्तित्वहीन

2. सरल सहसंबंध गुणांक की सीमा है

(i) 0 से अनंत

(ii) माइनस वन से प्लस वन

(iii) माइनस अनंत से अनंत

3. यदि $r _{x y}$ धनात्मक है तो X और Y के बीच संबंध इस प्रकार का होता है

(i) जब Y बढ़ता है तो X बढ़ता है

(ii) जब Y घटता है तो X बढ़ता है

(iii) जब Y बढ़ता है तो X में कोई परिवर्तन नहीं होता

4. यदि $r _{x y}=0$ है तो चर X और Y

(i) रैखिक रूप से संबंधित हैं

(ii) रैखिक रूप से संबंधित नहीं हैं

(iii) स्वतंत्र हैं

5. निम्नलिखित तीन मापों में से कौन-सा कोई भी प्रकार के संबंध को माप सकता है

(i) कार्ल पियर्सन का सहसंबंध गुणांक

(ii) स्पीयरमैन का क्रम सहसंबंध

(iii) बिखरा आरेख

6. यदि सटीक मापे गए आँकड़े उपलब्ध हों तो सरल सहसंबंध गुणांक

(i) क्रम सहसंबंध गुणांक से अधिक सटीक होता है

(ii) क्रम सहसंबंध गुणांक से कम सटीक होता है

(iii) क्रम सहसंबंध गुणांक जितना ही सटीक होता है

7. r को सहयोग के माप के रूप में सहप्रसरण से क्यों प्राथमिकता दी जाती है?

8. क्या r आँकड़ों के प्रकार के आधार पर -1 और 1 की सीमा के बाहर हो सकता है?

9. क्या सहसंबंध कारण-प्रभाव को दर्शाता है?

10. कब क्रम सहसंबंध सरल सहसंबंध गुणांक से अधिक सटीक होता है?

11. क्या शून्य सहसंबंध का अर्थ स्वतंत्रता है?

12. क्या सरल सहसंबंध गुणांक किसी भी प्रकार के संबंध को माप सकता है?

13. एक सप्ताह तक हर दिन अपने स्थानीय बाज़ार से पाँच सब्ज़ियों के दाम इकट्ठा करें। उनके सहसंबंध गुणांक की गणना करें। परिणाम की व्याख्या करें।

14. अपने सहपाठियों की ऊँचाई मापें। उनसे उनके बेंचमेट की ऊँचाई पूछें। इन दो चरों के बीच सहसंबंध गुणांक की गणना करें। परिणाम की व्याख्या करें।

15. कुछ ऐसे चर सूचीबद्ध करें जिनका सटीक मापन कठिन होता है।

16. $r$ के मानों $1,-1$ और 0 की व्याख्या करें।

17. रैंक सहसंबंध गुणांक पीरसोनीयन सहसंबंध गुणांक से अलग क्यों होता है?

18. पिताओं की ऊँचाई इंच में $(\mathrm{X})$ और उनके पुत्रों की ऊँचाई $(\mathrm{Y})$ के बीच सहसंबंध गुणांक की गणना करें

$\begin{array}{lllllllll}\mathrm{X} & 65 & 66 & 57 & 67 & 68 & 69 & 70 & 72\end{array}$

$\begin{array}{lllllllll}\mathrm{Y} & 67 & 56 & 65 & 68 & 72 & 72 & 69 & 71 &\end{array}$

(उत्तर $\mathrm{r}=0.603$ )

19. $X$ और $Y$ के बीच सहसंबंध गुणांक की गणना करें और उनके संबंध पर टिप्पणी करें:

$\begin{array}{lllllllll}\mathrm{X} & -3 & -2 & -1 & 1 & 2 & 3\end{array}$

$\begin{array}{lllllllll}\mathrm{Y} & 9 & 4 & 1 & 1 & 4 & 9\end{array}$

(उत्तर $\mathrm{r}=0$ )

20. $\mathrm{X}$ और $\mathrm{Y}$ के बीच सहसंबंध गुणांक की गणना करें और उनके संबंध पर टिप्पणी करें

$\begin{array}{lllllllll}\mathrm{X} & 1 & 3 & 4 & 5 & 7 & 8\end{array}$

$\begin{array}{lllllllll}\mathrm{Y} & 2 & 6 & 8 & 10 & 14 & 16\end{array}$

(उत्तर $\mathrm{r}=1$ )

गतिविधि

  • यहाँ चर्चा किए गए सभी सूत्रों का उपयोग करके भारत की राष्ट्रीय आय और निर्यात के बीच $\mathrm{r}$ की गणना करें, कम से कम दस प्रेक्षण लेकर।