باب 06 ارتباط
1. تعارف
پچھلے ابواب میں آپ نے سیکھا ہے کہ اعداد و شمار کے انبار سے خلاصہ اقدامات کیسے بنائے جاتے ہیں اور ایک جیسی متغیرات میں تبدیلیوں کا مطالعہ کیسے کیا جاتا ہے۔ اب آپ سیکھیں گے کہ دو متغیرات کے درمیان تعلق کا جائزہ کیسے لیا جاتا ہے۔ جیسے جیسے گرمیوں کی گرمی بڑھتی ہے، پہاڑی اسٹیشنوں پر زیادہ سے زیادہ زائرین کا ہجوم ہو جاتا ہے۔ آئس کریم کی فروخت میں تیزی آ جاتی ہے۔ اس طرح، درجہ حرارت کا تعلق زائرین کی تعداد اور آئس کریم کی فروخت سے ہے۔ اسی طرح، جب آپ کے مقامی منڈی میں ٹماٹر کی سپلائی بڑھ جاتی ہے، تو اس کی قیمت گر جاتی ہے۔ جب مقامی فصل مارکیٹ میں پہنچنا شروع ہوتی ہے، تو ٹماٹر کی قیمت 40 روپے فی $\mathrm{kg}$ سے گر کر 4 روپے فی کلو یا اس سے بھی کم ہو جاتی ہے۔ اس طرح سپلائی کا تعلق قیمت سے ہے۔ ارتباط کا تجزیہ ایسے تعلقات کا منظم طریقے سے جائزہ لینے کا ایک ذریعہ ہے۔ یہ اس طرح کے سوالات سے نمٹتا ہے:
- کیا دو متغیرات کے درمیان کوئی تعلق ہے؟
- کیا ایک متغیر کی قدر بدلتی ہے تو دوسرے کی قدر بھی بدلتی ہے؟
- کیا دونوں متغیرات ایک ہی سمت میں حرکت کرتے ہیں؟
- تعلق کتنا مضبوط ہے؟
2. تعلقات کی اقسام
آئیے تعلقات کی مختلف اقسام پر نظر ڈالتے ہیں۔ کسی شے کی طلب کی مقدار اور اس کی قیمت میں حرکات کا تعلق طلب کے نظریے کا ایک لازمی حصہ ہے، جس کا آپ بارہویں جماعت میں مطالعہ کریں گے۔ زرعی پیداوار کی کمی کا تعلق کم بارش سے ہے۔ تعلق کی ایسی مثالوں کو سبب اور اثر کی تشریح دی جا سکتی ہے۔ دیگر محض اتفاق ہو سکتے ہیں۔ کسی پناہ گاہ میں نقل مکانی کرنے والے پرندوں کی آمد اور علاقے میں شرح پیدائش کے درمیان تعلق کو کوئی سبب و اثر والی تشریح نہیں دی جا سکتی۔ یہ تعلقات محض اتفاق ہیں۔ جوتوں کے سائز اور آپ کی جیب میں موجود رقم کا تعلق ایک اور ایسی ہی مثال ہے۔ یہاں تک کہ اگر تعلقات موجود ہوں بھی، تو ان کی وضاحت کرنا مشکل ہے۔
ایک اور مثال میں، کسی تیسرے متغیر کے دو متغیرات پر اثرات سے ان دو متغیرات کے درمیان ایک تعلق پیدا ہو سکتا ہے۔ آئس کریم کی تیز فروخت کا تعلق ڈوبنے سے ہونے والی اموات کی زیادہ تعداد سے ہو سکتا ہے۔ متاثرین آئس کریم کھانے کی وجہ سے نہیں ڈوبتے۔ بڑھتا ہوا درجہ حرارت آئس کریم کی تیز فروخت کا باعث بنتا ہے۔ مزید برآں، گرمی سے بچنے کے لیے بڑی تعداد میں لوگ تیراکی کے پولز میں جانے لگتے ہیں۔ اس سے ڈوبنے سے ہونے والی اموات کی تعداد میں اضافہ ہو سکتا ہے۔ اس طرح، درجہ حرارت آئس کریم کی فروخت اور ڈوبنے سے ہونے والی اموات کے درمیان اعلی ارتباط کی وجہ ہے۔
ارتباط کیا ناپتا ہے؟
ارتباط متغیرات کے درمیان تعلق کی سمت اور شدت کا مطالعہ اور پیمائش کرتا ہے۔ ارتباط ہم تغیر (covariation) ناپتا ہے، سببیت (causation) نہیں۔ ارتباط کو کبھی بھی سبب و اثر کے تعلق کی نشاندہی کرنے والا نہیں سمجھنا چاہیے۔ دو متغیرات $\mathrm{X}$ اور Y کے درمیان ارتباط کی موجودگی کا سادہ مطلب یہ ہے کہ جب ایک متغیر کی قدر ایک سمت میں بدلتی پائی جاتی ہے، تو دوسرے متغیر کی قدر بھی یا تو اسی سمت میں (یعنی مثبت تبدیلی) یا مخالف سمت میں (یعنی منفی تبدیلی) بدلتی پائی جاتی ہے، لیکن ایک واضح طریقے سے۔ سادگی کے لیے ہم یہاں فرض کرتے ہیں کہ ارتباط، اگر موجود ہے، خطی (linear) ہے، یعنی دونوں متغیرات کی نسبتی حرکت کو گراف پیپر پر ایک سیدھی لکیر کھینچ کر ظاہر کیا جا سکتا ہے۔
ارتباط کی اقسام
ارتباط کو عام طور پر منفی اور مثبت ارتباط میں درجہ بندی کیا جاتا ہے۔ ارتباط کو مثبت کہا جاتا ہے جب متغیرات ایک ہی سمت میں ایک ساتھ حرکت کرتے ہیں۔ جب آمدنی بڑھتی ہے، تو مصرف (consumption) بھی بڑھتا ہے۔ جب آمدنی گھٹتی ہے، تو مصرف بھی گھٹتا ہے۔ آئس کریم کی فروخت اور درجہ حرارت ایک ہی سمت میں حرکت کرتے ہیں۔ ارتباط منفی ہوتا ہے جب وہ مخالف سمتوں میں حرکت کرتے ہیں۔ جب سیبوں کی قیمت گرتی ہے تو اس کی طلب بڑھ جاتی ہے۔ جب قیمتیں بڑھتی ہیں تو اس کی طلب کم ہو جاتی ہے۔ جب آپ پڑھائی میں زیادہ وقت صرف کرتے ہیں، تو آپ کے فیل ہونے کے امکانات کم ہو جاتے ہیں۔ جب آپ اپنی پڑھائی میں کم گھنٹے صرف کرتے ہیں، تو کم نماز/گریڈ لینے کے امکانات بڑھ جاتے ہیں۔ یہ منفی ارتباط کی مثالیں ہیں۔ متغیرات مخالف سمت میں حرکت کرتے ہیں۔
3. ارتباط ناپنے کی تکنیکیں
ارتباط کے مطالعہ کے لیے استعمال ہونے والے تین اہم اوزار اسکیٹر ڈایاگرام (scatter diagrams)، کارل پیئرسن کا ارتباط کا عددی سر (coefficient of correlation) اور اسپئیرمین کا درجہ ارتباط (rank correlation) ہیں۔ ایک اسکیٹر ڈایاگرام بصری طور پر ارتباط کی نوعیت کو پیش کرتا ہے بغیر کوئی مخصوص عددی قدر دیے۔ دو متغیرات کے درمیان خطی تعلق کی عددی پیمائش کارل پیئرسن کے ارتباط کے عددی سر سے دی جاتی ہے۔ ایک تعلق کو خطی کہا جاتا ہے اگر اسے ایک سیدھی لکیر سے ظاہر کیا جا سکے۔ اسپئیرمین کا ارتباط کا عددی سر ان درجوں کے درمیان خطی ارتباط ناپتا ہے جو انفرادی اشیا کو ان کی صفات کے مطابق تفویض کیے جاتے ہیں۔ صفات وہ متغیرات ہیں جنہیں عددی طور پر نہیں ناپا جا سکتا جیسے لوگوں کی ذہانت، جسمانی ظاہری شکل، ایمانداری، وغیرہ۔
اسکیٹر ڈایاگرام
اسکیٹر ڈایاگرام تعلق کی شکل کا بصری طور پر جائزہ لینے کے لیے ایک مفید تکنیک ہے، بغیر کسی عددی قدر کا حساب لگائے۔ اس تکنیک میں، دو متغیرات کی قدریں گراف پیپر پر نقاط کے طور پر لگائی جاتی ہیں۔ اسکیٹر ڈایاگرام سے، تعلق کی نوعیت کا کافی اچھا اندازہ لگایا جا سکتا ہے۔ اسکیٹر ڈایاگرام میں بکھرے ہوئے نقاط کی قربت کا درجہ اور ان کی مجموعی سمت ہمیں تعلق کا جائزہ لینے کے قابل بناتی ہے۔ اگر تمام نقاط ایک لکیر پر واقع ہوں، تو ارتباط کامل (perfect) ہے اور اتحاد (unity) میں کہا جاتا ہے۔ اگر بکھرے ہوئے نقاط لکیر کے اردگرد وسیع پیمانے پر منتشر ہوں، تو ارتباط کم ہے۔ ارتباط کو خطی کہا جاتا ہے اگر بکھرے ہوئے نقاط کسی لکیر کے قریب یا لکیر پر واقع ہوں۔
شکل 6.1 سے شکل 6.5 تک پھیلے ہوئے اسکیٹر ڈایاگرام ہمیں دو متغیرات کے درمیان تعلق کا اندازہ دیتے ہیں۔ شکل 6.1 ایک اوپر اٹھتی ہوئی لکیر کے اردگرد بکھرے ہوئے نقاط دکھاتی ہے جو متغیرات کی ایک ہی سمت میں حرکت کی نشاندہی کرتی ہے۔ جب $\mathrm{X}$ بڑھے گا $\mathrm{Y}$ بھی بڑھے گا۔ یہ مثبت ارتباط ہے۔ شکل 6.2 میں نقاط نیچے کی طرف ڈھلوان لکیر کے اردگرد بکھرے ہوئے پائے جاتے ہیں۔ اس بار متغیرات مخالف سمتوں میں حرکت کرتے ہیں۔ جب $\mathrm{X}$ بڑھے گا $\mathrm{Y}$ گرے گا اور اس کے برعکس۔ یہ منفی ارتباط ہے۔ شکل 6.3 میں کوئی اوپر اٹھتی ہوئی یا نیچے ڈھلوان لکیر نہیں ہے جس کے اردگرد نقاط بکھرے ہوں۔ یہ عدم ارتباط (no correlation) کی ایک مثال ہے۔ شکل 6.4 اور شکل 6.5 میں، نقاط اب کسی اوپر اٹھتی ہوئی یا نیچے گرتی ہوئی لکیر کے اردگرد منتشر نہیں ہیں۔ نقاط خود لکیروں پر ہیں۔ اسے بالترتیب کامل مثبت ارتباط اور کامل منفی ارتباط کہا جاتا ہے۔
سرگرمی
- اپنی کلاس کے طلباء کی قد، وزن اور کسی دو مضامین میں کلاس $X$ میں حاصل کردہ نمازوں کے اعداد و شمار جمع کریں۔ ان متغیرات کے اسکیٹر ڈایاگرام ایک وقت میں دو لے کر بنائیں۔ آپ کو کس قسم کا تعلق نظر آتا ہے؟
اسکیٹر ڈایاگرام کا باریک بینی سے مشاہدہ تعلق کی نوعیت اور شدت کا اندازہ دیتا ہے۔
کارل پیئرسن کا ارتباط کا عددی سر
اسے پیداواری لمحہ ارتباط کا عددی سر (product moment correlation coefficient) یا سادہ ارتباط کا عددی سر (simple correlation coefficient) بھی کہا جاتا ہے۔ یہ دو متغیرات $\mathrm{X}$ اور $Y$ کے درمیان خطی تعلق کے درجے کی ایک درست عددی قدر دیتا ہے۔
یہ نوٹ کرنا اہم ہے کہ کارل پیئرسن کے ارتباط کے عددی سر کا استعمال صرف اس وقت کیا جانا چاہیے جب متغیرات کے درمیان خطی تعلق ہو۔ جب $\mathrm{X}$ اور $\mathrm{Y}$ کے درمیان غیر خطی (non-linear) تعلق ہو، تو کارل پیئرسن کے ارتباط کے عددی سر کا حساب لگانا گمراہ کن ہو سکتا ہے۔ اس طرح، اگر حقیقی تعلق خطی قسم کا ہے جیسا کہ شکل 6.1، $6.2,6.4$ اور 6.5 میں اسکیٹر ڈایاگرام دکھاتے ہیں، تو کارل پیئرسن کے ارتباط کے عددی سر کا حساب لگایا جانا چاہیے اور یہ ہمیں متغیرات کے درمیان تعلق کی سمت اور شدت بتائے گا۔ لیکن اگر حقیقی تعلق اس قسم کا ہے جیسا کہ شکل 6.6 یا 6.7 میں اسکیٹر ڈایاگرام دکھاتے ہیں، تو اس کا مطلب ہے کہ $\mathrm{X}$ اور $\mathrm{Y}$ کے درمیان غیر خطی تعلق ہے اور ہمیں کارل پیئرسن کے ارتباط کے عددی سر کو استعمال کرنے کی کوشش نہیں کرنی چاہیے۔
لہٰذا، کارل پیئرسن کے ارتباط کے عددی سر کا حساب لگانے سے پہلے متغیرات کے درمیان تعلق کا اسکیٹر ڈایاگرام پہلے دیکھنا مناسب ہے۔
فرض کریں $X _{1}, X _{2}, \ldots, X _{N}$، $X$ کی $N$ قدریں ہیں اور $\mathrm{Y} _{1}, \mathrm{Y} _{2}, \ldots, \mathrm{Y} _{\mathrm{N}}$، Y کی متعلقہ قدریں ہیں۔ آئندہ پیشکشوں میں، سادگی کے لیے اکائی کو ظاہر کرنے والے سبسکرپٹس (subscripts) حذف کر دیے گئے ہیں۔ $\mathrm{X}$ اور $\mathrm{Y}$ کے حسابی اوسط (arithmetic means) اس طرح تعریف کیے جاتے ہیں:
$$ \overline{\mathrm{X}}=\frac{\sum \mathrm{X}}{\mathrm{N}} ; \quad \overline{\mathrm{Y}}=\frac{\sum \mathrm{Y}}{\mathrm{N}} $$
اور ان کے تغیرات (variances) حسب ذیل ہیں:
$$ \sigma^{2} x=\frac{\sum(X-\bar{X})^{2}}{N}=\frac{\sum X^{2}}{N}-\bar{X}^{2} $$
اور $$\quad \sigma^{2} \mathrm{y}=\frac{\sum(\mathrm{Y}-\overline{\mathrm{Y}})^{2}}{\mathrm{~N}}=\frac{\sum \mathrm{Y}^{2}}{\mathrm{~N}}-\overline{\mathrm{Y}}^{2}$$
$\mathrm{X}$ اور $\mathrm{Y}$ کے معیاری انحراف (standard deviations) بالترتیب ان کے تغیرات کے مثبت مربع جذر (positive square roots) ہیں۔ $\mathrm{X}$ اور $\mathrm{Y}$ کا ہم تغیر (covariance) اس طرح تعریف کیا جاتا ہے:
$\operatorname{Cov}(\mathrm{X}, \mathrm{Y})=\frac{\sum(\mathrm{X}-\overline{\mathrm{X}})(\mathrm{Y}-\overline{\mathrm{Y}})}{\mathrm{N}}=\frac{\sum \mathrm{xy}}{\mathrm{N}}$
جہاں $\mathrm{x}=\mathrm{X}-\overline{\mathrm{X}}$ اور $\mathrm{y}=\mathrm{Y}-\overline{\mathrm{Y}}$ بالترتیب $\mathrm{X}$ اور $\mathrm{Y}$ کی $i^{\text {th }}$ وی قدر کے ان کی اوسط قدروں سے انحرافات (deviations) ہیں۔
$\mathrm{X}$ اور $\mathrm{Y}$ کے درمیان ہم تغیر کا نشان (sign) ارتباط کے عددی سر کا نشان طے کرتا ہے۔ معیاری انحراف ہمیشہ مثبت ہوتے ہیں۔ اگر ہم تغیر صفر ہے، تو ارتباط کا عددی سر ہمیشہ صفر ہوتا ہے۔ پیداواری لمحہ ارتباط یا کارل پیئرسن کی ارتباط کی پیمائش اس طرح دی جاتی ہے:
$$ \begin{equation*} \mathrm{r}={ }^{\Sigma \mathrm{xy}} / N \sigma _{\mathrm{x}} \sigma _{\mathrm{y}} \tag{1} \end{equation*} $$
یا
$$ \begin{equation*} \mathrm{r}=\frac{\sum(\mathrm{X}-\overline{\mathrm{X}})(\mathrm{Y}-\overline{\mathrm{Y}})}{\sqrt{\Sigma(\mathrm{X}-\overline{\mathrm{X}})^{2}} \sqrt{\Sigma(\mathrm{Y}-\overline{\mathrm{Y}})^{2}}} \tag{2} \end{equation*} $$
یا
$$ \begin{equation*} r=\frac{\frac{\sum X Y-\left(\sum X\right)\left(\sum Y\right)}{N}}{\sqrt{\sum X^{2}-\frac{\left(\sum X\right)^{2}}{N}} \sqrt{\sum Y^{2}-\frac{\left(\sum Y\right)^{2}}{N}}}\tag{3} \end{equation*} $$
یا
$$ \begin{equation*} r=\frac{N \sum XY-(\sum X)(\sum Y)}{\sqrt{N \sum X^2-(\sum X)^2} \cdot \sqrt{N \sum Y^2-(\sum Y)^2}}\tag{4} \end{equation*} $$
ارتباط کے عددی سر کی خصوصیات
آئیے اب ارتباط کے عددی سر کی خصوصیات پر بات کرتے ہیں:
- $r$ کی کوئی اکائی نہیں ہے۔ یہ ایک خالص عدد ہے۔ اس کا مطلب ہے کہ پیمائش کی اکائیاں $r$ کا حصہ نہیں ہیں۔ مثال کے طور پر، فٹ میں قد اور کلوگرام میں وزن کے درمیان $r$، فرض کریں، 0.7 ہو سکتا ہے۔
- $r$ کی منفی قدر الٹے تعلق (inverse relation) کی نشاندہی کرتی ہے۔ ایک متغیر میں تبدیلی دوسرے متغیر میں تبدیلی کے ساتھ مخالف سمت میں وابستہ ہوتی ہے۔ جب کسی شے کی قیمت بڑھتی ہے، تو اس کی طلب گرتی ہے۔ جب سود کی شرح بڑھتی ہے تو فنڈز کی طلب بھی گرتی ہے۔ ایسا اس لیے ہوتا ہے کہ اب فنڈز مہنگے ہو گئے ہیں۔
- اگر $r$ مثبت ہے تو دونوں متغیرات ایک ہی سمت میں حرکت کرتے ہیں۔ جب چائے کے متبادل کافی کی قیمت بڑھتی ہے تو چائے کی طلب بھی بڑھ جاتی ہے۔ آبپاشی کی سہولیات میں بہتری زیادہ پیداوار کے ساتھ وابستہ ہے۔ جب درجہ حرارت بڑھتا ہے تو آئس کریم کی فروخت تیز ہو جاتی ہے۔
- ارتباط کے عددی سر کی قدر منفی ایک اور مثبت ایک کے درمیان ہوتی ہے، $-1 \leq r \leq 1$۔ اگر کسی مشق میں، $r$ کی قدر اس حد سے باہر ہو تو یہ حساب میں غلطی کی نشاندہی کرتی ہے۔
- $r$ کا حجم مبدا کی تبدیلی (change of origin) اور پیمانے کی تبدیلی (change of scale) سے متاثر نہیں ہوتا۔ دو متغیرات $\mathrm{X}$ اور $\mathrm{Y}$ دیے گئے ہیں، آئیے دو نئے متغیرات تعریف کرتے ہیں:
$\mathrm{U}=\frac{\mathrm{X}-\mathrm{A}}{\mathrm{B}} ; \mathrm{V}=\frac{\mathrm{Y}-\mathrm{C}}{\mathrm{D}}$
جہاں $A$ اور $C$ بالترتیب $\mathrm{X}$ اور $\mathrm{Y}$ کے فرضی اوسط (assumed means) ہیں۔ $\mathrm{B}$ اور $\mathrm{D}$ مشترک عوامل ہیں اور ایک ہی نشان کے ہیں۔ پھر
$r _{x y}=r _{u v}$
یہ خصوصیت ارتباط کے عددی سر کے حساب کو انتہائی سادہ طریقے سے، جیسے قدم انحراف طریقہ (step deviation method) میں، کرنے کے لیے استعمال ہوتی ہے۔
- اگر $r=0$ تو دونوں متغیرات غیر مرتبط (uncorrelated) ہیں۔ ان کے درمیان کوئی خطی تعلق نہیں ہے۔ تاہم دیگر قسم کے تعلقات موجود ہو سکتے ہیں۔
- اگر $r=1$ یا $r=-1$ تو ارتباط کامل ہے اور عین خطی تعلق موجود ہے۔
- $r$ کی اعلی قدر مضبوط خطی تعلق کی نشاندہی کرتی ہے۔ اس کی قدر اعلی کہی جاتی ہے جب یہ +1 یا -1 کے قریب ہو۔
- $r$ کی کم قدر (صفر کے قریب) کمزور خطی تعلق کی نشاندہی کرتی ہے۔ لیکن غیر خطی تعلق موجود ہو سکتا ہے۔
جیسا کہ آپ نے باب 1 میں پڑھا ہے، شماریاتی طریقے عام فہم کا متبادل نہیں ہیں۔ یہاں، ایک اور مثال ہے، جو ارتباط کے حساب اور تشریح سے پہلے اعداد و شمار کو صحیح طریقے سے سمجھنے کی ضرورت کو اجاگر کرتی ہے۔ ایک وبا کچھ گاؤں میں پھیلتی ہے اور حکومت متاثرہ گاؤں میں ڈاکٹروں کی ایک ٹیم بھیجتی ہے۔ اموات کی تعداد اور گاؤں میں بھیجے گئے ڈاکٹروں کی تعداد کے درمیان ارتباط مثبت پایا جاتا ہے۔ عام طور پر، ڈاکٹروں کی طرف سے فراہم کردہ صحت کی دیکھ بھال کی سہولیات سے اموات کی تعداد میں کمی متوقع ہوتی ہے جو منفی ارتباط دکھاتی ہے۔ یہ دوسری وجوہات کی بنا پر ہوا۔ اعداد و شمار ایک مخصوص وقت کی مدت سے متعلق ہیں۔ رپورٹ کی گئی بہت سی اموات لاعلاج کیسز ہو سکتی ہیں جہاں ڈاکٹر بہت کم کر سکتے تھے۔ مزید برآں، ڈاکٹروں کی موجودگی کا فائدہ کچھ وقت کے بعد ہی نظر آتا ہے۔ یہ بھی ممکن ہے کہ رپورٹ کی گئی اموات وبا کی وجہ سے نہ ہوں۔ ایک سونامی اچانک ریاست پر حملہ آور ہوتی ہے اور ہلاکتوں کی تعداد بڑھ جاتی ہے۔
آئیے کسانوں کے اسکولی تعلیم کے سالوں اور سالانہ فی ایکڑ پیداوار کے درمیان تعلق کا جائزہ لے کر $r$ کے حساب کو واضح کرتے ہیں۔
مثال 1
| کسانوں کے اسکولی تعلیم کے سالوں کی تعداد | سالانہ فی ایکڑ پیداوار ‘ہزار روپے میں (Rs) |
|---|---|
| 0 | 4 |
| 2 | 4 |
| 4 | 6 |
| 6 | 10 |
| 8 | 10 |
| 10 | 8 |
| 12 | 7 |
فارمولا 1 کو $\sum \mathrm{Xy}, \sigma _{\mathrm{x}}, \sigma _{\mathrm{y}}$ کی قدر کی ضرورت ہے۔
جدول 6.1 سے ہمیں ملتا ہے،
$$ \begin{aligned} & \sum \mathrm{xy}=42, \\ & \sigma _{\mathrm{x}}=\sqrt{\frac{\sum(\mathrm{X}-\overline{\mathrm{X}})^{2}}{\mathrm{~N}}}=\sqrt{\frac{112}{7}}, \\ & \sigma _{\mathrm{y}}=\sqrt{\frac{\sum(\mathrm{Y}-\overline{\mathrm{Y}})^{2}}{\mathrm{~N}}}=\sqrt{\frac{38}{7}} \end{aligned} $$
ان قدروں کو فارمولا (1) میں رکھنے پر
$$ \mathrm{r}=\frac{42}{7 \sqrt{\frac{112}{7}} \sqrt{\frac{38}{7}}}=0.644 $$
یہی قدر فارمولا (2) سے بھی حاصل کی جا سکتی ہے۔
$$ \begin{gather*} \mathrm{r}=\frac{\sum(\mathrm{X}-\overline{\mathrm{X}})(\mathrm{Y}-\overline{\mathrm{Y}})}{\sqrt{\sum(\mathrm{X}-\overline{\mathrm{X}})^{2}} \sqrt{\sum(\mathrm{Y}-\overline{\mathrm{Y}})^{2}}} \tag{2}\\ \mathrm{r}=\frac{42}{\sqrt{112} \sqrt{38}}=0.644 \end{gather*} $$
اس طرح، کسانوں کی تعلیم کے سال اور سالانہ فی ایکڑ پیداوار مثبت طور پر مرتبط ہیں۔ $r$ کی قدر بھی بڑی ہے۔ اس کا مطلب ہے کہ کسان تعلیم میں جتنے زیادہ سال لگائیں گے، فی ایکڑ پیداوار اتنی ہی زیادہ ہوگی۔ یہ کسانوں کی تعلیم کی اہمیت کو واضح کرتا ہے۔
فارمولا (3) استعمال کرنے کے لیے
جدول 6.1 کسانوں کے اسکولی تعلیم کے سالوں اور سالانہ پیداوار کے درمیان r کا حساب
| تعلیم کے سال (X) | $(X-\bar{X})$ | $(X-\bar{X})^{2}$ | سالانہ فی ایکڑ پیداوار ‘ہزار روپے میں (Y) | $(Y-\bar{Y})$ | $(Y-\bar{Y})^{2}$ | $(X-\bar{X})(Y-\bar{Y})$ |
|---|---|---|---|---|---|---|
| 0 | -6 | 36 | 4 | -3 | 9 | 18 |
| 2 | -4 | 16 | 4 | -3 | 9 | 12 |
| 4 | -2 | 4 | 6 | -1 | 1 | 2 |
| 6 | 0 | 0 | 10 | 3 | 9 | 0 |
| 8 | 2 | 4 | 10 | 3 | 9 | 6 |
| 10 | 4 | 16 | 8 | 1 | 1 | 4 |
| 12 | 6 | 36 | 7 | 0 | 0 | 0 |
| $\Sigma X=42$ | $\sum (X-\overline{\mathrm{X}})^{2}=112$ | $\Sigma Y=49$ | $\Sigma(Y-\bar{Y})^{2}=38$ | $\Sigma(X-\bar{X})(Y-\bar{Y})=42$ |
$$ \begin{equation*} r=\frac{\sum X Y-\frac{(\Sigma X)\left(\sum Y\right)}{N}}{\sqrt{\Sigma X^{2}-\frac{(\Sigma X)^{2}}{N}} \sqrt{\Sigma \mathrm{Y}^{2}-\frac{(\Sigma Y)^{2}}{N}}}\tag{3} \end{equation*} $$
مندرجہ ذیل عبارات کی قدریں حساب کرنی ہوں گی یعنی
$\Sigma \mathrm{XY}, \Sigma \mathrm{X}^{2}, \Sigma \mathrm{Y}^{2}$۔
اب $r$ کی قدر حاصل کرنے کے لیے فارمولا (3) لگائیں۔
آئیے $r$ کی مختلف قدروں کی تشریح جان لیں۔ انگریزی اور شماریات میں حاصل کردہ نمازوں کے درمیان ارتباط کا عددی سر، فرض کریں، 0.1 ہے۔ اس کا مطلب ہے کہ اگرچہ دونوں مضامین میں حاصل کردہ نمازیں مثبت طور پر مرتبط ہیں، لیکن تعلق کی طاقت کمزور ہے۔ انگریزی میں زیادہ نماز حاصل کرنے والے طلباء شماریات میں نسبتاً کم نماز حاصل کر رہے ہوں گے۔ اگر $r$ کی قدر، فرض کریں، 0.9 ہوتی، تو انگریزی میں زیادہ نماز حاصل کرنے والے طلباء لازمی طور پر شماریات میں زیادہ نماز حاصل کریں گے۔
منفی ارتباط کی ایک مثال مقامی منڈی میں سبزیوں کی آمد اور سبزیوں کی قیمت کے درمیان تعلق ہے۔ اگر $r$ -0.9 ہے، تو مقامی منڈی میں سبزیوں کی سپلائی سبزیوں کی کم قیمت کے ساتھ ہوگی۔ اگر یہ -0.1 ہوتی، تو زیادہ سبزیوں کی سپلائی کم قیمت کے ساتھ ہوگی، لیکن اتنی کم نہیں جتنی قیمت اس وقت ہوتی جب $r$ -0.9 ہو۔ قیمت میں گراوٹ کی حد $r$ کی مطلق قدر (absolute value) پر منحصر ہے۔ اگر یہ صفر ہوتی، تو مارکیٹ میں بڑی سپلائی کے باوجود بھی قیمت میں کوئی گراوٹ نہیں ہوتی۔ یہ امکان بھی ہے اگر سپلائی میں اضافے کا خیال ایک اچھے ٹرانسپورٹ نیٹ ورک کے ذریعے رکھا جاتا ہے جو اسے دیگر مارکیٹوں میں منتقل کر دیتا ہے۔
سرگرمی
- مندرجہ ذیل جدول دیکھیں۔ موجودہ قیمت پر قومی آمدنی کی سالانہ نمو اور جی ڈی پی کے فیصد کے طور پر مجموعی ملکی بچت (Gross Domestic Saving) کے درمیان $r$ کا حساب لگائیں۔
ارتباط کے عددی سر کے حساب کے لیے قدم انحراف طریقہ۔
جب متغیرات کی قدریں بڑی ہوں، تو حساب کا بوجھ $r$ کی ایک خصوصیت استعمال کر کے کافی حد تک کم کیا جا سکتا ہے۔ یہ ہے کہ $r$ مبدا اور پیمانے کی تبدیلی سے آزاد ہے۔ اسے قدم انحراف طریقہ (step deviation method) بھی کہا جاتا ہے۔ اس میں متغیرات $\mathrm{X}$ اور $\mathrm{Y}$ کا درج ذیل طور پر تبدیلی شامل ہے:
جدول 6.2
| سال | قومی آمدنی کی سالانہ نمو |
جی ڈی پی کے فیصد کے طور پر مجموعی ملکی بچت |
|---|---|---|
| 1992-93 | 14 | 24 |
| 1993-94 | 17 | 23 |
| 1994-95 | 18 | 26 |
| 1995-96 | 17 | 27 |
| 1996-97 | 16 | 25 |
| 1997-98 | 12 | 25 |
| 1998-99 | 16 | 23 |
| 1999-00 | 11 | 25 |
| 2000-01 | 8 | 24 |
| 2001-02 | 10 | 23 |
ماخذ: اقتصادی جائزہ، (2004-05) صفحہ 8،9
$\mathrm{U}=\frac{\mathrm{X}-\mathrm{A}}{\mathrm{B}} ; \mathrm{V}=\frac{\mathrm{Y}-\mathrm{C}}{\mathrm{D}}$
جہاں $A$ اور $B$ فرضی اوسط ہیں، $h$ اور $\mathrm{k}$ مشترک عوامل ہیں اور ایک ہی نشان رکھتے ہیں۔
پھر $\mathrm{r} _{\mathrm{uv}}=\mathrm{r} _{\mathrm{XY}}$
اسے قیمت کے اشاریہ (price index) اور زر رسد (money supply) کے درمیان ارتباط کے تجزیہ کے مشق سے واضح کیا جا سکتا ہے۔
مثال 2
قیمت کا اشاریہ $(\mathrm{X})$ $ 120 \quad 150 \quad 190 \quad 220 \quad 230$
زر رسد روپے کروڑوں میں $(\mathrm{Y})$ $\quad 1800 \quad 2000 \quad 2500 \quad 2700 \quad 3000$
سادگی، قدم انحراف طریقہ استعمال کرتے ہوئے، ذیل میں واضح کی گئی ہے۔ فرض کریں $\mathrm{A}=100 ; \mathrm{h}=10 ; \mathrm{B}=1700$ اور $\mathrm{k}=100$
تبدیل شدہ متغیرات کا جدول حسب ذیل ہے:
قدم انحراف طریقہ استعمال کرتے ہوئے قیمت کے اشاریہ اور زر رسد کے درمیان $r$ کا حساب
جدول 6.3
| $U$ | $V$ | |||
|---|---|---|---|---|
| $\left(\frac{\mathrm{x}-100}{10}\right)$ | $\left(\frac{\mathrm{y}-1700}{100}\right)$ | $U^{2}$ | $V^{2}$ | $U V$ |
| 2 | 1 | 4 | 1 | 2 |
| 5 | 3 | 25 | 9 | 15 |
| 9 | 8 | 81 | 64 | 72 |
| 12 | 10 | 144 | 100 | 120 |
| 13 | 13 | 169 | 169 | 169 |
$\Sigma \mathrm{U}=41 ; \Sigma \mathrm{U}=35 ; \Sigma \mathrm{U}^{2}=423 ;$ $\Sigma \mathrm{V}^{2}=343 ; \Sigma \mathrm{UV}=378$
ان قدروں کو فارمولا (3) میں رکھنے پر
$$ \begin{aligned} & \mathrm{r}=\frac{\Sigma \mathrm{UV}-\frac{(\Sigma \mathrm{U})(\Sigma \mathrm{U})}{\mathrm{N}}}{\sqrt{\Sigma \mathrm{U}^{2}-\frac{(\Sigma \mathrm{U})^{2}}{\mathrm{~N}}} \sqrt{\Sigma \mathrm{V}^{2}-\frac{(\Sigma \mathrm{V})^{2}}{\mathrm{~N}}}} …(3) \end{aligned} $$
$$=\frac{378-\frac{41 \times 35}{5}}{\sqrt{423-\frac{(41)^2}{5}}\sqrt{343-\frac{(35)^2}{5}}}$$
$$ \begin{aligned} & =0.98 \end{aligned} $$
قیمت کے اشاریہ اور زر رسد کے درمیان مضبوط مثبت ارتباط مالیاتی پالیسی (monetary policy) کی ایک اہم بنیاد ہے۔ جب زر رسد بڑھتی ہے تو قیمت کا اشاریہ بھی بڑھتا ہے۔
سرگرمی
- ہندوستان کی آبادی اور قومی آمدنی سے متعلق اعداد و شمار کا استعمال کرتے ہوئے، قدم انحراف طریقہ کا استعمال کرتے ہوئے ان کے درمیان ارتباط کا حساب لگائیں۔
اسپئیرمین کا درجہ ارتباط
اسپئیرمین کا درجہ ارتباط برطانوی ماہر نفسیات C.E. Spearman نے تیار کیا تھا۔ اس کا استعمال درج ذیل حالات میں کیا جاتا ہے:
- فرض کریں ہم ایک دور دراز گاؤں کے طلباء کی قد اور وزن کے درمیان ارتباط کا تخمینہ لگانے کی کوشش کر رہے ہیں جہاں نہ تو ناپنے والی چھڑیاں (measuring rods) ہیں اور نہ ہی تولنے والی مشینیں (weighing machines) دستیاب ہیں۔ ایسی صورت حال میں، ہم قد یا وزن نہیں ناپ سکتے، لیکن ہم یقینی طور پر طلباء کو وزن اور قد کے مطابق درجہ دے سکتے ہیں۔ پھر ان درجوں کو اسپئیرمین کے درجہ ارتباط کے عددی سر کے حساب کے لیے استعمال کیا جا سکتا ہے۔
- فرض کریں ہم انصاف، ایمانداری یا خوبصورتی جیسی چیزوں سے نمٹ رہے ہیں۔ انہیں اسی طرح نہیں ناپا جا سکتا جیسے ہم آمدنی، وزن یا قد ناپتے ہیں۔ زیادہ سے زیادہ، ان چیزوں کو نسبتاً ناپا جا سکتا ہے، مثال کے طور پر، ہم لوگوں کو خوبصورتی کے مطابق درجہ دے سکتے ہیں (کچھ لوگ بحث کر سکتے ہیں کہ یہ بھی ممکن نہیں ہے کیونکہ خوبصورتی کے معیارات اور معیارات شخص سے شخص اور ثقافت سے ثقافت میں مختلف ہو سکتے ہیں)۔ اگر ہم متغیرات کے درمیان تعلق معلوم کرنا چاہتے ہیں، جن میں سے کم از کم ایک اس قسم کا ہے، تو اسپئیرمین کے درجہ ارتباط کے عددی سر کا استعمال کیا جانا چاہیے۔
- اسپئیرمین کے درجہ ارتباط کے عددی سر کا استعمال کچھ معاملات میں کیا جا سکتا ہے جہاں ایک ایسا تعلق ہے جس کی سمت واضح ہے لیکن جو غیر خطی ہے جیسا کہ اس وقت دکھایا جاتا ہے جب اسکیٹر ڈایاگرام شکل 6.6 اور 6.7 میں دکھائی گئی قسم کے