باب 06 ارتباط

1. تعارف

پچھلے ابواب میں آپ نے سیکھا ہے کہ اعداد و شمار کے انبار سے خلاصہ اقدامات کیسے بنائے جاتے ہیں اور ایک جیسی متغیرات میں تبدیلیاں کیسے ہوتی ہیں۔ اب آپ سیکھیں گے کہ دو متغیرات کے درمیان تعلق کا جائزہ کیسے لیا جاتا ہے۔ جیسے جیسے گرمیوں کی گرمی بڑھتی ہے، پہاڑی اسٹیشنوں پر زیادہ سے زیادہ زائرین کا ہجوم ہو جاتا ہے۔ آئس کریم کی فروخت میں تیزی آ جاتی ہے۔ اس طرح، درجہ حرارت کا تعلق زائرین کی تعداد اور آئس کریم کی فروخت سے ہے۔ اسی طرح، جب آپ کے مقامی منڈی میں ٹماٹر کی سپلائی بڑھتی ہے تو اس کی قیمت گر جاتی ہے۔ جب مقامی فصل مارکیٹ میں پہنچنا شروع ہوتی ہے تو ٹماٹر کی قیمت 40 روپے فی $\mathrm{kg}$ سے گر کر 4 روپے فی کلو یا اس سے بھی کم ہو جاتی ہے۔ اس طرح سپلائی کا تعلق قیمت سے ہے۔ ارتباطی تجزیہ ایسے تعلقات کا منظم طریقے سے جائزہ لینے کا ایک ذریعہ ہے۔ یہ ان جیسے سوالات سے نمٹتا ہے:

  • کیا دو متغیرات کے درمیان کوئی تعلق ہے؟
  • اگر ایک متغیر کی قیمت بدلتی ہے، تو کیا دوسرے کی قیمت بھی بدلتی ہے؟
  • کیا دونوں متغیرات ایک ہی سمت میں حرکت کرتے ہیں؟
  • تعلق کتنا مضبوط ہے؟

2. تعلقات کی اقسام

آئیے تعلقات کی مختلف اقسام پر نظر ڈالتے ہیں۔ کسی شے کی طلب کی مقدار اور اس کی قیمت میں حرکات کا تعلق طلب کے نظریے کا ایک لازمی حصہ ہے، جس کا آپ بارہویں جماعت میں مطالعہ کریں گے۔ زرعی پیداوار کی کمی کا تعلق کم بارش سے ہے۔ تعلق کی ایسی مثالوں کو سبب اور اثر کی تشریح دی جا سکتی ہے۔ دیگر محض اتفاق ہو سکتے ہیں۔ کسی پناہ گاہ میں نقل مکانی کرنے والے پرندوں کی آمد اور مقامی علاقے میں شرح پیدائش کے درمیان تعلق کو کوئی سبب و اثر والی تشریح نہیں دی جا سکتی۔ یہ تعلقات محض اتفاق ہیں۔ جوتوں کے سائز اور آپ کی جیب میں موجود رقم کا تعلق ایک اور ایسی ہی مثال ہے۔ یہاں تک کہ اگر تعلقات موجود بھی ہوں، تو ان کی وضاحت کرنا مشکل ہے۔

ایک اور مثال میں، کسی تیسرے متغیر کے دو متغیرات پر اثرات سے ان دو متغیرات کے درمیان ایک تعلق پیدا ہو سکتا ہے۔ آئس کریم کی تیز فروخت کا تعلق ڈوبنے سے ہونے والی اموات کی زیادہ تعداد سے ہو سکتا ہے۔ متاثرین آئس کریم کھانے کی وجہ سے نہیں ڈوبتے۔ بڑھتا ہوا درجہ حرارت آئس کریم کی تیز فروخت کا باعث بنتا ہے۔ مزید برآں، گرمی سے بچنے کے لیے زیادہ تعداد میں لوگ تیراکی کے پولز میں جانا شروع کر دیتے ہیں۔ اس سے ڈوبنے سے ہونے والی اموات کی تعداد میں اضافہ ہو سکتا ہے۔ اس طرح، درجہ حرارت آئس کریم کی فروخت اور ڈوبنے سے ہونے والی اموات کے درمیان اعلیٰ ارتباط کی وجہ ہے۔

ارتباط کیا ناپتا ہے؟

تباط کا مطالعہ اور پیمائش متغیرات کے درمیان تعلق کی سمت اور شدت کا ہوتا ہے۔ ارتباط ہم تغیر (covariation) ناپتا ہے، سببیت (causation) نہیں۔ ارتباط کو کبھی بھی سبب و اثر کے تعلق کی نشاندہی کرنے والا نہیں سمجھنا چاہیے۔ دو متغیرات $\mathrm{X}$ اور Y کے درمیان ارتباط کی موجودگی کا سادہ مطلب یہ ہے کہ جب ایک متغیر کی قیمت ایک سمت میں بدلتی پائی جاتی ہے، تو دوسرے متغیر کی قیمت بھی یا تو اسی سمت میں (یعنی مثبت تبدیلی) یا مخالف سمت میں (یعنی منفی تبدیلی) بدلتی پائی جاتی ہے، لیکن ایک واضح طریقے سے۔ سادگی کے لیے ہم یہاں فرض کرتے ہیں کہ ارتباط، اگر موجود ہے، خطی (linear) ہے، یعنی دونوں متغیرات کی نسبتی حرکت کو گراف پیپر پر ایک سیدھی لکیر کھینچ کر ظاہر کیا جا سکتا ہے۔

ارتباط کی اقسام

تباط کو عام طور پر منفی اور مثبت ارتباط میں تقسیم کیا جاتا ہے۔ ارتباط کو مثبت کہا جاتا ہے جب متغیرات ایک ہی سمت میں ایک ساتھ حرکت کرتے ہیں۔ جب آمدنی بڑھتی ہے، تو مصرف (consumption) بھی بڑھتا ہے۔ جب آمدنی گھٹتی ہے، تو مصرف بھی گھٹتا ہے۔ آئس کریم کی فروخت اور درجہ حرارت ایک ہی سمت میں حرکت کرتے ہیں۔ ارتباط منفی ہوتا ہے جب وہ مخالف سمتوں میں حرکت کرتے ہیں۔ جب سیبوں کی قیمت گرتی ہے تو اس کی طلب بڑھ جاتی ہے۔ جب قیمتیں بڑھتی ہیں تو اس کی طلب کم ہو جاتی ہے۔ جب آپ پڑھائی میں زیادہ وقت صرف کرتے ہیں، تو آپ کے فیل ہونے کے امکانات کم ہو جاتے ہیں۔ جب آپ اپنی پڑھائی میں کم گھنٹے صرف کرتے ہیں، تو کم نماز/گریڈ لینے کے امکانات بڑھ جاتے ہیں۔ یہ منفی ارتباط کی مثالیں ہیں۔ متغیرات مخالف سمت میں حرکت کرتے ہیں۔

3. ارتباط ناپنے کی تکنیکیں

تباط کے مطالعے کے لیے استعمال ہونے والے تین اہم اوزار منتشر خاکے (scatter diagrams)، کارل پیئرسن کا ارتباطی سر (coefficient of correlation) اور اسپیرمین کا درجہ ارتباط (rank correlation) ہیں۔ ایک منتشر خاکہ بصری طور پر ارتباط کی نوعیت پیش کرتا ہے بغیر کوئی مخصوص عددی قدر دیے۔ دو متغیرات کے درمیان خطی تعلق کی عددی پیمائش کارل پیئرسن کے ارتباطی سر سے دی جاتی ہے۔ ایک تعلق کو خطی کہا جاتا ہے اگر اسے ایک سیدھی لکیر سے ظاہر کیا جا سکے۔ اسپیرمین کا ارتباطی سر ان درجوں کے درمیان خطی ارتباط ناپتا ہے جو انفرادی اشیاء کو ان کی صفات کے مطابق تفویض کیے جاتے ہیں۔ صفات وہ متغیرات ہیں جنہیں عددی طور پر نہیں ناپا جا سکتا جیسے لوگوں کی ذہانت، جسمانی ظاہری شکل، ایمانداری، وغیرہ۔

منتشر خاکہ (Scatter Diagram)

ایک منتشر خاکہ تعلق کی شکل کا بصری طور پر جائزہ لینے کے لیے ایک مفید تکنیک ہے، بغیر کسی عددی قدر کا حساب لگائے۔ اس تکنیک میں، دو متغیرات کی قدروں کو گراف پیپر پر نقاط کے طور پر نشان زد کیا جاتا ہے۔ ایک منتشر خاکے سے، تعلق کی نوعیت کا کافی اچھا اندازہ لگایا جا سکتا ہے۔ ایک منتشر خاکے میں منتشر نقاط کی قربت کا درجہ اور ان کی مجموعی سمت ہمیں تعلق کا جائزہ لینے کے قابل بناتی ہے۔ اگر تمام نقاط ایک لکیر پر واقع ہوں، تو ارتباط کامل (perfect) ہے اور اسے وحدت (unity) میں ہونے کے طور پر کہا جاتا ہے۔ اگر منتشر نقاط لکیر کے ارد گرد وسیع پیمانے پر منتشر ہوں، تو ارتباط کم ہے۔ ارتباط کو خطی کہا جاتا ہے اگر منتشر نقاط کسی لکیر کے قریب یا اس پر واقع ہوں۔

شکل 6.1 سے شکل 6.5 تک پھیلے ہوئے منتشر خاکے ہمیں دو متغیرات کے درمیان تعلق کا ایک خیال دیتے ہیں۔ شکل 6.1 ایک اوپر اٹھتی ہوئی لکیر کے ارد گرد منتشر نقاط دکھاتی ہے جو متغیرات کی ایک ہی سمت میں حرکت کی نشاندہی کرتی ہے۔ جب $\mathrm{X}$ بڑھتا ہے تو $\mathrm{Y}$ بھی بڑھے گا۔ یہ مثبت ارتباط ہے۔ شکل 6.2 میں نقاط نیچے کی طرف ڈھلوان لکیر کے ارد گرد منتشر پائے جاتے ہیں۔ اس بار متغیرات مخالف سمتوں میں حرکت کرتے ہیں۔ جب $\mathrm{X}$ بڑھتا ہے تو $\mathrm{Y}$ گرتا ہے اور اس کے برعکس۔ یہ منفی ارتباط ہے۔ شکل 6.3 میں کوئی اوپر اٹھتی ہوئی یا نیچے ڈھلوان لکیر نہیں ہے جس کے ارد گرد نقاط منتشر ہوں۔ یہ عدم ارتباط کی ایک مثال ہے۔ شکل 6.4 اور شکل 6.5 میں، نقاط اب کسی اوپر اٹھتی ہوئی یا نیچے گرتی ہوئی لکیر کے ارد گرد منتشر نہیں ہیں۔ نقاط خود لکیروں پر ہیں۔ اسے بالترتیب کامل مثبت ارتباط اور کامل منفی ارتباط کہا جاتا ہے۔

سرگرمی

  • اپنی کلاس کے طلباء کی قد، وزن اور کسی دو مضامین میں کلاس $X$ میں حاصل کردہ نمبروں کے اعداد و شمار جمع کریں۔ ان متغیرات کے منتشر خاکے دو دو کو ایک ساتھ لے کر بنائیں۔ آپ کو کس قسم کا تعلق نظر آتا ہے؟

منتشر خاکے کا بغور مشاہدہ تعلق کی نوعیت اور شدت کا ایک خیال دیتا ہے۔

کارل پیئرسن کا ارتباطی سر

اسے پیداواری لمحہ ارتباطی سر (product moment correlation coefficient) یا سادہ ارتباطی سر (simple correlation coefficient) بھی کہا جاتا ہے۔ یہ دو متغیرات $\mathrm{X}$ اور $Y$ کے درمیان خطی تعلق کے درجے کی ایک درست عددی قدر دیتا ہے۔

یہ نوٹ کرنا اہم ہے کہ کارل پیئرسن کے ارتباطی سر کا استعمال صرف اس وقت کرنا چاہیے جب متغیرات کے درمیان خطی تعلق ہو۔ جب $\mathrm{X}$ اور $\mathrm{Y}$ کے درمیان غیر خطی (non-linear) تعلق ہو، تو کارل پیئرسن کے ارتباطی سر کا حساب لگانا گمراہ کن ہو سکتا ہے۔ اس طرح، اگر حقیقی تعلق خطی نوعیت کا ہے جیسا کہ شکل 6.1، $6.2,6.4$ اور 6.5 میں منتشر خاکوں سے دکھایا گیا ہے، تو کارل پیئرسن کے ارتباطی سر کا حساب لگانا چاہیے اور یہ ہمیں متغیرات کے درمیان تعلق کی سمت اور شدت بتائے گا۔ لیکن اگر حقیقی تعلق اس نوعیت کا ہے جیسا کہ شکل 6.6 یا 6.7 کے منتشر خاکوں میں دکھایا گیا ہے، تو اس کا مطلب ہے کہ $\mathrm{X}$ اور $\mathrm{Y}$ کے درمیان غیر خطی تعلق ہے اور ہمیں کارل پیئرسن کے ارتباطی سر کے استعمال کی کوشش نہیں کرنی چاہیے۔

لہٰذا، کارل پیئرسن کے ارتباطی سر کا حساب لگانے سے پہلے متغیرات کے درمیان تعلق کے منتشر خاکے کا پہلے جائزہ لینا مناسب ہے۔

فرض کریں $X _{1}, X _{2}, \ldots, X _{N}$، $N$ قدروں پر مشتمل ہے اور $\mathrm{Y} _{1}, \mathrm{Y} _{2}, \ldots, \mathrm{Y} _{\mathrm{N}}$، Y کی متعلقہ قدروں پر مشتمل ہے۔ آئندہ پیشکشوں میں، سادگی کے لیے اکائی کو ظاہر کرنے والے سبسکرپٹس حذف کر دیے گئے ہیں۔ $\mathrm{X}$ اور $\mathrm{Y}$ کے حسابی اوسط (arithmetic means) اس طرح تعریف کیے جاتے ہیں:

$$ \overline{\mathrm{X}}=\frac{\sum \mathrm{X}}{\mathrm{N}} ; \quad \overline{\mathrm{Y}}=\frac{\sum \mathrm{Y}}{\mathrm{N}} $$

اور ان کے تغیرات (variances) حسب ذیل ہیں:

$$ \sigma^{2} x=\frac{\sum(X-\bar{X})^{2}}{N}=\frac{\sum X^{2}}{N}-\bar{X}^{2} $$

اور $$\quad \sigma^{2} \mathrm{y}=\frac{\sum(\mathrm{Y}-\overline{\mathrm{Y}})^{2}}{\mathrm{~N}}=\frac{\sum \mathrm{Y}^{2}}{\mathrm{~N}}-\overline{\mathrm{Y}}^{2}$$

$\mathrm{X}$ اور $\mathrm{Y}$ کے معیاری انحراف (standard deviations) بالترتیب ان کے تغیرات کے مثبت مربع جذر (square roots) ہیں۔ $\mathrm{X}$ اور $\mathrm{Y}$ کا ہم تغیر (covariance) اس طرح تعریف کیا جاتا ہے:

$\operatorname{Cov}(\mathrm{X}, \mathrm{Y})=\frac{\sum(\mathrm{X}-\overline{\mathrm{X}})(\mathrm{Y}-\overline{\mathrm{Y}})}{\mathrm{N}}=\frac{\sum \mathrm{xy}}{\mathrm{N}}$

جہاں $\mathrm{x}=\mathrm{X}-\overline{\mathrm{X}}$ اور $\mathrm{y}=\mathrm{Y}-\overline{\mathrm{Y}}$ بالترتیب $i^{\text {th }}$ ویں قدر کے $\mathrm{X}$ اور $\mathrm{Y}$ سے ان کی اوسط قدروں کے انحرافات (deviations) ہیں۔

$\mathrm{X}$ اور $\mathrm{Y}$ کے درمیان ہم تغیر (covariance) کا نشان ارتباطی سر کے نشان کا تعین کرتا ہے۔ معیاری انحراف ہمیشہ مثبت ہوتے ہیں۔ اگر ہم تغیر صفر ہے، تو ارتباطی سر ہمیشہ صفر ہوتا ہے۔ پیداواری لمحہ ارتباط یا کارل پیئرسن کی ارتباط کی پیمائش اس طرح دی جاتی ہے:

$$ \begin{equation*} \mathrm{r}={ }^{\Sigma \mathrm{xy}} / N \sigma _{\mathrm{x}} \sigma _{\mathrm{y}} \tag{1} \end{equation*} $$

یا

$$ \begin{equation*} \mathrm{r}=\frac{\sum(\mathrm{X}-\overline{\mathrm{X}})(\mathrm{Y}-\overline{\mathrm{Y}})}{\sqrt{\Sigma(\mathrm{X}-\overline{\mathrm{X}})^{2}} \sqrt{\Sigma(\mathrm{Y}-\overline{\mathrm{Y}})^{2}}} \tag{2} \end{equation*} $$

یا

$$ \begin{equation*} r=\frac{\frac{\sum X Y-\left(\sum X\right)\left(\sum Y\right)}{N}}{\sqrt{\sum X^{2}-\frac{\left(\sum X\right)^{2}}{N}} \sqrt{\sum Y^{2}-\frac{\left(\sum Y\right)^{2}}{N}}}\tag{3} \end{equation*} $$

یا

$$ \begin{equation*} r=\frac{N \sum XY-(\sum X)(\sum Y)}{\sqrt{N \sum X^2-(\sum X)^2} \cdot \sqrt{N \sum Y^2-(\sum Y)^2}}\tag{4} \end{equation*} $$

ارتباطی سر کی خصوصیات

آئیے اب ارتباطی سر کی خصوصیات پر بات کرتے ہیں:

  • $r$ کی کوئی اکائی نہیں ہے۔ یہ ایک خالص عدد ہے۔ اس کا مطلب ہے کہ پیمائش کی اکائیاں $r$ کا حصہ نہیں ہیں۔ مثال کے طور پر، فٹ میں قد اور کلوگرام میں وزن کے درمیان $r$، فرض کریں، 0.7 ہو سکتا ہے۔
  • $r$ کی منفی قدر الٹے تعلق کی نشاندہی کرتی ہے۔ ایک متغیر میں تبدیلی دوسرے متغیر میں تبدیلی کے ساتھ مخالف سمت میں وابستہ ہوتی ہے۔ جب کسی شے کی قیمت بڑھتی ہے، تو اس کی طلب گر جاتی ہے۔ جب سود کی شرح بڑھتی ہے تو فنڈز کی طلب بھی گر جاتی ہے۔ یہ اس لیے ہے کہ اب فنڈز مہنگے ہو گئے ہیں۔
  • اگر $r$ مثبت ہے تو دونوں متغیرات ایک ہی سمت میں حرکت کرتے ہیں۔ جب چائے کے متبادل کافی کی قیمت بڑھتی ہے تو چائے کی طلب بھی بڑھ جاتی ہے۔ آبپاشی کی سہولیات میں بہتری زیادہ پیداوار کے ساتھ وابستہ ہے۔ جب درجہ حرارت بڑھتا ہے تو آئس کریم کی فروخت تیز ہو جاتی ہے۔
  • ارتباطی سر کی قدر منفی ایک اور مثبت ایک کے درمیان ہوتی ہے، $-1 \leq r \leq 1$۔ اگر کسی مشق میں، $r$ کی قدر اس رینج سے باہر ہے تو یہ حساب میں غلطی کی نشاندہی کرتی ہے۔
  • $r$ کا حجم مبدا (origin) اور پیمانے (scale) کی تبدیلی سے متاثر نہیں ہوتا۔ دو متغیرات $\mathrm{X}$ اور $\mathrm{Y}$ دیے گئے ہیں، آئیے دو نئے متغیرات تعریف کرتے ہیں:

$\mathrm{U}=\frac{\mathrm{X}-\mathrm{A}}{\mathrm{B}} ; \mathrm{V}=\frac{\mathrm{Y}-\mathrm{C}}{\mathrm{D}}$

جہاں $A$ اور $C$ بالترتیب $\mathrm{X}$ اور $\mathrm{Y}$ کے فرضی اوسط (assumed means) ہیں۔ $\mathrm{B}$ اور $\mathrm{D}$ مشترک عوامل ہیں اور ایک ہی نشان کے ہیں۔ پھر

$r _{x y}=r _{u v}$

اس خصوصیت کو ارتباطی سر کے حساب کو انتہائی سادہ طریقے سے، جیسے قدم انحراف طریقہ (step deviation method) میں، کرنے کے لیے استعمال کیا جاتا ہے۔

  • اگر $r=0$ تو دونوں متغیرات غیر مرتبط (uncorrelated) ہیں۔ ان کے درمیان کوئی خطی تعلق نہیں ہے۔ تاہم دیگر قسم کے تعلقات موجود ہو سکتے ہیں۔
  • اگر $r=1$ یا $r=-1$ تو ارتباط کامل ہے اور ان کے درمیان عین خطی تعلق ہے۔
  • $r$ کی اعلیٰ قدر مضبوط خطی تعلق کی نشاندہی کرتی ہے۔ اس کی قدر اعلیٰ کہی جاتی ہے جب یہ +1 یا -1 کے قریب ہو۔
  • $r$ کی کم قدر (صفر کے قریب) ایک کمزور خطی تعلق کی نشاندہی کرتی ہے۔ لیکن غیر خطی تعلق موجود ہو سکتا ہے۔

جیسا کہ آپ نے باب 1 میں پڑھا ہے، شماریاتی طریقے عام فہم کا متبادل نہیں ہیں۔ یہاں، ایک اور مثال ہے، جو ارتباط کے حساب اور تشریح سے پہلے اعداد و شمار کو صحیح طریقے سے سمجھنے کی ضرورت کو اجاگر کرتی ہے۔ ایک وبا کچھ گاؤں میں پھیلتی ہے اور حکومت متاثرہ گاؤں میں ڈاکٹروں کی ایک ٹیم بھیجتی ہے۔ اموات کی تعداد اور گاؤں میں بھیجے گئے ڈاکٹروں کی تعداد کے درمیان ارتباط مثبت پایا جاتا ہے۔ عام طور پر، ڈاکٹروں کی طرف سے فراہم کردہ صحت کی دیکھ بھال کی سہولیات سے اموات کی تعداد میں کمی متوقع ہوتی ہے جو منفی ارتباط دکھاتی ہے۔ یہ دیگر وجوہات کی بنا پر ہوا۔ اعداد و شمار ایک مخصوص وقت کی مدت سے متعلق ہیں۔ رپورٹ شدہ اموات میں سے بہت سے لاعلاج مریض ہو سکتے ہیں جہاں ڈاکٹر بہت کم کر سکتے تھے۔ مزید برآں، ڈاکٹروں کی موجودگی کا فائدہ کچھ وقت کے بعد ہی نظر آتا ہے۔ یہ بھی ممکن ہے کہ رپورٹ شدہ اموات وبا کی وجہ سے نہ ہوں۔ ایک سونامی اچانک ریاست پر حملہ آور ہوتی ہے اور ہلاکتوں کی تعداد بڑھ جاتی ہے۔

آئیے کاشتکاروں کے اسکولی تعلیم کے سالوں اور فی ایکڑ سالانہ پیداوار کے درمیان تعلق کا جائزہ لے کر $r$ کے حساب کو واضح کرتے ہیں۔

مثال 1

کاشتکاروں کے اسکولی تعلیم کے سالوں کی تعداد فی ایکڑ سالانہ پیداوار ‘000 (روپے) میں
0 4
2 4
4 6
6 10
8 10
10 8
12 7

فارمولہ 1 کو $\sum \mathrm{Xy}, \sigma _{\mathrm{x}}, \sigma _{\mathrm{y}}$ کی قدر کی ضرورت ہے۔

جدول 6.1 سے ہمیں ملتا ہے،

$$ \begin{aligned} & \sum \mathrm{xy}=42, \\ & \sigma _{\mathrm{x}}=\sqrt{\frac{\sum(\mathrm{X}-\overline{\mathrm{X}})^{2}}{\mathrm{~N}}}=\sqrt{\frac{112}{7}}, \\ & \sigma _{\mathrm{y}}=\sqrt{\frac{\sum(\mathrm{Y}-\overline{\mathrm{Y}})^{2}}{\mathrm{~N}}}=\sqrt{\frac{38}{7}} \end{aligned} $$

ان قدروں کو فارمولہ (1) میں رکھنے پر

$$ \mathrm{r}=\frac{42}{7 \sqrt{\frac{112}{7}} \sqrt{\frac{38}{7}}}=0.644 $$

یہی قدر فارمولہ (2) سے بھی حاصل کی جا سکتی ہے۔

$$ \begin{gather*} \mathrm{r}=\frac{\sum(\mathrm{X}-\overline{\mathrm{X}})(\mathrm{Y}-\overline{\mathrm{Y}})}{\sqrt{\sum(\mathrm{X}-\overline{\mathrm{X}})^{2}} \sqrt{\sum(\mathrm{Y}-\overline{\mathrm{Y}})^{2}}} \tag{2}\\ \mathrm{r}=\frac{42}{\sqrt{112} \sqrt{38}}=0.644 \end{gather*} $$

اس طرح، کاشتکاروں کی تعلیم کے سال اور فی ایکڑ سالانہ پیداوار مثبت طور پر مرتبط ہیں۔ $r$ کی قدر بھی زیادہ ہے۔ اس کا مطلب ہے کہ کاشتکار تعلیم میں جتنے زیادہ سال سرمایہ کاری کریں گے، فی ایکڑ پیداوار اتنی ہی زیادہ ہوگی۔ یہ کاشتکاروں کی تعلیم کی اہمیت کو واضح کرتا ہے۔

فارمولہ (3) استعمال کرنے کے لیے

جدول 6.1 کاشتکاروں کے اسکولی تعلیم کے سالوں اور سالانہ پیداوار کے درمیان r کا حساب

تعلیم کے سال (X) $(X-\bar{X})$ $(X-\bar{X})^{2}$ فی ایکڑ سالانہ پیداوار ‘000 روپے میں (Y) $(Y-\bar{Y})$ $(Y-\bar{Y})^{2}$ $(X-\bar{X})(Y-\bar{Y})$
0 -6 36 4 -3 9 18
2 -4 16 4 -3 9 12
4 -2 4 6 -1 1 2
6 0 0 10 3 9 0
8 2 4 10 3 9 6
10 4 16 8 1 1 4
12 6 36 7 0 0 0
$\Sigma X=42$ $\sum (X-\overline{\mathrm{X}})^{2}=112$ $\Sigma Y=49$ $\Sigma(Y-\bar{Y})^{2}=38$ $\Sigma(X-\bar{X})(Y-\bar{Y})=42$

$$ \begin{equation*} r=\frac{\sum X Y-\frac{(\Sigma X)\left(\sum Y\right)}{N}}{\sqrt{\Sigma X^{2}-\frac{(\Sigma X)^{2}}{N}} \sqrt{\Sigma \mathrm{Y}^{2}-\frac{(\Sigma Y)^{2}}{N}}}\tag{3} \end{equation*} $$

مندرجہ ذیل عبارات کی قدریں حساب کرنی ہوں گی یعنی

$\Sigma \mathrm{XY}, \Sigma \mathrm{X}^{2}, \Sigma \mathrm{Y}^{2}$.

اب $r$ کی قدر حاصل کرنے کے لیے فارمولہ (3) لگائیں۔

آئیے $r$ کی مختلف قدروں کی تشریح جان لیں۔ انگریزی اور شماریات میں حاصل کردہ نمبروں کے درمیان ارتباطی سر، فرض کریں، 0.1 ہے۔ اس کا مطلب ہے کہ اگرچہ دونوں مضامین میں حاصل کردہ نمبر مثبت طور پر مرتبط ہیں، لیکن تعلق کی طاقت کمزور ہے۔ انگریزی میں زیادہ نمبر حاصل کرنے والے طلباء شماریات میں نسبتاً کم نمبر حاصل کر رہے ہوں گے۔ اگر $r$ کی قدر، فرض کریں، 0.9 ہوتی، تو انگریزی میں زیادہ نمبر حاصل کرنے والے طلباء لازماً شماریات میں زیادہ نمبر حاصل کریں گے۔

منفی ارتباط کی ایک مثال مقامی منڈی میں سبزیوں کی آمد اور سبزیوں کی قیمت کے درمیان تعلق ہے۔ اگر $r$ -0.9 ہے، تو مقامی منڈی میں سبزیوں کی سپلائی سبزیوں کی کم قیمت کے ساتھ ہوگی۔ اگر یہ -0.1 ہوتا، تو زیادہ سبزیوں کی سپلائی کم قیمت کے ساتھ ہوگی، لیکن اتنی کم نہیں جتنی قیمت اس وقت ہوتی جب $r$ -0.9 ہو۔ قیمت میں گراوٹ کا دائرہ $r$ کی مطلق قدر (absolute value) پر منحصر ہے۔ اگر یہ صفر ہوتا، تو مارکیٹ میں بڑی سپلائی کے بعد بھی قیمت میں کوئی گراوٹ نہیں ہوتی۔ یہ بھی ایک امکان ہے اگر سپلائی میں اضافے کا خیال ایک اچھے ٹرانسپورٹ نیٹ ورک کے ذریعے رکھا جاتا ہے جو اسے دیگر مارکیٹوں میں منتقل کر دیتا ہے۔

سرگرمی

  • مندرجہ ذیل جدول کو دیکھیں۔ موجودہ قیمت پر قومی آمدنی کی سالانہ نمو اور جی ڈی پی کے فیصد کے طور پر مجموعی ملکی بچت کے درمیان $r$ کا حساب لگائیں۔

ارتباطی سر کے حساب کے لیے قدم انحراف طریقہ (step deviation method)۔

جب متغیرات کی قدریں بڑی ہوں، تو حساب کا بوجھ کافی حد تک کم کیا جا سکتا ہے $r$ کی ایک خصوصیت استعمال کر کے۔ یہ ہے کہ $r$ مبدا اور پیمانے کی تبدیلی سے آزاد ہے۔ اسے قدم انحراف طریقہ بھی کہا جاتا ہے۔ اس میں متغیرات $\mathrm{X}$ اور $\mathrm{Y}$ کا درج ذیل طور پر تبدیلی شامل ہے:

جدول 6.2

سال قومی آمدنی کی
سالانہ نمو
جی ڈی پی کے فیصد کے
طور پر مجموعی
ملکی بچت
1992-93 14 24
1993-94 17 23
1994-95 18 26
1995-96 17 27
1996-97 16 25
1997-98 12 25
1998-99 16 23
1999-00 11 25
2000-01 8 24
2001-02 10 23

ماخذ: اقتصادی سروے، (2004-05) صفحہ 8،9

$\mathrm{U}=\frac{\mathrm{X}-\mathrm{A}}{\mathrm{B}} ; \mathrm{V}=\frac{\mathrm{Y}-\mathrm{C}}{\mathrm{D}}$

جہاں $A$ اور $B$ فرضی اوسط ہیں، $h$ اور $\mathrm{k}$ مشترک عوامل ہیں اور ایک ہی نشان رکھتے ہیں۔

پھر $\mathrm{r} _{\mathrm{uv}}=\mathrm{r} _{\mathrm{XY}}$

اسے قیمت کے اشاریہ (price index) اور زر رسد (money supply) کے درمیان ارتباط کے تجزیے کے مشق سے واضح کیا جا سکتا ہے۔

مثال 2

قیمت کا اشاریہ $(\mathrm{X})$ $ 120 \quad 150 \quad 190 \quad 220 \quad 230$

زر رسد روپے کروڑوں میں $(\mathrm{Y})$ $\quad 1800 \quad 2000 \quad 2500 \quad 2700 \quad 3000$

سادگی، قدم انحراف طریقہ استعمال کرتے ہوئے، ذیل میں واضح کی گئی ہے۔ فرض کریں $\mathrm{A}=100 ; \mathrm{h}=10 ; \mathrm{B}=1700$ اور $\mathrm{k}=100$

تبدیل شدہ متغیرات کا جدول حسب ذیل ہے:

قدم انحراف طریقہ استعمال کرتے ہوئے قیمت کے اشاریہ اور زر رسد کے درمیان $r$ کا حساب

جدول 6.3

$U$ $V$
$\left(\frac{\mathrm{x}-100}{10}\right)$ $\left(\frac{\mathrm{y}-1700}{100}\right)$ $U^{2}$ $V^{2}$ $U V$
2 1 4 1 2
5 3 25 9 15
9 8 81 64 72
12 10 144 100 120
13 13 169 169 169

$\Sigma \mathrm{U}=41 ; \Sigma \mathrm{U}=35 ; \Sigma \mathrm{U}^{2}=423 ;$ $\Sigma \mathrm{V}^{2}=343 ; \Sigma \mathrm{UV}=378$

ان قدروں کو فارمولہ (3) میں رکھنے پر

$$ \begin{aligned} & \mathrm{r}=\frac{\Sigma \mathrm{UV}-\frac{(\Sigma \mathrm{U})(\Sigma \mathrm{U})}{\mathrm{N}}}{\sqrt{\Sigma \mathrm{U}^{2}-\frac{(\Sigma \mathrm{U})^{2}}{\mathrm{~N}}} \sqrt{\Sigma \mathrm{V}^{2}-\frac{(\Sigma \mathrm{V})^{2}}{\mathrm{~N}}}} …(3) \end{aligned} $$

$$=\frac{378-\frac{41 \times 35}{5}}{\sqrt{423-\frac{(41)^2}{5}}\sqrt{343-\frac{(35)^2}{5}}}$$

$$ \begin{aligned} & =0.98 \end{aligned} $$

قیمت کے اشاریہ اور زر رسد کے درمیان مضبوط مثبت ارتباط مالیاتی پالیسی (monetary policy) کی ایک اہم بنیاد ہے۔ جب زر رسد بڑھتی ہے تو قیمت کا اشاریہ بھی بڑھتا ہے۔

سرگرمی

  • ہندوستان کی آبادی اور قومی آمدنی سے متعلق اعداد و شمار کا استعمال کرتے ہوئے، قدم انحراف طریقہ استعمال کر کے ان کے درمیان ارتباط کا حساب لگائیں۔

اسپیرمین کا درجہ ارتباط (Spearman’s rank correlation)

اسپیرمین کا درجہ ارتباط برطانوی ماہر نفسیات C.E. Spearman نے تیار کیا تھا۔ اس کا استعمال درج ذیل حالات میں کیا جاتا ہے:

  1. فرض کریں ہم ایک دور دراز گاؤں کے طلباء کی قد اور وزن کے درمیان ارتباط کا تخمینہ لگانے کی کوشش کر رہے ہیں جہاں نہ پیمائش کی چھڑیاں دستیاب ہیں اور نہ ہی تولنے والی مشینیں۔ ایسی صورت حال میں، ہم قد یا وزن نہیں ناپ سکتے، لیکن ہم یقیناً طلباء کو وزن اور قد کے مطابق درجہ دے سکتے ہیں۔ پھر ان درجوں کو اسپیرمین کے درجہ ارتباطی سر کے حساب کے لیے استعمال کیا جا سکتا ہے۔
  2. فرض کریں ہم انصاف، ایمانداری یا خوبصورتی جیسی چیزوں سے نمٹ رہے ہیں۔ انہیں اسی طرح نہیں ناپا جا سکتا جس طرح ہم آمدنی، وزن یا قد ناپتے ہیں۔ زیادہ سے زیادہ، ان چیزوں کو نسبتاً ناپا جا سکتا ہے، مثال کے طور پر، ہم لوگوں کو خوبصورتی کے مطابق درجہ دے سکتے ہیں (کچھ لوگ بحث کر سکتے ہیں کہ یہ بھی ممکن نہیں ہے کیونکہ خوبصورتی کے معیارات اور معیار شخص سے شخص اور ثقافت سے ثقافت مختلف ہو سکتے ہیں)۔ اگر ہم متغیرات کے درمیان تعلق معلوم کرنا چاہتے ہیں، جن میں سے کم از کم ایک اس قسم کا ہے، تو اسپیرمین کے درجہ ارتباطی سر استعمال کیا جائے گا۔
  3. اسپیرمین کا درجہ ارتباطی سر کچھ معاملات میں استعمال کیا جا سکتا ہے جہاں ایک ایسا تعلق ہو جس کی سمت واضح ہو لیکن جو غیر خطی ہو جیسا کہ اس وقت دکھایا جاتا ہے جب منتشر خاکے شکل 6.6 اور 6.7 کی قسم کے ہوں۔
  4. اسپیرمین کا ارتباطی سر انتہائی قدروں سے متاثر نہیں ہوتا۔ اس لحاظ سے، یہ کارل پیئرسن کے ارتباطی سر سے بہتر ہے۔ اس طرح اگر اعداد و شمار میں کچھ انتہائی قدریں شامل ہوں، تو اسپیرمین کا ارتباطی سر بہت مفید ہو سکتا ہے۔

درجہ ارتباطی سر اور سادہ ارتباطی سر کی ایک ہی تشریح ہے۔ اس کا فارمولا سادہ ارتباطی سر سے اخذ کیا گیا ہے جہاں انفرادی قدروں کو درجوں سے بدل دیا گیا ہے۔ ان درجوں کو ارتباط کے حساب کے لیے استعمال کیا جاتا ہے۔ یہ سر ان اکائیوں کو تفویض کردہ درجوں کے درمیان خطی ارتباط کی پیمائش فراہم کرتا ہے، ان کی قدروں کا نہیں۔ اسپیرمین کے درجہ ارتباط کا فارمولا ہے:

$$ \begin{equation*} r _{a}=1-\frac{6 \sum D^{2}}{n^{3}-n} \tag{4} \end{equation*} $$