باب 02 ڈیٹا پروسیسنگ

آپ نے پچھلے باب میں سیکھا ہے کہ ڈیٹا کو منظم اور پیش کرنا انہیں قابل فہم بناتا ہے۔ یہ ڈیٹا پروسیسنگ کو آسان بناتا ہے۔ ڈیٹا کا تجزیہ کرنے کے لیے متعدد شماریاتی تکنیکوں کا استعمال کیا جاتا ہے، جیسے:

  1. مرکزی رجحان کے پیمانے
  2. انتشار کے پیمانے
  3. تعلق کے پیمانے

جبکہ مرکزی رجحان کے پیمانے وہ قدر فراہم کرتے ہیں جو مشاہدات کے مجموعے کا مثالی نمائندہ ہوتی ہے، انتشار کے پیمانے ڈیٹا کے اندرونی تغیرات کو مدنظر رکھتے ہیں، جو اکثر مرکزی رجحان کے کسی پیمانے کے گرد ہوتے ہیں۔ دوسری طرف، تعلق کے پیمانے کسی بھی دو یا زیادہ متعلقہ مظاہر کے درمیان وابستگی کی ڈگری فراہم کرتے ہیں، جیسے بارش اور سیلاب کے واقعات یا کھاد کی کھپت اور فصلوں کی پیداوار۔ اس باب میں، آپ مرکزی رجحان کے پیمانے سیکھیں گے۔

مرکزی رجحان کے پیمانے

قابل پیمائش خصوصیات جیسے بارش، بلندی، آبادی کی کثافت، تعلیمی قابلیت کی سطحیں یا عمر کے گروپ مختلف ہوتے ہیں۔ اگر ہم انہیں سمجھنا چاہیں، تو ہم کیسے کریں گے؟ شاید ہمیں ایک واحد قدر یا نمبر درکار ہوگا جو تمام مشاہدات کی بہترین نمائندگی کرے۔ یہ واحد قدر عام طور پر تقسیم کے مرکز کے قریب ہوتی ہے نہ کہ کسی ایک انتہا پر۔ تقسیموں کے مرکز کو معلوم کرنے کے لیے استعمال ہونے والی شماریاتی تکنیکوں کو مرکزی رجحان کے پیمانے کہا جاتا ہے۔ مرکزی رجحان کو ظاہر کرنے والا نمبر پورے ڈیٹا سیٹ کے لیے نمائندہ اعداد و شمار ہوتا ہے کیونکہ یہ وہ نقطہ ہے جس کے گرد اشیاء کلسٹر ہونے کا رجحان رکھتی ہیں۔

مرکزی رجحان کے پیمانے شماریاتی اوسط کے طور پر بھی جانے جاتے ہیں۔ مرکزی رجحان کے کئی پیمانے ہیں، جیسے اوسط، میڈین اور موڈ۔

اوسط (مین)

اوسط وہ قدر ہے جو تمام اقدار کو جمع کرکے اور مشاہدات کی تعداد سے تقسیم کرکے حاصل کی جاتی ہے۔

میڈین

میڈین اس درجہ کی قدر ہے، جو ترتیب شدہ سیریز کو دو برابر حصوں میں تقسیم کرتی ہے۔ یہ اصل قدر سے آزاد ہوتی ہے۔ ڈیٹا کو چڑھتے یا اترتے ترتیب میں لگانا اور پھر درمیانی درجہ والے نمبر کی قدر معلوم کرنا میڈین کے حساب میں سب سے اہم ہے۔ اگر اعداد جفت ہوں تو دو درمیانی درجہ والی اقدار کا اوسط میڈین ہوگا۔

موڈ

موڈ وہ نقطہ یا قدر ہے جہاں زیادہ سے زیادہ وقوع یا تعدد پایا جاتا ہے۔ آپ دیکھ سکتے ہیں کہ ان میں سے ہر ایک پیمانہ ڈیٹا سیٹ کے مختلف اقسام کے لیے موزوں ایک واحد نمائندہ نمبر کا تعین کرنے کا ایک مختلف طریقہ ہے۔

اوسط (مین)

اوسط کسی متغیر کی مختلف اقدار کا سادہ حسابی اوسط ہوتی ہے۔ غیر گروہ بند اور گروہ بند ڈیٹا کے لیے، اوسط کے حساب کے طریقے ضروری طور پر مختلف ہوتے ہیں۔ اوسط کا حساب براہ راست یا بالواسطہ طریقوں سے، گروہ بند اور غیر گروہ بند دونوں طرح کے ڈیٹا کے لیے لگایا جا سکتا ہے۔

غیر گروہ بند ڈیٹا سے اوسط کا حساب

براہ راست طریقہ

غیر گروہ بند ڈیٹا سے اوسط کا حساب براہ راست طریقہ استعمال کرتے ہوئے لگانے میں، ہر مشاہدے کی اقدار کو جمع کیا جاتا ہے اور کل واقعات کی تعداد کو تمام مشاہدات کے مجموعے سے تقسیم کیا جاتا ہے۔ اوسط کا حساب مندرجہ ذیل فارمولے کے استعمال سے لگایا جاتا ہے:

$$ \overline{\mathrm{X}}=\frac{\sum x}{\mathrm{~N}} $$

جہاں،

$$ \begin{aligned} \overline{\mathrm{X}} & =\text { Mean } \ \sum \quad & \text { Sum of a series of } \ & \text { measures } \end{aligned} $$

$x \quad=$ پیمائشوں کی ایک سیریز میں ایک خام اسکور

$\sum \mathrm{x}=$ تمام پیمائشوں کا مجموعہ

$\mathrm{N} \quad$ = پیمائشوں کی تعداد

مثال 2.1 : مالوہ پٹھار، مدھیہ پردیش کے لیے اوسط بارش کا حساب لگائیں، جو علاقے کے اضلاع کی بارش سے دی گئی ہے، جدول 2.1 میں:

$\hspace{1cm}$ جدول 2.1 : اوسط بارش کا حساب

مالوہ پٹھار کے
اضلاع
معمول کی بارش
ملی میٹر میں
بالواسطہ طریقہ
x براہ راست طریقہ $d=x-800^{*}$
اندور 979 179
دیواس 1083 283
دھار 833 33
رتلام 896 96
اجین 891 91
مندسور 825 25
شجاپور 977 177
$\sum x$ اور $\sum d$ 6484 884
$\frac{\sum x}{N}$ اور $\frac{\sum d}{N}$ 926.29 126.29
  • جہاں 800 فرضی اوسط ہے۔
    $\mathrm{d}$ فرضی اوسط سے انحراف ہے۔

جدول 2.1 میں دیے گئے ڈیٹا کے لیے اوسط کا حساب مندرجہ ذیل طور پر لگایا گیا ہے:

$$ \begin{aligned} \overline{\mathrm{X}} & =\frac{\sum x}{N} \ & =\frac{6,484}{7} \ & =926.29 \end{aligned} $$

اوسط کے حساب سے یہ نوٹ کیا جا سکتا ہے کہ خام بارش کے ڈیٹا کو براہ راست جمع کیا گیا ہے اور مجموعے کو مشاہدات کی تعداد یعنی اضلاع سے تقسیم کیا گیا ہے۔ اس لیے، اسے براہ راست طریقہ کہا جاتا ہے۔

بالواسطہ طریقہ

مشاہدات کی بڑی تعداد کے لیے، اوسط کے حساب کے لیے عام طور پر بالواسطہ طریقہ استعمال کیا جاتا ہے۔ یہ مشاہدات کی اقدار کو ایک مستقل قدر ان سے منفی کرکے چھوٹے نمبروں میں کم کرنے میں مدد کرتا ہے۔ مثال کے طور پر، جیسا کہ جدول 2.1 میں دکھایا گیا ہے، بارش کی اقدار 800 اور $1100 \mathrm{~mm}$ کے درمیان ہیں۔ ہم ‘فرضی اوسط’ منتخب کرکے اور ہر قدر سے منتخب کردہ نمبر منفی کرکے ان اقدار کو کم کر سکتے ہیں۔ موجودہ معاملے میں، ہم نے 800 کو فرضی اوسط کے طور پر لیا ہے۔ ایسے آپریشن کو کوڈنگ کہا جاتا ہے۔ پھر ان کم شدہ نمبروں (جدول 2.1 کا کالم 3) سے اوسط کا حساب لگایا جاتا ہے۔

بالواسطہ طریقہ استعمال کرتے ہوئے اوسط کے حساب کے لیے مندرجہ ذیل فارمولہ استعمال کیا جاتا ہے:

$$ \overline{\mathrm{X}}=A+\frac{\sum d}{N} $$

جہاں،

$$ \begin{aligned} A & =\text { Subtracted constant } \ \sum d & =\text { Sum of the coded scores } \ N & =\text { Number of individual observations in a series } \end{aligned} $$

جدول 2.1 میں دکھائے گئے ڈیٹا کے لیے اوسط کا حساب بالواسطہ طریقہ سے مندرجہ ذیل طریقے سے لگایا جا سکتا ہے:

$$ \begin{aligned} \overline{\mathrm{X}} & =800+\frac{884}{7} \ & =800+\frac{884}{7} \ \overline{\mathrm{X}} & =926.29 \mathrm{~mm} \end{aligned} $$

نوٹ کریں کہ اوسط قدر دونوں طریقوں میں سے کسی ایک سے حساب کرنے پر بھی ایک جیسی آتی ہے۔

گروہ بند ڈیٹا سے اوسط کا حساب

اوسط کا حساب گروہ بند ڈیٹا کے لیے بھی براہ راست یا بالواسطہ طریقہ استعمال کرکے لگایا جاتا ہے۔

براہ راست طریقہ

جب اسکورز کو ایک تعدد تقسیم میں گروہ بند کیا جاتا ہے، تو انفرادی اقدار اپنی شناخت کھو دیتی ہیں۔ ان اقدار کو ان کلاس وقفوں کے وسطی نقاط سے ظاہر کیا جاتا ہے جن میں وہ واقع ہیں۔ گروہ بند ڈیٹا سے اوسط کا حساب براہ راست طریقہ استعمال کرتے ہوئے لگانے میں، ہر کلاس وقفہ کے وسطی نقطہ کو اس کے متعلقہ تعدد $(f)$ سے ضرب دیا جاتا ہے؛ $f x$ ($\mathrm{X}$ وسطی نقاط ہیں) کی تمام اقدار کو جمع کرکے $\sum f x$ حاصل کیا جاتا ہے جو آخر میں مشاہدات کی تعداد یعنی $\mathrm{N}$ سے تقسیم کیا جاتا ہے۔ لہذا، اوسط کا حساب مندرجہ ذیل فارمولے کے استعمال سے لگایا جاتا ہے:

$$ \overline{\mathrm{X}}=\frac{\sum f x}{N} $$

جہاں:

$$ \begin{aligned} \overline{\mathrm{X}} & =\text { Mean } \ f & =\text { Frequencies } \ x & =\text { Midpoints of class intervals } \ N & \left.=\text { Number of observations (it may also be defined as } \sum f\right) \end{aligned} $$

مثال 2.2 : فیکٹری ورکرز کی اوسط اجرت کی شرح کا حساب لگائیں، جدول 2.2 میں دیے گئے ڈیٹا کا استعمال کرتے ہوئے:

جدول 2.2 : فیکٹری ورکرز کی اجرت کی شرح

اجرت کی شرح (روپے/دن) ورکرز کی تعداد ()
کلاسیں $\boldsymbol{f}$
$50-70$ 10
$70-90$ 20
$90-110$ 25
$110-130$ 35
$130-150$ 9

جدول 2.3 : اوسط کا حساب

کلاسیں تعدد
(f)
وسطی
نقاط
$(x)$
$f x x$ $d=x-100$ $f d$ $U=$
$(x-100)$
20
$f u$
$50-70$ 10 60 600 -40 -400 -2 -20
$70-90$ 20 80 1,600 -20 -400 -1 -20
$\mathbf{9 0 - 1 1 0}$ $\mathbf{2 5}$ $\mathbf{1 0 0}$ 2,500 $\mathbf{0}$ 0 0 0
$110-130$ 35 120 4,200 20 700 1 35
$130-150$ 9 140 1,260 40 360 2 18
$\sum f x$
اور $\sum f=99$ $\sum f x=$ $\sum f d=$ $\sum f u=$
$\sum f x$ 10,160 260 13

جہاں $\mathrm{N}=\sum f=99$

جدول 2.3 گروہ بند ڈیٹا کے لیے اوسط کے حساب کی طریقہ کار فراہم کرتا ہے۔ دی گئی تعدد تقسیم میں، ننانوے ورکرز کو اجرت کی شرح کی پانچ کلاسیں میں گروہ بند کیا گیا ہے۔ ان گروپوں کے وسطی نقاط تیسرے کالم میں درج ہیں۔ اوسط معلوم کرنے کے لیے، ہر وسطی نقطہ $(\mathrm{X})$ کو تعدد $(f)$ سے ضرب دیا گیا ہے اور ان کا مجموعہ ($\sum f_{x}$) کو $N$ سے تقسیم کیا گیا ہے۔

دیے گئے فارمولے کا استعمال کرتے ہوئے اوسط کا حساب مندرجہ ذیل طور پر لگایا جا سکتا ہے:

$$ \begin{aligned} \overline{\mathrm{X}} & =\frac{\sum f x}{N} \ & =\frac{10,160}{99} \ & =102.6 \end{aligned} $$

بالواسطہ طریقہ

گروہ بند ڈیٹا کے لیے بالواسطہ طریقہ کے لیے مندرجہ ذیل فارمولہ استعمال کیا جا سکتا ہے۔ اس فارمولے کے اصول غیر گروہ بند ڈیٹا کے لیے دیے گئے بالواسطہ طریقہ کے اصولوں سے ملتے جلتے ہیں۔ اسے مندرجہ ذیل طور پر ظاہر کیا جاتا ہے:

$$ \bar{x}=A \pm \frac{\sum f d}{N} $$

جہاں،

= فرضی اوسط گروپ کا وسطی نقطہ (جدول 2.3 میں فرضی اوسط گروپ 90 – 110 ہے جس کا وسطی نقطہ 100 ہے۔) f = تعدد d = فرضی اوسط گروپ (A) سے انحراف N = معاملات کا مجموعہ یا ∑ f i = وقفہ کی چوڑائی (اس معاملے میں، یہ 20 ہے)

جدول 2.3 سے، براہ راست طریقہ استعمال کرتے ہوئے اوسط کے حساب میں شامل مندرجہ ذیل مراحل اخذ کیے جا سکتے ہیں:

(i) اوسط کو 90 - 110 کے گروپ میں فرض کیا گیا ہے۔ اسے ترجیحاً سیریز کے درمیان کے قریب ترین کلاس سے فرض کیا جاتا ہے۔ یہ طریقہ کار حساب کے حجم کو کم کرتا ہے۔ جدول 2.3 میں، A (فرضی اوسط) 100 ہے، جو کلاس $90-110$ کا وسطی نقطہ ہے۔

(ii) پانچواں کالم (u) ہر کلاس کے وسطی نقطہ کا فرضی اوسط گروپ کے وسطی نقطہ $(90-110)$ سے انحراف درج کرتا ہے۔

(iii) چھٹا کالم ہر $f$ کو اس کے متعلقہ $d$ سے ضرب دینے پر حاصل ہونے والی قدر $f d$ دکھاتا ہے۔ پھر، $f d$ کی مثبت اور منفی اقدار کو الگ الگ جمع کیا جاتا ہے اور ان کا مطلق فرق معلوم کیا جاتا ہے ($\sum f d$)۔ نوٹ کریں کہ $\sum f d$ سے منسلک علامت کو فارمولے میں A کے بعد تبدیل کر دیا جاتا ہے، جہاں $\pm$ دیا جاتا ہے۔

بالواسطہ طریقہ استعمال کرتے ہوئے اوسط کا حساب مندرجہ ذیل طور پر لگایا گیا ہے:

$$ \begin{aligned} \overline{\boldsymbol{x}} & =\boldsymbol{A} \pm \frac{\sum \boldsymbol{f} \boldsymbol{d}}{\boldsymbol{N}} \ & =100+\frac{260}{99} \ & =100+2.6 \ & =102.6 \end{aligned} $$

نوٹ : بالواسطہ اوسط طریقہ برابر اور غیر برابر کلاس وقفوں دونوں کے لیے کام کرے گا۔

میڈین

میڈین ایک مقامی اوسط ہے۔ اسے “تقسیم میں وہ نقطہ” کے طور پر بیان کیا جا سکتا ہے جس کے دونوں طرف معاملات کی برابر تعداد ہو"۔ میڈین کو علامت $\mathrm{M}$ کے استعمال سے ظاہر کیا جاتا ہے۔

غیر گروہ بند ڈیٹا کے لیے میڈین کا حساب

جب اسکورز غیر گروہ بند ہوں، تو انہیں چڑھتے یا اترتے ترتیب میں لگایا جاتا ہے۔ میڈین ترتیب شدہ سیریز میں مرکزی مشاہدہ یا قدر کو ڈھونڈ کر معلوم کی جا سکتی ہے۔ مرکزی قدر کو چڑھتے یا اترتے ترتیب میں لگی سیریز کے کسی بھی سرے سے ڈھونڈا جا سکتا ہے۔ میڈین کے حساب کے لیے مندرجہ ذیل مساوات استعمال کی جاتی ہے:

$\left(\frac{\mathrm{N}+1}{2}\right)$ ویں شے کی قدر

مثال 2.3: ہمالیہ کے کچھ حصوں میں پہاڑی چوٹیوں کی میڈین اونچائی کا حساب لگائیں، مندرجہ ذیل کا استعمال کرتے ہوئے:

$8,126 \mathrm{~m}, 8,611 \mathrm{~m}, 7,817 \mathrm{~m}, 8,172 \mathrm{~m}, 8,076 \mathrm{~m}, 8,848 \mathrm{~m}, 8,598 \mathrm{~m}$.

حساب : میڈین (M) کا حساب مندرجہ ذیل مراحل میں لگایا جا سکتا ہے:

(i) دیے گئے ڈیٹا کو چڑھتے یا اترتے ترتیب میں لگائیں۔

(ii) سیریز میں مرکزی قدر کو ڈھونڈنے کے لیے فارمولہ لگائیں۔ اس طرح:

($\frac{\mathrm{N}+1}{2}$) ویں شے کی قدر

$=\left(\frac{7+1}{2}\right)$ ویں شے

$=\left(\frac{8}{2}\right)$ ویں شے

ترتیب شدہ سیریز میں 4ویں شے میڈین ہوگی۔

ڈیٹا کو چڑھتے ترتیب میں ترتیب دینا -

7,$817 ; 8,076 ; 8,126 ; 8,172 ; 8,598 ; 8,611 ; 8,848$

لہذا،

4ویں شے

$$ \mathrm{M}=8,172 \mathrm{~m} $$

گروہ بند ڈیٹا کے لیے میڈین کا حساب

جب اسکورز گروہ بند ہوں، تو ہمیں اس نقطہ کی قدر معلوم کرنی ہوتی ہے جہاں کوئی فرد یا مشاہدہ گروپ میں مرکزی طور پر واقع ہو۔ اس کا حساب مندرجہ ذیل فارمولے کے استعمال سے لگایا جا سکتا ہے:

$$ M=\boldsymbol{l}+\frac{\boldsymbol{i}}{\boldsymbol{f}}\left(\frac{\boldsymbol{N}}{2}-\boldsymbol{c}\right) $$

جہاں،

M = گروہ بند ڈیٹا کے لیے میڈین
l = میڈین کلاس کی نچلی حد
i = وقفہ
f = میڈین کلاس کا تعدد
N = تعدد کی کل تعداد یا مشاہدات کی تعداد
c = پری-میڈین کلاس کا مجموعی تعدد۔

مثال 2.4 : مندرجہ ذیل تقسیم کے لیے میڈین کا حساب لگائیں:

کلاس $50-60$ $60-70$ $70-80$ $80-90$ $90-100$ $100-110$
$\boldsymbol{f}$ 3 7 11 16 8 5

جدول 2.4 : میڈین کا حساب

کلاس تعدد
(f)
مجموعی تعدد (iv) میڈین کلاس کا
حساب
$50-60$
$60-70$
$70-80$
$\mathbf{8 0 - 9 0}$
(میڈین گروپ)
$90-100$
$100-110$
3
7
11
$16 \boldsymbol{f}$

8
5
5
3
10
$21 c$
$\mathbf{3 7}$
45
50
$M=\frac{N}{2}$
$=\frac{50}{4}$
$\sum_{\mathbf{N}=\mathbf{5 0}} f$ یا

میڈین کا حساب نیچے دیے گئے مراحل میں لگایا گیا ہے:

(i) تعدد جدول کو جدول 2.4 میں دیے گئے طور پر ترتیب دیں۔

(ii) مجموعی تعدد (F) ہر عام تعدد کو متواتر وقفہ گروپوں میں جمع کرکے حاصل کیے جاتے ہیں، جیسا کہ جدول 2.4 کے کالم 3 میں دیا گیا ہے۔

(iii) میڈین نمبر $\frac{N}{2}$ کے ذریعے حاصل کیا جاتا ہے یعنی اس معاملے میں $\frac{50}{2}=\mathbf{2 5}$، جیسا کہ جدول 2.4 کے کالم 4 میں دکھایا گیا ہے۔

(iv) مجموعی تعدد تقسیم (F) میں اوپر سے نیچے کی طرف گنتی کریں جب تک کہ $\frac{N}{2}$ سے اگلی بڑی قدر تک نہ پہنچ جائیں۔ اس مثال میں، $\frac{N}{2}$ 25 ہے، جو 40-44 کے کلاس وقفہ میں آتا ہے جس کا مجموعی تعدد 37 ہے، اس طرح پری-میڈین کلاس کا مجموعی تعدد 21 ہے اور میڈین کلاس کا اصل تعدد 16 ہے۔

(v) میڈین کا حساب پھر مرحلہ 4 میں متعین تمام اقدار کو مندرجہ ذیل مساوات میں ڈال کر لگایا جاتا ہے:

$$ M=l+\frac{i}{f}(m-c) $$

$$ \begin{aligned} & =80+\frac{10}{16}(25-21) \ & =80+\frac{5}{8} \times 4 \ & =80+\frac{5}{2} \ & =80+2.5 \ M & =82.5 \end{aligned} $$

موڈ

تقسیم میں سب سے زیادہ کثرت سے آنے والی قدر کو موڈ کہا جاتا ہے۔ اسے $\mathbf{Z}$ یا $\mathbf{M}_{\mathbf{0}}$ کے طور پر ظاہر کیا جاتا ہے۔ موڈ ایک ایسا پیمانہ ہے جس کا استعمال اوسط اور میڈین کے مقابلے میں کم وسیع ہے۔ کسی دیے گئے ڈیٹا سیٹ میں ایک سے زیادہ قسم کے موڈ ہو سکتے ہیں۔

غیر گروہ بند ڈیٹا کے لیے موڈ کا حساب

دیے گئے ڈیٹا سیٹس سے موڈ کا حساب لگاتے وقت تمام پیمائشوں کو پہلے چڑھتے یا اترتے ترتیب میں لگایا جاتا ہے۔ یہ سب سے زیادہ کثرت سے آنے والی پیمائش کو آسانی سے شناخت کرنے میں مدد کرتا ہے۔

مثال 2.5 : جغرافیہ میں دس طلباء کے لیے مندرجہ ذیل ٹیسٹ اسکور کے لیے موڈ کا حساب لگائیں:

$$ 61,10,88,37,61,72,55,61,46,22 $$

حساب : موڈ معلوم کرنے کے لیے پیمائشوں کو چڑھتے ترتیب میں لگایا گیا ہے جیسا کہ نیچے دیا گیا ہے:

$10,22,37,46,55, \mathbf{6 1}, \mathbf{6 1}, \mathbf{6 1}, 72,88$.

پیمائش 61 جو سیریز میں تین بار آتی ہے، دیے گئے ڈیٹاسیٹ میں موڈ ہے۔ چونکہ ڈیٹاسیٹ میں کوئی دوسرا نمبر اسی طرح نہیں آتا، اس لیے یہ یک موڈی ہونے کی خصوصیت رکھتا ہے۔

مثال 2.6 : دس دیگر طلباء کے ایک مختلف نمونے کا استعمال کرتے ہوئے موڈ کا حساب لگائیں، جنہوں نے اسکور کیا:

$82,11,57,82,08,11,82,95,41,11$.

حساب : دی گئی پیمائشوں کو چڑھتے ترتیب میں ترتیب دیں جیسا کہ نیچے دکھایا گیا ہے:

$$ 08,11,11,11,41,57,82,82,82,95 $$

یہ آسانی سے دیکھا جا سکتا ہے کہ 11 اور 82 دونوں پیمائشیں تقسیم میں تین تین بار آ رہی ہیں۔ لہذا، ڈیٹاسیٹ ظاہری طور پر دو موڈی ہے۔ اگر تین اقدار برابر اور سب سے زیادہ تعدد رکھتی ہوں، تو سیریز تین موڈی ہوتی ہے۔ اسی طرح، ایک سیریز میں بہت سی پیمائشوں کی تکرار اسے کثیر موڈی بنا دیتی ہے۔ تاہم، جب سیریز میں کوئی پیمائش دہرائی نہ جائے تو اسے بغیر موڈ کے طور پر نامزد کیا جاتا ہے۔

اوسط، میڈین اور موڈ کا موازنہ

مرکزی رجحان کے تینوں پیمانوں کا موازنہ عام تقسیم منحنی کی مدد سے آسانی سے کیا جا سکتا ہے۔ عام منحنی ایک تعدد تقسیم سے مراد ہے جس میں اسکورز کا گراف اکثر گھنٹی نما منحنی کہلاتا ہے۔ بہت سی انسانی خصوصیات جیسے ذہانت، شخصیت کے اسکور اور طلبہ کی کامیابیوں کی عام تقسیمیں ہوتی ہیں۔ گھنٹی نما منحنی اس طرح دکھائی دیتا ہے، کیونکہ یہ متقابل ہوتا ہے۔ دوسرے الفاظ میں، زیادہ تر مشاہدات درمیانی قدر پر اور اس کے ارد گرد ہوتے ہیں۔ جیسے جیسے کوئی انتہائی اقدار کے قریب پہنچتا ہے، مشاہدات کی تعداد متقابل طریقے سے کم ہوتی جاتی ہے۔ ایک عام منحنی میں ڈیٹا کی تغیر پذیری زیادہ یا کم ہو سکتی ہے۔ عام تقسیم منحنی کی ایک مثال شکل 2.3 میں دی گئی ہے۔

شکل 2.3 : عام تقسیم منحنی

عام تقسیم کی ایک اہم خصوصیت ہوتی ہے۔ اوسط، میڈین اور موڈ ایک ہی اسکور ہوتے ہیں (شکل 2.3 میں 100 کا اسکور) کیونکہ عام تقسیم متقابل ہوتی ہے۔ سب سے زیادہ تعدد والا اسکور تقسیم کے درمیان میں آتا ہے اور بالکل نصف اسکور درمیان سے اوپر آتے ہیں اور نصف اسکور درمیان سے نیچے آتے ہیں۔ زیادہ تر اسکور تقسیم کے درمیان یا اوسط کے ارد گرد آتے ہیں۔ بہت زیادہ اور بہت کم اسکور کثرت سے نہیں آتے اور اس لیے، نایاب سمجھے جاتے ہیں۔

اگر ڈیٹا کسی طرح ترچھا یا مسخ شدہ ہو، تو اوسط، میڈین اور موڈ ایک ساتھ نہیں ہوں گے اور ترچھے ڈیٹا کے اثر پر غور کرنے کی ضرورت ہوگی (شکل 2.4 اور 2.5$)$)۔

شکل 2.4 : مثبت ترچھا پن

شکل $2.5:$ منفی ترچھا پن

مشق

1. نیچے دیے گئے چار متبادلات میں سے صحیح جواب منتخب کریں:

(i) مرکزی رجحان کا وہ پیمانہ جو انتہائی اقدار سے متاثر نہیں ہوتا:

(الف) اوسط
(ب) اوسط اور موڈ
(ج) موڈ
(د) میڈین

(ii) مرکزی رجحان کا وہ پیمانہ جو کسی بھی تقسیم کے ابھار کے ساتھ ہمیشہ ملتا ہے:

(الف) میڈین
(ب) میڈین اور موڈ
(ج) اوسط
(د) موڈ

2. مندرجہ ذیل سوالات کے جواب تقریباً 30 الفاظ میں دیں:

(i) اوسط کی تعریف کریں۔
(ii) موڈ کے استعمال کے کیا فوائد ہیں؟

3. مندرجہ ذیل سوالات کے جواب تقریباً 125 الفاظ میں دیں:

(i) اوسط، میڈین اور موڈ کی نسبتی پوزیشنوں کو عام تقسیم اور ترچھی تقسیم میں خاکوں کی مدد سے وضاحت کریں۔
(ii) اوسط، میڈین اور موڈ کی اطلاق پذیری پر تبصرہ کریں (اشارہ: ان کے فوائد اور نقصانات سے)۔

سرگرمی

1. جغرافیائی تجزیہ کے لیے قابل اطلاق ایک فرضی مثال لیں اور غیر گروہ بند ڈیٹا سے اوسط کے حساب کے براہ راست اور بالواسطہ طریقوں کی وضاحت کریں۔