باب 03: ڈیٹا کی تنظیم

1. تعارف

پچھلے باب میں آپ نے سیکھا کہ ڈیٹا کیسے جمع کیا جاتا ہے۔ آپ مردم شماری اور نمونہ گیری کے درمیان فرق سے بھی واقف ہوئے۔ اس باب میں، آپ جان پائیں گے کہ جو ڈیٹا آپ نے جمع کیا ہے، اسے کیسے درجہ بندی کیا جائے۔ خام ڈیٹا کو درجہ بندی کرنے کا مقصد ان میں ترتیب لانا ہے تاکہ انہیں مزید شماریاتی تجزیے کے لیے آسانی سے پیش کیا جا سکے۔

کیا آپ نے کبھی اپنے مقامی کوڑے کے تاجر یا کباڑی والے کو دیکھا ہے جسے آپ پرانے اخبارات، ٹوٹے ہوئے گھریلو سامان، خالی شیشے کی بوتلیں، پلاسٹک وغیرہ بیچتے ہیں؟ وہ یہ چیزیں آپ سے خریدتا ہے اور انہیں ان لوگوں کو بیچتا ہے جو انہیں ری سائیکل کرتے ہیں۔ لیکن اپنی دکان میں اتنے زیادہ کوڑے کے ساتھ اس کے لیے اپنے کاروبار کا انتظام کرنا بہت مشکل ہو جائے گا، اگر اس نے انہیں مناسب طریقے سے منظم نہ کیا ہوتا۔ اپنی صورت حال کو آسان بنانے کے لیے وہ مختلف کوڑے کو مناسب طریقے سے گروہ بندی یا “درجہ بندی” کرتا ہے۔ وہ پرانے اخبارات کو ایک ساتھ رکھتا ہے اور انہیں رسی سے باندھ دیتا ہے۔ پھر تمام خالی شیشے کی بوتلیں ایک بوری میں جمع کرتا ہے۔ وہ دھاتوں کی اشیاء کو اپنی دکان کے ایک کونے میں ڈھیر لگا دیتا ہے اور انہیں “لوہا”، “تانبا”، “ایلومینیم”، “پیتل” وغیرہ جیسے گروہوں میں ترتیب دیتا ہے، اور اسی طرح۔ اس طرح وہ اپنے کوڑے کو مختلف اقسام - “اخبارات”، “پلاسٹک”، “شیشہ”، “دھاتیں” وغیرہ - میں گروہ بندی کرتا ہے اور ان میں ترتیب لاتا ہے۔ ایک بار جب اس کا کوڑا ترتیب دیا جاتا ہے اور درجہ بندی ہو جاتی ہے، تو اس کے لیے کوئی خاص چیز تلاش کرنا آسان ہو جاتا ہے جس کی خریدار کو ضرورت ہو۔

اسی طرح جب آپ اپنی اسکول کی کتابوں کو ایک خاص ترتیب میں ترتیب دیتے ہیں، تو آپ کے لیے انہیں سنبھالنا آسان ہو جاتا ہے۔ آپ انہیں مضامین کے مطابق درجہ بندی کر سکتے ہیں جہاں ہر مضمون ایک گروہ یا طبقہ بن جاتا ہے۔ لہذا، جب آپ کو مثال کے طور پر تاریخ کی کوئی خاص کتاب درکار ہو، تو آپ کو صرف “تاریخ” کے گروہ میں اس کتاب کو تلاش کرنے کی ضرورت ہے۔ ورنہ، آپ کو مطلوبہ کتاب تلاش کرنے کے لیے اپنے پورے مجموعے میں تلاش کرنا پڑے گا۔

اگرچہ اشیاء یا چیزوں کی درجہ بندی ہمارا قیمتی وقت اور محنت بچاتی ہے، لیکن یہ کسی من مانی طریقے سے نہیں کی جاتی۔ کباڑی والا اپنے کوڑے کو دوبارہ استعمال ہونے والے سامان کی منڈیوں کے مطابق گروہ بندی کرتا ہے۔ مثال کے طور پر، “شیشہ” کے گروہ کے تحت وہ خالی بوتلیں، ٹوٹے ہوئے آئینے اور کھڑکی کے شیشے وغیرہ رکھے گا۔ اسی طرح جب آپ اپنی تاریخ کی کتابوں کو “تاریخ” کے گروہ کے تحت درجہ بندی کرتے ہیں تو آپ اس گروہ میں کسی دوسرے مضمون کی کتاب نہیں رکھیں گے۔ ورنہ گروہ بندی کا پورا مقصد ضائع ہو جائے گا۔ لہذا، درجہ بندی کچھ معیارات کی بنیاد پر چیزوں کو گروہوں یا طبقات میں ترتیب دینا یا منظم کرنا ہے۔

سرگرمی

  • اپنے مقامی ڈاک خانے کا دورہ کریں تاکہ معلوم ہو سکے کہ خطوط کیسے چھانٹے جاتے ہیں۔ کیا آپ جانتے ہیں کہ خط میں پن کوڈ کیا ظاہر کرتا ہے؟ اپنے ڈاکیا سے پوچھیں۔

2. خام ڈیٹا

کباڑی والے کے کوڑے کی طرح، غیر درجہ بند ڈیٹا یا خام ڈیٹا انتہائی غیر منظم ہوتے ہیں۔ وہ اکثر بہت بڑے اور سنبھالنے میں مشکل ہوتے ہیں۔ ان سے معنی خیز نتائج اخذ کرنا ایک مشکل کام ہے کیونکہ وہ آسانی سے شماریاتی طریقوں کے تابع نہیں ہوتے۔ لہذا کسی بھی منظم شماریاتی تجزیے سے پہلے ایسے ڈیٹا کی مناسب تنظیم اور پیشکش ضروری ہے۔ لہذا ڈیٹا جمع کرنے کے بعد اگلا مرحلہ انہیں منظم کرنا اور درجہ بند شکل میں پیش کرنا ہے۔

فرض کریں کہ آپ ریاضی میں طلباء کی کارکردگی جاننا چاہتے ہیں اور آپ نے اپنے اسکول کے 100 طلباء کے ریاضی کے نمبروں پر ڈیٹا جمع کیا ہے۔ اگر آپ انہیں ایک جدول کے طور پر پیش کریں، تو وہ کچھ اس طرح نظر آئیں گے جیسے جدول 3.1۔

جدول 3.1 ایک امتحان میں 100 طلباء کے ریاضی میں حاصل کردہ نمبر

47 45 10 60 51 56 66 100 49 40
60 59 56 55 62 48 59 55 51 41
42 69 64 66 50 59 57 65 62 50
64 30 37 75 17 56 20 14 55 90
62 51 55 14 25 34 90 49 56 54
70 47 49 82 40 82 60 85 65 66
49 44 64 69 70 48 12 28 55 65
49 40 25 41 71 80 0 56 14 22
66 53 46 70 43 61 59 12 30 35
45 44 57 76 82 39 32 14 90 25

یا آپ نے اپنے محلے کے 50 گھرانوں کے کھانے پر ماہانہ اخراجات کے بارے میں ڈیٹا جمع کیا ہوگا تاکہ ان کے کھانے پر اوسط اخراجات معلوم ہو سکیں۔ اس صورت میں جمع کردہ ڈیٹا، اگر آپ نے اسے جدول کے طور پر پیش کیا ہوتا، تو جدول 3.2 جیسا ہوتا۔ دونوں جدول 3.1 اور 3.2 خام یا غیر درجہ بند ڈیٹا ہیں۔ دونوں جدولوں میں آپ دیکھیں گے کہ نمبر کسی ترتیب میں نہیں ہیں۔ اب اگر آپ سے جدول 3.1 سے ریاضی میں سب سے زیادہ نمبر پوچھے جائیں تو آپ کو پہلے 100 طلباء کے نمبروں کو چڑھتے یا اترتے ترتیب میں ترتیب دینا ہوگا۔ یہ ایک مشکل کام ہے۔ یہ اور بھی مشکل ہو جاتا ہے، اگر 100 کے بجائے آپ کے پاس 1,000 طلباء کے نمبر ہوں۔ اسی طرح، جدول 3.2 میں، آپ نوٹ کریں گے کہ آپ کے لیے 50 گھرانوں کے اوسط ماہانہ اخراجات کا تعین کرنا مشکل ہے۔ اور یہ مشکل کئی گنا بڑھ جائے گی اگر تعداد زیادہ ہوتی - مثلاً، 5,000 گھرانے۔ ہمارے کباڑی والے کی طرح، جو اپنا کوڑا بڑا اور بے ترتیب ہونے پر کسی خاص چیز کو تلاش کرنے میں پریشان ہو جائے گا، آپ کو بھی اسی طرح کی صورت حال کا سامنا ہوگا جب آپ بڑے خام ڈیٹا سے کوئی معلومات حاصل کرنے کی کوشش کریں گے۔ لہذا، ایک لفظ میں، بڑے غیر درجہ بند ڈیٹا سے معلومات نکالنا ایک مشکل کام ہے۔

جدول 3.2 50 گھرانوں کے کھانے پر ماہانہ گھریلو اخراجات (روپے میں)

1904 1559 3473 1735 2760
2041 1612 1753 1855 4439
5090 1085 1823 2346 1523
1211 1360 1110 2152 1183
1218 1315 1105 2628 2712
4248 1812 1264 1183 1171
1007 1180 1953 1137 2048
2025 1583 1324 2621 3676
1397 1832 1962 2177 2575
1293 1365 1146 3222 1396

خام ڈیٹا کو درجہ بندی کے ذریعے خلاصہ کیا جاتا ہے، اور قابل فہم بنایا جاتا ہے۔ جب ایک جیسی خصوصیات کے حقائق کو ایک ہی طبقے میں رکھا جاتا ہے، تو یہ کسی کو آسانی سے انہیں تلاش کرنے، موازنہ کرنے، اور بغیر کسی مشکل کے نتائج اخذ کرنے کے قابل بناتا ہے۔ آپ نے باب 2 میں پڑھا ہے کہ حکومت ہند ہر دس سال بعد آبادی کی مردم شماری کرتی ہے۔ مردم شماری 2001 میں تقریباً 20 کروڑ افراد سے رابطہ کیا گیا تھا۔ مردم شماری کا خام ڈیٹا اتنا بڑا اور ٹکڑوں میں بٹا ہوا ہے کہ اس سے کوئی معنی خیز نتیجہ اخذ کرنا تقریباً ناممکن لگتا ہے۔ لیکن جب اسی ڈیٹا کو جنس، تعلیم، ازدواجی حیثیت، پیشہ وغیرہ کے مطابق درجہ بندی کیا جاتا ہے، تو اس وقت ہندوستان کی آبادی کی ساخت اور نوعیت آسانی سے سمجھ میں آ جاتی ہے۔

خام ڈیٹا متغیرات پر مشاہدات پر مشتمل ہوتا ہے۔ جدول 3.1 اور 3.2 میں دیے گئے خام ڈیٹا میں کسی مخصوص یا متغیرات کے گروہ پر مشاہدات شامل ہیں۔ مثال کے طور پر جدول 3.1 کو دیکھیں جس میں 100 طلباء کے ریاضی میں حاصل کردہ نمبر ہیں۔ ہم ان نمبروں سے کس طرح معنی اخذ کر سکتے ہیں؟ ریاضی کے استاد ان نمبروں کو دیکھ کر سوچ رہے ہوں گے- میرے طلباء نے کیسا کیا؟ کتنے پاس نہیں ہوئے؟ ہم ڈیٹا کو کیسے درجہ بندی کرتے ہیں یہ ہمارے ذہن میں موجود مقصد پر منحصر ہے۔ اس صورت میں، استاد کچھ گہرائی میں سمجھنا چاہتا ہے- کہ ان طلباء نے کیسا کیا ہے۔ شاید وہ تعدد تقسیم بنانے کا انتخاب کرے گی۔ اس پر اگلے حصے میں بحث کی گئی ہے۔

سرگرمی

  • ایک سال کے لیے اپنے خاندان کے ہفتہ وار کل اخراجات کا ڈیٹا جمع کریں اور اسے ایک جدول میں ترتیب دیں۔ دیکھیں کہ آپ کے پاس کتنے مشاہدات ہیں۔ ڈیٹا کو ماہانہ ترتیب دیں اور مشاہدات کی تعداد معلوم کریں۔

3. ڈیٹا کی درجہ بندی

درجہ بندی کے گروہ یا طبقات مختلف طریقوں سے کیے جاتے ہیں۔ اپنی کتابوں کو مضامین کے مطابق - “تاریخ”، “جغرافیہ”، “ریاضی”، “سائنس” وغیرہ - درجہ بندی کرنے کے بجائے، آپ انہیں مصنف کے لحاظ سے حروف تہجی کی ترتیب میں درجہ بندی کر سکتے تھے۔ یا، آپ انہیں اشاعت کے سال کے مطابق بھی درجہ بندی کر سکتے تھے۔ جس طرح آپ انہیں درجہ بندی کرنا چاہتے ہیں وہ آپ کی ضرورت پر منحصر ہوگا۔

اسی طرح خام ڈیٹا کو مقصد کے لحاظ سے مختلف طریقوں سے درجہ بندی کیا جاتا ہے۔ انہیں وقت کے مطابق گروہ بندی کیا جا سکتا ہے۔ ایسی درجہ بندی کو زمانی درجہ بندی کہا جاتا ہے۔ ایسی درجہ بندی میں، ڈیٹا کو وقت جیسے سالوں، سہ ماہیوں، مہینوں، ہفتوں وغیرہ کے حوالے سے چڑھتے یا اترتے ترتیب میں درجہ بندی کیا جاتا ہے۔ مندرجہ ذیل مثال ہندوستان کی آبادی کو سالوں کے لحاظ سے درجہ بند کر کے دکھاتی ہے۔ متغیر ‘آبادی’ ایک زمانی سلسلہ ہے کیونکہ یہ مختلف سالوں کے لیے اقدار کا ایک سلسلہ ظاہر کرتا ہے۔

مثال 1

ہندوستان کی آبادی (کروڑوں میں)

سال آبادی (کروڑ)
1951 35.7
1961 43.8
1971 54.6
1981 68.4
1991 81.8
2001 102.7
2011 121.0

مقامی درجہ بندی میں ڈیٹا کو جغرافیائی مقامات جیسے ممالک، ریاستوں، شہروں، اضلاع وغیرہ کے حوالے سے درجہ بندی کیا جاتا ہے۔

مثال 2 مختلف ممالک میں گندم کی پیداوار دکھاتی ہے۔

مثال 2

مختلف ممالک کے لیے گندم کی پیداوار (2013)

ملک گندم کی پیداوار (کلوگرام/ہیکٹر)
کینیڈا 3594
چین 5055
فرانس 7254
جرمنی 7998
بھارت 3154
پاکستان 2787

ماخذ: Indian Agricultural Statistics at a Glance, 2015

سرگرمیاں

  • مثال 1 میں، وہ سال معلوم کریں جن میں ہندوستان کی آبادی کم از کم اور زیادہ سے زیادہ تھی،
  • مثال 2 میں، وہ ملک تلاش کریں جس کی گندم کی پیداوار ہندوستان سے تھوڑی سی زیادہ ہے۔ فیصد کے لحاظ سے وہ کتنا ہوگا؟
  • مثال 2 کے ممالک کو پیداوار کی چڑھتی ترتیب میں ترتیب دیں۔ پیداوار کی اترتی ترتیب کے لیے بھی یہی مشق کریں۔

کبھی کبھار آپ ایسی خصوصیات کے بارے میں جانتے ہیں جنہیں مقداری طور پر ظاہر نہیں کیا جا سکتا۔ ایسی خصوصیات کو صفات یا گن کہا جاتا ہے۔ مثال کے طور پر، قومیت، خواندگی، مذہب، جنس، ازدواجی حیثیت وغیرہ۔ انہیں ناپا نہیں جا سکتا۔ پھر بھی ان صفات کو کسی معیاری خصوصیت کی موجودگی یا عدم موجودگی کی بنیاد پر درجہ بندی کیا جا سکتا ہے۔ صفات پر ڈیٹا کی ایسی درجہ بندی کو معیاری درجہ بندی کہا جاتا ہے۔ مندرجہ ذیل مثال میں، ہم دیکھتے ہیں کہ ایک ملک کی آبادی کو معیاری متغیر “جنس” کی بنیاد پر گروہ بندی کیا گیا ہے۔ ایک مشاہدہ یا تو مرد ہو سکتا ہے یا عورت۔ ان دو خصوصیات کو ازدواجی حیثیت کی بنیاد پر مزید درجہ بندی کیا جا سکتا ہے جیسا کہ نیچے دیا گیا ہے:

مثال 3

پہلے مرحلے پر درجہ بندی کسی صفت کی موجودگی اور عدم موجودگی کی بنیاد پر ہے، یعنی مرد یا غیر مرد (عورت)۔ دوسرے مرحلے پر، ہر طبقہ - مرد اور عورت، کو کسی دوسری صفت کی موجودگی یا عدم موجودگی کی بنیاد پر مزید ذیلی تقسیم کیا جاتا ہے، یعنی شادی شدہ ہے یا غیر شادی شدہ۔ خصوصیات، جیسے قد، وزن، عمر، آمدنی، طلباء کے نمبر وغیرہ، فطری طور پر مقداری ہیں۔ جب ایسی خصوصیات کا جمع کردہ ڈیٹا طبقات میں گروہ بندی کیا جاتا ہے، تو یہ ایک مقداری درجہ بندی بن جاتی ہے۔

سرگرمی

  • ارد گرد کی اشیاء کو زندہ یا غیر زندہ کے طور پر گروہ بندی کیا جا سکتا ہے۔ کیا یہ ایک مقداری درجہ بندی ہے؟

مثال 4

100 طلباء کے ریاضی میں نمبروں کی تعدد تقسیم

نمبر تعدد
0-10 1
10-20 8
20-30 6
30-40 7
40-50 21
50-60 23
60-70 19
70-80 6
80-90 5
90-100 4
کل 100

مثال 4 جدول 3.1 میں دیے گئے 100 طلباء کے ریاضی میں نمبروں کی مقداری درجہ بندی دکھاتی ہے۔

سرگرمی

  • مثال 4 کی تعدد کی اقدار کو کل تعدد کے تناسب یا فیصد کے طور پر ظاہر کریں۔ نوٹ کریں کہ اس طرح ظاہر کی گئی تعدد کو نسبتی تعدد کہا جاتا ہے۔
  • مثال 4 میں، کس طبقے میں ڈیٹا کی زیادہ سے زیادہ ارتکاز ہے؟ اسے کل مشاہدات کے فیصد کے طور پر ظاہر کریں۔ کس طبقے میں ڈیٹا کی کم از کم ارتکاز ہے؟

4. متغیرات: مسلسل اور منفصل

متغیر کی ایک سادہ تعریف، جو آپ نے پچھلے باب میں پڑھی ہے، یہ نہیں بتاتی کہ یہ کیسے مختلف ہوتا ہے۔ متغیرات مخصوص معیار کی بنیاد پر مختلف ہوتے ہیں۔ انہیں بڑے پیمانے پر دو اقسام میں تقسیم کیا جاتا ہے:

(i) مسلسل اور

(ii) منفصل۔

ایک مسلسل متغیر کوئی بھی عددی قدر لے سکتا ہے۔ یہ صحیح عددی اقدار $(1,2,3,4, \ldots)$، کسری اقدار $(1 / 2,2 / 3,3 / 4, \ldots)$، اور وہ اقدار لے سکتا ہے جو عین کسر نہیں ہیں ($(\sqrt{2}=1.414$، $\sqrt{3}=1.732, \ldots, \sqrt{7}=2.645$)۔ مثال کے طور پر، ایک طالب علم کا قد، جیسے جیسے وہ $90 \mathrm{~cm}$ سے $150 \mathrm{~cm}$ تک بڑھتا ہے، ان کے درمیان تمام اقدار لے گا۔ یہ پوری اقدار جیسے $90 \mathrm{~cm}, 100 \mathrm{~cm}, 108 \mathrm{~cm}, 150 \mathrm{~cm}$ لے سکتا ہے۔ یہ کسری اقدار جیسے 90.85 $\mathrm{cm}, 102.34 \mathrm{~cm}, 149.99 \mathrm{~cm}$ وغیرہ بھی لے سکتا ہے جو پوری اقدار نہیں ہیں۔ اس طرح متغیر “قد” ہر قابل تصور قدر میں ظاہر ہونے کے قابل ہے اور اس کی اقدار کو لامتناہی درجوں میں بھی توڑا جا سکتا ہے۔ مسلسل متغیر کی دیگر مثالیں وزن، وقت، فاصلہ وغیرہ ہیں۔

مسلسل متغیر کے برعکس، ایک منفصل متغیر صرف کچھ مخصوص اقدار لے سکتا ہے۔ اس کی قدر صرف محدود “چھلانگوں” سے بدلتی ہے۔ یہ ایک قدر سے دوسری قدر میں “چھلانگ” لگاتا ہے لیکن ان کے درمیان کوئی درمیانی قدر نہیں لیتا۔ مثال کے طور پر، ایک متغیر جیسے “ایک کلاس میں طلباء کی تعداد”، مختلف کلاسوں کے لیے، صرف پوری اقدار اختیار کرے گا۔ یہ کوئی کسری قدر جیسے 0.5 نہیں لے سکتا کیونکہ “آدھا طالب علم” بے معنی ہے۔ لہذا یہ 25 اور 26 کے درمیان 25.5 جیسی قدر نہیں لے سکتا۔ بلکہ اس کی قدر 25 یا 26 ہو سکتی تھی۔ جو ہم مشاہدہ کرتے ہیں وہ یہ ہے کہ جیسے جیسے اس کی قدر 25 سے 26 میں بدلتی ہے، ان کے درمیان کی اقدار - کسریں - اس کے ذریعے نہیں لی جاتیں۔ لیکن ہمیں یہ تاثر نہیں ہونا چاہیے کہ ایک منفصل متغیر کوئی کسری قدر نہیں لے سکتا۔ فرض کریں $X$ ایک متغیر ہے جو $1 / 8,1$ / $16,1 / 32,1 / 64, \ldots$ جیسی اقدار لیتا ہے۔ کیا یہ ایک منفصل متغیر ہے؟ ہاں، کیونکہ اگرچہ $\mathrm{X}$ کسری اقدار لیتا ہے لیکن یہ دو متصل کسری اقدار کے درمیان کوئی قدر نہیں لے سکتا۔ یہ $1 /$ 8 سے $1 / 16$ اور $1 / 16$ سے $1 / 32$ میں بدلتا ہے یا “چھلانگ” لگاتا ہے۔ لیکن یہ $1 / 8$ اور $1 / 16$ کے درمیان یا $1 / 16$ اور $1 / 32$ کے درمیان کوئی قدر نہیں لے سکتا۔

سرگرمی

  • درج ذیل متغیرات کو مسلسل اور منفصل کے طور پر ممیز کریں: رقبہ، حجم، درجہ حرارت، پانسے پر ظاہر ہونے والا نمبر، فصل کی پیداوار، آبادی، بارش، سڑک پر گاڑیوں کی تعداد اور عمر۔

مثال 4 دکھاتی ہے کہ 100 طلباء کے نمبروں کو کیسے طبقات میں گروہ بندی کیا گیا ہے۔ آپ سوچ رہے ہوں گے کہ ہمیں یہ جدول 3.1 کے خام ڈیٹا سے کیسے ملا۔ لیکن، اس سوال کو حل کرنے سے پہلے، آپ کو معلوم ہونا چاہیے کہ تعدد تقسیم کیا ہے۔

5. تعدد تقسیم کیا ہے؟

تعدد تقسیم ایک مقداری متغیر کے خام ڈیٹا کو درجہ بندی کرنے کا ایک جامع طریقہ ہے۔ یہ دکھاتی ہے کہ ایک متغیر کی مختلف اقدار (یہاں، ایک طالب علم کے ریاضی میں حاصل کردہ نمبر) مختلف طبقات میں کیسے تقسیم ہیں ان کے متعلقہ طبقہ تعدد کے ساتھ۔ اس صورت میں ہمارے پاس نمبروں کے دس طبقات ہیں: $0-10,10-20, \ldots$, 90-100۔ اصطلاح طبقہ تعدد کا مطلب ہے کسی خاص طبقے میں اقدار کی تعداد۔ مثال کے طور پر، طبقہ 30-40 میں ہمیں جدول 3.1 کے خام ڈیٹا سے نمبروں کی 7 اقدار ملتی ہیں۔ وہ $30,37,34,30,35,39,32$ ہیں۔ طبقہ: $30-40$ کی تعدد اس طرح 7 ہے۔ لیکن آپ سوچ رہے ہوں گے کہ $40-$ جو خام ڈیٹا میں دو بار آ رہا ہے - اسے طبقہ 30-40 میں شامل کیوں نہیں کیا گیا۔ اگر اسے شامل کیا جاتا تو 30-40 کی طبقہ تعدد 7 کے بجائے 9 ہوتی۔ اگر آپ اس باب کو غور سے پڑھنے کے لیے کافی صبر کریں تو آپ کے لیے یہ پہیلی واضح ہو جائے گی۔ لہذا جاری رکھیں۔ آپ خود جواب تلاش کر لیں گے۔

تعدد تقسیم جدول میں ہر طبقہ طبقہ حدود سے محدود ہوتا ہے۔ طبقہ حدود ایک طبقے کے دو سرے ہیں۔ سب سے کم قدر کو زیریں طبقہ حد کہا جاتا ہے اور سب سے زیادہ قدر کو بالائی طبقہ حد کہا جاتا ہے۔ مثال کے طور پر، طبقہ: 60-70 کے لیے طبقہ حدود 60 اور 70 ہیں۔ اس کی زیریں طبقہ حد 60 ہے اور اس کی بالائی طبقہ حد 70 ہے۔ طبقہ وقفہ یا طبقہ چوڑائی بالائی طبقہ حد اور زیریں طبقہ حد کے درمیان فرق ہے۔ طبقہ 60-70 کے لیے، طبقہ وقفہ 10 ہے (بالائی طبقہ حد منفی زیریں طبقہ حد)۔

طبقہ وسط نقطہ یا طبقہ نشان ایک طبقے کی درمیانی قدر ہے۔ یہ زیریں طبقہ حد اور بالائی طبقہ حد کے درمیان آدھے راستے پر واقع ہوتا ہے اور مندرجہ ذیل طریقے سے معلوم کیا جا سکتا ہے:

طبقہ وسط نقطہ یا طبقہ نشان

$$ \text { = (Upper Class Limit + Lower Class Limit)/2 } $$

ہر طبقے کے لیے طبقہ نشان یا وسط قدر طبقے کی نمائندگی کے لیے استعمال ہوتا ہے۔ ایک بار جب خام ڈیٹا کو طبقات میں گروہ بندی کر دیا جاتا ہے، تو انفرادی مشاہدات مزید حسابات میں استعمال نہیں ہوتے۔ اس کے بجائے، طبقہ نشان استعمال ہوتا ہے۔

جدول 3.3 زیریں طبقہ حدود، بالائی طبقہ حدود اور طبقہ نشان

طبقہ تعدد زیریں طبقہ حد بالائی طبقہ حد طبقہ نشان
0-10 1 0 10 5
10-20 8 10 20 15
20-30 6 20 30 25
30-40 7 30 40 35
40-50 21 40 50 45
50-60 23 50 60 55
60-70 19 60 70 65
70-80 6 70 80 75
80-90 5 80 90 85
90-100 4 90 100 95

تعدد منحنی ایک تعدد تقسیم کی گرافک نمائندگی ہے۔ شکل 3.1 ہماری اوپر دی گئی مثال کے ڈیٹا کی تعدد تقسیم کی تصویری پیشکش دکھاتی ہے۔ تعدد منحنی حاصل کرنے کے لیے ہم طبقہ نشانات کو $\mathrm{X}$-محور پر اور تعدد کو $\mathrm{Y}$ محور پر پلاتے ہیں۔

شکل 3.1: ڈیٹا کی تعدد تقسیم کی تصویری پیشکش۔

تعدد تقسیم کیسے تیار کریں

تعدد تقسیم تیار کرتے وقت، درج ذیل پانچ سوالات کو حل کرنے کی ضرورت ہے:

  1. کیا ہمارے پاس برابر یا غیر برابر سائز کے طبقہ وقفے ہونے چاہئیں؟
  2. ہمارے پاس کتنے طبقات ہونے چاہئیں؟
  3. ہر طبقے کا سائز کیا ہونا چاہیے؟
  4. ہمیں طبقہ حدود کا تعین کیسے کرنا چاہیے؟
  5. ہمیں ہر طبقے کے لیے تعدد کیسے حاصل کرنی چاہیے؟

کیا ہمارے پاس برابر یا غیر برابر سائز کے طبقہ وقفے ہونے چاہئیں؟

دو حالتیں ہیں جن میں غیر برابر سائز کے وقفے استعمال ہوتے ہیں۔ پہلا، جب ہمارے پاس آمدنی اور دیگر اسی طرح کے متغیرات پر ڈیٹا ہو جہاں حد بہت زیادہ ہو۔ مثال کے طور پر، یومیہ آمدنی تقریباً صفر سے لے کر کئی سو کروڑ روپے تک ہو سکتی ہے۔ ایسی صورت حال میں، برابر طبقہ وقفے مناسب نہیں ہیں کیونکہ (i) اگر طبقہ وق