باب 03: ڈیٹا کی تنظیم
1. تعارف
پچھلے باب میں آپ نے سیکھا کہ ڈیٹا کیسے جمع کیا جاتا ہے۔ آپ نے مردم شماری اور نمونہ گیری کے درمیان فرق بھی جانا۔ اس باب میں، آپ جان پائیں گے کہ جو ڈیٹا آپ نے جمع کیا ہے، اسے کیسے درجہ بندی کرنا ہے۔ خام ڈیٹا کو درجہ بندی کرنے کا مقصد ان میں ترتیب لانا ہے تاکہ ان پر مزید احصائی تجزیہ آسانی سے کیا جا سکے۔
کیا آپ نے کبھی اپنے مقامی کباڑی فروش یا کباڑی والے کو دیکھا ہے جسے آپ پرانے اخبارات، ٹوٹے ہوئے گھریلو سامان، خالی شیشے کی بوتلیں، پلاسٹک وغیرہ بیچتے ہیں؟ وہ یہ چیزیں آپ سے خریدتا ہے اور انہیں ان لوگوں کو بیچتا ہے جو انہیں ری سائیکل کرتے ہیں۔ لیکن اپنی دکان میں اتنے زیادہ کباڑ کے ساتھ اس کے لیے اپنے کاروبار کا انتظام کرنا بہت مشکل ہو جاتا، اگر اس نے انہیں مناسب طریقے سے منظم نہ کیا ہوتا۔ اپنی صورت حال کو آسان بنانے کے لیے وہ مختلف کباڑ کو مناسب طریقے سے گروپ یا “درجہ بندی” کرتا ہے۔ وہ پرانے اخبارات کو ایک ساتھ رکھتا ہے اور انہیں رسی سے باندھ دیتا ہے۔ پھر تمام خالی شیشے کی بوتلیں ایک بوری میں جمع کرتا ہے۔ وہ دھاتوں کی چیزوں کا ڈھیر اپنی دکان کے ایک کونے میں لگاتا ہے اور انہیں “لوہا”، “تانبا”، “ایلومینیم”، “پیتل” وغیرہ جیسے گروپوں میں ترتیب دیتا ہے، اور اسی طرح۔ اس طرح وہ اپنے کباڑ کو مختلف اقسام - “اخبارات”، “پلاسٹک”، “شیشہ”، “دھاتیں” وغیرہ - میں گروپ کرتا ہے اور ان میں ترتیب لاتا ہے۔ ایک بار جب اس کا کباڑ ترتیب دیا اور درجہ بندی کر دیا جاتا ہے، تو اس کے لیے کوئی خاص چیز تلاش کرنا آسان ہو جاتا ہے جس کی کسی خریدار کو ضرورت ہو۔
اسی طرح جب آپ اپنی اسکول کی کتابوں کو ایک خاص ترتیب میں رکھتے ہیں، تو آپ کے لیے انہیں سنبھالنا آسان ہو جاتا ہے۔ آپ انہیں مضامین کے مطابق درجہ بندی کر سکتے ہیں جہاں ہر مضمون ایک گروپ یا کلاس بن جاتا ہے۔ لہذا، جب آپ کو مثال کے طور پر تاریخ کی کوئی خاص کتاب درکار ہو، تو آپ کو صرف “تاریخ” کے گروپ میں اس کتاب کو تلاش کرنے کی ضرورت ہے۔ ورنہ، آپ کو مطلوبہ کتاب تلاش کرنے کے لیے اپنے پورے ذخیرے میں تلاش کرنا پڑے گا۔
اگرچہ چیزوں یا اشیاء کی درجہ بندی ہمارا قیمتی وقت اور محنت بچاتی ہے، لیکن یہ کسی من مانی طریقے سے نہیں کی جاتی۔ کباڑی والا اپنے کباڑ کو دوبارہ استعمال ہونے والے سامان کی منڈیوں کے مطابق گروپ کرتا ہے۔ مثال کے طور پر، “شیشہ” کے گروپ کے تحت وہ خالی بوتلیں، ٹوٹے ہوئے آئینے اور کھڑکی کے شیشے وغیرہ رکھے گا۔ اسی طرح جب آپ اپنی تاریخ کی کتابوں کو “تاریخ” کے گروپ کے تحت درجہ بندی کرتے ہیں تو آپ اس گروپ میں کسی دوسرے مضمون کی کتاب نہیں رکھیں گے۔ ورنہ گروپ بندی کا پورا مقصد ضائع ہو جائے گا۔ لہذا، درجہ بندی کچھ معیارات کی بنیاد پر چیزوں کو گروپوں یا کلاسوں میں ترتیب دینا یا منظم کرنا ہے۔
سرگرمی
- اپنے مقامی ڈاک خانے کا دورہ کریں تاکہ معلوم ہو سکے کہ خطوط کیسے چھانٹے جاتے ہیں۔ کیا آپ جانتے ہیں کہ خط میں پن کوڈ کیا ظاہر کرتا ہے؟ اپنے ڈاکیا سے پوچھیں۔
2. خام ڈیٹا
کباڑی والے کے کباڑ کی طرح، غیر درجہ بند ڈیٹا یا خام ڈیٹا انتہائی غیر منظم ہوتے ہیں۔ وہ اکثر بہت بڑے اور سنبھالنے میں مشکل ہوتے ہیں۔ ان سے معنی خیز نتائج اخذ کرنا ایک طویل کام ہے کیونکہ وہ آسانی سے احصائی طریقوں کے تابع نہیں ہوتے۔ لہذا کسی بھی منظم احصائی تجزیے سے پہلے ایسے ڈیٹا کی مناسب تنظیم اور پیشکش کی ضرورت ہوتی ہے۔ اس لیے ڈیٹا جمع کرنے کے بعد اگلا مرحلہ انہیں منظم کرنا اور درجہ بند شکل میں پیش کرنا ہے۔
فرض کریں کہ آپ ریاضی میں طلبہ کی کارکردگی جاننا چاہتے ہیں اور آپ نے اپنے اسکول کے 100 طلبہ کے ریاضی کے نمبروں پر ڈیٹا جمع کیا ہے۔ اگر آپ انہیں ایک جدول کے طور پر پیش کریں، تو وہ کچھ اس طرح نظر آئیں گے جیسے جدول 3.1۔
جدول 3.1 ایک امتحان میں 100 طلبہ کے حاصل کردہ ریاضی کے نمبر
| 47 | 45 | 10 | 60 | 51 | 56 | 66 | 100 | 49 | 40 |
| 60 | 59 | 56 | 55 | 62 | 48 | 59 | 55 | 51 | 41 |
| 42 | 69 | 64 | 66 | 50 | 59 | 57 | 65 | 62 | 50 |
| 64 | 30 | 37 | 75 | 17 | 56 | 20 | 14 | 55 | 90 |
| 62 | 51 | 55 | 14 | 25 | 34 | 90 | 49 | 56 | 54 |
| 70 | 47 | 49 | 82 | 40 | 82 | 60 | 85 | 65 | 66 |
| 49 | 44 | 64 | 69 | 70 | 48 | 12 | 28 | 55 | 65 |
| 49 | 40 | 25 | 41 | 71 | 80 | 0 | 56 | 14 | 22 |
| 66 | 53 | 46 | 70 | 43 | 61 | 59 | 12 | 30 | 35 |
| 45 | 44 | 57 | 76 | 82 | 39 | 32 | 14 | 90 | 25 |
یا آپ نے اپنے محلے کے 50 گھرانوں کے کھانے پر ماہانہ اخراجات کا ڈیٹا ان کے کھانے پر اوسط اخراجات جاننے کے لیے جمع کیا ہوگا۔ اس صورت میں جمع کردہ ڈیٹا، اگر آپ نے اسے جدول کے طور پر پیش کیا ہوتا، تو جدول 3.2 جیسا ہوتا۔ دونوں جدول 3.1 اور 3.2 خام یا غیر درجہ بند ڈیٹا ہیں۔ دونوں جدولوں میں آپ دیکھیں گے کہ نمبر کسی ترتیب میں نہیں ہیں۔ اب اگر آپ سے جدول 3.1 سے ریاضی میں سب سے زیادہ نمبر پوچھے جائیں تو آپ کو پہلے 100 طلبہ کے نمبروں کو چڑھتے یا اترتے ترتیب میں ترتیب دینا ہوگا۔ یہ ایک طویل کام ہے۔ یہ اور بھی زیادہ طویل ہو جاتا ہے، اگر 100 کی بجائے آپ کے پاس 1,000 طلبہ کے نمبر ہوں۔ اسی طرح، جدول 3.2 میں، آپ نوٹ کریں گے کہ آپ کے لیے 50 گھرانوں کے اوسط ماہانہ اخراجات کا تعین کرنا مشکل ہے۔ اور یہ مشکل کئی گنا بڑھ جائے گی اگر تعداد زیادہ ہوتی - مثلاً 5,000 گھرانے۔ ہمارے کباڑی والے کی طرح، جو اپنا کباڑ بڑا اور بکھرا ہوا ہونے پر کسی خاص چیز کو تلاش کرنے میں پریشان ہو جاتا، آپ کو بھی اسی طرح کی صورت حال کا سامنا ہوگا جب آپ بڑے خام ڈیٹا سے کوئی معلومات حاصل کرنے کی کوشش کریں گے۔ لہذا، ایک لفظ میں، بڑے غیر درجہ بند ڈیٹا سے معلومات نکالنا ایک طویل کام ہے۔
جدول 3.2 50 گھرانوں کے کھانے پر ماہانہ گھریلو اخراجات (روپے میں)
| — | — | — | — | — |
|---|---|---|---|---|
| 1904 | 1559 | 3473 | 1735 | 2760 |
| 2041 | 1612 | 1753 | 1855 | 4439 |
| 5090 | 1085 | 1823 | 2346 | 1523 |
| 1211 | 1360 | 1110 | 2152 | 1183 |
| 1218 | 1315 | 1105 | 2628 | 2712 |
| 4248 | 1812 | 1264 | 1183 | 1171 |
| 1007 | 1180 | 1953 | 1137 | 2048 |
| 2025 | 1583 | 1324 | 2621 | 3676 |
| 1397 | 1832 | 1962 | 2177 | 2575 |
| 1293 | 1365 | 1146 | 3222 | 1396 |
خام ڈیٹا کو درجہ بندی کے ذریعے خلاصہ کیا جاتا ہے، اور قابل فہم بنایا جاتا ہے۔ جب ایک جیسی خصوصیات کے حقائق ایک ہی کلاس میں رکھے جاتے ہیں، تو یہ کسی کو آسانی سے انہیں تلاش کرنے، موازنہ کرنے، اور بغیر کسی مشکل کے نتائج اخذ کرنے کے قابل بناتا ہے۔ آپ نے باب 2 میں پڑھا ہے کہ حکومت ہند ہر دس سال بعد آبادی کی مردم شماری کرتی ہے۔ مردم شماری 2001 میں تقریباً 20 کروڑ افراد سے رابطہ کیا گیا تھا۔ مردم شماری کا خام ڈیٹا اتنا بڑا اور ٹکڑوں میں ہے کہ اس سے کوئی معنی خیز نتیجہ نکالنا تقریباً ناممکن کام لگتا ہے۔ لیکن جب اسی ڈیٹا کو جنس، تعلیم، ازدواجی حیثیت، پیشہ وغیرہ کے مطابق درجہ بندی کیا جاتا ہے، تو اس وقت ہندوستان کی آبادی کی ساخت اور نوعیت آسانی سے سمجھ میں آ جاتی ہے۔
خام ڈیٹا متغیرات پر مشاہدات پر مشتمل ہوتا ہے۔ جدول 3.1 اور 3.2 میں دیے گئے خام ڈیٹا کسی مخصوص یا متغیرات کے گروپ پر مشاہدات پر مشتمل ہیں۔ مثال کے طور پر جدول 3.1 کو دیکھیں جس میں 100 طلبہ کے ریاضی میں حاصل کردہ نمبر ہیں۔ ہم ان نمبروں سے کس طرح معنی اخذ کر سکتے ہیں؟ ریاضی کے استاد ان نمبروں کو دیکھ کر سوچ رہے ہوں گے- میرے طلبہ نے کیسا کیا ہے؟ کتنے پاس نہیں ہوئے؟ ہم ڈیٹا کو کیسے درجہ بندی کرتے ہیں یہ ہمارے ذہن میں موجود مقصد پر منحصر ہے۔ اس صورت میں، استاد کچھ گہرائی میں سمجھنا چاہتا ہے کہ ان طلبہ نے کیسا کیا ہے۔ شاید وہ تعدد تقسیم تعمیر کرنے کا انتخاب کرے گی۔ اس پر اگلے حصے میں بحث کی گئی ہے۔
سرگرمی
- ایک سال کے لیے اپنے خاندان کے ہفتہ وار کل اخراجات کا ڈیٹا جمع کریں اور اسے ایک جدول میں ترتیب دیں۔ دیکھیں کہ آپ کے پاس کتنے مشاہدات ہیں۔ ڈیٹا کو ماہانہ ترتیب دیں اور مشاہدات کی تعداد معلوم کریں۔
3. ڈیٹا کی درجہ بندی
درجہ بندی کے گروپ یا کلاس مختلف طریقوں سے کیے جاتے ہیں۔ اپنی کتابوں کو مضامین کے مطابق - “تاریخ”، “جغرافیہ”، “ریاضی”، “سائنس” وغیرہ - درجہ بندی کرنے کی بجائے، آپ انہیں مصنف کے لحاظ سے حروف تہجی کی ترتیب میں درجہ بندی کر سکتے تھے۔ یا، آپ انہیں اشاعت کے سال کے مطابق بھی درجہ بندی کر سکتے تھے۔ جس طرح آپ انہیں درجہ بندی کرنا چاہتے ہیں وہ آپ کی ضرورت پر منحصر ہوگا۔
اسی طرح خام ڈیٹا کو مقصد کے لحاظ سے مختلف طریقوں سے درجہ بندی کیا جاتا ہے۔ انہیں وقت کے مطابق گروپ کیا جا سکتا ہے۔ ایسی درجہ بندی کو زمانی درجہ بندی کہا جاتا ہے۔ ایسی درجہ بندی میں، ڈیٹا کو وقت جیسے سالوں، سہ ماہی، مہینوں، ہفتوں وغیرہ کے حوالے سے چڑھتے یا اترتے ترتیب میں درجہ بندی کیا جاتا ہے۔ مندرجہ ذیل مثال ہندوستان کی آبادی کو سالوں کے لحاظ سے درجہ بند کر کے دکھاتی ہے۔ متغیر ‘آبادی’ ایک زمانی سلسلہ ہے کیونکہ یہ مختلف سالوں کے لیے اقدار کا ایک سلسلہ ظاہر کرتا ہے۔
مثال 1
ہندوستان کی آبادی (کروڑوں میں)
| سال | آبادی (کروڑ) |
|---|---|
| 1951 | 35.7 |
| 1961 | 43.8 |
| 1971 | 54.6 |
| 1981 | 68.4 |
| 1991 | 81.8 |
| 2001 | 102.7 |
| 2011 | 121.0 |
مکانی درجہ بندی میں ڈیٹا کو جغرافیائی مقامات جیسے ممالک، ریاستوں، شہروں، اضلاع وغیرہ کے حوالے سے درجہ بندی کیا جاتا ہے۔
مثال 2 مختلف ممالک میں گندم کی پیداوار دکھاتی ہے۔
مثال 2
مختلف ممالک کے لیے گندم کی پیداوار (2013)
| ملک | گندم کی پیداوار (کلوگرام/ہیکٹر) |
|---|---|
| کینیڈا | 3594 |
| چین | 5055 |
| فرانس | 7254 |
| جرمنی | 7998 |
| ہندوستان | 3154 |
| پاکستان | 2787 |
ماخذ: Indian Agricultural Statistics at a Glance, 2015
سرگرمیاں
- مثال 1 میں، وہ سال معلوم کریں جن میں ہندوستان کی آبادی کم از کم اور زیادہ سے زیادہ تھی۔
- مثال 2 میں، وہ ملک تلاش کریں جس کی گندم کی پیداوار ہندوستان سے تھوڑی سی زیادہ ہے۔ فیصد کے لحاظ سے یہ کتنا ہوگا؟
- مثال 2 کے ممالک کو پیداوار کی چڑھتی ترتیب میں ترتیب دیں۔ پیداوار کی اترتی ترتیب کے لیے بھی یہی مشق کریں۔
کبھی کبھی آپ ایسی خصوصیات کے بارے میں جانتے ہیں جنہیں مقداری طور پر ظاہر نہیں کیا جا سکتا۔ ایسی خصوصیات کو صفات کہا جاتا ہے۔ مثال کے طور پر، قومیت، خواندگی، مذہب، جنس، ازدواجی حیثیت وغیرہ۔ انہیں ناپا نہیں جا سکتا۔ پھر بھی ان صفات کو کسی معیاری خصوصیت کی موجودگی یا عدم موجودگی کی بنیاد پر درجہ بندی کیا جا سکتا ہے۔ صفات پر ڈیٹا کی ایسی درجہ بندی کو معیاری درجہ بندی کہا جاتا ہے۔ مندرجہ ذیل مثال میں، ہم دیکھتے ہیں کہ ایک ملک کی آبادی کو معیاری متغیر “جنس” کی بنیاد پر گروپ کیا گیا ہے۔ ایک مشاہدہ یا تو مرد ہو سکتا ہے یا عورت۔ ان دو خصوصیات کو ازدواجی حیثیت کی بنیاد پر مزید درجہ بندی کیا جا سکتا ہے جیسا کہ نیچے دیا گیا ہے:
مثال 3
پہلے مرحلے پر درجہ بندی کسی صفت کی موجودگی اور عدم موجودگی کی بنیاد پر ہے، یعنی مرد یا غیر مرد (عورت)۔ دوسرے مرحلے پر، ہر کلاس - مرد اور عورت، کو کسی دوسری صفت کی موجودگی یا عدم موجودگی کی بنیاد پر مزید ذیلی تقسیم کیا جاتا ہے، یعنی شادی شدہ ہے یا غیر شادی شدہ۔ خصوصیات، جیسے قد، وزن، عمر، آمدنی، طلبہ کے نمبر وغیرہ، فطری طور پر مقداری ہیں۔ جب ایسی خصوصیات کا جمع کردہ ڈیٹا کلاسوں میں گروپ کیا جاتا ہے، تو یہ ایک مقداری درجہ بندی بن جاتی ہے۔
سرگرمی
- ارد گرد کی اشیاء کو زندہ یا غیر زندہ کے طور پر گروپ کیا جا سکتا ہے۔ کیا یہ ایک مقداری درجہ بندی ہے؟
مثال 4
100 طلبہ کے ریاضی کے نمبروں کی تعدد تقسیم
| نمبر | تعدد |
|---|---|
| 0-10 | 1 |
| 10-20 | 8 |
| 20-30 | 6 |
| 30-40 | 7 |
| 40-50 | 21 |
| 50-60 | 23 |
| 60-70 | 19 |
| 70-80 | 6 |
| 80-90 | 5 |
| 90-100 | 4 |
| کل | 100 |
مثال 4 جدول 3.1 میں دیے گئے 100 طلبہ کے ریاضی کے نمبروں کی مقداری درجہ بندی دکھاتی ہے۔
سرگرمی
- مثال 4 کی تعدد کی اقدار کو کل تعدد کے تناسب یا فیصد کے طور پر ظاہر کریں۔ نوٹ کریں کہ اس طرح ظاہر کی گئی تعدد کو نسبتی تعدد کہا جاتا ہے۔
- مثال 4 میں، کس کلاس میں ڈیٹا کی زیادہ سے زیادہ ارتکاز ہے؟ اسے کل مشاہدات کے فیصد کے طور پر ظاہر کریں۔ کس کلاس میں ڈیٹا کی کم از کم ارتکاز ہے؟
4. متغیرات: مسلسل اور منفصل
متغیر کی ایک سادہ تعریف، جو آپ نے پچھلے باب میں پڑھی ہے، یہ نہیں بتاتی کہ یہ کیسے بدلتا ہے۔ متغیرات مخصوص معیارات کی بنیاد پر مختلف ہوتے ہیں۔ انہیں بڑے پیمانے پر دو اقسام میں تقسیم کیا جاتا ہے:
(i) مسلسل اور بلا تعطل
(ii) منفصل ریاضی۔
ایک مسلسل متغیر کوئی بھی عددی قدر لے سکتا ہے۔ یہ صحیح عددی اقدار $(1,2,3,4, \ldots)$، کسری اقدار $(1 / 2,2 / 3,3 / 4, \ldots)$، اور وہ اقدار لے سکتا ہے جو عین کسر نہیں ہیں ($(\sqrt{2}=1.414$، $\sqrt{3}=1.732, \ldots, \sqrt{7}=2.645$)۔ مثال کے طور پر، ایک طالب علم کا قد، جیسے جیسے وہ $90 \mathrm{~cm}$ سے $150 \mathrm{~cm}$ تک بڑھتا ہے، ان کے درمیان تمام اقدار لے گا۔ یہ وہ اقدار لے سکتا ہے جو پورے نمبر ہیں جیسے $90 \mathrm{~cm}, 100 \mathrm{~cm}, 108 \mathrm{~cm}, 150 \mathrm{~cm}$۔ یہ کسری اقدار بھی لے سکتا ہے جیسے 90.85 $\mathrm{cm}, 102.34 \mathrm{~cm}, 149.99 \mathrm{~cm}$ وغیرہ جو پورے نمبر نہیں ہیں۔ اس طرح متغیر “قد” ہر قابل تصور قدر میں ظاہر ہونے کے قابل ہے اور اس کی اقدار کو لامتناہی درجوں میں بھی توڑا جا سکتا ہے۔ مسلسل متغیر کی دیگر مثالیں وزن، وقت، فاصلہ وغیرہ ہیں۔
ایک مسلسل متغیر کے برعکس، ایک منفصل متغیر صرف کچھ مخصوص اقدار لے سکتا ہے۔ اس کی قدر صرف محدود “چھلانگوں” سے بدلتی ہے۔ یہ ایک قدر سے دوسری قدر میں “چھلانگ” لگاتا ہے لیکن ان کے درمیان کوئی درمیانی قدر نہیں لیتا۔ مثال کے طور پر، ایک متغیر جیسے “ایک کلاس میں طلبہ کی تعداد”، مختلف کلاسوں کے لیے، ایسی اقدار اختیار کرے گا جو صرف پورے نمبر ہیں۔ یہ 0.5 جیسی کوئی کسری قدر نہیں لے سکتا کیونکہ “آدھا طالب علم” بے معنی ہے۔ لہذا یہ 25 اور 26 کے درمیان 25.5 جیسی کوئی قدر نہیں لے سکتا۔ بلکہ اس کی قدر 25 یا 26 ہو سکتی تھی۔ جو ہم مشاہدہ کرتے ہیں وہ یہ ہے کہ جیسے جیسے اس کی قدر 25 سے 26 میں بدلتی ہے، ان کے درمیان کی اقدار - کسریں - اس کے ذریعے نہیں لی جاتیں۔ لیکن ہمیں یہ تاثر نہیں ہونا چاہیے کہ ایک منفصل متغیر کوئی کسری قدر نہیں لے سکتا۔ فرض کریں $X$ ایک متغیر ہے جو $1 / 8,1$ / $16,1 / 32,1 / 64, \ldots$ جیسی اقدار لیتا ہے۔ کیا یہ ایک منفصل متغیر ہے؟ ہاں، کیونکہ اگرچہ $\mathrm{X}$ کسری اقدار لیتا ہے لیکن یہ دو متصل کسری اقدار کے درمیان کوئی قدر نہیں لے سکتا۔ یہ $1 /$ 8 سے $1 / 16$ اور $1 / 16$ سے $1 / 32$ میں بدلتا ہے یا “چھلانگ” لگاتا ہے۔ لیکن یہ $1 / 8$ اور $1 / 16$ کے درمیان یا $1 / 16$ اور $1 / 32$ کے درمیان کوئی قدر نہیں لے سکتا۔
سرگرمی
- درج ذیل متغیرات کو مسلسل اور منفصل کے طور پر ممیز کریں: رقبہ، حجم، درجہ حرارت، پانسے پر ظاہر ہونے والا نمبر، فصل کی پیداوار، آبادی، بارش، سڑک پر گاڑیوں کی تعداد اور عمر۔
مثال 4 دکھاتی ہے کہ 100 طلبہ کے نمبروں کو کلاسوں میں کیسے گروپ کیا گیا ہے۔ آپ سوچ رہے ہوں گے کہ ہمیں یہ جدول 3.1 کے خام ڈیٹا سے کیسے ملا۔ لیکن، اس سوال سے نمٹنے سے پہلے، آپ کو یہ جاننا ہوگا کہ تعدد تقسیم کیا ہے۔
5. تعدد تقسیم کیا ہے؟
تعدد تقسیم ایک مقداری متغیر کے خام ڈیٹا کو درجہ بندی کرنے کا ایک جامع طریقہ ہے۔ یہ دکھاتی ہے کہ ایک متغیر کی مختلف اقدار (یہاں، ایک طالب علم کے ریاضی میں حاصل کردہ نمبر) مختلف کلاسوں میں کیسے تقسیم ہیں ان کی متعلقہ کلاس تعدد کے ساتھ۔ اس صورت میں ہمارے پاس نمبروں کی دس کلاسیں ہیں: $0-10,10-20, \ldots$, 90-100۔ اصطلاح کلاس تعدد کا مطلب ہے کسی خاص کلاس میں اقدار کی تعداد۔ مثال کے طور پر، کلاس 30-40 میں ہمیں جدول 3.1 کے خام ڈیٹا سے نمبروں کی 7 اقدار ملتی ہیں۔ وہ $30,37,34,30,35,39,32$ ہیں۔ کلاس: $30-40$ کی تعدد اس طرح 7 ہے۔ لیکن آپ سوچ رہے ہوں گے کہ $40-$ جو خام ڈیٹا میں دو بار آ رہا ہے - اسے کلاس 30-40 میں شامل کیوں نہیں کیا گیا۔ اگر اسے شامل کیا جاتا تو 30-40 کی کلاس تعدد 7 کی بجائے 9 ہوتی۔ اگر آپ اس باب کو غور سے پڑھنے کے لیے کافی صبر کریں تو یہ پہیلی آپ کے لیے واضح ہو جائے گی۔ لہذا جاری رکھیں۔ آپ خود جواب تلاش کر لیں گے۔
تعدد تقسیم جدول میں ہر کلاس کلاس حدود سے محدود ہوتی ہے۔ کلاس حدود ایک کلاس کے دو سرے ہیں۔ سب سے کم قدر کو زیریں کلاس حد اور سب سے زیادہ قدر کو بالائی کلاس حد کہا جاتا ہے۔ مثال کے طور پر، کلاس: 60-70 کے لیے کلاس حدود 60 اور 70 ہیں۔ اس کی زیریں کلاس حد 60 ہے اور اس کی بالائی کلاس حد 70 ہے۔ کلاس وقفہ یا کلاس چوڑائی بالائی کلاس حد اور زیریں کلاس حد کے درمیان فرق ہے۔ کلاس 60-70 کے لیے، کلاس وقفہ 10 ہے (بالائی کلاس حد منفی زیریں کلاس حد)۔
کلاس وسط نقطہ یا کلاس نشان ایک کلاس کی درمیانی قدر ہے۔ یہ ایک کلاس کی زیریں کلاس حد اور بالائی کلاس حد کے درمیان آدھے راستے پر ہوتا ہے اور مندرجہ ذیل طریقے سے معلوم کیا جا سکتا ہے:
کلاس وسط نقطہ یا کلاس نشان
$$ \text { = (Upper Class Limit + Lower Class Limit)/2 } $$
ہر کلاس کے کلاس نشان یا وسط قدر کو کلاس کی نمائندگی کے لیے استعمال کیا جاتا ہے۔ ایک بار جب خام ڈیٹا کو کلاسوں میں گروپ کیا جاتا ہے، تو انفرادی مشاہدات مزید حسابات میں استعمال نہیں ہوتے۔ اس کی بجائے، کلاس نشان استعمال ہوتا ہے۔
جدول 3.3 زیریں کلاس حدود، بالائی کلاس حدود اور کلاس نشان
| کلاس | تعدد | زیریں کلاس حد | بالائی کلاس حد | کلاس نشان |
|---|---|---|---|---|
| 0-10 | 1 | 0 | 10 | 5 |
| 10-20 | 8 | 10 | 20 | 15 |
| 20-30 | 6 | 20 | 30 | 25 |
| 30-40 | 7 | 30 | 40 | 35 |
| 40-50 | 21 | 40 | 50 | 45 |
| 50-60 | 23 | 50 | 60 | 55 |
| 60-70 | 19 | 60 | 70 | 65 |
| 70-80 | 6 | 70 | 80 | 75 |
| 80-90 | 5 | 80 | 90 | 85 |
| 90-100 | 4 | 90 | 100 | 95 |
تعدد منحنی ایک تعدد تقسیم کی گرافک نمائندگی ہے۔ شکل 3.1 ہماری اوپر دی گئی مثال کے ڈیٹا کی تعدد تقسیم کی تصویری پیشکش دکھاتی ہے۔ تعدد منحنی حاصل کرنے کے لیے ہم کلاس نشانات کو $\mathrm{X}$-محور پر اور تعدد کو $\mathrm{Y}$ محور پر پلاتے ہیں۔
شکل 3.1: ڈیٹا کی تعدد تقسیم کی تصویری پیشکش۔
تعدد تقسیم کیسے بنائیں
تعدد تقسیم تیار کرتے وقت، درج ذیل پانچ سوالات پر توجہ دینے کی ضرورت ہے:
- کیا ہمارے پاس برابر یا غیر برابر سائز کے کلاس وقفے ہونے چاہئیں؟
- ہمارے پاس کتنی کلاسیں ہونی چاہئیں؟
- ہر کلاس کا سائز کیا ہونا چاہیے؟
- ہمیں کلاس حدود کیسے طے کرنی چاہئیں؟
- ہمیں ہر کلاس کے لیے تعدد کیسے حاصل کرنا چاہیے؟
کیا ہمارے پاس برابر یا غیر برابر سائز کے کلاس وقفے ہونے چاہئیں؟
دو حالتیں ہیں جن میں غیر برابر سائز کے وقفے استعمال ہوتے ہیں۔ پہلا، جب ہمارے پاس آمدنی اور دیگر اسی طرح کے متغیرات پر ڈیٹا ہو جہاں رینج بہت زیادہ ہو۔ مثال کے طور پر، یومیہ آمدنی تقریباً صفر سے لے کر کئی سو کروڑ روپے تک ہو سکتی ہے۔ ایسی صورت میں، برابر کلاس وقفے مناسب نہیں ہیں کیونکہ (i) اگر کلاس وقفے درمیانے سائز کے اور برابر ہوں، تو بہت سی کلاسیں ہوں گی۔ (ii) اگر کلاس وقفے چھوٹے ہوں، تو ہم آمدنی کی بہت چھوٹی سطحوں یا بہت زیادہ