باب 01 ڈیٹا - اس کا ماخذ اور تالیف
آپ نے مختلف قسم کے ڈیٹا دیکھے اور استعمال کیے ہوں گے۔ مثال کے طور پر، ٹیلی ویژن پر تقریباً ہر خبرنامے کے اختتام پر، بڑے شہروں میں اس دن ریکارڈ کیے گئے درجہ حرارت دکھائے جاتے ہیں۔ اسی طرح، بھارت کی جغرافیہ کی کتابیں آبادی کی ترقی اور تقسیم، اور مختلف فصلیں، معدنیات اور صنعتی مصنوعات کی پیداوار، تقسیم اور تجارت سے متعلق ڈیٹا کو جدولی شکل میں پیش کرتی ہیں۔ کیا آپ نے کبھی سوچا ہے کہ ان کا کیا مطلب ہے؟ یہ ڈیٹا کہاں سے حاصل ہوتے ہیں؟ انہیں کس طرح جدول بند اور پروسیس کیا جاتا ہے تاکہ ان سے معنی خیز معلومات حاصل کی جا سکیں؟ اس باب میں، ہم ڈیٹا کے ان پہلوؤں پر غور کریں گے اور ان بہت سے سوالات کے جواب دینے کی کوشش کریں گے۔
ڈیٹا کیا ہے؟
ڈیٹا کو ایسے اعداد کے طور پر بیان کیا جاتا ہے جو حقیقی دنیا کی پیمائشوں کی نمائندگی کرتے ہیں۔ ڈیٹم ایک واحد پیمائش ہے۔ ہم اکثر ایسی خبریں پڑھتے ہیں جیسے بارمر میں 20 سینٹی میٹر مسلسل بارش یا 24 گھنٹوں میں بانسواڑا میں ایک ہی وقت میں 35 سینٹی میٹر بارش، یا ایسی معلومات جیسے نئی دہلی - ممبئی کا فاصلہ کوٹا وڈودرا کے راستے 1385 کلومیٹر اور اٹارسی - منماڈ کے راستے ٹرین سے 1542 کلومیٹر ہے۔ یہ عددی معلومات ڈیٹا کہلاتی ہے۔ یہ آسانی سے سمجھا جا سکتا ہے کہ آج دنیا بھر میں ڈیٹا کی بڑی مقدار دستیاب ہے۔ تاہم، بعض اوقات، اگر یہ ڈیٹا خام شکل میں ہوں تو ان سے منطقی نتائج اخذ کرنا مشکل ہو جاتا ہے۔ لہٰذا، یہ یقینی بنانا ضروری ہے کہ پیمائی گئی معلومات الگورتھمک طور پر اخذ کی گئی ہوں اور/یا منطقی طور پر نتیجہ نکالا گیا ہو اور/یا متعدد ڈیٹا سے شماریاتی طور پر حساب کیا گیا ہو۔ معلومات کو یا تو کسی سوال کے معنی خیز جواب کے طور پر یا ایک معنی خیز محرک کے طور پر بیان کیا جاتا ہے جو مزید سوالات کو جنم دے سکتا ہے۔
ڈیٹا کی ضرورت
نقشے جغرافیہ کے مطالعہ میں اہم ذرائع ہیں۔ اس کے علاوہ، مظاہر کی تقسیم اور ترقی کو بھی جدولی شکل میں ڈیٹا کے ذریعے سمجھایا جاتا ہے۔ ہم جانتے ہیں کہ زمین کی سطح پر بہت سے مظاہر کے درمیان باہمی تعلق موجود ہوتا ہے۔ یہ تعاملات بہت سے متغیرات سے متاثر ہوتے ہیں جنہیں مقداری اصطلاحات میں بہترین طور پر سمجھایا جا سکتا ہے۔ ان متغیرات کا شماریاتی تجزیہ آج ایک ضرورت بن گیا ہے۔ مثال کے طور پر، کسی علاقے کی کاشتکاری کے نمونے کا مطالعہ کرنے کے لیے، کاشت شدہ رقبہ، فصل کی پیداوار اور پیداوار، آبپاش رقبہ، بارش کی مقدار اور کھاد، کیڑے مار ادویات، زرعی زہروں وغیرہ کے استعمال جیسے آدانوں کے بارے میں شماریاتی معلومات کا ہونا ضروری ہے۔ اسی طرح، کسی شہر کی ترقی کا مطالعہ کرنے کے لیے کل آبادی، کثافت، تارکین وطن کی تعداد، لوگوں کے پیشے، ان کی تنخواہیں، صنعتیں، نقل و حمل اور مواصلات کے ذرائع سے متعلق ڈیٹا کی ضرورت ہوتی ہے۔ اس طرح، جغرافیائی تجزیہ میں ڈیٹا اہم کردار ادا کرتا ہے۔
ڈیٹا کی پیشکش
آپ نے ایک شخص کی کہانی سنی ہوگی جو اپنی بیوی اور پانچ سالہ بچے کے ساتھ سفر کر رہا تھا۔ راستے میں، اسے ایک دریا عبور کرنا پڑا۔ سب سے پہلے، اس نے دریا کی گہرائی چار مقامات پر $0.6,0.8,0.9$ اور 1.5 میٹر ناپی۔ اس نے اوسط گہرائی 0.95 میٹر کے طور پر حساب کی۔ اس کے بچے کی اونچائی 1 میٹر تھی۔ لہٰذا، اس نے انہیں دریا پار کرنے کے لیے رہنمائی کی اور اس کا بچہ دریا میں ڈوب گیا۔ دوسرے کنارے پر، وہ سوچ میں بیٹھ گیا: “لکھا جوکھا تھاہے، تو بچہ ڈوبا کاہے؟” (جب اوسط گہرائی ہر ایک کی پہنچ میں تھی تو بچہ کیوں ڈوبا؟)۔ اسے شماریاتی مغالطہ کہا جاتا ہے، جو آپ کو حقیقی صورت حال سے ہٹا سکتا ہے۔ لہ٭، حقائق و اعداد و شمار جاننے کے لیے ڈیٹا جمع کرنا ضروری ہے، لیکن ڈیٹا کی پیشکش بھی اتنی ہی اہم ہے۔ آج، تجزیہ، پیشکش اور نتائج اخذ کرنے میں شماریاتی طریقوں کا استعمال تقریباً تمام شعبوں بشمول جغرافیہ میں، جو ڈیٹا استعمال کرتے ہیں، اہم کردار ادا کرتا ہے۔ لہٰذا، یہ نتیجہ اخذ کیا جا سکتا ہے کہ کسی مظہر کی توجہ، مثلاً آبادی، جنگل یا نقل و حمل یا مواصلات کا نیٹ ورک نہ صرف وقت اور مقام کے ساتھ مختلف ہوتا ہے بلکہ ڈیٹا کا استعمال کرتے ہوئے آسانی سے سمجھایا بھی جا سکتا ہے۔ دوسرے الفاظ میں، آپ کہہ سکتے ہیں کہ متغیرات کے درمیان تعلق کی وضاحت کرنے میں معیاری وضاحت سے مقداری تجزیہ کی طرف ایک تبدیلی آئی ہے۔ لہٰذا، مطالعہ کو زیادہ منطقی بنانے اور درست نتیجہ اخذ کرنے کے لیے تجزیاتی اوزار اور تکنیکیں آج کل زیادہ اہم ہو گئی ہیں۔ ڈیٹا کو جمع کرنے اور مرتب کرنے کے آغاز سے لے کر اس کی جدول بندی، تنظیم، ترتیب اور تجزیہ تک اور پھر نتائج اخذ کرنے تک درست مقداری تکنیکوں کا استعمال کیا جاتا ہے۔
ڈیٹا کے ذرائع
ڈیٹا مندرجہ ذیل طریقوں سے جمع کیا جاتا ہے۔ یہ ہیں: 1. بنیادی ذرائع، اور 2. ثانوی ذرائع۔
وہ ڈیٹا جو پہلی بار کسی فرد یا افراد کے گروپ، ادارے/تنظیموں کے ذریعے جمع کیے جاتے ہیں، ڈیٹا کے بنیادی ذرائع کہلاتے ہیں۔ دوسری طرف، کسی بھی شائع شدہ یا غیر شائع شدہ ذرائع سے جمع کردہ ڈیٹا کو ثانوی ذرائع کہا جاتا ہے۔ شکل 1.1 ڈیٹا جمع کرنے کے مختلف طریقے دکھاتی ہے۔
بنیادی ڈیٹا کے ذرائع
1. ذاتی مشاہدات
اس سے مراد کسی فرد یا افراد کے گروپ کے ذریعے میدان میں براہ راست مشاہدات کے ذریعے معلومات کا جمع کرنا ہے۔ فیلڈ سروے کے ذریعے، زمین کی تزئین کی خصوصیات، ڈرینج پیٹرن، مٹی اور قدرتی نباتات کی اقسام، نیز آبادی کی ساخت، جنس تناسب، خواندگی، نقل و حمل اور مواصلات کے ذرائع، شہری اور دیہی آبادیوں وغیرہ کے بارے میں معلومات جمع کی جاتی ہیں۔ تاہم،
شکل 1.1 : ڈیٹا جمع کرنے کے طریقے
ذاتی مشاہدات کرنے میں، شامل شخص (اشخاص) کے پاس موضوع کا نظریاتی علم اور غیر جانبدارانہ تشخیص کے لیے سائنسی رویہ ہونا ضروری ہے۔
2. انٹرویو
اس طریقہ کار میں، محقق جواب دہندہ سے براہ راست مکالمے اور بات چیت کے ذریعے معلومات حاصل کرتا ہے۔ تاہم، انٹرویو لینے والے کو علاقے کے لوگوں کے ساتھ انٹرویو کرتے وقت مندرجہ ذیل احتیاطی تدابیر اختیار کرنی چاہئیں:
(i) ان اشیاء کی ایک مختصر فہرست تیار کی جائے جن کے بارے میں انٹرویو کیے گئے افراد سے معلومات جمع کرنی ہے۔
(ii) انٹرویو کرنے میں شامل شخص (اشخاص) کو سروے کے مقصد کے بارے میں واضح ہونا چاہیے۔
(iii) کسی حساس سوال سے پہلے جواب دہندگان کو اعتماد میں لیا جائے اور اسے یقین دلایا جائے کہ رازداری برقرار رکھی جائے گی۔
(iv) ایک سازگار ماحول پیدا کیا جائے تاکہ جواب دہندہ بغیر کسی ہچکچاہٹ کے حقائق کی وضاحت کر سکے۔
(v) سوالات کی زبان سادہ اور شائستہ ہونی چاہیے تاکہ جواب دہندگان متحرک محسوس کریں اور آسانی سے پوچھی گئی معلومات دینے پر رضامند ہو جائیں۔
(vi) ایسا کوئی سوال پوچھنے سے گریز کریں جو جواب دہندہ کے مذہبی جذبات یا خود احترام کو ٹھیس پہنچائے۔
(vii) انٹرویو کے اختتام پر، جواب دہندہ سے پوچھیں کہ وہ کون سی اضافی معلومات فراہم کر سکتا ہے/سکتی ہے، اس کے علاوہ جو اس نے پہلے ہی فراہم کی ہے۔
(viii) آپ کے لیے اپنا قیمتی وقت نکالنے کے لیے اس کا شکریہ اور احسان مندی کا اظہار کریں۔
3. سوالنامہ/شیڈول
اس طریقہ کار میں، سادہ سوالات اور ان کے ممکنہ جوابات ایک سادہ کاغذ پر لکھے جاتے ہیں اور جواب دہندگان کو دیے گئے انتخاب میں سے ممکنہ جوابوں پر نشان لگانا ہوتا ہے۔ بعض اوقات، ساختہ سوالات کا ایک سیٹ لکھا جاتا ہے اور سوالنامہ میں کافی جگہ فراہم کی جاتی ہے جہاں جواب دہندگان اپنی رائے لکھتے ہیں۔ سروے کے مقاصد سوالنامہ میں واضح طور پر درج ہونے چاہئیں۔ یہ طریقہ کار بڑے علاقے کا سروے کرنے میں مفید ہے۔ یہاں تک کہ سوالنامہ دور دراز مقامات پر ڈاک کے ذریعے بھیجا جا سکتا ہے۔ اس طریقہ کار کی حد یہ ہے کہ صرف خواندہ اور تعلیم یافتہ لوگوں سے ہی مطلوبہ معلومات فراہم کرنے کے لیے رابطہ کیا جا سکتا ہے۔ سوالنامہ کے مشابہ جو تفتیش کے معاملے سے متعلق سوالات پر مشتمل ہوتا ہے وہ شیڈول ہے۔ سوالنامہ اور شیڈول کے درمیان فرق صرف یہ ہے کہ جواب دہندہ خود سوالنامے کو پُر کرتا ہے/کرتی ہے، جبکہ ایک مناسب تربیت یافتہ شمار کنندہ خود جواب دہندگان سے مخاطب ہو کر سوالات پوچھ کر شیڈول پُر کرتا ہے۔ سوالنامے پر شیڈول کا اہم فائدہ یہ ہے کہ خواندہ اور ناخواندہ دونوں قسم کے جواب دہندگان سے معلومات جمع کی جا سکتی ہیں۔
4. دیگر طریقے
مٹی اور پانی کی خصوصیات کے بارے میں ڈیٹا مٹی کٹ اور پانی کے معیار کٹ کا استعمال کرتے ہوئے ان کی خصوصیات کی پیمائش کر کے براہ راست میدان میں جمع کیا جاتا ہے۔ اسی طرح، فیلڈ سائنسدان ٹرانسڈیوسرز (شکل 1.2) کا استعمال کرتے ہوئے فصلیں اور نباتات کی صحت کے بارے میں ڈیٹا جمع کرتے ہیں۔
ڈیٹا کے ثانوی ذرائع
ڈیٹا کے ثانوی ذرائع میں شائع شدہ اور غیر شائع شدہ ریکارڈز شامل ہیں جن میں حکومتی اشاعتیں، دستاویزات اور رپورٹس شامل ہیں۔
شائع شدہ ذرائع
1. حکومتی اشاعتیں
بھارت کی حکومت، ریاستی حکومتوں اور ضلع بلٹنز کی مختلف وزارتوں اور محکموں کی اشاعتیں ثانوی معلومات کے سب سے اہم ذرائع میں سے ایک ہیں۔ ان میں رجسٹرار جنرل آف انڈیا کے دفتر کے ذریعے شائع کردہ مردم شماری ہند، نیشنل سیمپل سروے کی رپورٹس، انڈین میٹرولوجیکل ڈیپارٹمنٹ کے موسمی رپورٹس اور ریاستی حکومتوں کے ذریعے شائع کردہ شماریاتی خلاصے، اور مختلف کمیشنوں کے ذریعے شائع کردہ ادواری رپورٹس شامل ہیں۔ کچھ حکومتی اشاعتیں شکل 1.3 میں دکھائی گئی ہیں۔
شکل 1.2 : فصلوں کی صحت کی پیمائش کرتا ہوا فیلڈ سائنسدان
شکل 1.3 : کچھ حکومتی اشاعتیں
2. نیم/کواٹسی-گورنمنٹ اشاعتیں
شہری ترقیاتی اتھارٹیز اور مختلف شہروں اور قصبوں کی میونسپل کارپوریشنز، ضلع پریشدز (ضلعی کونسلیں) وغیرہ کی اشاعتیں اور رپورٹس اس زمرے میں آتی ہیں۔
3. بین الاقوامی اشاعتیں
بین الاقوامی اشاعتیں میں اقوام متحدہ کی مختلف ایجنسیوں جیسے یونائیٹڈ نیشنز ایجوکیشنل، سائنٹیفک اینڈ کلچرل آرگنائزیشن (یونیسکو)، یونائیٹڈ نیشنز ڈویلپمنٹ پروگرام (یو این ڈی پی)، ورلڈ ہیلتھ آرگنائزیشن (ڈبلیو ایچ او)، فوڈ اینڈ ایگریکلچرل آرگنائزیشن (ایف اے او) وغیرہ کے ذریعے شائع کردہ سالنامے، رپورٹس اور مونوگراف شامل ہیں۔ اقوام متحدہ کی کچھ اہم اشاعتیں جو وقفے وقفے سے شائع ہوتی ہیں وہ ہیں ڈیموگرافک ایئر بک، سٹیٹسٹیکل ایئر بک اور ہیومن ڈویلپمنٹ رپورٹ (شکل 1.4)۔
شکل 1.4 : اقوام متحدہ کی کچھ اشاعتیں
4. نجی اشاعتیں
اخبارات اور نجی تنظیموں کے ذریعے شائع کردہ سالنامے، سروے، تحقیقی رپورٹس اور مونوگراف اس زمرے میں آتے ہیں۔
5. اخبارات اور میگزین
روزانہ اخبارات اور ہفتہ وار، پندرہ روزہ اور ماہانہ میگزین ثانوی ڈیٹا کے آسانی سے قابل رسائی ذرائع کے طور پر کام کرتے ہیں۔
6. الیکٹرانک میڈیا
الیکٹرانک میڈیا، خاص طور پر انٹرنیٹ، حالیہ برسوں میں ثانوی ڈیٹا کا ایک اہم ذریعہ بن کر ابھرا ہے۔
غیر شائع شدہ ذرائع
1. حکومتی دستاویزات
غیر شائع شدہ رپورٹس، مونوگراف اور دستاویزات ثانوی ڈیٹا کا ایک اور ذریعہ ہیں۔ یہ دستاویزات حکمرانی کے مختلف سطحوں پر غیر شائع شدہ ریکارڈ کے طور پر تیار اور محفوظ کی جاتی ہیں۔ مثال کے طور پر، متعلقہ گاؤں کے پٹواری کے ذریعے محفوظ کردہ گاؤں کی سطح کے محصولاتی ریکارڈز گاؤں کی سطح کی معلومات کا ایک اہم ذریعہ ہیں۔
2. کواٹسی-گورنمنٹ ریکارڈز
ادواری رپورٹس اور ترقیاتی منصوبے جو مختلف میونسپل کارپوریشنز، ضلعی کونسلوں اور سول سروسز کے محکموں کے ذریعے تیار اور محفوظ کیے جاتے ہیں، کواٹسی-گورنمنٹ ریکارڈز میں شامل ہیں۔
3. نجی دستاویزات
ان میں کمپنیوں، ٹریڈ یونینوں، مختلف سیاسی اور غیر سیاسی تنظیموں اور رہائشی فلاحی ایسوسی ایشنز کی غیر شائع شدہ رپورٹس اور ریکارڈ شامل ہیں۔
ڈیٹا کی جدول بندی اور درجہ بندی
بنیادی یا ثانوی ذرائع سے جمع کردہ ڈیٹا ابتدائی طور پر معلومات کا ایک بڑا الجھاؤ نظر آتا ہے جس کی سمجھ بہت کم ہوتی ہے۔ اسے خام ڈیٹا کہا جاتا ہے۔ معنی خیز نتائج اخذ کرنے اور انہیں قابل استعمال بنانے کے لیے خام ڈیٹا کو جدول بندی اور درجہ بندی کی ضرورت ہوتی ہے۔
ڈیٹا کو خلاصہ کرنے اور پیش کرنے کے سب سے آسان آلات میں سے ایک شماریاتی جدول ہے۔ یہ کالموں اور قطاروں میں ڈیٹا کا ایک منظم انتظام ہے۔ جدول کا مقصد پیشکش کو آسان بنانا اور موازنہ کرنے میں آسانی پیدا کرنا ہے۔ یہ جدول قاری کو مطلوبہ معلومات کو تیزی سے تلاش کرنے کے قابل بناتا ہے۔ اس طرح، جدول تجزیہ کار کے لیے کم سے کم جگہ میں ڈیٹا کے ایک بڑے مجموعے کو منظم طریقے سے پیش کرنا ممکن بناتا ہے۔
ڈیٹا کی تالیف اور پیشکش
ڈیٹا کو جمع کیا جاتا ہے، جدول بند کیا جاتا ہے اور جدولی شکل میں یا تو مطلق اصطلاحات، فیصد یا اشاریوں میں پیش کیا جاتا ہے۔
مطلق ڈیٹا
جب ڈیٹا کو ان کی اصل شکل میں عددی اعداد کے طور پر پیش کیا جاتا ہے، تو انہیں مطلق ڈیٹا یا خام ڈیٹا کہا جاتا ہے۔ مثال کے طور پر، کسی ملک یا ریاست کی کل آبادی، کسی فصل یا مینوفیکچرنگ انڈسٹری کی کل پیداوار، وغیرہ۔ جدول 1.1 بھارت اور کچھ منتخب ریاستوں کی آبادی کا مطلق ڈیٹا دکھاتا ہے۔
$\hspace{1cm}$ جدول 1.1 : بھارت اور منتخب ریاستوں/یونین علاقوں کی آبادی، 2011
| ریاست/ یو ٹی کوڈ |
بھارت/ریاست/ یونین علاقہ |
کل آبادی | ||
|---|---|---|---|---|
| افراد | مرد | خواتین | ||
| 1 | 2 | 3 | 4 | 5 |
| بھارت $^{1}$ | $1,21,05,69,573$ | $62,31,21,843$ | $58,74,47,730$ | |
| 1. | جموں و کشمیر ${ }^{2}$ | $1,25,41,302$ | $66,40,662$ | $59,00,640$ |
| 2. | ہماچل پردیش | $68,64,602$ | $34,81,873$ | $33,82,729$ |
| 3. | پنجاب | $2,77,43,338$ | $1,46,39,465$ | $1,31,03,873$ |
| 4. | چندی گڑھ $^{3}$ | $10,55,450$ | $5,80,663$ | $4,74,787$ |
| 5. | اتراکھنڈ | $1,00,86,292$ | $51,37,773$ | $49,48,519$ |
| 6. | ہریانہ | $2,53,51,462$ | $1,34,94,734$ | $1,18,56,728$ |
| 7. | نیشنل کیپیٹل ٹیریٹری آف دہلی |
$1,67,87,941$ | $89,87,326$ | $78,00,615$ |
| 8. | راجستھان | $6,85,48,437$ | $3,55,50,997$ | $3,29,97,440$ |
| 9. | اتر پردیش | $19,98,12,341$ | $10,44,80,510$ | $9,53,31,831$ |
| 10 | بہار | $10,40,99,452$ | $5,42,78,157$ | $4,98,21,295$ |
${ }^{1}$ بھارت کی تمام علاقائی حدود شامل ہیں
${ }^{2}$ پاکستان کے زیر انتظام کشمیر کو چھوڑ کر
${ }^{3}$ یونین علاقہ
ماخذ : مردم شماری، 2011
فیصد/تناسب
کبھی کبھی ڈیٹا کو تناسب یا فیصد کی شکل میں جدول بند کیا جاتا ہے جو ایک مشترکہ پیرامیٹر سے حساب کیے جاتے ہیں، جیسے خواندگی کی شرح یا آبادی کی شرح نمو، زرعی مصنوعات یا صنعتی مصنوعات کا فیصد، وغیرہ۔ جدول 1.2 فیصد کی شکل میں دہائیوں میں بھارت کی خواندگی کی شرح پیش کرتا ہے۔ خواندگی کی شرح اس طرح حساب کی جاتی ہے:
$$ \frac{\text { Total Literates }}{\text { Total Population }} \times 100 $$
جدول 1.2 : خواندگی کی شرح : 1951 – 2011
| سال | افراد | مرد | خواتین |
|---|---|---|---|
| 1951 | 18.33 | 27.16 | 8.86 |
| 1961 | 28.3 | 40.4 | 15.35 |
| 1971 | 34.45 | 45.96 | 21.97 |
| 1981 | 43.57 | 56.38 | 29.76 |
| 1991 | 52.21 | 64.13 | 39.29 |
| 2001 | 64.84 | 75.85 | 54.16 |
| 2011 | 73.0 | 80.9 | 64.6 |
ماخذ: مردم شماری، 2011
اشاریہ نمبر
ایک اشاریہ نمبر ایک شماریاتی پیمائش ہے جو وقت، جغرافیائی محل وقوع یا دیگر خصوصیات کے لحاظ سے متغیر یا متعلقہ متغیرات کے گروپ میں تبدیلیوں کو ظاہر کرنے کے لیے ڈیزائن کیا گیا ہے۔ یہ نوٹ کرنا ضروری ہے کہ اشاریہ نمبر نہ صرف وقت کے ساتھ تبدیلیوں کی پیمائش کرتے ہیں بلکہ مختلف مقامات، صنعتوں، شہروں یا ممالک کی معاشی حالتوں کا موازنہ بھی کرتے ہیں۔ اشاریہ نمبر کا وسیع پیمانے پر معاشیات اور کاروبار میں قیمت اور مقدار میں تبدیلیوں کو دیکھنے کے لیے استعمال کیا جاتا ہے۔ اشاریہ نمبر کے حساب کے لیے مختلف طریقے ہیں۔ تاہم، سادہ مجموعی طریقہ سب سے زیادہ عام طور پر استعمال ہوتا ہے۔ یہ مندرجہ ذیل فارمولے کا استعمال کرتے ہوئے حاصل کیا جاتا ہے:
$$ \frac{\sum q_{1}}{\sum q_{0}} \times 100 $$
$\sum q_{1}=$ موجودہ سال کی پیداوار کا کل
$\sum q_{0}=$ بنیادی سال کی پیداوار کا کل
عام طور پر، بنیادی سال کی اقدار کو 100 لیا جاتا ہے اور اشاریہ نمبر اس پر حساب کیا جاتا ہے۔ مثال کے طور پر، جدول 1.3 بھارت میں لوہے کے سنگ معدن کی پیداوار اور 1970-71 کو بنیادی سال لے کر 1970-71 سے 2000-01 تک اشاریہ نمبر میں تبدیلیوں کو دکھاتا ہے۔
$\hspace{1.5cm}$ جدول 1.3 : بھارت میں لوہے کے سنگ معدن کی پیداوار
| پیداوار (ملین ٹن میں) |
حساب | اشاریہ نمبر | |
|---|---|---|---|
| $1970-71$ | 32.5 | $\frac{32.5}{32.5} \times 100$ | 100 |
| $1980-81$ | 42.2 | $\frac{42.2}{32.5} \times 100$ | 130 |
| $1990-91$ | 53.7 | $\frac{53.7}{32.5} \times 100$ | 165 |
| $2000-01$ | 67.4 | $\frac{67.4}{32.5} \times 100$ | 207 |
ماخذ - انڈیا: اکنامک ایئر بک، 2005
ڈیٹا کی پروسیسنگ
خام ڈیٹا کی پروسیسنگ کے لیے ان کی منتخب کلاسوں میں جدول بندی اور درجہ بندی کی ضرورت ہوتی ہے۔ مثال کے طور پر، جدول 1.4 میں دیے گئے ڈیٹا کو یہ سمجھنے کے لیے استعمال کیا جا سکتا ہے کہ انہیں کس طرح پروسیس کیا جاتا ہے۔
ہم دیکھ سکتے ہیں کہ دیا گیا ڈیٹا غیر گروپڈ ہے۔ لہٰذا، پہلا قدم ڈیٹا کو گروپ کرنا ہے تاکہ اس کی مقدار کم کی جا سکے اور اسے سمجھنا آسان بنایا جا سکے۔
جدول 1.4 : جغرافیہ کے پرچہ میں 60 طلباء کے اسکور
| 47 | 02 | 39 | 64 | 22 | 46 | 28 | 02 | 09 | 10 |
|---|---|---|---|---|---|---|---|---|---|
| 89 | 96 | 74 | 06 | 26 | 15 | 92 | 84 | 84 | 90 |
| 32 | 22 | 53 | 62 | 73 | 57 | 37 | 44 | 67 | 50 |
| 18 | 51 | 36 | 58 | 28 | 65 | 63 | 59 | 75 | 70 |
| 56 | 58 | 43 | 74 | 64 | 12 | 35 | 42 | 68 | 80 |
| 64 | 37 | 17 | 31 | 41 | 71 | 56 | 83 | 59 | 90 |
ڈیٹا کا گروپنگ
خام ڈیٹا کے گروپنگ کے لیے یہ طے کرنا ضروری ہے کہ کلاسوں کی تعداد کتنی ہوگی جن میں خام ڈیٹا کو گروپ کیا جائے گا اور کلاس وقفہ کیا ہوگا۔ تاہم، کلاس وقفہ اور کلاسوں کی تعداد کا انتخاب خام ڈیٹا کی رینج پر منحصر ہے۔ جدول 1.4 میں دیا گیا خام ڈیٹا 02 سے 96 تک ہے۔ لہٰذا، ہم آسانی سے ڈیٹا کو دس کلاسوں میں گروپ کرنے کا انتخاب کر سکتے ہیں، ہر گروپ میں دس یونٹس کا وقفہ رکھتے ہوئے، مثلاً 0-10, 10-20, 20-30, وغیرہ (جدول 1.5)۔
جدول 1.5 : تعدد حاصل کرنے کے لیے نشانات لگانا
| گروپ | خام ڈیٹا کے عددی | نشانات | افراد کی تعداد |
|---|---|---|---|
| $0-10$ | $02,02,09,06$ | //// | 4 |
| $10-20$ | $10,15,18,12,17$ | $7 x+1$ | 5 |
| $20-30$ | $22,28,26,22,28$ | $74 x$ | 5 |
| $30-40$ | $39,32,37,36,35,37,31$ | $7+4+11$ | 7 |
| $40-50$ | $47,46,44,43,42,41$ | $7+x+1$ | 6 |
| $50-60$ | $53,57,50,51,58$ $59,56,58,56,59$ |
$74 x+111$ | 10 |
| $60-70$ | 64,62,67,65, $63,64,68,64$ |
$7+x+7 x+$ | 8 |
| $70-80$ | $74,73,75,70,74,71$ | $7+x+11$ | 6 |
| $80-90$ | $89,84,84,80,83$ | $74 \times 1$ | 5 |
| $90-100$ | $96,92,90,90$ | $7 x+1$ | 4 |
| $\sum f=N=60$ |
درجہ بندی کا عمل
ایک بار جب گروپوں کی تعداد اور ہر گروپ کا کلاس وقفہ طے ہو جائے، تو خام ڈیٹا کو جدول 1.5 میں دکھائے گئے طریقے سے درجہ بند کیا جاتا ہے۔ یہ ایک طریقہ سے کیا جاتا ہے جو عام طور سے “چار اور کراس طریقہ” یا نشانات کے نام سے جانا جاتا ہے۔
سب سے پہلے، ہر فرد کو اس گروپ میں ایک نشان تفویض کیا جاتا ہے جس میں وہ آتا ہے۔ مثال کے طور پر، خام ڈیٹا کا پہلا عددی 47 ہے۔ چونکہ یہ 40-50 کے گروپ میں آتا ہے، اس لیے جدول 1.5 کے کالم 3 میں ایک نشان درج کیا جاتا ہے۔
تعدد تقسیم
جدول 1.5 میں ہم نے ایک مقداری متغیر کے خام ڈیٹا کو درجہ بند کیا ہے اور انہیں کلاس وار گروپ کیا ہے۔ افراد کی تعداد (جدول 1.5 کے چوتھے کالم میں مقامات) کو تعدد کہا جاتا ہے اور کالم تعدد تقسیم کی نمائندگی کرتا ہے۔ یہ ظاہر کرتا ہے کہ ایک متغیر کی مختلف اقدار مختلف کلاسوں میں کیسے تقسیم ہوتی ہیں۔ تعدد کو ساد