অধ্যায় ০৩ উপাত্তের সংগঠন
1. ভূমিকা
পূর্ববর্তী অধ্যায়ে আপনি শিখেছেন কিভাবে উপাত্ত সংগ্রহ করা হয়। আপনি জনগণনা ও নমুনায়নের পার্থক্যও জানতে পেরেছেন। এই অধ্যায়ে আপনি জানবেন কিভাবে আপনি যে উপাত্ত সংগ্রহ করেছেন সেগুলোকে শ্রেণীবদ্ধ করা হবে। অশ্রেণীবদ্ধ বা কাঁচা উপাত্তকে শ্রেণীবদ্ধ করার উদ্দেশ্য হল এগুলোর মধ্যে সুশৃঙ্খলা আনা যাতে এগুলোকে সহজেই পরবর্তী পরিসংখ্যানগত বিশ্লেষণের আওতায় আনা যায়।
আপনি কি কখনো আপনার স্থানীয় কাবাড়িওয়ালা বা পুরনো কাগজপত্র, ভাঙা গৃহস্থালি জিনিস, খালি কাঁচের বোতল, প্লাস্টিক ইত্যাদি যাকে বিক্রি করেন তাকে লক্ষ্য করেছেন? তিনি আপনার কাছ থেকে এই জিনিসগুলো কিনে নেন এবং যারা এগুলো পুনর্ব্যবহার করে তাদের কাছে বিক্রি করেন। কিন্তু তার দোকানে এত বেশি জঞ্জাল থাকায় তার পক্ষে ব্যবসা পরিচালনা করা খুবই কঠিন হত, যদি তিনি সেগুলো সঠিকভাবে সংগঠিত না করতেন। তার অবস্থা সহজ করার জন্য তিনি বিভিন্ন জঞ্জালকে উপযুক্তভাবে দল বা “শ্রেণী”-তে ভাগ করেন। তিনি পুরনো সংবাদপত্রগুলো একসাথে রাখেন এবং দড়ি দিয়ে বেঁধে রাখেন। তারপর সব খালি কাঁচের বোতল একটি বস্তায় সংগ্রহ করেন। তিনি ধাতব জিনিসগুলো তার দোকানের এক কোণে জমা করেন এবং “লোহা”, “তামা”, “অ্যালুমিনিয়াম”, “পিতল” ইত্যাদি দলে সাজান, এবং এভাবেই চলতে থাকে। এভাবে তিনি তার জঞ্জালকে বিভিন্ন শ্রেণীতে ভাগ করেন - “সংবাদপত্র”, “প্লাস্টিক”, “কাঁচ”, “ধাতু” ইত্যাদি - এবং এগুলোর মধ্যে শৃঙ্খলা আনেন। একবার তার জঞ্জাল সাজানো ও শ্রেণীবদ্ধ হয়ে গেলে, কোন ক্রেতা যে নির্দিষ্ট জিনিসটি চাইতে পারে তা খুঁজে পাওয়া তার পক্ষে সহজ হয়ে যায়।
একইভাবে যখন আপনি আপনার স্কুলের বইগুলো একটি নির্দিষ্ট ক্রমে সাজান, তখন সেগুলো হ্যান্ডেল করা আপনার পক্ষে সহজ হয়ে যায়। আপনি বিষয় অনুযায়ী সেগুলো শ্রেণীবদ্ধ করতে পারেন যেখানে প্রতিটি বিষয় একটি দল বা শ্রেণী হয়ে যায়। সুতরাং, যখন আপনার উদাহরণস্বরূপ ইতিহাসের একটি নির্দিষ্ট বই দরকার হয়, তখন আপনাকে যা করতে হবে তা হল “ইতিহাস” দলটিতে সেই বইটি খুঁজে বের করা। অন্যথায়, আপনি যে নির্দিষ্ট বইটি খুঁজছেন তা খুঁজে পেতে আপনার পুরো সংগ্রহটি ঘাঁটতে হত।
বস্তু বা জিনিসপত্র শ্রেণীবদ্ধ করা আমাদের মূল্যবান সময় ও শ্রম বাঁচালেও, তা ইচ্ছামতো করা হয় না। কাবাড়িওয়ালা পুনর্ব্যবহারযোগ্য পণ্যের বাজার অনুযায়ী তার জঞ্জালকে দলে ভাগ করেন। উদাহরণস্বরূপ, “কাঁচ” দলের অধীনে তিনি খালি বোতল, ভাঙা আয়না এবং জানালার কাচ ইত্যাদি রাখবেন। একইভাবে যখন আপনি আপনার ইতিহাসের বইগুলো “ইতিহাস” দলের অধীনে শ্রেণীবদ্ধ করেন, আপনি সেই দলে অন্য বিষয়ের একটি বই রাখবেন না। অন্যথায় দলবদ্ধ করার পুরো উদ্দেশ্যই ব্যর্থ হবে। সুতরাং, শ্রেণীবদ্ধকরণ হল কিছু মানদণ্ডের ভিত্তিতে জিনিসপত্রকে দল বা শ্রেণীতে সাজানো বা সংগঠিত করা।
কার্যকলাপ
- চিঠিগুলো কিভাবে বাছাই করা হয় তা জানতে আপনার স্থানীয় ডাকঘর পরিদর্শন করুন। আপনি কি জানেন একটি চিঠির পিন-কোড কী নির্দেশ করে? আপনার ডাকবাহককে জিজ্ঞাসা করুন।
2. কাঁচা উপাত্ত
কাবাড়িওয়ালার জঞ্জালের মতো, অশ্রেণীবদ্ধ উপাত্ত বা কাঁচা উপাত্ত অত্যন্ত বিশৃঙ্খল। এগুলো প্রায়শই খুব বড় এবং হ্যান্ডেল করা কষ্টসাধ্য। এগুলো থেকে অর্থপূর্ণ সিদ্ধান্তে পৌঁছানো একটি ক্লান্তিকর কাজ কারণ এগুলো সহজেই পরিসংখ্যানগত পদ্ধতির আওতায় আসে না। তাই কোনও পদ্ধতিগত পরিসংখ্যানগত বিশ্লেষণ শুরু করার আগে এমন উপাত্তের সঠিক সংগঠন ও উপস্থাপনার প্রয়োজন হয়। সুতরাং উপাত্ত সংগ্রহ করার পর পরবর্তী ধাপ হল সেগুলোকে শ্রেণীবদ্ধ আকারে সংগঠিত ও উপস্থাপন করা।
ধরুন আপনি গণিতে শিক্ষার্থীদের পারফরম্যান্স জানতে চান এবং আপনি আপনার স্কুলের ১০০ জন শিক্ষার্থীর গণিতে প্রাপ্ত নম্বরের উপাত্ত সংগ্রহ করেছেন। যদি আপনি সেগুলো একটি টেবিল আকারে উপস্থাপন করেন, তাহলে সেগুলো টেবিল ৩.১-এর মতো দেখাতে পারে।
সারণী ৩.১ একটি পরীক্ষায় ১০০ জন শিক্ষার্থী কর্তৃক গণিতে প্রাপ্ত নম্বর
| 47 | 45 | 10 | 60 | 51 | 56 | 66 | 100 | 49 | 40 |
| 60 | 59 | 56 | 55 | 62 | 48 | 59 | 55 | 51 | 41 |
| 42 | 69 | 64 | 66 | 50 | 59 | 57 | 65 | 62 | 50 |
| 64 | 30 | 37 | 75 | 17 | 56 | 20 | 14 | 55 | 90 |
| 62 | 51 | 55 | 14 | 25 | 34 | 90 | 49 | 56 | 54 |
| 70 | 47 | 49 | 82 | 40 | 82 | 60 | 85 | 65 | 66 |
| 49 | 44 | 64 | 69 | 70 | 48 | 12 | 28 | 55 | 65 |
| 49 | 40 | 25 | 41 | 71 | 80 | 0 | 56 | 14 | 22 |
| 66 | 53 | 46 | 70 | 43 | 61 | 59 | 12 | 30 | 35 |
| 45 | 44 | 57 | 76 | 82 | 39 | 32 | 14 | 90 | 25 |
অথবা আপনি আপনার প্রতিবেশী ৫০টি পরিবারের খাদ্যের মাসিক ব্যয়ের উপাত্ত সংগ্রহ করতে পারেন তাদের খাদ্যের গড় ব্যয় জানার জন্য। সেই ক্ষেত্রে সংগ্রহ করা উপাত্ত, যদি আপনি টেবিল আকারে উপস্থাপন করতেন, তাহলে সারণী ৩.২-এর মতো হত। সারণী ৩.১ এবং ৩.২ উভয়ই কাঁচা বা অশ্রেণীবদ্ধ উপাত্ত। উভয় টেবিলেই আপনি দেখতে পাচ্ছেন যে সংখ্যাগুলো কোন ক্রমে সাজানো নেই। এখন যদি আপনাকে সারণী ৩.১ থেকে গণিতে সর্বোচ্চ নম্বর জিজ্ঞাসা করা হয় তাহলে আপনাকে প্রথমে ১০০ জন শিক্ষার্থীর নম্বর ঊর্ধ্বক্রম বা অধঃক্রমে সাজাতে হবে। এটি একটি ক্লান্তিকর কাজ। এটি আরও ক্লান্তিকর হয়ে ওঠে, যদি ১০০-এর বদলে আপনার হ্যান্ডেল করতে হয় ১,০০০ শিক্ষার্থীর নম্বর। একইভাবে, সারণী ৩.২-এ, আপনি লক্ষ্য করবেন যে ৫০টি পরিবারের গড় মাসিক ব্যয় নির্ধারণ করা আপনার পক্ষে কঠিন। এবং এই অসুবিধা বহুগুণ বেড়ে যাবে যদি সংখ্যাটি আরও বড় হয় - ধরুন, ৫,০০০ পরিবার। আমাদের কাবাড়িওয়ালার মতো, যিনি একটি নির্দিষ্ট জিনিস খুঁজে পেতে হিমশিম খাবেন যখন তার জঞ্জাল বড় ও অগোছালো হয়ে যায়, আপনি যখন বড় আকারের কাঁচা উপাত্ত থেকে কোন তথ্য পেতে চেষ্টা করবেন তখন একই অবস্থার সম্মুখীন হবেন। এক কথায়, তাই, বড় অশ্রেণীবদ্ধ উপাত্ত থেকে তথ্য বের করা একটি ক্লান্তিকর কাজ।
সারণী ৩.২ ৫০টি পরিবারের খাদ্যের উপর মাসিক গৃহস্থালি ব্যয় (রুপিতে)
| — | — | — | — | — |
|---|---|---|---|---|
| 1904 | 1559 | 3473 | 1735 | 2760 |
| 2041 | 1612 | 1753 | 1855 | 4439 |
| 5090 | 1085 | 1823 | 2346 | 1523 |
| 1211 | 1360 | 1110 | 2152 | 1183 |
| 1218 | 1315 | 1105 | 2628 | 2712 |
| 4248 | 1812 | 1264 | 1183 | 1171 |
| 1007 | 1180 | 1953 | 1137 | 2048 |
| 2025 | 1583 | 1324 | 2621 | 3676 |
| 1397 | 1832 | 1962 | 2177 | 2575 |
| 1293 | 1365 | 1146 | 3222 | 1396 |
কাঁচা উপাত্তকে শ্রেণীবদ্ধ করে সংক্ষিপ্ত ও বোধগম্য করা হয়। যখন একই বৈশিষ্ট্যের তথ্যগুলো একই শ্রেণীতে স্থাপন করা হয়, তখন সেগুলো সহজে খুঁজে পাওয়া, তুলনা করা এবং কোন অসুবিধা ছাড়াই অনুমান করা সম্ভব হয়। আপনি অধ্যায় ২-এ পড়েছেন যে ভারত সরকার প্রতি দশ বছর পর পর জনগণনা পরিচালনা করে। ২০০১ সালের জনগণনায় প্রায় ২০ কোটি ব্যক্তির সাথে যোগাযোগ করা হয়েছিল। জনগণনার কাঁচা উপাত্ত এত বড় এবং খণ্ডিত যে সেগুলো থেকে কোন অর্থপূর্ণ সিদ্ধান্তে পৌঁছানো প্রায় অসম্ভব কাজ বলে মনে হয়। কিন্তু যখন একই উপাত্ত লিঙ্গ, শিক্ষা, বৈবাহিক অবস্থা, পেশা ইত্যাদি অনুযায়ী শ্রেণীবদ্ধ করা হয়, তখন ভারতের জনসংখ্যার কাঠামো ও প্রকৃতি সহজেই বোঝা যায়।
কাঁচা উপাত্ত চলকের উপর পর্যবেক্ষণ নিয়ে গঠিত। সারণী ৩.১ এবং ৩.২-এ প্রদত্ত কাঁচা উপাত্ত একটি নির্দিষ্ট বা চলকের দলের উপর পর্যবেক্ষণ নিয়ে গঠিত। উদাহরণস্বরূপ সারণী ৩.১-এর দিকে তাকান যাতে ১০০ জন শিক্ষার্থী কর্তৃক অর্জিত গণিতের নম্বর রয়েছে। আমরা কিভাবে এই নম্বরগুলোর অর্থ বুঝতে পারি? গণিতের শিক্ষক এই নম্বরগুলো দেখে ভাববেন- আমার শিক্ষার্থীরা কেমন করেছে? কতজন পাস করতে পারেনি? আমরা কিভাবে উপাত্ত শ্রেণীবদ্ধ করব তা নির্ভর করে আমাদের মনে যে উদ্দেশ্য রয়েছে তার উপর। এই ক্ষেত্রে, শিক্ষিকা কিছু গভীরতায় বুঝতে চান- এই শিক্ষার্থীরা কেমন করেছে। তিনি সম্ভবত গণসংখ্যা বিন্যাস গঠন করতে বেছে নেবেন। এটি পরবর্তী বিভাগে আলোচনা করা হয়েছে।
কার্যকলাপ
- এক বছরের জন্য আপনার পরিবারের মোট সাপ্তাহিক ব্যয়ের উপাত্ত সংগ্রহ করুন এবং একটি টেবিলে সাজান। দেখুন আপনার কতগুলি পর্যবেক্ষণ আছে। উপাত্তগুলো মাসিকভাবে সাজান এবং পর্যবেক্ষণের সংখ্যা নির্ণয় করুন।
3. উপাত্তের শ্রেণীবদ্ধকরণ
একটি শ্রেণীবদ্ধকরণের দল বা শ্রেণী বিভিন্নভাবে করা হয়। আপনার বইগুলোকে বিষয় অনুযায়ী - “ইতিহাস”, “ভূগোল”, “গণিত”, “বিজ্ঞান” ইত্যাদি শ্রেণীবদ্ধ করার পরিবর্তে - আপনি সেগুলো লেখক অনুসারে বর্ণানুক্রমিক ক্রমে শ্রেণীবদ্ধ করতে পারতেন। অথবা, আপনি প্রকাশনার বছর অনুযায়ীও সেগুলো শ্রেণীবদ্ধ করতে পারতেন। আপনি সেগুলোকে কিভাবে শ্রেণীবদ্ধ করতে চান তা আপনার প্রয়োজনীয়তার উপর নির্ভর করবে।
একইভাবে কাঁচা উপাত্ত উদ্দেশ্য অনুযায়ী বিভিন্নভাবে শ্রেণীবদ্ধ করা হয়। সেগুলো সময় অনুযায়ী দলবদ্ধ করা যেতে পারে। এমন শ্রেণীবদ্ধকরণকে কালানুক্রমিক শ্রেণীবদ্ধকরণ বলে। এমন শ্রেণীবদ্ধকরণে, উপাত্তকে বছর, ত্রৈমাসিক, মাস, সপ্তাহ ইত্যাদি সময়ের সাপেক্ষে ঊর্ধ্বক্রম বা অধঃক্রমে শ্রেণীবদ্ধ করা হয়। নিম্নলিখিত উদাহরণটি বছর অনুযায়ী শ্রেণীবদ্ধ ভারতের জনসংখ্যা দেখায়। চলক ‘জনসংখ্যা’ একটি সময় শ্রেণী কারণ এটি বিভিন্ন বছরের জন্য মানের একটি শ্রেণী চিত্রিত করে।
উদাহরণ ১
ভারতের জনসংখ্যা (কোটিতে)
| বছর | জনসংখ্যা (কোটি) |
|---|---|
| 1951 | 35.7 |
| 1961 | 43.8 |
| 1971 | 54.6 |
| 1981 | 68.4 |
| 1991 | 81.8 |
| 2001 | 102.7 |
| 2011 | 121.0 |
স্থানিক শ্রেণীবদ্ধকরণে উপাত্তকে দেশ, রাজ্য, শহর, জেলা ইত্যাদি ভৌগোলিক অবস্থানের সাপেক্ষে শ্রেণীবদ্ধ করা হয়।
উদাহরণ ২ বিভিন্ন দেশে গমের ফলন দেখায়।
উদাহরণ ২
বিভিন্ন দেশের জন্য গমের ফলন (২০১৩)
| দেশ | গমের ফলন (কেজি/হেক্টর) |
|---|---|
| কানাডা | 3594 |
| চীন | 5055 |
| ফ্রান্স | 7254 |
| জার্মানি | 7998 |
| ভারত | 3154 |
| পাকিস্তান | 2787 |
উৎস: Indian Agricultural Statistics at a Glance, 2015
কার্যকলাপ
- উদাহরণ ১-এ, সেই বছরগুলো খুঁজে বের করুন যখন ভারতের জনসংখ্যা সর্বনিম্ন ও সর্বোচ্চ ছিল।
- উদাহরণ ২-এ, সেই দেশটি খুঁজে বের করুন যার গমের ফলন ভারতের তুলনায় কিছুটা বেশি। শতাংশের হিসেবে সেটা কত হবে?
- উদাহরণ ২-এর দেশগুলোকে ফলনের ঊর্ধ্বক্রম অনুসারে সাজান। ফলনের অধঃক্রমের জন্য একই অনুশীলন করুন।
কখনও কখনও আপনি এমন বৈশিষ্ট্যের সম্মুখীন হন যেগুলো পরিমাণগতভাবে প্রকাশ করা যায় না। এমন বৈশিষ্ট্যগুলোকে গুণবাচক বৈশিষ্ট্য বলে। উদাহরণস্বরূপ, জাতীয়তা, সাক্ষরতা, ধর্ম, লিঙ্গ, বৈবাহিক অবস্থা ইত্যাদি। সেগুলো পরিমাপ করা যায় না। তবুও এই গুণবাচক বৈশিষ্ট্যগুলো একটি গুণগত বৈশিষ্ট্যের উপস্থিতি বা অনুপস্থিতির ভিত্তিতে শ্রেণীবদ্ধ করা যেতে পারে। গুণবাচক বৈশিষ্ট্যের উপর উপাত্তের এমন শ্রেণীবদ্ধকরণকে গুণগত শ্রেণীবদ্ধকরণ বলে। নিম্নলিখিত উদাহরণে, আমরা দেখতে পাই একটি দেশের জনসংখ্যা গুণগত চলক “লিঙ্গ”-এর ভিত্তিতে দলবদ্ধ করা হয়েছে। একটি পর্যবেক্ষণ হয় পুরুষ বা নারী হতে পারে। এই দুটি বৈশিষ্ট্যকে নীচে দেওয়া বৈবাহিক অবস্থার ভিত্তিতে আরও শ্রেণীবদ্ধ করা যেতে পারে:
উদাহরণ ৩
প্রথম পর্যায়ে শ্রেণীবদ্ধকরণ একটি গুণবাচক বৈশিষ্ট্যের উপস্থিতি ও অনুপস্থিতির ভিত্তিতে, অর্থাৎ পুরুষ বা পুরুষ নয় (নারী)। দ্বিতীয় পর্যায়ে, প্রতিটি শ্রেণী - পুরুষ ও নারী, আরেকটি গুণবাচক বৈশিষ্ট্যের উপস্থিতি বা অনুপস্থিতির ভিত্তিতে আরও উপবিভক্ত করা হয়, অর্থাৎ বিবাহিত বা অবিবাহিত কিনা। উচ্চতা, ওজন, বয়স, আয়, শিক্ষার্থীদের নম্বর ইত্যাদি বৈশিষ্ট্য পরিমাণগত প্রকৃতির। যখন এই ধরনের বৈশিষ্ট্যের সংগ্রহ করা উপাত্ত শ্রেণীতে দলবদ্ধ করা হয়, তখন এটি একটি পরিমাণগত শ্রেণীবদ্ধকরণ হয়ে যায়।
কার্যকলাপ
- চারপাশের বস্তুগুলোকে জীবিত বা অজীব হিসেবে দলবদ্ধ করা যেতে পারে। এটি কি একটি পরিমাণগত শ্রেণীবদ্ধকরণ?
উদাহরণ ৪
১০০ জন শিক্ষার্থীর গণিতে প্রাপ্ত নম্বরের গণসংখ্যা বিন্যাস
| নম্বর | গণসংখ্যা |
|---|---|
| 0-10 | 1 |
| 10-20 | 8 |
| 20-30 | 6 |
| 30-40 | 7 |
| 40-50 | 21 |
| 50-60 | 23 |
| 60-70 | 19 |
| 70-80 | 6 |
| 80-90 | 5 |
| 90-100 | 4 |
| মোট | 100 |
উদাহরণ ৪ সারণী ৩.১-এ প্রদত্ত ১০০ জন শিক্ষার্থীর গণিতে প্রাপ্ত নম্বরের পরিমাণগত শ্রেণীবদ্ধকরণ দেখায়।
কার্যকলাপ
- উদাহরণ ৪-এর গণসংখ্যার মানগুলোকে মোট গণসংখ্যার অনুপাত বা শতাংশ হিসেবে প্রকাশ করুন। লক্ষ্য করুন যে এইভাবে প্রকাশিত গণসংখ্যাকে আপেক্ষিক গণসংখ্যা বলে।
- উদাহরণ ৪-এ, কোন শ্রেণীতে উপাত্তের সর্বোচ্চ ঘনত্ব রয়েছে? মোট পর্যবেক্ষণের শতাংশ হিসেবে এটি প্রকাশ করুন। কোন শ্রেণীতে উপাত্তের সর্বনিম্ন ঘনত্ব রয়েছে?
4. চলক: অবিচ্ছিন্ন ও বিচ্ছিন্ন
চলকের একটি সহজ সংজ্ঞা, যা আপনি গত অধ্যায়ে পড়েছেন, তা আপনাকে বলে না যে এটি কিভাবে পরিবর্তিত হয়। চলক নির্দিষ্ট মানদণ্ডের ভিত্তিতে ভিন্ন হয়। সেগুলোকে ব্যাপকভাবে দুই প্রকারে শ্রেণীবদ্ধ করা হয়:
(i) অবিচ্ছিন্ন ও নিরবচ্ছিন্ন
(ii) বিচ্ছিন্ন গণিত।
একটি অবিচ্ছিন্ন চলক যেকোনো সংখ্যাসূচক মান নিতে পারে। এটি পূর্ণসংখ্যার মান $(1,2,3,4, \ldots)$, ভগ্নাংশের মান $(1 / 2,2 / 3,3 / 4, \ldots)$, এবং সঠিক ভগ্নাংশ নয় এমন মান $(\sqrt{2}=1.414$, $\sqrt{3}=1.732, \ldots, \sqrt{7}=2.645$ ) নিতে পারে। উদাহরণস্বরূপ, একজন শিক্ষার্থীর উচ্চতা, যখন সে/সে বড় হয় ধরা যাক $90 \mathrm{~cm}$ থেকে $150 \mathrm{~cm}$, তার মধ্যবর্তী সব মান নেবে। এটি পূর্ণসংখ্যার মতো মান নিতে পারে যেমন $90 \mathrm{~cm}, 100 \mathrm{~cm}, 108 \mathrm{~cm}, 150 \mathrm{~cm}$। এটি ভগ্নাংশের মানও নিতে পারে যেমন 90.85 $\mathrm{cm}, 102.34 \mathrm{~cm}, 149.99 \mathrm{~cm}$ ইত্যাদি যা পূর্ণসংখ্যা নয়। সুতরাং চলক “উচ্চতা” প্রতিটি সম্ভাব্য মান প্রকাশ করতে সক্ষম এবং এর মানগুলিকে অসীম গ্রেডেশনে ভাগ করা যেতে পারে। একটি অবিচ্ছিন্ন চলকের অন্যান্য উদাহরণ হল ওজন, সময়, দূরত্ব ইত্যাদি।
একটি অবিচ্ছিন্ন চলকের বিপরীতে, একটি বিচ্ছিন্ন চলক শুধুমাত্র নির্দিষ্ট মান নিতে পারে। এর মান শুধুমাত্র সসীম “লাফ”-এর মাধ্যমে পরিবর্তিত হয়। এটি একটি মান থেকে অন্য মানে “লাফ দেয়” কিন্তু তাদের মধ্যবর্তী কোন মান নেয় না। উদাহরণস্বরূপ, “একটি শ্রেণীতে শিক্ষার্থীর সংখ্যা”-এর মতো একটি চলক, বিভিন্ন শ্রেণীর জন্য, শুধুমাত্র পূর্ণসংখ্যার মান গ্রহণ করবে। এটি 0.5-এর মতো কোন ভগ্নাংশের মান নিতে পারে না কারণ “একজন শিক্ষার্থীর অর্ধেক” অর্থহীন। তাই এটি 25 এবং 26-এর মধ্যে 25.5-এর মতো কোন মান নিতে পারে না। বরং এর মান 25 বা 26 হতে পারত। আমরা যা পর্যবেক্ষণ করি তা হল যখন এর মান 25 থেকে 26-এ পরিবর্তিত হয়, তখন তাদের মধ্যবর্তী মানগুলি - ভগ্নাংশগুলি - এটি গ্রহণ করে না। কিন্তু আমাদের এই ধারণা থাকা উচিত নয় যে একটি বিচ্ছিন্ন চলক কোন ভগ্নাংশের মান নিতে পারে না। ধরুন $X$ একটি চলক যা $1 / 8,1$ / $16,1 / 32,1 / 64, \ldots$ এর মতো মান নেয়। এটি কি একটি বিচ্ছিন্ন চলক? হ্যাঁ, কারণ যদিও $\mathrm{X}$ ভগ্নাংশের মান নেয় এটি দুটি সন্নিহিত ভগ্নাংশের মানের মধ্যে কোন মান নিতে পারে না। এটি $1 /$ 8 থেকে $1 / 16$ এবং $1 / 16$ থেকে $1 / 32$-এ পরিবর্তিত হয় বা “লাফ দেয়”। কিন্তু এটি $1 / 8$ এবং $1 / 16$-এর মধ্যে বা $1 / 16$ এবং $1 / 32$-এর মধ্যে কোন মান নিতে পারে না।
কার্যকলাপ
- নিম্নলিখিত চলকগুলিকে অবিচ্ছিন্ন ও বিচ্ছিন্ন হিসেবে পার্থক্য করুন: ক্ষেত্রফল, আয়তন, তাপমাত্রা, একটি পাশার উপর প্রদর্শিত সংখ্যা, ফসলের ফলন, জনসংখ্যা, বৃষ্টিপাত, রাস্তায় গাড়ির সংখ্যা এবং বয়স।
উদাহরণ ৪ দেখায় কিভাবে ১০০ জন শিক্ষার্থীর নম্বর শ্রেণীতে দলবদ্ধ করা হয়েছে। আপনি ভাবছেন কিভাবে আমরা সারণী ৩.১-এর কাঁচা উপাত্ত থেকে এটি পেলাম। কিন্তু, আমরা এই প্রশ্নের সমাধান করার আগে, আপনাকে জানতে হবে গণসংখ্যা বিন্যাস কী।
5. গণসংখ্যা বিন্যাস কী?
গণসংখ্যা বিন্যাস হল একটি পরিমাণগত চলকের কাঁচা উপাত্ত শ্রেণীবদ্ধ করার একটি ব্যাপক পদ্ধতি। এটি দেখায় যে একটি চলকের বিভিন্ন মান (এখানে, একজন শিক্ষার্থী কর্তৃক অর্জিত গণিতের নম্বর) বিভিন্ন শ্রেণীতে কিভাবে বিতরণ করা হয়েছে তাদের সংশ্লিষ্ট শ্রেণী গণসংখ্যার সাথে। এই ক্ষেত্রে আমাদের নম্বরের দশটি শ্রেণী রয়েছে: $0-10,10-20, \ldots$, 90-100। শ্রেণী গণসংখ্যা শব্দটির অর্থ একটি নির্দিষ্ট শ্রেণীতে মানের সংখ্যা। উদাহরণস্বরূপ, 30-40 শ্রেণীতে আমরা সারণী ৩.১-এর কাঁচা উপাত্ত থেকে নম্বরের 7টি মান পাই। সেগুলো হল $30,37,34,30,35,39,32$। শ্রেণী: $30-40$-এর গণসংখ্যা তাই 7। কিন্তু আপনি হয়তো ভাবছেন কেন $40-$ যা কাঁচা উপাত্তে দুইবার ঘটছে - তা 30-40 শ্রেণীতে অন্তর্ভুক্ত নয়। যদি এটি অন্তর্ভুক্ত করা হত তাহলে 30-40 শ্রেণীর গণসংখ্যা 7-এর বদলে 9 হত। ধাঁধাটি আপনার কাছে স্পষ্ট হবে যদি আপনি এই অধ্যায়টি মনোযোগ সহকারে পড়ার জন্য যথেষ্ট ধৈর্যশীল হন। তাই পড়তে থাকুন। আপনি নিজেই উত্তর পাবেন।
একটি গণসংখ্যা বিন্যাস সারণীতে প্রতিটি শ্রেণী শ্রেণী সীমা দ্বারা আবদ্ধ। শ্রেণী সীমা হল একটি শ্রেণীর দুই প্রান্ত। সর্বনিম্ন মানকে নিম্ন শ্রেণী সীমা এবং সর্বোচ্চ মানকে উচ্চ শ্রেণী সীমা বলে। উদাহরণস্বরূপ, শ্রেণী: 60-70-এর জন্য শ্রেণী সীমা হল 60 এবং 70। এর নিম্ন শ্রেণী সীমা হল 60 এবং উচ্চ শ্রেণী সীমা হল 70। শ্রেণী ব্যবধান বা শ্রেণী প্রস্থ হল উচ্চ শ্রেণী সীমা এবং নিম্ন শ্রেণী সীমার পার্থক্য। 60-70 শ্রেণীর জন্য, শ্রেণী ব্যবধান হল 10 (উচ্চ শ্রেণী সীমা বিয়োগ নিম্ন শ্রেণী সীমা)।
শ্রেণী মধ্যবিন্দু বা শ্রেণী চিহ্ন হল একটি শ্রেণীর মধ্যবর্তী মান। এটি একটি শ্রেণীর নিম্ন শ্রেণী সীমা এবং উচ্চ শ্রেণী সীমার মধ্যবর্তী স্থানে অবস্থিত এবং নিম্নলিখিত পদ্ধতিতে নির্ণয় করা যেতে পারে:
শ্রেণী মধ্যবিন্দু বা শ্রেণী চিহ্ন
$$ \text { = (Upper Class Limit + Lower Class Limit)/2 } $$
প্রতিটি শ্রেণীর শ্রেণী চিহ্ন বা মধ্য-মান শ্রেণীটিকে প্রতিনিধিত্ব করতে ব্যবহৃত হয়। একবার কাঁচা উপাত্ত শ্রেণীতে দলবদ্ধ হয়ে গেলে, ব্যক্তিগত পর্যবেক্ষণ আরও গণনায় ব্যবহৃত হয় না। পরিবর্তে, শ্রেণী চিহ্ন ব্যবহৃত হয়।
সারণী ৩.৩ নিম্ন শ্রেণী সীমা, উচ্চ শ্রেণী সীমা এবং শ্রেণী চিহ্ন
| শ্রেণী | গণসংখ্যা | নিম্ন শ্রেণী সীমা | উচ্চ শ্রেণী সীমা | শ্রেণী চিহ্ন |
|---|---|---|---|---|
| 0-10 | 1 | 0 | 10 | 5 |
| 10-20 | 8 | 10 | 20 | 15 |
| 20-30 | 6 | 20 | 30 | 25 |
| 30-40 | 7 | 30 | 40 | 35 |
| 40-50 | 21 | 40 | 50 | 45 |
| 50-60 | 23 | 50 | 60 | 55 |
| 60-70 | 19 | 60 | 70 | 65 |
| 70-80 | 6 | 70 | 80 | 75 |
| 80-90 | 5 | 80 | 90 | 85 |
| 90-100 | 4 | 90 | 100 | 95 |
গণসংখ্যা বক্ররেখা হল একটি গণসংখ্যা বিন্যাসের গ্রাফিক উপস্থাপনা। চিত্র ৩.১ উপরের উদাহরণে উপাত্তের গণসংখ্যা বিন্যাসের চিত্রিত উপস্থাপনা দেখায়। গণসংখ্যা বক্ররেখা পেতে আমরা শ্রেণী চিহ্নগুলিকে $\mathrm{X}$-অক্ষে এবং গণসংখ্যাকে $\mathrm{Y}$ অক্ষে অঙ্কন করি।
চিত্র ৩.১: উপাত্তের গণসংখ্যা বিন্যাসের চিত্রিত উপস্থাপনা।
কিভাবে একটি গণসংখ্যা বিন্যাস তৈরি করবেন
একটি গণসংখ্যা বিন্যাস প্রস্তুত করার সময়, নিম্নলিখিত পাঁচটি প্রশ্নের সমাধান করা প্রয়োজন:
- আমাদের সমান বা অসমান আকারের শ্রেণী ব্যবধান থাকা উচিত?
- আমাদের কতগুলি শ্রেণী থাকা উচিত?
- প্রতিটি শ্রেণীর আকার কত হওয়া উচিত?
- আমরা কিভাবে শ্রেণী সীমা নির্ধারণ করব?
- আমরা কিভাবে প্রতিটি শ্রেণীর জন্য গণসংখ্যা পাব?
আমাদের সমান বা অসমান আকারের শ্রেণী ব্যবধান থাকা উচিত?
দুটি পরিস্থিতি রয়েছে যেখানে অসমান আকারের ব্যবধান ব্যবহৃত হয়। প্রথমত, যখন আমাদের আয় এবং অন্যান্য অনুরূপ চলকের উপর উপাত্ত থাকে যেখানে পরিসর খুব বেশি। উদাহরণস্বরূপ, দৈনিক আয় প্রায় শূন্য থেকে অনেক শত কোটি রুপি পর্যন্ত হতে পারে। এমন পরিস্থিতিতে, সমান শ্রেণী ব্যবধান উপযুক্ত নয় কারণ (i) যদি শ্রেণী ব্যবধান মাঝারি আকারের এবং সমান হয়, তাহলে প্রচুর সংখ্যক শ্রেণী থাকবে। (ii) যদি শ্রেণী ব্যবধান ছোট হয়, আমরা খুব ছোট স্তর বা খুব উচ্চ স্তরের আয়ের উপর তথ্য দমন করার প্রবণতা রাখব।
দ্বিতীয়ত, যদি মানগুলির একটি বড় সংখ্যা পরিসরের একটি ছোট অংশে কেন্দ্রীভূত হয়, তাহলে সমান শ্রেণী ব্যবধান অনেক মানের উপর তথ্যের অভাবের দিকে নিয়ে যাবে।
অন্যান্য সব ক্ষেত্রে, গণসংখ্যা বিন্যাসে সমান আকারের শ্রেণী ব্যবধান ব্যবহৃত হয়।
আমাদের কতগুলি শ্রেণী থাকা উচিত?
শ্রেণীর সংখ্যা সাধারণত ছয় থেকে পনেরোর মধ্যে হয়। যদি আমরা সমান আকারের শ্রেণী ব্যবধান ব্যবহার করি, তাহলে শ্রেণীর সংখ্যা পরিসর (চলকের বৃহত্তম এবং ক্ষুদ্রতম মানের মধ্যে পার্থক্য) কে শ্রেণী ব্যবধানের আকার দিয়ে ভাগ করে গণনা করা যেতে পারে।
কার্যকলাপ
নিম্নলিখিতগুলির পরিসর নির্ণয় করুন:
- উদাহরণ ১-এ ভারতের জনসংখ্যা,
- উদাহরণ ২-এ গমের ফলন।
প্রতিটি নমুনার আকার কত হওয়া উচিত?
এই প্রশ্নের উত্তর পূর্ববর্তী প্রশ্নের উত্তরের উপর নির্ভর করে। চলকের পরিসর দেওয়া থাকলে, আমরা একবার শ্রেণী ব্যবধান স্থির করলে শ্রেণীর সংখ্যা নির্ধারণ করতে পারি। সুতরাং, আমরা দেখতে পাই যে এই দুটি সিদ্ধান্ত পরস্পর সংযুক্ত। আমরা একটি না স্থির করে অন্যটি স্থির করতে পারি না।
উদাহরণ ৪-এ, আমাদের শ্রেণীর সংখ্যা 10 রয়েছে। পরিসরের মান 100 দেওয়া থাকলে, শ্রেণী ব্যবধান স্বয়ংক্রিয়ভাবে 10 হয়। লক্ষ্য করুন যে বর্তমান প্রসঙ্গে আমরা সমান মাত্রার শ্রেণী ব্যবধান বেছে নিয়েছি। যাইহোক, আমরা সমান মাত্রার নয় এমন শ্রেণী ব্যবধান বেছে নিতে পারতাম। সেই ক্ষেত্রে, শ্রেণীগুলি অসম প্রস্থের হত।
আমরা কিভাবে শ্রেণী সীমা নির্ধারণ করব?
শ্রেণী সীমা নির্দিষ্ট এবং স্পষ্টভাবে উল্লেখ করা উচিত। সাধারণত, খোলা-প্রান্ত বিশিষ্ট শ্রেণী যেমন “70 এবং তার বেশি” বা “10-এর কম” কাম্য নয়।
নিম্ন ও উচ্চ শ্রেণী সীমা এমনভাবে নির্ধারণ করা উচিত যাতে প্রতিটি শ্রেণীর গণসংখ্যা বিন্যাসের মাঝামাঝিতে কেন্দ্রীভূত হওয়ার প্রবণতা রাখে।
শ্রেণী ব্যবধান দুই প্রকার:
(i) অন্তর্ভুক্তিমূলক শ্রেণী ব্যবধান: এই ক্ষেত্রে, একটি শ্রেণীর নিম্ন ও উচ্চ সীমার সমান মানগুলি একই শ্রেণীর গণসংখ্যায় অন্তর্ভুক্ত করা হয়।
(ii) ব্যতীতিমূলক শ্রেণী ব্যবধান: এই ক্ষেত্রে, উচ্চ বা নিম্ন শ্রেণী সীমার সমান একটি বিষয় সেই শ্রেণীর গণসংখ্যা থেকে বাদ দেওয়া হয়।
বিচ্ছিন্ন চলকের ক্ষেত্রে, শুধুমাত্র ব্যতীতিমূলক শ্রেণী ব্যবধান ব্যবহার করা যেতে পারে।
অবিচ্ছিন্ন চলকের ক্ষেত্রে, ব্যতীতিমূলক শ্রেণী ব্যবধান খুবই বেশি ব্যবহৃত হয়।
উদাহরণ
ধরুন আমাদের একটি পরীক্ষায় শিক্ষার্থীদের প্রাপ্ত নম্বরের উপর উপাত্ত রয়েছে এবং সব নম্বর পূর্ণ সংখ্যায় রয়েছে (