অধ্যায় ০৩ উপাত্তের সংগঠন

1. ভূমিকা

পূর্ববর্তী অধ্যায়ে আপনি শিখেছেন কিভাবে উপাত্ত সংগ্রহ করা হয়। আপনি জনগণনা ও নমুনায়নের পার্থক্যও জানতে পেরেছেন। এই অধ্যায়ে আপনি জানবেন কিভাবে আপনি যে উপাত্ত সংগ্রহ করেছেন সেগুলোকে শ্রেণীবদ্ধ করা হবে। অশ্রেণীবদ্ধ বা কাঁচা উপাত্তকে শ্রেণীবদ্ধ করার উদ্দেশ্য হল এগুলোর মধ্যে সুশৃঙ্খলা আনা যাতে এগুলোকে সহজেই পরবর্তী পরিসংখ্যানগত বিশ্লেষণের আওতায় আনা যায়।

আপনি কি কখনো আপনার স্থানীয় কাবাড়িওয়ালা বা পুরনো কাগজপত্র, ভাঙা গৃহস্থালি জিনিস, খালি কাঁচের বোতল, প্লাস্টিক ইত্যাদি যাকে বিক্রি করেন তাকে লক্ষ্য করেছেন? তিনি আপনার কাছ থেকে এই জিনিসগুলো কিনে নেন এবং যারা এগুলো পুনর্ব্যবহার করে তাদের কাছে বিক্রি করেন। কিন্তু তার দোকানে এত বেশি জঞ্জাল থাকায় তার পক্ষে ব্যবসা পরিচালনা করা খুবই কঠিন হত, যদি তিনি সেগুলো সঠিকভাবে সংগঠিত না করতেন। তার অবস্থা সহজ করার জন্য তিনি বিভিন্ন জঞ্জালকে উপযুক্তভাবে দল বা “শ্রেণী”-তে ভাগ করেন। তিনি পুরনো সংবাদপত্রগুলো একসাথে রাখেন এবং দড়ি দিয়ে বেঁধে রাখেন। তারপর সব খালি কাঁচের বোতল একটি বস্তায় সংগ্রহ করেন। তিনি ধাতব জিনিসগুলো তার দোকানের এক কোণে জমা করেন এবং “লোহা”, “তামা”, “অ্যালুমিনিয়াম”, “পিতল” ইত্যাদি দলে সাজান, এবং এভাবেই চলতে থাকে। এভাবে তিনি তার জঞ্জালকে বিভিন্ন শ্রেণীতে ভাগ করেন - “সংবাদপত্র”, “প্লাস্টিক”, “কাঁচ”, “ধাতু” ইত্যাদি - এবং এগুলোর মধ্যে শৃঙ্খলা আনেন। একবার তার জঞ্জাল সাজানো ও শ্রেণীবদ্ধ হয়ে গেলে, কোন ক্রেতা যে নির্দিষ্ট জিনিসটি চাইতে পারে তা খুঁজে পাওয়া তার পক্ষে সহজ হয়ে যায়।

একইভাবে যখন আপনি আপনার স্কুলের বইগুলো একটি নির্দিষ্ট ক্রমে সাজান, তখন সেগুলো হ্যান্ডেল করা আপনার পক্ষে সহজ হয়ে যায়। আপনি বিষয় অনুযায়ী সেগুলো শ্রেণীবদ্ধ করতে পারেন যেখানে প্রতিটি বিষয় একটি দল বা শ্রেণী হয়ে যায়। সুতরাং, যখন আপনার উদাহরণস্বরূপ ইতিহাসের একটি নির্দিষ্ট বই দরকার হয়, তখন আপনাকে যা করতে হবে তা হল “ইতিহাস” দলটিতে সেই বইটি খুঁজে বের করা। অন্যথায়, আপনি যে নির্দিষ্ট বইটি খুঁজছেন তা খুঁজে পেতে আপনার পুরো সংগ্রহটি ঘাঁটতে হত।

বস্তু বা জিনিসপত্র শ্রেণীবদ্ধ করা আমাদের মূল্যবান সময় ও শ্রম বাঁচালেও, তা ইচ্ছামতো করা হয় না। কাবাড়িওয়ালা পুনর্ব্যবহারযোগ্য পণ্যের বাজার অনুযায়ী তার জঞ্জালকে দলে ভাগ করেন। উদাহরণস্বরূপ, “কাঁচ” দলের অধীনে তিনি খালি বোতল, ভাঙা আয়না এবং জানালার কাচ ইত্যাদি রাখবেন। একইভাবে যখন আপনি আপনার ইতিহাসের বইগুলো “ইতিহাস” দলের অধীনে শ্রেণীবদ্ধ করেন, আপনি সেই দলে অন্য বিষয়ের একটি বই রাখবেন না। অন্যথায় দলবদ্ধ করার পুরো উদ্দেশ্যই ব্যর্থ হবে। সুতরাং, শ্রেণীবদ্ধকরণ হল কিছু মানদণ্ডের ভিত্তিতে জিনিসপত্রকে দল বা শ্রেণীতে সাজানো বা সংগঠিত করা।

কার্যকলাপ

  • চিঠিগুলো কিভাবে বাছাই করা হয় তা জানতে আপনার স্থানীয় ডাকঘর পরিদর্শন করুন। আপনি কি জানেন একটি চিঠির পিন-কোড কী নির্দেশ করে? আপনার ডাকবাহককে জিজ্ঞাসা করুন।

2. কাঁচা উপাত্ত

কাবাড়িওয়ালার জঞ্জালের মতো, অশ্রেণীবদ্ধ উপাত্ত বা কাঁচা উপাত্ত অত্যন্ত বিশৃঙ্খল। এগুলো প্রায়শই খুব বড় এবং হ্যান্ডেল করা কষ্টসাধ্য। এগুলো থেকে অর্থপূর্ণ সিদ্ধান্তে পৌঁছানো একটি ক্লান্তিকর কাজ কারণ এগুলো সহজেই পরিসংখ্যানগত পদ্ধতির আওতায় আসে না। তাই কোনও পদ্ধতিগত পরিসংখ্যানগত বিশ্লেষণ শুরু করার আগে এমন উপাত্তের সঠিক সংগঠন ও উপস্থাপনার প্রয়োজন হয়। সুতরাং উপাত্ত সংগ্রহ করার পর পরবর্তী ধাপ হল সেগুলোকে শ্রেণীবদ্ধ আকারে সংগঠিত ও উপস্থাপন করা।

ধরুন আপনি গণিতে শিক্ষার্থীদের পারফরম্যান্স জানতে চান এবং আপনি আপনার স্কুলের ১০০ জন শিক্ষার্থীর গণিতে প্রাপ্ত নম্বরের উপাত্ত সংগ্রহ করেছেন। যদি আপনি সেগুলো একটি টেবিল আকারে উপস্থাপন করেন, তাহলে সেগুলো টেবিল ৩.১-এর মতো দেখাতে পারে।

সারণী ৩.১ একটি পরীক্ষায় ১০০ জন শিক্ষার্থী কর্তৃক গণিতে প্রাপ্ত নম্বর

47 45 10 60 51 56 66 100 49 40
60 59 56 55 62 48 59 55 51 41
42 69 64 66 50 59 57 65 62 50
64 30 37 75 17 56 20 14 55 90
62 51 55 14 25 34 90 49 56 54
70 47 49 82 40 82 60 85 65 66
49 44 64 69 70 48 12 28 55 65
49 40 25 41 71 80 0 56 14 22
66 53 46 70 43 61 59 12 30 35
45 44 57 76 82 39 32 14 90 25

অথবা আপনি আপনার প্রতিবেশী ৫০টি পরিবারের খাদ্যের মাসিক ব্যয়ের উপাত্ত সংগ্রহ করতে পারেন তাদের খাদ্যের গড় ব্যয় জানার জন্য। সেই ক্ষেত্রে সংগ্রহ করা উপাত্ত, যদি আপনি টেবিল আকারে উপস্থাপন করতেন, তাহলে সারণী ৩.২-এর মতো হত। সারণী ৩.১ এবং ৩.২ উভয়ই কাঁচা বা অশ্রেণীবদ্ধ উপাত্ত। উভয় টেবিলেই আপনি দেখতে পাচ্ছেন যে সংখ্যাগুলো কোন ক্রমে সাজানো নেই। এখন যদি আপনাকে সারণী ৩.১ থেকে গণিতে সর্বোচ্চ নম্বর জিজ্ঞাসা করা হয় তাহলে আপনাকে প্রথমে ১০০ জন শিক্ষার্থীর নম্বর ঊর্ধ্বক্রম বা অধঃক্রমে সাজাতে হবে। এটি একটি ক্লান্তিকর কাজ। এটি আরও ক্লান্তিকর হয়ে ওঠে, যদি ১০০-এর বদলে আপনার হ্যান্ডেল করতে হয় ১,০০০ শিক্ষার্থীর নম্বর। একইভাবে, সারণী ৩.২-এ, আপনি লক্ষ্য করবেন যে ৫০টি পরিবারের গড় মাসিক ব্যয় নির্ধারণ করা আপনার পক্ষে কঠিন। এবং এই অসুবিধা বহুগুণ বেড়ে যাবে যদি সংখ্যাটি আরও বড় হয় - ধরুন, ৫,০০০ পরিবার। আমাদের কাবাড়িওয়ালার মতো, যিনি একটি নির্দিষ্ট জিনিস খুঁজে পেতে হিমশিম খাবেন যখন তার জঞ্জাল বড় ও অগোছালো হয়ে যায়, আপনি যখন বড় আকারের কাঁচা উপাত্ত থেকে কোন তথ্য পেতে চেষ্টা করবেন তখন একই অবস্থার সম্মুখীন হবেন। এক কথায়, তাই, বড় অশ্রেণীবদ্ধ উপাত্ত থেকে তথ্য বের করা একটি ক্লান্তিকর কাজ।

সারণী ৩.২ ৫০টি পরিবারের খাদ্যের উপর মাসিক গৃহস্থালি ব্যয় (রুপিতে)

1904 1559 3473 1735 2760
2041 1612 1753 1855 4439
5090 1085 1823 2346 1523
1211 1360 1110 2152 1183
1218 1315 1105 2628 2712
4248 1812 1264 1183 1171
1007 1180 1953 1137 2048
2025 1583 1324 2621 3676
1397 1832 1962 2177 2575
1293 1365 1146 3222 1396

কাঁচা উপাত্তকে শ্রেণীবদ্ধ করে সংক্ষিপ্ত ও বোধগম্য করা হয়। যখন একই বৈশিষ্ট্যের তথ্যগুলো একই শ্রেণীতে স্থাপন করা হয়, তখন সেগুলো সহজে খুঁজে পাওয়া, তুলনা করা এবং কোন অসুবিধা ছাড়াই অনুমান করা সম্ভব হয়। আপনি অধ্যায় ২-এ পড়েছেন যে ভারত সরকার প্রতি দশ বছর পর পর জনগণনা পরিচালনা করে। ২০০১ সালের জনগণনায় প্রায় ২০ কোটি ব্যক্তির সাথে যোগাযোগ করা হয়েছিল। জনগণনার কাঁচা উপাত্ত এত বড় এবং খণ্ডিত যে সেগুলো থেকে কোন অর্থপূর্ণ সিদ্ধান্তে পৌঁছানো প্রায় অসম্ভব কাজ বলে মনে হয়। কিন্তু যখন একই উপাত্ত লিঙ্গ, শিক্ষা, বৈবাহিক অবস্থা, পেশা ইত্যাদি অনুযায়ী শ্রেণীবদ্ধ করা হয়, তখন ভারতের জনসংখ্যার কাঠামো ও প্রকৃতি সহজেই বোঝা যায়।

কাঁচা উপাত্ত চলকের উপর পর্যবেক্ষণ নিয়ে গঠিত। সারণী ৩.১ এবং ৩.২-এ প্রদত্ত কাঁচা উপাত্ত একটি নির্দিষ্ট বা চলকের দলের উপর পর্যবেক্ষণ নিয়ে গঠিত। উদাহরণস্বরূপ সারণী ৩.১-এর দিকে তাকান যাতে ১০০ জন শিক্ষার্থী কর্তৃক অর্জিত গণিতের নম্বর রয়েছে। আমরা কিভাবে এই নম্বরগুলোর অর্থ বুঝতে পারি? গণিতের শিক্ষক এই নম্বরগুলো দেখে ভাববেন- আমার শিক্ষার্থীরা কেমন করেছে? কতজন পাস করতে পারেনি? আমরা কিভাবে উপাত্ত শ্রেণীবদ্ধ করব তা নির্ভর করে আমাদের মনে যে উদ্দেশ্য রয়েছে তার উপর। এই ক্ষেত্রে, শিক্ষিকা কিছু গভীরতায় বুঝতে চান- এই শিক্ষার্থীরা কেমন করেছে। তিনি সম্ভবত গণসংখ্যা বিন্যাস গঠন করতে বেছে নেবেন। এটি পরবর্তী বিভাগে আলোচনা করা হয়েছে।

কার্যকলাপ

  • এক বছরের জন্য আপনার পরিবারের মোট সাপ্তাহিক ব্যয়ের উপাত্ত সংগ্রহ করুন এবং একটি টেবিলে সাজান। দেখুন আপনার কতগুলি পর্যবেক্ষণ আছে। উপাত্তগুলো মাসিকভাবে সাজান এবং পর্যবেক্ষণের সংখ্যা নির্ণয় করুন।

3. উপাত্তের শ্রেণীবদ্ধকরণ

একটি শ্রেণীবদ্ধকরণের দল বা শ্রেণী বিভিন্নভাবে করা হয়। আপনার বইগুলোকে বিষয় অনুযায়ী - “ইতিহাস”, “ভূগোল”, “গণিত”, “বিজ্ঞান” ইত্যাদি শ্রেণীবদ্ধ করার পরিবর্তে - আপনি সেগুলো লেখক অনুসারে বর্ণানুক্রমিক ক্রমে শ্রেণীবদ্ধ করতে পারতেন। অথবা, আপনি প্রকাশনার বছর অনুযায়ীও সেগুলো শ্রেণীবদ্ধ করতে পারতেন। আপনি সেগুলোকে কিভাবে শ্রেণীবদ্ধ করতে চান তা আপনার প্রয়োজনীয়তার উপর নির্ভর করবে।

একইভাবে কাঁচা উপাত্ত উদ্দেশ্য অনুযায়ী বিভিন্নভাবে শ্রেণীবদ্ধ করা হয়। সেগুলো সময় অনুযায়ী দলবদ্ধ করা যেতে পারে। এমন শ্রেণীবদ্ধকরণকে কালানুক্রমিক শ্রেণীবদ্ধকরণ বলে। এমন শ্রেণীবদ্ধকরণে, উপাত্তকে বছর, ত্রৈমাসিক, মাস, সপ্তাহ ইত্যাদি সময়ের সাপেক্ষে ঊর্ধ্বক্রম বা অধঃক্রমে শ্রেণীবদ্ধ করা হয়। নিম্নলিখিত উদাহরণটি বছর অনুযায়ী শ্রেণীবদ্ধ ভারতের জনসংখ্যা দেখায়। চলক ‘জনসংখ্যা’ একটি সময় শ্রেণী কারণ এটি বিভিন্ন বছরের জন্য মানের একটি শ্রেণী চিত্রিত করে।

উদাহরণ ১

ভারতের জনসংখ্যা (কোটিতে)

বছর জনসংখ্যা (কোটি)
1951 35.7
1961 43.8
1971 54.6
1981 68.4
1991 81.8
2001 102.7
2011 121.0

স্থানিক শ্রেণীবদ্ধকরণে উপাত্তকে দেশ, রাজ্য, শহর, জেলা ইত্যাদি ভৌগোলিক অবস্থানের সাপেক্ষে শ্রেণীবদ্ধ করা হয়।

উদাহরণ ২ বিভিন্ন দেশে গমের ফলন দেখায়।

উদাহরণ ২

বিভিন্ন দেশের জন্য গমের ফলন (২০১৩)

দেশ গমের ফলন (কেজি/হেক্টর)
কানাডা 3594
চীন 5055
ফ্রান্স 7254
জার্মানি 7998
ভারত 3154
পাকিস্তান 2787

উৎস: Indian Agricultural Statistics at a Glance, 2015

কার্যকলাপ

  • উদাহরণ ১-এ, সেই বছরগুলো খুঁজে বের করুন যখন ভারতের জনসংখ্যা সর্বনিম্ন ও সর্বোচ্চ ছিল।
  • উদাহরণ ২-এ, সেই দেশটি খুঁজে বের করুন যার গমের ফলন ভারতের তুলনায় কিছুটা বেশি। শতাংশের হিসেবে সেটা কত হবে?
  • উদাহরণ ২-এর দেশগুলোকে ফলনের ঊর্ধ্বক্রম অনুসারে সাজান। ফলনের অধঃক্রমের জন্য একই অনুশীলন করুন।

কখনও কখনও আপনি এমন বৈশিষ্ট্যের সম্মুখীন হন যেগুলো পরিমাণগতভাবে প্রকাশ করা যায় না। এমন বৈশিষ্ট্যগুলোকে গুণবাচক বৈশিষ্ট্য বলে। উদাহরণস্বরূপ, জাতীয়তা, সাক্ষরতা, ধর্ম, লিঙ্গ, বৈবাহিক অবস্থা ইত্যাদি। সেগুলো পরিমাপ করা যায় না। তবুও এই গুণবাচক বৈশিষ্ট্যগুলো একটি গুণগত বৈশিষ্ট্যের উপস্থিতি বা অনুপস্থিতির ভিত্তিতে শ্রেণীবদ্ধ করা যেতে পারে। গুণবাচক বৈশিষ্ট্যের উপর উপাত্তের এমন শ্রেণীবদ্ধকরণকে গুণগত শ্রেণীবদ্ধকরণ বলে। নিম্নলিখিত উদাহরণে, আমরা দেখতে পাই একটি দেশের জনসংখ্যা গুণগত চলক “লিঙ্গ”-এর ভিত্তিতে দলবদ্ধ করা হয়েছে। একটি পর্যবেক্ষণ হয় পুরুষ বা নারী হতে পারে। এই দুটি বৈশিষ্ট্যকে নীচে দেওয়া বৈবাহিক অবস্থার ভিত্তিতে আরও শ্রেণীবদ্ধ করা যেতে পারে:

উদাহরণ ৩

প্রথম পর্যায়ে শ্রেণীবদ্ধকরণ একটি গুণবাচক বৈশিষ্ট্যের উপস্থিতি ও অনুপস্থিতির ভিত্তিতে, অর্থাৎ পুরুষ বা পুরুষ নয় (নারী)। দ্বিতীয় পর্যায়ে, প্রতিটি শ্রেণী - পুরুষ ও নারী, আরেকটি গুণবাচক বৈশিষ্ট্যের উপস্থিতি বা অনুপস্থিতির ভিত্তিতে আরও উপবিভক্ত করা হয়, অর্থাৎ বিবাহিত বা অবিবাহিত কিনা। উচ্চতা, ওজন, বয়স, আয়, শিক্ষার্থীদের নম্বর ইত্যাদি বৈশিষ্ট্য পরিমাণগত প্রকৃতির। যখন এই ধরনের বৈশিষ্ট্যের সংগ্রহ করা উপাত্ত শ্রেণীতে দলবদ্ধ করা হয়, তখন এটি একটি পরিমাণগত শ্রেণীবদ্ধকরণ হয়ে যায়।

কার্যকলাপ

  • চারপাশের বস্তুগুলোকে জীবিত বা অজীব হিসেবে দলবদ্ধ করা যেতে পারে। এটি কি একটি পরিমাণগত শ্রেণীবদ্ধকরণ?

উদাহরণ ৪

১০০ জন শিক্ষার্থীর গণিতে প্রাপ্ত নম্বরের গণসংখ্যা বিন্যাস

নম্বর গণসংখ্যা
0-10 1
10-20 8
20-30 6
30-40 7
40-50 21
50-60 23
60-70 19
70-80 6
80-90 5
90-100 4
মোট 100

উদাহরণ ৪ সারণী ৩.১-এ প্রদত্ত ১০০ জন শিক্ষার্থীর গণিতে প্রাপ্ত নম্বরের পরিমাণগত শ্রেণীবদ্ধকরণ দেখায়।

কার্যকলাপ

  • উদাহরণ ৪-এর গণসংখ্যার মানগুলোকে মোট গণসংখ্যার অনুপাত বা শতাংশ হিসেবে প্রকাশ করুন। লক্ষ্য করুন যে এইভাবে প্রকাশিত গণসংখ্যাকে আপেক্ষিক গণসংখ্যা বলে।
  • উদাহরণ ৪-এ, কোন শ্রেণীতে উপাত্তের সর্বোচ্চ ঘনত্ব রয়েছে? মোট পর্যবেক্ষণের শতাংশ হিসেবে এটি প্রকাশ করুন। কোন শ্রেণীতে উপাত্তের সর্বনিম্ন ঘনত্ব রয়েছে?

4. চলক: অবিচ্ছিন্ন ও বিচ্ছিন্ন

চলকের একটি সহজ সংজ্ঞা, যা আপনি গত অধ্যায়ে পড়েছেন, তা আপনাকে বলে না যে এটি কিভাবে পরিবর্তিত হয়। চলক নির্দিষ্ট মানদণ্ডের ভিত্তিতে ভিন্ন হয়। সেগুলোকে ব্যাপকভাবে দুই প্রকারে শ্রেণীবদ্ধ করা হয়:

(i) অবিচ্ছিন্ন ও নিরবচ্ছিন্ন

(ii) বিচ্ছিন্ন গণিত।

একটি অবিচ্ছিন্ন চলক যেকোনো সংখ্যাসূচক মান নিতে পারে। এটি পূর্ণসংখ্যার মান $(1,2,3,4, \ldots)$, ভগ্নাংশের মান $(1 / 2,2 / 3,3 / 4, \ldots)$, এবং সঠিক ভগ্নাংশ নয় এমন মান $(\sqrt{2}=1.414$, $\sqrt{3}=1.732, \ldots, \sqrt{7}=2.645$ ) নিতে পারে। উদাহরণস্বরূপ, একজন শিক্ষার্থীর উচ্চতা, যখন সে/সে বড় হয় ধরা যাক $90 \mathrm{~cm}$ থেকে $150 \mathrm{~cm}$, তার মধ্যবর্তী সব মান নেবে। এটি পূর্ণসংখ্যার মতো মান নিতে পারে যেমন $90 \mathrm{~cm}, 100 \mathrm{~cm}, 108 \mathrm{~cm}, 150 \mathrm{~cm}$। এটি ভগ্নাংশের মানও নিতে পারে যেমন 90.85 $\mathrm{cm}, 102.34 \mathrm{~cm}, 149.99 \mathrm{~cm}$ ইত্যাদি যা পূর্ণসংখ্যা নয়। সুতরাং চলক “উচ্চতা” প্রতিটি সম্ভাব্য মান প্রকাশ করতে সক্ষম এবং এর মানগুলিকে অসীম গ্রেডেশনে ভাগ করা যেতে পারে। একটি অবিচ্ছিন্ন চলকের অন্যান্য উদাহরণ হল ওজন, সময়, দূরত্ব ইত্যাদি।

একটি অবিচ্ছিন্ন চলকের বিপরীতে, একটি বিচ্ছিন্ন চলক শুধুমাত্র নির্দিষ্ট মান নিতে পারে। এর মান শুধুমাত্র সসীম “লাফ”-এর মাধ্যমে পরিবর্তিত হয়। এটি একটি মান থেকে অন্য মানে “লাফ দেয়” কিন্তু তাদের মধ্যবর্তী কোন মান নেয় না। উদাহরণস্বরূপ, “একটি শ্রেণীতে শিক্ষার্থীর সংখ্যা”-এর মতো একটি চলক, বিভিন্ন শ্রেণীর জন্য, শুধুমাত্র পূর্ণসংখ্যার মান গ্রহণ করবে। এটি 0.5-এর মতো কোন ভগ্নাংশের মান নিতে পারে না কারণ “একজন শিক্ষার্থীর অর্ধেক” অর্থহীন। তাই এটি 25 এবং 26-এর মধ্যে 25.5-এর মতো কোন মান নিতে পারে না। বরং এর মান 25 বা 26 হতে পারত। আমরা যা পর্যবেক্ষণ করি তা হল যখন এর মান 25 থেকে 26-এ পরিবর্তিত হয়, তখন তাদের মধ্যবর্তী মানগুলি - ভগ্নাংশগুলি - এটি গ্রহণ করে না। কিন্তু আমাদের এই ধারণা থাকা উচিত নয় যে একটি বিচ্ছিন্ন চলক কোন ভগ্নাংশের মান নিতে পারে না। ধরুন $X$ একটি চলক যা $1 / 8,1$ / $16,1 / 32,1 / 64, \ldots$ এর মতো মান নেয়। এটি কি একটি বিচ্ছিন্ন চলক? হ্যাঁ, কারণ যদিও $\mathrm{X}$ ভগ্নাংশের মান নেয় এটি দুটি সন্নিহিত ভগ্নাংশের মানের মধ্যে কোন মান নিতে পারে না। এটি $1 /$ 8 থেকে $1 / 16$ এবং $1 / 16$ থেকে $1 / 32$-এ পরিবর্তিত হয় বা “লাফ দেয়”। কিন্তু এটি $1 / 8$ এবং $1 / 16$-এর মধ্যে বা $1 / 16$ এবং $1 / 32$-এর মধ্যে কোন মান নিতে পারে না।

কার্যকলাপ

  • নিম্নলিখিত চলকগুলিকে অবিচ্ছিন্ন ও বিচ্ছিন্ন হিসেবে পার্থক্য করুন: ক্ষেত্রফল, আয়তন, তাপমাত্রা, একটি পাশার উপর প্রদর্শিত সংখ্যা, ফসলের ফলন, জনসংখ্যা, বৃষ্টিপাত, রাস্তায় গাড়ির সংখ্যা এবং বয়স।

উদাহরণ ৪ দেখায় কিভাবে ১০০ জন শিক্ষার্থীর নম্বর শ্রেণীতে দলবদ্ধ করা হয়েছে। আপনি ভাবছেন কিভাবে আমরা সারণী ৩.১-এর কাঁচা উপাত্ত থেকে এটি পেলাম। কিন্তু, আমরা এই প্রশ্নের সমাধান করার আগে, আপনাকে জানতে হবে গণসংখ্যা বিন্যাস কী।

5. গণসংখ্যা বিন্যাস কী?

গণসংখ্যা বিন্যাস হল একটি পরিমাণগত চলকের কাঁচা উপাত্ত শ্রেণীবদ্ধ করার একটি ব্যাপক পদ্ধতি। এটি দেখায় যে একটি চলকের বিভিন্ন মান (এখানে, একজন শিক্ষার্থী কর্তৃক অর্জিত গণিতের নম্বর) বিভিন্ন শ্রেণীতে কিভাবে বিতরণ করা হয়েছে তাদের সংশ্লিষ্ট শ্রেণী গণসংখ্যার সাথে। এই ক্ষেত্রে আমাদের নম্বরের দশটি শ্রেণী রয়েছে: $0-10,10-20, \ldots$, 90-100। শ্রেণী গণসংখ্যা শব্দটির অর্থ একটি নির্দিষ্ট শ্রেণীতে মানের সংখ্যা। উদাহরণস্বরূপ, 30-40 শ্রেণীতে আমরা সারণী ৩.১-এর কাঁচা উপাত্ত থেকে নম্বরের 7টি মান পাই। সেগুলো হল $30,37,34,30,35,39,32$। শ্রেণী: $30-40$-এর গণসংখ্যা তাই 7। কিন্তু আপনি হয়তো ভাবছেন কেন $40-$ যা কাঁচা উপাত্তে দুইবার ঘটছে - তা 30-40 শ্রেণীতে অন্তর্ভুক্ত নয়। যদি এটি অন্তর্ভুক্ত করা হত তাহলে 30-40 শ্রেণীর গণসংখ্যা 7-এর বদলে 9 হত। ধাঁধাটি আপনার কাছে স্পষ্ট হবে যদি আপনি এই অধ্যায়টি মনোযোগ সহকারে পড়ার জন্য যথেষ্ট ধৈর্যশীল হন। তাই পড়তে থাকুন। আপনি নিজেই উত্তর পাবেন।

একটি গণসংখ্যা বিন্যাস সারণীতে প্রতিটি শ্রেণী শ্রেণী সীমা দ্বারা আবদ্ধ। শ্রেণী সীমা হল একটি শ্রেণীর দুই প্রান্ত। সর্বনিম্ন মানকে নিম্ন শ্রেণী সীমা এবং সর্বোচ্চ মানকে উচ্চ শ্রেণী সীমা বলে। উদাহরণস্বরূপ, শ্রেণী: 60-70-এর জন্য শ্রেণী সীমা হল 60 এবং 70। এর নিম্ন শ্রেণী সীমা হল 60 এবং উচ্চ শ্রেণী সীমা হল 70। শ্রেণী ব্যবধান বা শ্রেণী প্রস্থ হল উচ্চ শ্রেণী সীমা এবং নিম্ন শ্রেণী সীমার পার্থক্য। 60-70 শ্রেণীর জন্য, শ্রেণী ব্যবধান হল 10 (উচ্চ শ্রেণী সীমা বিয়োগ নিম্ন শ্রেণী সীমা)।

শ্রেণী মধ্যবিন্দু বা শ্রেণী চিহ্ন হল একটি শ্রেণীর মধ্যবর্তী মান। এটি একটি শ্রেণীর নিম্ন শ্রেণী সীমা এবং উচ্চ শ্রেণী সীমার মধ্যবর্তী স্থানে অবস্থিত এবং নিম্নলিখিত পদ্ধতিতে নির্ণয় করা যেতে পারে:

শ্রেণী মধ্যবিন্দু বা শ্রেণী চিহ্ন

$$ \text { = (Upper Class Limit + Lower Class Limit)/2 } $$

প্রতিটি শ্রেণীর শ্রেণী চিহ্ন বা মধ্য-মান শ্রেণীটিকে প্রতিনিধিত্ব করতে ব্যবহৃত হয়। একবার কাঁচা উপাত্ত শ্রেণীতে দলবদ্ধ হয়ে গেলে, ব্যক্তিগত পর্যবেক্ষণ আরও গণনায় ব্যবহৃত হয় না। পরিবর্তে, শ্রেণী চিহ্ন ব্যবহৃত হয়।

সারণী ৩.৩ নিম্ন শ্রেণী সীমা, উচ্চ শ্রেণী সীমা এবং শ্রেণী চিহ্ন

শ্রেণী গণসংখ্যা নিম্ন শ্রেণী সীমা উচ্চ শ্রেণী সীমা শ্রেণী চিহ্ন
0-10 1 0 10 5
10-20 8 10 20 15
20-30 6 20 30 25
30-40 7 30 40 35
40-50 21 40 50 45
50-60 23 50 60 55
60-70 19 60 70 65
70-80 6 70 80 75
80-90 5 80 90 85
90-100 4 90 100 95

গণসংখ্যা বক্ররেখা হল একটি গণসংখ্যা বিন্যাসের গ্রাফিক উপস্থাপনা। চিত্র ৩.১ উপরের উদাহরণে উপাত্তের গণসংখ্যা বিন্যাসের চিত্রিত উপস্থাপনা দেখায়। গণসংখ্যা বক্ররেখা পেতে আমরা শ্রেণী চিহ্নগুলিকে $\mathrm{X}$-অক্ষে এবং গণসংখ্যাকে $\mathrm{Y}$ অক্ষে অঙ্কন করি।

চিত্র ৩.১: উপাত্তের গণসংখ্যা বিন্যাসের চিত্রিত উপস্থাপনা।

কিভাবে একটি গণসংখ্যা বিন্যাস তৈরি করবেন

একটি গণসংখ্যা বিন্যাস প্রস্তুত করার সময়, নিম্নলিখিত পাঁচটি প্রশ্নের সমাধান করা প্রয়োজন:

  1. আমাদের সমান বা অসমান আকারের শ্রেণী ব্যবধান থাকা উচিত?
  2. আমাদের কতগুলি শ্রেণী থাকা উচিত?
  3. প্রতিটি শ্রেণীর আকার কত হওয়া উচিত?
  4. আমরা কিভাবে শ্রেণী সীমা নির্ধারণ করব?
  5. আমরা কিভাবে প্রতিটি শ্রেণীর জন্য গণসংখ্যা পাব?

আমাদের সমান বা অসমান আকারের শ্রেণী ব্যবধান থাকা উচিত?

দুটি পরিস্থিতি রয়েছে যেখানে অসমান আকারের ব্যবধান ব্যবহৃত হয়। প্রথমত, যখন আমাদের আয় এবং অন্যান্য অনুরূপ চলকের উপর উপাত্ত থাকে যেখানে পরিসর খুব বেশি। উদাহরণস্বরূপ, দৈনিক আয় প্রায় শূন্য থেকে অনেক শত কোটি রুপি পর্যন্ত হতে পারে। এমন পরিস্থিতিতে, সমান শ্রেণী ব্যবধান উপযুক্ত নয় কারণ (i) যদি শ্রেণী ব্যবধান মাঝারি আকারের এবং সমান হয়, তাহলে প্রচুর সংখ্যক শ্রেণী থাকবে। (ii) যদি শ্রেণী ব্যবধান ছোট হয়, আমরা খুব ছোট স্তর বা খুব উচ্চ স্তরের আয়ের উপর তথ্য দমন করার প্রবণতা রাখব।

দ্বিতীয়ত, যদি মানগুলির একটি বড় সংখ্যা পরিসরের একটি ছোট অংশে কেন্দ্রীভূত হয়, তাহলে সমান শ্রেণী ব্যবধান অনেক মানের উপর তথ্যের অভাবের দিকে নিয়ে যাবে।

অন্যান্য সব ক্ষেত্রে, গণসংখ্যা বিন্যাসে সমান আকারের শ্রেণী ব্যবধান ব্যবহৃত হয়।

আমাদের কতগুলি শ্রেণী থাকা উচিত?

শ্রেণীর সংখ্যা সাধারণত ছয় থেকে পনেরোর মধ্যে হয়। যদি আমরা সমান আকারের শ্রেণী ব্যবধান ব্যবহার করি, তাহলে শ্রেণীর সংখ্যা পরিসর (চলকের বৃহত্তম এবং ক্ষুদ্রতম মানের মধ্যে পার্থক্য) কে শ্রেণী ব্যবধানের আকার দিয়ে ভাগ করে গণনা করা যেতে পারে।

কার্যকলাপ

নিম্নলিখিতগুলির পরিসর নির্ণয় করুন:

  • উদাহরণ ১-এ ভারতের জনসংখ্যা,
  • উদাহরণ ২-এ গমের ফলন।

প্রতিটি নমুনার আকার কত হওয়া উচিত?

এই প্রশ্নের উত্তর পূর্ববর্তী প্রশ্নের উত্তরের উপর নির্ভর করে। চলকের পরিসর দেওয়া থাকলে, আমরা একবার শ্রেণী ব্যবধান স্থির করলে শ্রেণীর সংখ্যা নির্ধারণ করতে পারি। সুতরাং, আমরা দেখতে পাই যে এই দুটি সিদ্ধান্ত পরস্পর সংযুক্ত। আমরা একটি না স্থির করে অন্যটি স্থির করতে পারি না।

উদাহরণ ৪-এ, আমাদের শ্রেণীর সংখ্যা 10 রয়েছে। পরিসরের মান 100 দেওয়া থাকলে, শ্রেণী ব্যবধান স্বয়ংক্রিয়ভাবে 10 হয়। লক্ষ্য করুন যে বর্তমান প্রসঙ্গে আমরা সমান মাত্রার শ্রেণী ব্যবধান বেছে নিয়েছি। যাইহোক, আমরা সমান মাত্রার নয় এমন শ্রেণী ব্যবধান বেছে নিতে পারতাম। সেই ক্ষেত্রে, শ্রেণীগুলি অসম প্রস্থের হত।

আমরা কিভাবে শ্রেণী সীমা নির্ধারণ করব?

শ্রেণী সীমা নির্দিষ্ট এবং স্পষ্টভাবে উল্লেখ করা উচিত। সাধারণত, খোলা-প্রান্ত বিশিষ্ট শ্রেণী যেমন “70 এবং তার বেশি” বা “10-এর কম” কাম্য নয়।

নিম্ন ও উচ্চ শ্রেণী সীমা এমনভাবে নির্ধারণ করা উচিত যাতে প্রতিটি শ্রেণীর গণসংখ্যা বিন্যাসের মাঝামাঝিতে কেন্দ্রীভূত হওয়ার প্রবণতা রাখে।

শ্রেণী ব্যবধান দুই প্রকার:

(i) অন্তর্ভুক্তিমূলক শ্রেণী ব্যবধান: এই ক্ষেত্রে, একটি শ্রেণীর নিম্ন ও উচ্চ সীমার সমান মানগুলি একই শ্রেণীর গণসংখ্যায় অন্তর্ভুক্ত করা হয়।

(ii) ব্যতীতিমূলক শ্রেণী ব্যবধান: এই ক্ষেত্রে, উচ্চ বা নিম্ন শ্রেণী সীমার সমান একটি বিষয় সেই শ্রেণীর গণসংখ্যা থেকে বাদ দেওয়া হয়।

বিচ্ছিন্ন চলকের ক্ষেত্রে, শুধুমাত্র ব্যতীতিমূলক শ্রেণী ব্যবধান ব্যবহার করা যেতে পারে।

অবিচ্ছিন্ন চলকের ক্ষেত্রে, ব্যতীতিমূলক শ্রেণী ব্যবধান খুবই বেশি ব্যবহৃত হয়।

উদাহরণ

ধরুন আমাদের একটি পরীক্ষায় শিক্ষার্থীদের প্রাপ্ত নম্বরের উপর উপাত্ত রয়েছে এবং সব নম্বর পূর্ণ সংখ্যায় রয়েছে (