অধ্যায় ০২ ডেটা প্রসেসিং
আপনি পূর্ববর্তী অধ্যায়ে শিখেছেন যে তথ্য সংগঠিত ও উপস্থাপন করলে তা বোধগম্য হয়। এটি তথ্য প্রক্রিয়াকরণে সহায়তা করে। তথ্য বিশ্লেষণের জন্য বেশ কিছু পরিসংখ্যানগত কৌশল ব্যবহৃত হয়, যেমন:
১. কেন্দ্রীয় প্রবণতার পরিমাপ ২. বিচ্ছুরণের পরিমাপ ৩. সম্পর্কের পরিমাপ
কেন্দ্রীয় প্রবণতার পরিমাপগুলি পর্যবেক্ষণের একটি সেটের আদর্শ প্রতিনিধিত্বকারী মান প্রদান করে, অন্যদিকে বিচ্ছুরণের পরিমাপগুলি তথ্যের অভ্যন্তরীণ তারতম্য বিবেচনা করে, প্রায়শই কেন্দ্রীয় প্রবণতার একটি পরিমাপের চারপাশে। অন্যদিকে, সম্পর্কের পরিমাপগুলি যেকোনো দুই বা ততোধিক সম্পর্কিত ঘটনার মধ্যে সংযোগের মাত্রা প্রদান করে, যেমন বৃষ্টিপাত ও বন্যার ঘটনা বা সার ব্যবহার ও ফসলের ফলন। এই অধ্যায়ে, আপনি কেন্দ্রীয় প্রবণতার পরিমাপগুলি শিখবেন।
কেন্দ্রীয় প্রবণতার পরিমাপ
পরিমাপযোগ্য বৈশিষ্ট্যগুলি যেমন বৃষ্টিপাত, উচ্চতা, জনসংখ্যার ঘনত্ব, শিক্ষাগত অর্জনের স্তর বা বয়স শ্রেণী পরিবর্তিত হয়। আমরা যদি সেগুলি বুঝতে চাই, তাহলে কীভাবে করব? আমাদের সম্ভবত একটি একক মান বা সংখ্যা প্রয়োজন যা সমস্ত পর্যবেক্ষণের সবচেয়ে ভালোভাবে প্রতিনিধিত্ব করে। এই একক মান সাধারণত বণ্টনের কেন্দ্রের কাছাকাছি থাকে, চরম প্রান্তে নয়। বণ্টনের কেন্দ্র খুঁজে বের করতে ব্যবহৃত পরিসংখ্যানগত কৌশলগুলিকে কেন্দ্রীয় প্রবণতার পরিমাপ বলা হয়। কেন্দ্রীয় প্রবণতা নির্দেশকারী সংখ্যাটি সম্পূর্ণ তথ্য সেটের জন্য প্রতিনিধিত্বমূলক চিত্র কারণ এটি সেই বিন্দু যার চারপাশে উপাদানগুলির গুচ্ছবদ্ধ হওয়ার প্রবণতা থাকে।
কেন্দ্রীয় প্রবণতার পরিমাপগুলিকে পরিসংখ্যানগত গড়ও বলা হয়। কেন্দ্রীয় প্রবণতার বেশ কিছু পরিমাপ রয়েছে, যেমন গড়, মধ্যমা এবং প্রচুরক।
গড়
গড় হল সেই মান যা সমস্ত মানের যোগফলকে পর্যবেক্ষণের সংখ্যা দিয়ে ভাগ করে প্রাপ্ত হয়।
মধ্যমা
মধ্যমা হল সেই ক্রমিক মান যা সাজানো শ্রেণীকে দুটি সমান সংখ্যায় বিভক্ত করে। এটি প্রকৃত মান থেকে স্বাধীন। তথ্যগুলোকে ঊর্ধ্বক্রম বা অধঃক্রমে সাজানো এবং তারপর মধ্যম ক্রমিক সংখ্যার মান বের করা মধ্যমা গণনার ক্ষেত্রে সবচেয়ে গুরুত্বপূর্ণ। জোড় সংখ্যার ক্ষেত্রে দুটি মধ্যম ক্রমিক মানের গড় হবে মধ্যমা।
প্রচুরক
প্রচুরক হল একটি নির্দিষ্ট বিন্দু বা মানে সর্বাধিক সংঘটন বা কম্পাঙ্ক। আপনি লক্ষ্য করবেন যে এই পরিমাপগুলির প্রতিটি বিভিন্ন ধরনের তথ্য সেটের জন্য উপযুক্ত একটি একক প্রতিনিধিত্বমূলক সংখ্যা নির্ধারণের একটি ভিন্ন পদ্ধতি।
গড়
গড় হল একটি চলকের বিভিন্ন মানের সরল গাণিতিক গড়। অগ্রুপীকৃত ও গ্রুপীকৃত তথ্যের জন্য, গড় গণনার পদ্ধতি অগত্যা ভিন্ন। গড় প্রত্যক্ষ বা পরোক্ষ পদ্ধতিতে গণনা করা যেতে পারে, গ্রুপীকৃত ও অগ্রুপীকৃত উভয় তথ্যের জন্য।
অগ্রুপীকৃত তথ্য থেকে গড় গণনা
প্রত্যক্ষ পদ্ধতি
অগ্রুপীকৃত তথ্য থেকে প্রত্যক্ষ পদ্ধতি ব্যবহার করে গড় গণনা করার সময়, প্রতিটি পর্যবেক্ষণের মান যোগ করা হয় এবং মোট সংঘটনের সংখ্যা সমস্ত পর্যবেক্ষণের যোগফল দিয়ে ভাগ করা হয়। নিম্নলিখিত সূত্র ব্যবহার করে গড় গণনা করা হয়:
$$ \overline{\mathrm{X}}=\frac{\sum x}{\mathrm{~N}} $$
যেখানে,
$$ \begin{aligned} \overline{\mathrm{X}} & =\text { Mean } \ \sum \quad & \text { Sum of a series of } \ & \text { measures } \end{aligned} $$
$x \quad=$ পরিমাপের একটি ধারায় একটি কাঁচা স্কোর
$\sum \mathrm{x}=$ সমস্ত পরিমাপের যোগফল
$\mathrm{N} \quad$ = পরিমাপের সংখ্যা
উদাহরণ ২.১ : টেবিল ২.১-এ প্রদত্ত অঞ্চলের জেলাগুলির বৃষ্টিপাত থেকে মধ্যপ্রদেশের মালওয়া মালভূমির জন্য গড় বৃষ্টিপাত গণনা করুন:
$\hspace{1cm}$ টেবিল ২.১ : গড় বৃষ্টিপাতের গণনা
| মালওয়া মালভূমির জেলাসমূহ |
স্বাভাবিক বৃষ্টিপাত মিমি তে |
পরোক্ষ পদ্ধতি |
|---|---|---|
| x প্রত্যক্ষ পদ্ধতি | $d=x-800^{*}$ | |
| ইন্দোর | ৯৭৯ | ১৭৯ |
| দেবাস | ১০৮৩ | ২৮৩ |
| ধার | ৮৩৩ | ৩৩ |
| রতলাম | ৮৯৬ | ৯৬ |
| উজ্জয়িন | ৮৯১ | ৯১ |
| মান্দসৌর | ৮২৫ | ২৫ |
| শাজাপুর | ৯৭৭ | ১৭৭ |
| $\sum x$ এবং $\sum d$ | ৬৪৮৪ | ৮৮৪ |
| $\frac{\sum x}{N}$ এবং $\frac{\sum d}{N}$ | ৯২৬.২৯ | ১২৬.২৯ |
- যেখানে ৮০০ ধরা হয়েছে অনুমিত গড়।
$\mathrm{d}$ হল অনুমিত গড় থেকে বিচ্যুতি।
টেবিল ২.১-এ প্রদত্ত তথ্যের জন্য গড় নিম্নরূপে গণনা করা হয়েছে:
$$ \begin{aligned} \overline{\mathrm{X}} & =\frac{\sum x}{N} \ & =\frac{6,484}{7} \ & =926.29 \end{aligned} $$
গড়ের গণনা থেকে লক্ষ্য করা যেতে পারে যে কাঁচা বৃষ্টিপাতের তথ্য সরাসরি যোগ করা হয়েছে এবং যোগফলকে পর্যবেক্ষণের সংখ্যা অর্থাৎ জেলার সংখ্যা দিয়ে ভাগ করা হয়েছে। তাই, এটিকে প্রত্যক্ষ পদ্ধতি বলা হয়।
পরোক্ষ পদ্ধতি
বড় সংখ্যক পর্যবেক্ষণের জন্য, সাধারণত গড় গণনা করতে পরোক্ষ পদ্ধতি ব্যবহার করা হয়। এটি একটি ধ্রুবক মান বিয়োগ করে পর্যবেক্ষণের মানগুলিকে ছোট সংখ্যায় কমাতে সাহায্য করে। উদাহরণস্বরূপ, টেবিল ২.১-এ দেখানো হয়েছে, বৃষ্টিপাতের মানগুলি ৮০০ এবং $1100 \mathrm{~mm}$ এর মধ্যে অবস্থিত। আমরা ‘অনুমিত গড়’ নির্বাচন করে এবং প্রতিটি মান থেকে নির্বাচিত সংখ্যাটি বিয়োগ করে এই মানগুলি কমাতে পারি। বর্তমান ক্ষেত্রে, আমরা অনুমিত গড় হিসাবে ৮০০ নিয়েছি। এই ধরনের অপারেশনকে কোডিং বলা হয়। তারপর এই হ্রাসকৃত সংখ্যা থেকে গড় বের করা হয় (টেবিল ২.১-এর কলাম ৩)।
পরোক্ষ পদ্ধতি ব্যবহার করে গড় গণনার জন্য নিম্নলিখিত সূত্রটি ব্যবহার করা হয়:
$$ \overline{\mathrm{X}}=A+\frac{\sum d}{N} $$
যেখানে,
$$ \begin{aligned} A & =\text { Subtracted constant } \ \sum d & =\text { Sum of the coded scores } \ N & =\text { Number of individual observations in a series } \end{aligned} $$
টেবিল ২.১-এ দেখানো তথ্যের জন্য গড় নিম্নলিখিতভাবে পরোক্ষ পদ্ধতি ব্যবহার করে গণনা করা যেতে পারে:
$$ \begin{aligned} \overline{\mathrm{X}} & =800+\frac{884}{7} \ & =800+\frac{884}{7} \ \overline{\mathrm{X}} & =926.29 \mathrm{~mm} \end{aligned} $$
লক্ষ্য করুন যে উভয় পদ্ধতিতে গণনা করলে গড় মান একই আসে।
গ্রুপীকৃত তথ্য থেকে গড় গণনা
গ্রুপীকৃত তথ্যের জন্যও গড় প্রত্যক্ষ বা পরোক্ষ পদ্ধতি ব্যবহার করে গণনা করা হয়।
প্রত্যক্ষ পদ্ধতি
যখন স্কোরগুলিকে একটি কম্পাঙ্ক বণ্টনে গ্রুপ করা হয়, তখন স্বতন্ত্র মানগুলি তাদের পরিচয় হারায়। এই মানগুলি সেই শ্রেণী ${ }^{\circ}$ ব্যবধানের মধ্যবিন্দু দ্বারা প্রতিনিধিত্ব করা হয় যেখানে তারা অবস্থিত। প্রত্যক্ষ পদ্ধতি ব্যবহার করে গ্রুপীকৃত তথ্য থেকে গড় গণনা করার সময়, প্রতিটি শ্রেণী ব্যবধানের মধ্যবিন্দুকে তার সংশ্লিষ্ট কম্পাঙ্ক $(f)$ দিয়ে গুণ করা হয়; $f x$ ($\mathrm{X}$ হল মধ্যবিন্দু) এর সমস্ত মান যোগ করে $\sum f x$ পাওয়া যায় যা শেষ পর্যন্ত পর্যবেক্ষণের সংখ্যা অর্থাৎ $\mathrm{N}$ দিয়ে ভাগ করা হয়। সুতরাং, নিম্নলিখিত সূত্র ব্যবহার করে গড় গণনা করা হয়:
$$ \overline{\mathrm{X}}=\frac{\sum f x}{N} $$
যেখানে:
$$ \begin{aligned} \overline{\mathrm{X}} & =\text { Mean } \ f & =\text { Frequencies } \ x & =\text { Midpoints of class intervals } \ N & \left.=\text { Number of observations (it may also be defined as } \sum f\right) \end{aligned} $$
উদাহরণ ২.২ : টেবিল ২.২-এ প্রদত্ত তথ্য ব্যবহার করে কারখানার শ্রমিকদের গড় মজুরির হার গণনা করুন:
টেবিল ২.২ : কারখানার শ্রমিকদের মজুরির হার
| মজুরির হার (টাকা/দিন) | শ্রমিকের সংখ্যা () |
|---|---|
| শ্রেণী | $\boldsymbol{f}$ |
| $50-70$ | ১০ |
| $70-90$ | ২০ |
| $90-110$ | ২৫ |
| $110-130$ | ৩৫ |
| $130-150$ | ৯ |
টেবিল ২.৩ : গড়ের গণনা
| শ্রেণী | কম্পাঙ্ক (f) |
মধ্য- বিন্দু $(x)$ |
$f x x$ | $d=x-100$ | $f d$ | $U=$ $(x-100)$ ২০ |
$f u$ |
|---|---|---|---|---|---|---|---|
| $50-70$ | ১০ | ৬০ | ৬০০ | -৪০ | -৪০০ | -২ | -২০ |
| $70-90$ | ২০ | ৮০ | ১,৬০০ | -২০ | -৪০০ | -১ | -২০ |
| $\mathbf{9 0 - 1 1 0}$ | $\mathbf{2 5}$ | $\mathbf{1 0 0}$ | ২,৫০০ | $\mathbf{0}$ | ০ | ০ | ০ |
| $110-130$ | ৩৫ | ১২০ | ৪,২০০ | ২০ | ৭০০ | ১ | ৩৫ |
| $130-150$ | ৯ | ১৪০ | ১,২৬০ | ৪০ | ৩৬০ | ২ | ১৮ |
| $\sum f x$ | |||||||
| এবং | $\sum f=99$ | $\sum f x=$ | $\sum f d=$ | $\sum f u=$ | |||
| $\sum f x$ | ১০,১৬০ | ২৬০ | ১৩ |
যেখানে $\mathrm{N}=\sum f=99$
টেবিল ২.৩ গ্রুপীকৃত তথ্যের জন্য গড় গণনার পদ্ধতি প্রদান করে। প্রদত্ত কম্পাঙ্ক বণ্টনে, নিরানব্বই জন শ্রমিককে মজুরির হারের পাঁচটি শ্রেণীতে গ্রুপ করা হয়েছে। এই গ্রুপগুলির মধ্যবিন্দুগুলি তৃতীয় কলামে তালিকাভুক্ত করা হয়েছে। গড় বের করতে, প্রতিটি মধ্যবিন্দু $(\mathrm{X})$ কে কম্পাঙ্ক $(f)$ দিয়ে গুণ করা হয়েছে এবং তাদের যোগফল ($\sum f_{x}$) কে $N$ দিয়ে ভাগ করা হয়েছে।
প্রদত্ত সূত্র ব্যবহার করে গড় নিম্নরূপে গণনা করা যেতে পারে:
$$ \begin{aligned} \overline{\mathrm{X}} & =\frac{\sum f x}{N} \ & =\frac{10,160}{99} \ & =102.6 \end{aligned} $$
পরোক্ষ পদ্ধতি
গ্রুপীকৃত তথ্যের জন্য পরোক্ষ পদ্ধতি ব্যবহারের জন্য নিম্নলিখিত সূত্রটি ব্যবহার করা যেতে পারে। এই সূত্রের নীতিগুলি অগ্রুপীকৃত তথ্যের জন্য প্রদত্ত পরোক্ষ পদ্ধতির অনুরূপ। এটি নিম্নরূপে প্রকাশ করা হয়
$$ \bar{x}=A \pm \frac{\sum f d}{N} $$
যেখানে,
= অনুমিত গড় গ্রুপের মধ্যবিন্দু (টেবিল ২.৩-এ অনুমিত গড় গ্রুপটি হল ৯০ – ১১০ যার মধ্যবিন্দু ১০০।) f = কম্পাঙ্ক d = অনুমিত গড় গ্রুপ (A) থেকে বিচ্যুতি N = ঘটনার যোগফল বা ∑ f i = ব্যবধান প্রস্থ (এই ক্ষেত্রে, এটি ২০)
টেবিল ২.৩ থেকে প্রত্যক্ষ পদ্ধতি ব্যবহার করে গড় গণনার সাথে জড়িত নিম্নলিখিত ধাপগুলি অনুমান করা যেতে পারে:
(i) গড়কে ৯০ - ১১০ গ্রুপে অনুমান করা হয়েছে। এটি সম্ভব হলে শ্রেণীটির মাঝামাঝি কাছাকাছি থেকে অনুমান করা ভালো। এই পদ্ধতি গণনার পরিমাণ কমিয়ে দেয়। টেবিল ২.৩-এ, A (অনুমিত গড়) হল ১০০, শ্রেণী $90-110$-এর মধ্যবিন্দু।
(ii) পঞ্চম কলাম (u) প্রতিটি শ্রেণীর মধ্যবিন্দুর অনুমিত গড় গ্রুপের মধ্যবিন্দু $(90-110)$ থেকে বিচ্যুতি তালিকাভুক্ত করে।
(iii) ষষ্ঠ কলামটি প্রতিটি $f$ কে তার সংশ্লিষ্ট $d$ দিয়ে গুণ করে প্রাপ্ত $f d$ মান দেখায়। তারপর, $f d$-এর ধনাত্মক ও ঋণাত্মক মানগুলি আলাদাভাবে যোগ করা হয় এবং তাদের পরম পার্থক্য বের করা হয় ($\sum f d$)। লক্ষ্য করুন যে $\sum f d$-এর সাথে সংযুক্ত চিহ্নটি A-এর পরের সূত্রে প্রতিস্থাপিত হয়, যেখানে $\pm$ দেওয়া আছে।
পরোক্ষ পদ্ধতি ব্যবহার করে গড় নিম্নরূপে গণনা করা হয়:
$$ \begin{aligned} \overline{\boldsymbol{x}} & =\boldsymbol{A} \pm \frac{\sum \boldsymbol{f} \boldsymbol{d}}{\boldsymbol{N}} \ & =100+\frac{260}{99} \ & =100+2.6 \ & =102.6 \end{aligned} $$
দ্রষ্টব্য : পরোক্ষ গড় পদ্ধতি সমান ও অসম উভয় শ্রেণী ব্যবধানের জন্য কাজ করবে।
মধ্যমা
মধ্যমা হল একটি অবস্থানগত গড়। এটিকে “একটি বণ্টনে সেই বিন্দু হিসাবে সংজ্ঞায়িত করা যেতে পারে যার উভয় পাশে সমান সংখ্যক ঘটনা রয়েছে”। মধ্যমা $\mathrm{M}$ চিহ্ন ব্যবহার করে প্রকাশ করা হয়।
অগ্রুপীকৃত তথ্যের জন্য মধ্যমা গণনা
যখন স্কোরগুলি অগ্রুপীকৃত থাকে, সেগুলি ঊর্ধ্বক্রম বা অধঃক্রমে সাজানো হয়। সাজানো শ্রেণীতে কেন্দ্রীয় পর্যবেক্ষণ বা মান খুঁজে বের করে মধ্যমা পাওয়া যেতে পারে। কেন্দ্রীয় মানটি ঊর্ধ্বক্রম বা অধঃক্রমে সাজানো শ্রেণীর যেকোনো প্রান্ত থেকে খুঁজে পাওয়া যেতে পারে। মধ্যমা গণনার জন্য নিম্নলিখিত সমীকরণ ব্যবহার করা হয়:
$\left(\frac{\mathrm{N}+1}{2}\right)$ তম পদটির মান
উদাহরণ ২.৩: নিম্নলিখিতটি ব্যবহার করে হিমালয়ের অংশে পর্বতশৃঙ্গগুলির মধ্যমা উচ্চতা গণনা করুন:
$8,126 \mathrm{~m}, 8,611 \mathrm{~m}, 7,817 \mathrm{~m}, 8,172 \mathrm{~m}, 8,076 \mathrm{~m}, 8,848 \mathrm{~m}, 8,598 \mathrm{~m}$.
গণনা : মধ্যমা (M) নিম্নলিখিত ধাপগুলিতে গণনা করা যেতে পারে:
(i) প্রদত্ত তথ্যগুলো ঊর্ধ্বক্রম বা অধঃক্রমে সাজান।
(ii) শ্রেণীতে কেন্দ্রীয় মান খুঁজে বের করার জন্য সূত্রটি প্রয়োগ করুন। সুতরাং:
($\frac{\mathrm{N}+1}{2}$) তম পদটির মান
$=\left(\frac{7+1}{2}\right)$ তম পদ
$=\left(\frac{8}{2}\right)$ তম পদ
সাজানো শ্রেণীতে ৪র্থ পদটি হবে মধ্যমা।
তথ্যগুলো ঊর্ধ্বক্রমে সাজানো -
৭,$817 ; 8,076 ; 8,126 ; 8,172 ; 8,598 ; 8,611 ; 8,848$
অতএব,
৪র্থ পদ
$$ \mathrm{M}=8,172 \mathrm{~m} $$
গ্রুপীকৃত তথ্যের জন্য মধ্যমা গণনা
যখন স্কোরগুলি গ্রুপ করা হয়, আমাদের সেই বিন্দুর মান খুঁজে বের করতে হবে যেখানে একজন ব্যক্তি বা পর্যবেক্ষণ গ্রুপের কেন্দ্রীয়ভাবে অবস্থিত। এটি নিম্নলিখিত সূত্র ব্যবহার করে গণনা করা যেতে পারে:
$$ M=\boldsymbol{l}+\frac{\boldsymbol{i}}{\boldsymbol{f}}\left(\frac{\boldsymbol{N}}{2}-\boldsymbol{c}\right) $$
যেখানে,
M = গ্রুপীকৃত তথ্যের জন্য মধ্যমা
l = মধ্যমা শ্রেণীর নিম্ন সীমা
i = ব্যবধান
f = মধ্যমা শ্রেণীর কম্পাঙ্ক
N = মোট কম্পাঙ্ক বা পর্যবেক্ষণের সংখ্যা
c = প্রাক-মধ্যমা শ্রেণীর ক্রমযোজিত কম্পাঙ্ক।
উদাহরণ ২.৪ : নিম্নলিখিত বণ্টনের জন্য মধ্যমা গণনা করুন:
| শ্রেণী | $50-60$ | $60-70$ | $70-80$ | $80-90$ | $90-100$ | $100-110$ |
|---|---|---|---|---|---|---|
| $\boldsymbol{f}$ | ৩ | ৭ | ১১ | ১৬ | ৮ | ৫ |
টেবিল ২.৪ : মধ্যমার গণনা
| শ্রেণী | কম্পাঙ্ক (f) |
ক্রমযোজিত কম্পাঙ্ক (iv) |
মধ্যমা শ্রেণীর গণনা |
|---|---|---|---|
| $50-60$ $60-70$ $70-80$ $\mathbf{8 0 - 9 0}$ (মধ্যমা গ্রুপ) $90-100$ $100-110$ |
৩ ৭ ১১ $16 \boldsymbol{f}$ ৮ ৫ ৫ |
৩ ১০ $21 c$ $\mathbf{3 7}$ ৪৫ ৫০ |
$M=\frac{N}{2}$ $=\frac{50}{4}$ |
| $\sum_{\mathbf{N}=\mathbf{5 0}} f$ বা |
মধ্যমা নিচে দেওয়া ধাপগুলিতে গণনা করা হয়:
(i) টেবিল ২.৪-এ দেখানো হিসাবে কম্পাঙ্ক টেবিল তৈরি করা হয়।
(ii) ক্রমযোজিত কম্পাঙ্ক (F) প্রাপ্ত করা হয় পরপর ব্যবধান গ্রুপের প্রতিটি স্বাভাবিক কম্পাঙ্ক যোগ করে, যেমন টেবিল ২.৪-এর কলাম ৩-এ দেওয়া আছে।
(iii) মধ্যমা সংখ্যা পাওয়া যায় $\frac{N}{2}$ দ্বারা অর্থাৎ এই ক্ষেত্রে $\frac{50}{2}=\mathbf{2 5}$, যেমন টেবিল ২.৪-এর কলাম ৪-এ দেখানো হয়েছে।
(iv) ক্রমযোজিত কম্পাঙ্ক বণ্টন (F)-এ উপর থেকে নিচের দিকে গণনা করুন যতক্ষণ না $\frac{N}{2}$-এর চেয়ে বড় পরবর্তী মান পাওয়া যায়। এই উদাহরণে, $\frac{N}{2}$ হল ২৫, যা ৪০-৪৪ শ্রেণী ব্যবধানে পড়ে যার ক্রমযোজিত কম্পাঙ্ক ৩৭, সুতরাং প্রাক-মধ্যমা শ্রেণীর ক্রমযোজিত কম্পাঙ্ক হল ২১ এবং মধ্যমা শ্রেণীর প্রকৃত কম্পাঙ্ক হল ১৬।
(v) তারপর ধাপ ৪-এ নির্ধারিত সমস্ত মান নিম্নলিখিত সমীকরণে প্রতিস্থাপন করে মধ্যমা গণনা করা হয়:
$$ M=l+\frac{i}{f}(m-c) $$
$$ \begin{aligned} & =80+\frac{10}{16}(25-21) \ & =80+\frac{5}{8} \times 4 \ & =80+\frac{5}{2} \ & =80+2.5 \ M & =82.5 \end{aligned} $$
প্রচুরক
একটি বণ্টনে যে মানটি সবচেয়ে বেশি বার ঘটে তাকে প্রচুরক বলে। এটিকে $\mathbf{Z}$ বা $\mathbf{M}_{\mathbf{0}}$ চিহ্ন দ্বারা প্রকাশ করা হয়। প্রচুরক হল একটি পরিমাপ যা গড় ও মধ্যমার তুলনায় কম ব্যাপকভাবে ব্যবহৃত হয়। একটি প্রদত্ত তথ্য সেটে একাধিক ধরনের প্রচুরক থাকতে পারে।
অগ্রুপীকৃত তথ্যের জন্য প্রচুরক গণনা
প্রদত্ত তথ্য সেট থেকে প্রচুরক গণনা করার সময় সমস্ত পরিমাপ প্রথমে ঊর্ধ্বক্রম বা অধঃক্রমে সাজানো হয়। এটি সবচেয়ে বেশি ঘটা পরিমাপ সহজেই চিহ্নিত করতে সাহায্য করে।
উদাহরণ ২.৫ : দশজন শিক্ষার্থীর জন্য ভূগোলে নিম্নলিখিত পরীক্ষার স্কোরের প্রচুরক গণনা করুন:
$$ 61,10,88,37,61,72,55,61,46,22 $$
গণনা : প্রচুরক খুঁজে বের করতে পরিমাপগুলি নিম্নরূপ ঊর্ধ্বক্রমে সাজানো হয়:
$10,22,37,46,55, \mathbf{6 1}, \mathbf{6 1}, \mathbf{6 1}, 72,88$.
ধারায় তিনবার ঘটমান ৬১ পরিমাপটি প্রদত্ত তথ্যসেটে প্রচুরক। যেহেতু তথ্যসেটে অন্য কোনো সংখ্যা একইভাবে নেই, তাই এটিতে একপ্রকার প্রচুরকের বৈশিষ্ট্য রয়েছে।
উদাহরণ ২.৬ : দশজন অন্যান্য শিক্ষার্থীর একটি ভিন্ন নমুনা ব্যবহার করে প্রচুরক গণনা করুন, যারা স্কোর করেছিল:
$82,11,57,82,08,11,82,95,41,11$.
গণনা : প্রদত্ত পরিমাপগুলি নিম্নরূপ ঊর্ধ্বক্রমে সাজান:
$$ 08,11,11,11,41,57,82,82,82,95 $$
সহজেই লক্ষ্য করা যায় যে ১১ এবং ৮২ উভয় পরিমাপই বণ্টনে তিনবার করে ঘটছে। সুতরাং, তথ্যসেটটি দ্বিপ্রকার প্রচুরক বিশিষ্ট। যদি তিনটি মানের কম্পাঙ্ক সমান ও সর্বোচ্চ হয়, তবে শ্রেণীটি ত্রিপ্রকার প্রচুরক বিশিষ্ট। একইভাবে, একটি শ্রেণীতে অনেক পরিমাপের পুনরাবৃত্তি এটিকে বহুপ্রকার প্রচুরক বিশিষ্ট করে তোলে। তবে, যখন একটি শ্রেণীতে কোনো পরিমাপ পুনরাবৃত্তি হয় না তখন তাকে প্রচুরকবিহীন হিসাবে চিহ্নিত করা হয়।
গড়, মধ্যমা ও প্রচুরকের তুলনা
কেন্দ্রীয় প্রবণতার তিনটি পরিমাপ স্বাভাবিক বণ্টন বক্ররেখার সাহায্যে সহজেই তুলনা করা যেতে পারে। স্বাভাবিক বক্ররেখাটি একটি কম্পাঙ্ক বণ্টনকে বোঝায় যেখানে স্কোরের গ্রাফকে প্রায়শই ঘণ্টা-আকৃতির বক্ররেখা বলা হয়। অনেক মানুষের বৈশিষ্ট্য যেমন বুদ্ধিমত্তা, ব্যক্তিত্ব স্কোর এবং শিক্ষার্থীদের অর্জনের স্বাভাবিক বণ্টন থাকে। ঘণ্টা-আকৃতির বক্ররেখাটি যেভাবে দেখায় সেভাবে দেখায়, কারণ এটি প্রতিসম। অন্য কথায়, বেশিরভাগ পর্যবেক্ষণ মধ্যম মানের উপর এবং তার চারপাশে অবস্থিত। চরম মানের দিকে এগোলে, পর্যবেক্ষণের সংখ্যা প্রতিসমভাবে হ্রাস পায়। একটি স্বাভাবিক বক্ররেখার উচ্চ বা নিম্ন তথ্য পরিবর্তনশীলতা থাকতে পারে। একটি স্বাভাবিক বণ্টন বক্ররেখার একটি উদাহরণ চিত্র ২.৩-এ দেওয়া হয়েছে।
চিত্র ২.৩ : স্বাভাবিক বণ্টন বক্ররেখা
স্বাভাবিক বণ্টনের একটি গুরুত্বপূর্ণ বৈশিষ্ট্য রয়েছে। গড়, মধ্যমা এবং প্রচুরক একই স্কোর (চিত্র ২.৩-এ ১০০ স্কোর) কারণ একটি স্বাভাবিক বণ্টন প্রতিসম। সর্বোচ্চ কম্পাঙ্ক সহ স্কোরটি বণ্টনের মাঝখানে ঘটে এবং ঠিক অর্ধেক স্কোর মাঝের উপরে ঘটে এবং অর্ধেক স্কোর মাঝের নিচে ঘটে। বেশিরভাগ স্কোর বণ্টনের মাঝামাঝি বা গড়ের কাছাকাছি ঘটে। খুব উচ্চ এবং খুব নিম্ন স্কোর প্রায়শই ঘটে না এবং তাই, বিরল বলে বিবেচিত হয়।
যদি তথ্যগুলি কোনোভাবে তির্যক বা বিকৃত হয়, তবে গড়, মধ্যমা এবং প্রচুরক মিলবে না এবং তির্যক তথ্যের প্রভাব বিবেচনা করতে হবে (চিত্র ২.৪ এবং ২.৫$)$।
চিত্র ২.৪ : ধনাত্মক তির্যকতা
চিত্র $2.5:$ ঋণাত্মক তির্যকতা
অনুশীলনী
১. নিচে দেওয়া চারটি বিকল্প থেকে সঠিক উত্তরটি বেছে নিন:
(i) কেন্দ্রীয় প্রবণতার যে পরিমাপটি চরম মান দ্বারা প্রভাবিত হয় না:
(ক) গড়
(খ) গড় ও প্রচুরক
(গ) প্রচুরক
(ঘ) মধ্যমা
(ii) কেন্দ্রীয় প্রবণতার যে পরিমাপটি যেকোনো বণ্টনের সর্বোচ্চ বিন্দুর সাথে সর্বদা মিলে যায়:
(ক) মধ্যমা
(খ) মধ্যমা ও প্রচুরক
(গ) গড়
(ঘ) প্রচুরক
২. প্রায় ৩০ শব্দে নিম্নলিখিত প্রশ্নগুলির উত্তর দিন:
(i) গড়কে সংজ্ঞায়িত করুন।
(ii) প্রচুরক ব্যবহারের সুবিধাগুলি কী কী?
৩. প্রায় ১২৫ শব্দে নিম্নলিখিত প্রশ্নগুলির উত্তর দিন:
(i) স্বাভাবিক বণ্টন ও তির্যক বণ্টনে গড়, মধ্যমা ও প্রচুরকের আপেক্ষিক অবস্থান চিত্রের সাহায্যে ব্যাখ্যা করুন।
(ii) গড়, মধ্যমা ও প্রচুরকের প্রযোজ্যতা সম্পর্কে মন্তব্য করুন (ইঙ্গিত: তাদের গুণ ও দোষ থেকে)।
কার্যকলাপ
১. ভৌগোলিক বিশ্লেষণের জন্য প্রযোজ্য একটি কাল্পনিক উদাহরণ নিন এবং অগ্রুপীকৃত তথ্য থেকে গড় গণনার প্রত্যক্ষ ও পরোক্ষ পদ্ধতিগুলি ব্যাখ্যা করুন।