অধ্যায় ০২ ডেটা প্রসেসিং

আপনি পূর্ববর্তী অধ্যায়ে শিখেছেন যে তথ্য সংগঠিত ও উপস্থাপন করলে তা বোধগম্য হয়। এটি তথ্য প্রক্রিয়াকরণে সহায়তা করে। তথ্য বিশ্লেষণের জন্য বেশ কিছু পরিসংখ্যানগত কৌশল ব্যবহৃত হয়, যেমন:

১. কেন্দ্রীয় প্রবণতার পরিমাপ ২. বিচ্ছুরণের পরিমাপ ৩. সম্পর্কের পরিমাপ

কেন্দ্রীয় প্রবণতার পরিমাপগুলি পর্যবেক্ষণের একটি সেটের আদর্শ প্রতিনিধিত্বকারী মান প্রদান করে, অন্যদিকে বিচ্ছুরণের পরিমাপগুলি তথ্যের অভ্যন্তরীণ তারতম্য বিবেচনা করে, প্রায়শই কেন্দ্রীয় প্রবণতার একটি পরিমাপের চারপাশে। অন্যদিকে, সম্পর্কের পরিমাপগুলি যেকোনো দুই বা ততোধিক সম্পর্কিত ঘটনার মধ্যে সংযোগের মাত্রা প্রদান করে, যেমন বৃষ্টিপাত ও বন্যার ঘটনা বা সার ব্যবহার ও ফসলের ফলন। এই অধ্যায়ে, আপনি কেন্দ্রীয় প্রবণতার পরিমাপগুলি শিখবেন।

কেন্দ্রীয় প্রবণতার পরিমাপ

পরিমাপযোগ্য বৈশিষ্ট্যগুলি যেমন বৃষ্টিপাত, উচ্চতা, জনসংখ্যার ঘনত্ব, শিক্ষাগত অর্জনের স্তর বা বয়স শ্রেণী পরিবর্তিত হয়। আমরা যদি সেগুলি বুঝতে চাই, তাহলে কীভাবে করব? আমাদের সম্ভবত একটি একক মান বা সংখ্যা প্রয়োজন যা সমস্ত পর্যবেক্ষণের সবচেয়ে ভালোভাবে প্রতিনিধিত্ব করে। এই একক মান সাধারণত বণ্টনের কেন্দ্রের কাছাকাছি থাকে, চরম প্রান্তে নয়। বণ্টনের কেন্দ্র খুঁজে বের করতে ব্যবহৃত পরিসংখ্যানগত কৌশলগুলিকে কেন্দ্রীয় প্রবণতার পরিমাপ বলা হয়। কেন্দ্রীয় প্রবণতা নির্দেশকারী সংখ্যাটি সম্পূর্ণ তথ্য সেটের জন্য প্রতিনিধিত্বমূলক চিত্র কারণ এটি সেই বিন্দু যার চারপাশে উপাদানগুলির গুচ্ছবদ্ধ হওয়ার প্রবণতা থাকে।

কেন্দ্রীয় প্রবণতার পরিমাপগুলিকে পরিসংখ্যানগত গড়ও বলা হয়। কেন্দ্রীয় প্রবণতার বেশ কিছু পরিমাপ রয়েছে, যেমন গড়, মধ্যমা এবং প্রচুরক।

গড়

গড় হল সেই মান যা সমস্ত মানের যোগফলকে পর্যবেক্ষণের সংখ্যা দিয়ে ভাগ করে প্রাপ্ত হয়।

মধ্যমা

মধ্যমা হল সেই ক্রমিক মান যা সাজানো শ্রেণীকে দুটি সমান সংখ্যায় বিভক্ত করে। এটি প্রকৃত মান থেকে স্বাধীন। তথ্যগুলোকে ঊর্ধ্বক্রম বা অধঃক্রমে সাজানো এবং তারপর মধ্যম ক্রমিক সংখ্যার মান বের করা মধ্যমা গণনার ক্ষেত্রে সবচেয়ে গুরুত্বপূর্ণ। জোড় সংখ্যার ক্ষেত্রে দুটি মধ্যম ক্রমিক মানের গড় হবে মধ্যমা।

প্রচুরক

প্রচুরক হল একটি নির্দিষ্ট বিন্দু বা মানে সর্বাধিক সংঘটন বা কম্পাঙ্ক। আপনি লক্ষ্য করবেন যে এই পরিমাপগুলির প্রতিটি বিভিন্ন ধরনের তথ্য সেটের জন্য উপযুক্ত একটি একক প্রতিনিধিত্বমূলক সংখ্যা নির্ধারণের একটি ভিন্ন পদ্ধতি।

গড়

গড় হল একটি চলকের বিভিন্ন মানের সরল গাণিতিক গড়। অগ্রুপীকৃত ও গ্রুপীকৃত তথ্যের জন্য, গড় গণনার পদ্ধতি অগত্যা ভিন্ন। গড় প্রত্যক্ষ বা পরোক্ষ পদ্ধতিতে গণনা করা যেতে পারে, গ্রুপীকৃত ও অগ্রুপীকৃত উভয় তথ্যের জন্য।

অগ্রুপীকৃত তথ্য থেকে গড় গণনা

প্রত্যক্ষ পদ্ধতি

অগ্রুপীকৃত তথ্য থেকে প্রত্যক্ষ পদ্ধতি ব্যবহার করে গড় গণনা করার সময়, প্রতিটি পর্যবেক্ষণের মান যোগ করা হয় এবং মোট সংঘটনের সংখ্যা সমস্ত পর্যবেক্ষণের যোগফল দিয়ে ভাগ করা হয়। নিম্নলিখিত সূত্র ব্যবহার করে গড় গণনা করা হয়:

$$ \overline{\mathrm{X}}=\frac{\sum x}{\mathrm{~N}} $$

যেখানে,

$$ \begin{aligned} \overline{\mathrm{X}} & =\text { Mean } \ \sum \quad & \text { Sum of a series of } \ & \text { measures } \end{aligned} $$

$x \quad=$ পরিমাপের একটি ধারায় একটি কাঁচা স্কোর

$\sum \mathrm{x}=$ সমস্ত পরিমাপের যোগফল

$\mathrm{N} \quad$ = পরিমাপের সংখ্যা

উদাহরণ ২.১ : টেবিল ২.১-এ প্রদত্ত অঞ্চলের জেলাগুলির বৃষ্টিপাত থেকে মধ্যপ্রদেশের মালওয়া মালভূমির জন্য গড় বৃষ্টিপাত গণনা করুন:

$\hspace{1cm}$ টেবিল ২.১ : গড় বৃষ্টিপাতের গণনা

মালওয়া মালভূমির
জেলাসমূহ
স্বাভাবিক বৃষ্টিপাত
মিমি তে
পরোক্ষ পদ্ধতি
x প্রত্যক্ষ পদ্ধতি $d=x-800^{*}$
ইন্দোর ৯৭৯ ১৭৯
দেবাস ১০৮৩ ২৮৩
ধার ৮৩৩ ৩৩
রতলাম ৮৯৬ ৯৬
উজ্জয়িন ৮৯১ ৯১
মান্দসৌর ৮২৫ ২৫
শাজাপুর ৯৭৭ ১৭৭
$\sum x$ এবং $\sum d$ ৬৪৮৪ ৮৮৪
$\frac{\sum x}{N}$ এবং $\frac{\sum d}{N}$ ৯২৬.২৯ ১২৬.২৯
  • যেখানে ৮০০ ধরা হয়েছে অনুমিত গড়।
    $\mathrm{d}$ হল অনুমিত গড় থেকে বিচ্যুতি।

টেবিল ২.১-এ প্রদত্ত তথ্যের জন্য গড় নিম্নরূপে গণনা করা হয়েছে:

$$ \begin{aligned} \overline{\mathrm{X}} & =\frac{\sum x}{N} \ & =\frac{6,484}{7} \ & =926.29 \end{aligned} $$

গড়ের গণনা থেকে লক্ষ্য করা যেতে পারে যে কাঁচা বৃষ্টিপাতের তথ্য সরাসরি যোগ করা হয়েছে এবং যোগফলকে পর্যবেক্ষণের সংখ্যা অর্থাৎ জেলার সংখ্যা দিয়ে ভাগ করা হয়েছে। তাই, এটিকে প্রত্যক্ষ পদ্ধতি বলা হয়।

পরোক্ষ পদ্ধতি

বড় সংখ্যক পর্যবেক্ষণের জন্য, সাধারণত গড় গণনা করতে পরোক্ষ পদ্ধতি ব্যবহার করা হয়। এটি একটি ধ্রুবক মান বিয়োগ করে পর্যবেক্ষণের মানগুলিকে ছোট সংখ্যায় কমাতে সাহায্য করে। উদাহরণস্বরূপ, টেবিল ২.১-এ দেখানো হয়েছে, বৃষ্টিপাতের মানগুলি ৮০০ এবং $1100 \mathrm{~mm}$ এর মধ্যে অবস্থিত। আমরা ‘অনুমিত গড়’ নির্বাচন করে এবং প্রতিটি মান থেকে নির্বাচিত সংখ্যাটি বিয়োগ করে এই মানগুলি কমাতে পারি। বর্তমান ক্ষেত্রে, আমরা অনুমিত গড় হিসাবে ৮০০ নিয়েছি। এই ধরনের অপারেশনকে কোডিং বলা হয়। তারপর এই হ্রাসকৃত সংখ্যা থেকে গড় বের করা হয় (টেবিল ২.১-এর কলাম ৩)।

পরোক্ষ পদ্ধতি ব্যবহার করে গড় গণনার জন্য নিম্নলিখিত সূত্রটি ব্যবহার করা হয়:

$$ \overline{\mathrm{X}}=A+\frac{\sum d}{N} $$

যেখানে,

$$ \begin{aligned} A & =\text { Subtracted constant } \ \sum d & =\text { Sum of the coded scores } \ N & =\text { Number of individual observations in a series } \end{aligned} $$

টেবিল ২.১-এ দেখানো তথ্যের জন্য গড় নিম্নলিখিতভাবে পরোক্ষ পদ্ধতি ব্যবহার করে গণনা করা যেতে পারে:

$$ \begin{aligned} \overline{\mathrm{X}} & =800+\frac{884}{7} \ & =800+\frac{884}{7} \ \overline{\mathrm{X}} & =926.29 \mathrm{~mm} \end{aligned} $$

লক্ষ্য করুন যে উভয় পদ্ধতিতে গণনা করলে গড় মান একই আসে।

গ্রুপীকৃত তথ্য থেকে গড় গণনা

গ্রুপীকৃত তথ্যের জন্যও গড় প্রত্যক্ষ বা পরোক্ষ পদ্ধতি ব্যবহার করে গণনা করা হয়।

প্রত্যক্ষ পদ্ধতি

যখন স্কোরগুলিকে একটি কম্পাঙ্ক বণ্টনে গ্রুপ করা হয়, তখন স্বতন্ত্র মানগুলি তাদের পরিচয় হারায়। এই মানগুলি সেই শ্রেণী ${ }^{\circ}$ ব্যবধানের মধ্যবিন্দু দ্বারা প্রতিনিধিত্ব করা হয় যেখানে তারা অবস্থিত। প্রত্যক্ষ পদ্ধতি ব্যবহার করে গ্রুপীকৃত তথ্য থেকে গড় গণনা করার সময়, প্রতিটি শ্রেণী ব্যবধানের মধ্যবিন্দুকে তার সংশ্লিষ্ট কম্পাঙ্ক $(f)$ দিয়ে গুণ করা হয়; $f x$ ($\mathrm{X}$ হল মধ্যবিন্দু) এর সমস্ত মান যোগ করে $\sum f x$ পাওয়া যায় যা শেষ পর্যন্ত পর্যবেক্ষণের সংখ্যা অর্থাৎ $\mathrm{N}$ দিয়ে ভাগ করা হয়। সুতরাং, নিম্নলিখিত সূত্র ব্যবহার করে গড় গণনা করা হয়:

$$ \overline{\mathrm{X}}=\frac{\sum f x}{N} $$

যেখানে:

$$ \begin{aligned} \overline{\mathrm{X}} & =\text { Mean } \ f & =\text { Frequencies } \ x & =\text { Midpoints of class intervals } \ N & \left.=\text { Number of observations (it may also be defined as } \sum f\right) \end{aligned} $$

উদাহরণ ২.২ : টেবিল ২.২-এ প্রদত্ত তথ্য ব্যবহার করে কারখানার শ্রমিকদের গড় মজুরির হার গণনা করুন:

টেবিল ২.২ : কারখানার শ্রমিকদের মজুরির হার

মজুরির হার (টাকা/দিন) শ্রমিকের সংখ্যা ()
শ্রেণী $\boldsymbol{f}$
$50-70$ ১০
$70-90$ ২০
$90-110$ ২৫
$110-130$ ৩৫
$130-150$

টেবিল ২.৩ : গড়ের গণনা

শ্রেণী কম্পাঙ্ক
(f)
মধ্য-
বিন্দু
$(x)$
$f x x$ $d=x-100$ $f d$ $U=$
$(x-100)$
২০
$f u$
$50-70$ ১০ ৬০ ৬০০ -৪০ -৪০০ -২ -২০
$70-90$ ২০ ৮০ ১,৬০০ -২০ -৪০০ -১ -২০
$\mathbf{9 0 - 1 1 0}$ $\mathbf{2 5}$ $\mathbf{1 0 0}$ ২,৫০০ $\mathbf{0}$
$110-130$ ৩৫ ১২০ ৪,২০০ ২০ ৭০০ ৩৫
$130-150$ ১৪০ ১,২৬০ ৪০ ৩৬০ ১৮
$\sum f x$
এবং $\sum f=99$ $\sum f x=$ $\sum f d=$ $\sum f u=$
$\sum f x$ ১০,১৬০ ২৬০ ১৩

যেখানে $\mathrm{N}=\sum f=99$

টেবিল ২.৩ গ্রুপীকৃত তথ্যের জন্য গড় গণনার পদ্ধতি প্রদান করে। প্রদত্ত কম্পাঙ্ক বণ্টনে, নিরানব্বই জন শ্রমিককে মজুরির হারের পাঁচটি শ্রেণীতে গ্রুপ করা হয়েছে। এই গ্রুপগুলির মধ্যবিন্দুগুলি তৃতীয় কলামে তালিকাভুক্ত করা হয়েছে। গড় বের করতে, প্রতিটি মধ্যবিন্দু $(\mathrm{X})$ কে কম্পাঙ্ক $(f)$ দিয়ে গুণ করা হয়েছে এবং তাদের যোগফল ($\sum f_{x}$) কে $N$ দিয়ে ভাগ করা হয়েছে।

প্রদত্ত সূত্র ব্যবহার করে গড় নিম্নরূপে গণনা করা যেতে পারে:

$$ \begin{aligned} \overline{\mathrm{X}} & =\frac{\sum f x}{N} \ & =\frac{10,160}{99} \ & =102.6 \end{aligned} $$

পরোক্ষ পদ্ধতি

গ্রুপীকৃত তথ্যের জন্য পরোক্ষ পদ্ধতি ব্যবহারের জন্য নিম্নলিখিত সূত্রটি ব্যবহার করা যেতে পারে। এই সূত্রের নীতিগুলি অগ্রুপীকৃত তথ্যের জন্য প্রদত্ত পরোক্ষ পদ্ধতির অনুরূপ। এটি নিম্নরূপে প্রকাশ করা হয়

$$ \bar{x}=A \pm \frac{\sum f d}{N} $$

যেখানে,

= অনুমিত গড় গ্রুপের মধ্যবিন্দু (টেবিল ২.৩-এ অনুমিত গড় গ্রুপটি হল ৯০ – ১১০ যার মধ্যবিন্দু ১০০।) f = কম্পাঙ্ক d = অনুমিত গড় গ্রুপ (A) থেকে বিচ্যুতি N = ঘটনার যোগফল বা ∑ f i = ব্যবধান প্রস্থ (এই ক্ষেত্রে, এটি ২০)

টেবিল ২.৩ থেকে প্রত্যক্ষ পদ্ধতি ব্যবহার করে গড় গণনার সাথে জড়িত নিম্নলিখিত ধাপগুলি অনুমান করা যেতে পারে:

(i) গড়কে ৯০ - ১১০ গ্রুপে অনুমান করা হয়েছে। এটি সম্ভব হলে শ্রেণীটির মাঝামাঝি কাছাকাছি থেকে অনুমান করা ভালো। এই পদ্ধতি গণনার পরিমাণ কমিয়ে দেয়। টেবিল ২.৩-এ, A (অনুমিত গড়) হল ১০০, শ্রেণী $90-110$-এর মধ্যবিন্দু।

(ii) পঞ্চম কলাম (u) প্রতিটি শ্রেণীর মধ্যবিন্দুর অনুমিত গড় গ্রুপের মধ্যবিন্দু $(90-110)$ থেকে বিচ্যুতি তালিকাভুক্ত করে।

(iii) ষষ্ঠ কলামটি প্রতিটি $f$ কে তার সংশ্লিষ্ট $d$ দিয়ে গুণ করে প্রাপ্ত $f d$ মান দেখায়। তারপর, $f d$-এর ধনাত্মক ও ঋণাত্মক মানগুলি আলাদাভাবে যোগ করা হয় এবং তাদের পরম পার্থক্য বের করা হয় ($\sum f d$)। লক্ষ্য করুন যে $\sum f d$-এর সাথে সংযুক্ত চিহ্নটি A-এর পরের সূত্রে প্রতিস্থাপিত হয়, যেখানে $\pm$ দেওয়া আছে।

পরোক্ষ পদ্ধতি ব্যবহার করে গড় নিম্নরূপে গণনা করা হয়:

$$ \begin{aligned} \overline{\boldsymbol{x}} & =\boldsymbol{A} \pm \frac{\sum \boldsymbol{f} \boldsymbol{d}}{\boldsymbol{N}} \ & =100+\frac{260}{99} \ & =100+2.6 \ & =102.6 \end{aligned} $$

দ্রষ্টব্য : পরোক্ষ গড় পদ্ধতি সমান ও অসম উভয় শ্রেণী ব্যবধানের জন্য কাজ করবে।

মধ্যমা

মধ্যমা হল একটি অবস্থানগত গড়। এটিকে “একটি বণ্টনে সেই বিন্দু হিসাবে সংজ্ঞায়িত করা যেতে পারে যার উভয় পাশে সমান সংখ্যক ঘটনা রয়েছে”। মধ্যমা $\mathrm{M}$ চিহ্ন ব্যবহার করে প্রকাশ করা হয়।

অগ্রুপীকৃত তথ্যের জন্য মধ্যমা গণনা

যখন স্কোরগুলি অগ্রুপীকৃত থাকে, সেগুলি ঊর্ধ্বক্রম বা অধঃক্রমে সাজানো হয়। সাজানো শ্রেণীতে কেন্দ্রীয় পর্যবেক্ষণ বা মান খুঁজে বের করে মধ্যমা পাওয়া যেতে পারে। কেন্দ্রীয় মানটি ঊর্ধ্বক্রম বা অধঃক্রমে সাজানো শ্রেণীর যেকোনো প্রান্ত থেকে খুঁজে পাওয়া যেতে পারে। মধ্যমা গণনার জন্য নিম্নলিখিত সমীকরণ ব্যবহার করা হয়:

$\left(\frac{\mathrm{N}+1}{2}\right)$ তম পদটির মান

উদাহরণ ২.৩: নিম্নলিখিতটি ব্যবহার করে হিমালয়ের অংশে পর্বতশৃঙ্গগুলির মধ্যমা উচ্চতা গণনা করুন:

$8,126 \mathrm{~m}, 8,611 \mathrm{~m}, 7,817 \mathrm{~m}, 8,172 \mathrm{~m}, 8,076 \mathrm{~m}, 8,848 \mathrm{~m}, 8,598 \mathrm{~m}$.

গণনা : মধ্যমা (M) নিম্নলিখিত ধাপগুলিতে গণনা করা যেতে পারে:

(i) প্রদত্ত তথ্যগুলো ঊর্ধ্বক্রম বা অধঃক্রমে সাজান।

(ii) শ্রেণীতে কেন্দ্রীয় মান খুঁজে বের করার জন্য সূত্রটি প্রয়োগ করুন। সুতরাং:

($\frac{\mathrm{N}+1}{2}$) তম পদটির মান

$=\left(\frac{7+1}{2}\right)$ তম পদ

$=\left(\frac{8}{2}\right)$ তম পদ

সাজানো শ্রেণীতে ৪র্থ পদটি হবে মধ্যমা।

তথ্যগুলো ঊর্ধ্বক্রমে সাজানো -

৭,$817 ; 8,076 ; 8,126 ; 8,172 ; 8,598 ; 8,611 ; 8,848$

অতএব,

৪র্থ পদ

$$ \mathrm{M}=8,172 \mathrm{~m} $$

গ্রুপীকৃত তথ্যের জন্য মধ্যমা গণনা

যখন স্কোরগুলি গ্রুপ করা হয়, আমাদের সেই বিন্দুর মান খুঁজে বের করতে হবে যেখানে একজন ব্যক্তি বা পর্যবেক্ষণ গ্রুপের কেন্দ্রীয়ভাবে অবস্থিত। এটি নিম্নলিখিত সূত্র ব্যবহার করে গণনা করা যেতে পারে:

$$ M=\boldsymbol{l}+\frac{\boldsymbol{i}}{\boldsymbol{f}}\left(\frac{\boldsymbol{N}}{2}-\boldsymbol{c}\right) $$

যেখানে,

M = গ্রুপীকৃত তথ্যের জন্য মধ্যমা
l = মধ্যমা শ্রেণীর নিম্ন সীমা
i = ব্যবধান
f = মধ্যমা শ্রেণীর কম্পাঙ্ক
N = মোট কম্পাঙ্ক বা পর্যবেক্ষণের সংখ্যা
c = প্রাক-মধ্যমা শ্রেণীর ক্রমযোজিত কম্পাঙ্ক।

উদাহরণ ২.৪ : নিম্নলিখিত বণ্টনের জন্য মধ্যমা গণনা করুন:

শ্রেণী $50-60$ $60-70$ $70-80$ $80-90$ $90-100$ $100-110$
$\boldsymbol{f}$ ১১ ১৬

টেবিল ২.৪ : মধ্যমার গণনা

শ্রেণী কম্পাঙ্ক
(f)
ক্রমযোজিত
কম্পাঙ্ক (iv)
মধ্যমা শ্রেণীর
গণনা
$50-60$
$60-70$
$70-80$
$\mathbf{8 0 - 9 0}$
(মধ্যমা গ্রুপ)
$90-100$
$100-110$


১১
$16 \boldsymbol{f}$




১০
$21 c$
$\mathbf{3 7}$
৪৫
৫০
$M=\frac{N}{2}$
$=\frac{50}{4}$
$\sum_{\mathbf{N}=\mathbf{5 0}} f$ বা

মধ্যমা নিচে দেওয়া ধাপগুলিতে গণনা করা হয়:

(i) টেবিল ২.৪-এ দেখানো হিসাবে কম্পাঙ্ক টেবিল তৈরি করা হয়।

(ii) ক্রমযোজিত কম্পাঙ্ক (F) প্রাপ্ত করা হয় পরপর ব্যবধান গ্রুপের প্রতিটি স্বাভাবিক কম্পাঙ্ক যোগ করে, যেমন টেবিল ২.৪-এর কলাম ৩-এ দেওয়া আছে।

(iii) মধ্যমা সংখ্যা পাওয়া যায় $\frac{N}{2}$ দ্বারা অর্থাৎ এই ক্ষেত্রে $\frac{50}{2}=\mathbf{2 5}$, যেমন টেবিল ২.৪-এর কলাম ৪-এ দেখানো হয়েছে।

(iv) ক্রমযোজিত কম্পাঙ্ক বণ্টন (F)-এ উপর থেকে নিচের দিকে গণনা করুন যতক্ষণ না $\frac{N}{2}$-এর চেয়ে বড় পরবর্তী মান পাওয়া যায়। এই উদাহরণে, $\frac{N}{2}$ হল ২৫, যা ৪০-৪৪ শ্রেণী ব্যবধানে পড়ে যার ক্রমযোজিত কম্পাঙ্ক ৩৭, সুতরাং প্রাক-মধ্যমা শ্রেণীর ক্রমযোজিত কম্পাঙ্ক হল ২১ এবং মধ্যমা শ্রেণীর প্রকৃত কম্পাঙ্ক হল ১৬।

(v) তারপর ধাপ ৪-এ নির্ধারিত সমস্ত মান নিম্নলিখিত সমীকরণে প্রতিস্থাপন করে মধ্যমা গণনা করা হয়:

$$ M=l+\frac{i}{f}(m-c) $$

$$ \begin{aligned} & =80+\frac{10}{16}(25-21) \ & =80+\frac{5}{8} \times 4 \ & =80+\frac{5}{2} \ & =80+2.5 \ M & =82.5 \end{aligned} $$

প্রচুরক

একটি বণ্টনে যে মানটি সবচেয়ে বেশি বার ঘটে তাকে প্রচুরক বলে। এটিকে $\mathbf{Z}$ বা $\mathbf{M}_{\mathbf{0}}$ চিহ্ন দ্বারা প্রকাশ করা হয়। প্রচুরক হল একটি পরিমাপ যা গড় ও মধ্যমার তুলনায় কম ব্যাপকভাবে ব্যবহৃত হয়। একটি প্রদত্ত তথ্য সেটে একাধিক ধরনের প্রচুরক থাকতে পারে।

অগ্রুপীকৃত তথ্যের জন্য প্রচুরক গণনা

প্রদত্ত তথ্য সেট থেকে প্রচুরক গণনা করার সময় সমস্ত পরিমাপ প্রথমে ঊর্ধ্বক্রম বা অধঃক্রমে সাজানো হয়। এটি সবচেয়ে বেশি ঘটা পরিমাপ সহজেই চিহ্নিত করতে সাহায্য করে।

উদাহরণ ২.৫ : দশজন শিক্ষার্থীর জন্য ভূগোলে নিম্নলিখিত পরীক্ষার স্কোরের প্রচুরক গণনা করুন:

$$ 61,10,88,37,61,72,55,61,46,22 $$

গণনা : প্রচুরক খুঁজে বের করতে পরিমাপগুলি নিম্নরূপ ঊর্ধ্বক্রমে সাজানো হয়:

$10,22,37,46,55, \mathbf{6 1}, \mathbf{6 1}, \mathbf{6 1}, 72,88$.

ধারায় তিনবার ঘটমান ৬১ পরিমাপটি প্রদত্ত তথ্যসেটে প্রচুরক। যেহেতু তথ্যসেটে অন্য কোনো সংখ্যা একইভাবে নেই, তাই এটিতে একপ্রকার প্রচুরকের বৈশিষ্ট্য রয়েছে।

উদাহরণ ২.৬ : দশজন অন্যান্য শিক্ষার্থীর একটি ভিন্ন নমুনা ব্যবহার করে প্রচুরক গণনা করুন, যারা স্কোর করেছিল:

$82,11,57,82,08,11,82,95,41,11$.

গণনা : প্রদত্ত পরিমাপগুলি নিম্নরূপ ঊর্ধ্বক্রমে সাজান:

$$ 08,11,11,11,41,57,82,82,82,95 $$

সহজেই লক্ষ্য করা যায় যে ১১ এবং ৮২ উভয় পরিমাপই বণ্টনে তিনবার করে ঘটছে। সুতরাং, তথ্যসেটটি দ্বিপ্রকার প্রচুরক বিশিষ্ট। যদি তিনটি মানের কম্পাঙ্ক সমান ও সর্বোচ্চ হয়, তবে শ্রেণীটি ত্রিপ্রকার প্রচুরক বিশিষ্ট। একইভাবে, একটি শ্রেণীতে অনেক পরিমাপের পুনরাবৃত্তি এটিকে বহুপ্রকার প্রচুরক বিশিষ্ট করে তোলে। তবে, যখন একটি শ্রেণীতে কোনো পরিমাপ পুনরাবৃত্তি হয় না তখন তাকে প্রচুরকবিহীন হিসাবে চিহ্নিত করা হয়।

গড়, মধ্যমা ও প্রচুরকের তুলনা

কেন্দ্রীয় প্রবণতার তিনটি পরিমাপ স্বাভাবিক বণ্টন বক্ররেখার সাহায্যে সহজেই তুলনা করা যেতে পারে। স্বাভাবিক বক্ররেখাটি একটি কম্পাঙ্ক বণ্টনকে বোঝায় যেখানে স্কোরের গ্রাফকে প্রায়শই ঘণ্টা-আকৃতির বক্ররেখা বলা হয়। অনেক মানুষের বৈশিষ্ট্য যেমন বুদ্ধিমত্তা, ব্যক্তিত্ব স্কোর এবং শিক্ষার্থীদের অর্জনের স্বাভাবিক বণ্টন থাকে। ঘণ্টা-আকৃতির বক্ররেখাটি যেভাবে দেখায় সেভাবে দেখায়, কারণ এটি প্রতিসম। অন্য কথায়, বেশিরভাগ পর্যবেক্ষণ মধ্যম মানের উপর এবং তার চারপাশে অবস্থিত। চরম মানের দিকে এগোলে, পর্যবেক্ষণের সংখ্যা প্রতিসমভাবে হ্রাস পায়। একটি স্বাভাবিক বক্ররেখার উচ্চ বা নিম্ন তথ্য পরিবর্তনশীলতা থাকতে পারে। একটি স্বাভাবিক বণ্টন বক্ররেখার একটি উদাহরণ চিত্র ২.৩-এ দেওয়া হয়েছে।

চিত্র ২.৩ : স্বাভাবিক বণ্টন বক্ররেখা

স্বাভাবিক বণ্টনের একটি গুরুত্বপূর্ণ বৈশিষ্ট্য রয়েছে। গড়, মধ্যমা এবং প্রচুরক একই স্কোর (চিত্র ২.৩-এ ১০০ স্কোর) কারণ একটি স্বাভাবিক বণ্টন প্রতিসম। সর্বোচ্চ কম্পাঙ্ক সহ স্কোরটি বণ্টনের মাঝখানে ঘটে এবং ঠিক অর্ধেক স্কোর মাঝের উপরে ঘটে এবং অর্ধেক স্কোর মাঝের নিচে ঘটে। বেশিরভাগ স্কোর বণ্টনের মাঝামাঝি বা গড়ের কাছাকাছি ঘটে। খুব উচ্চ এবং খুব নিম্ন স্কোর প্রায়শই ঘটে না এবং তাই, বিরল বলে বিবেচিত হয়।

যদি তথ্যগুলি কোনোভাবে তির্যক বা বিকৃত হয়, তবে গড়, মধ্যমা এবং প্রচুরক মিলবে না এবং তির্যক তথ্যের প্রভাব বিবেচনা করতে হবে (চিত্র ২.৪ এবং ২.৫$)$।

চিত্র ২.৪ : ধনাত্মক তির্যকতা

চিত্র $2.5:$ ঋণাত্মক তির্যকতা

অনুশীলনী

১. নিচে দেওয়া চারটি বিকল্প থেকে সঠিক উত্তরটি বেছে নিন:

(i) কেন্দ্রীয় প্রবণতার যে পরিমাপটি চরম মান দ্বারা প্রভাবিত হয় না:

(ক) গড়
(খ) গড় ও প্রচুরক
(গ) প্রচুরক
(ঘ) মধ্যমা

(ii) কেন্দ্রীয় প্রবণতার যে পরিমাপটি যেকোনো বণ্টনের সর্বোচ্চ বিন্দুর সাথে সর্বদা মিলে যায়:

(ক) মধ্যমা
(খ) মধ্যমা ও প্রচুরক
(গ) গড়
(ঘ) প্রচুরক

২. প্রায় ৩০ শব্দে নিম্নলিখিত প্রশ্নগুলির উত্তর দিন:

(i) গড়কে সংজ্ঞায়িত করুন।
(ii) প্রচুরক ব্যবহারের সুবিধাগুলি কী কী?

৩. প্রায় ১২৫ শব্দে নিম্নলিখিত প্রশ্নগুলির উত্তর দিন:

(i) স্বাভাবিক বণ্টন ও তির্যক বণ্টনে গড়, মধ্যমা ও প্রচুরকের আপেক্ষিক অবস্থান চিত্রের সাহায্যে ব্যাখ্যা করুন।
(ii) গড়, মধ্যমা ও প্রচুরকের প্রযোজ্যতা সম্পর্কে মন্তব্য করুন (ইঙ্গিত: তাদের গুণ ও দোষ থেকে)।

কার্যকলাপ

১. ভৌগোলিক বিশ্লেষণের জন্য প্রযোজ্য একটি কাল্পনিক উদাহরণ নিন এবং অগ্রুপীকৃত তথ্য থেকে গড় গণনার প্রত্যক্ষ ও পরোক্ষ পদ্ধতিগুলি ব্যাখ্যা করুন।