ಅಧ್ಯಾಯ 02 ಡೇಟಾ ಸಂಸ್ಕರಣೆ
ನೀವು ಹಿಂದಿನ ಅಧ್ಯಾಯದಲ್ಲಿ ಕಲಿತಿರುವಂತೆ, ಡೇಟಾವನ್ನು ಸಂಘಟಿಸುವುದು ಮತ್ತು ಪ್ರಸ್ತುತಪಡಿಸುವುದು ಅವುಗಳನ್ನು ಗ್ರಹಿಸಲು ಸಹಾಯ ಮಾಡುತ್ತದೆ. ಇದು ಡೇಟಾ ಪ್ರಕ್ರಿಯೆಗೊಳಿಸುವಿಕೆಯನ್ನು ಸುಲಭಗೊಳಿಸುತ್ತದೆ. ಡೇಟಾವನ್ನು ವಿಶ್ಲೇಷಿಸಲು ಹಲವಾರು ಸಂಖ್ಯಾಶಾಸ್ತ್ರೀಯ ತಂತ್ರಗಳನ್ನು ಬಳಸಲಾಗುತ್ತದೆ, ಉದಾಹರಣೆಗೆ:
- ಕೇಂದ್ರೀಯ ಪ್ರವೃತ್ತಿಯ ಅಳತೆಗಳು
- ವಿಚಲನದ ಅಳತೆಗಳು
- ಸಂಬಂಧದ ಅಳತೆಗಳು
ಕೇಂದ್ರೀಯ ಪ್ರವೃತ್ತಿಯ ಅಳತೆಗಳು ವೀಕ್ಷಣೆಗಳ ಗುಂಪಿನ ಆದರ್ಶ ಪ್ರತಿನಿಧಿಯಾಗುವ ಮೌಲ್ಯವನ್ನು ಒದಗಿಸಿದರೆ, ವಿಚಲನದ ಅಳತೆಗಳು ಡೇಟಾದ ಆಂತರಿಕ ವ್ಯತ್ಯಾಸಗಳನ್ನು, ಸಾಮಾನ್ಯವಾಗಿ ಕೇಂದ್ರೀಯ ಪ್ರವೃತ್ತಿಯ ಅಳತೆಯ ಸುತ್ತಲೂ, ಗಣನೆಗೆ ತೆಗೆದುಕೊಳ್ಳುತ್ತವೆ. ಮತ್ತೊಂದೆಡೆ, ಸಂಬಂಧದ ಅಳತೆಗಳು ಯಾವುದೇ ಎರಡು ಅಥವಾ ಹೆಚ್ಚು ಸಂಬಂಧಿತ ವಿದ್ಯಮಾನಗಳ ನಡುವಿನ ಸಂಬಂಧದ ಮಟ್ಟವನ್ನು ಒದಗಿಸುತ್ತವೆ, ಉದಾಹರಣೆಗೆ ಮಳೆ ಮತ್ತು ಪ್ರವಾಹದ ಸಂಭವ ಅಥವಾ ರಾಸಾಯನಿಕ ಗೊಬ್ಬರದ ಬಳಕೆ ಮತ್ತು ಬೆಳೆಗಳ ಇಳುವರಿ. ಈ ಅಧ್ಯಾಯದಲ್ಲಿ, ನೀವು ಕೇಂದ್ರೀಯ ಪ್ರವೃತ್ತಿಯ ಅಳತೆಗಳನ್ನು ಕಲಿಯುವಿರಿ.
ಕೇಂದ್ರೀಯ ಪ್ರವೃತ್ತಿಯ ಅಳತೆಗಳು
ಮಳೆ, ಎತ್ತರ, ಜನಸಾಂದ್ರತೆ, ಶೈಕ್ಷಣಿಕ ಸಾಧನೆಯ ಮಟ್ಟಗಳು ಅಥವಾ ವಯಸ್ಸಿನ ಗುಂಪುಗಳಂತಹ ಅಳತೆ ಮಾಡಬಹುದಾದ ಗುಣಲಕ್ಷಣಗಳು ವ್ಯತ್ಯಾಸಗೊಳ್ಳುತ್ತವೆ. ನಾವು ಅವುಗಳನ್ನು ಅರ್ಥಮಾಡಿಕೊಳ್ಳಲು ಬಯಸಿದರೆ, ನಾವು ಹೇಗೆ ಮಾಡುತ್ತೇವೆ? ನಮಗೆ ಬಹುಶಃ, ಎಲ್ಲಾ ವೀಕ್ಷಣೆಗಳನ್ನು ಉತ್ತಮವಾಗಿ ಪ್ರತಿನಿಧಿಸುವ ಒಂದೇ ಮೌಲ್ಯ ಅಥವಾ ಸಂಖ್ಯೆ ಬೇಕಾಗಬಹುದು. ಈ ಏಕೈಕ ಮೌಲ್ಯವು ಸಾಮಾನ್ಯವಾಗಿ ವಿತರಣೆಯ ಮಧ್ಯಭಾಗದ ಹತ್ತಿರ ಇರುತ್ತದೆ, ಅತಿ ತೀವ್ರತೆಯಲ್ಲಿ ಅಲ್ಲ. ವಿತರಣೆಗಳ ಕೇಂದ್ರವನ್ನು ಕಂಡುಹಿಡಿಯಲು ಬಳಸುವ ಸಂಖ್ಯಾಶಾಸ್ತ್ರೀಯ ತಂತ್ರಗಳನ್ನು ಕೇಂದ್ರೀಯ ಪ್ರವೃತ್ತಿಯ ಅಳತೆಗಳು ಎಂದು ಕರೆಯಲಾಗುತ್ತದೆ. ಕೇಂದ್ರೀಯ ಪ್ರವೃತ್ತಿಯನ್ನು ಸೂಚಿಸುವ ಸಂಖ್ಯೆಯು ಸಂಪೂರ್ಣ ಡೇಟಾ ಸೆಟ್ಗೆ ಪ್ರತಿನಿಧಿ ಅಂಕಿ ಆಗಿದೆ ಏಕೆಂದರೆ ಅದು ವಸ್ತುಗಳು ಗುಂಪಾಗಲು ಪ್ರವೃತ್ತಿ ಹೊಂದಿರುವ ಬಿಂದುವಾಗಿದೆ.
ಕೇಂದ್ರೀಯ ಪ್ರವೃತ್ತಿಯ ಅಳತೆಗಳನ್ನು ಸಂಖ್ಯಾಶಾಸ್ತ್ರೀಯ ಸರಾಸರಿಗಳು ಎಂದೂ ಕರೆಯಲಾಗುತ್ತದೆ. ಸರಾಸರಿ, ಮಧ್ಯಸ್ಥ ಮತ್ತು ಬಹುಲಕದಂತಹ ಹಲವಾರು ಕೇಂದ್ರೀಯ ಪ್ರವೃತ್ತಿಯ ಅಳತೆಗಳಿವೆ.
ಸರಾಸರಿ
ಸರಾಸರಿಯು ಎಲ್ಲಾ ಮೌಲ್ಯಗಳನ್ನು ಒಟ್ಟುಗೂಡಿಸಿ ಅದನ್ನು ವೀಕ್ಷಣೆಗಳ ಸಂಖ್ಯೆಯಿಂದ ಭಾಗಿಸುವ ಮೂಲಕ ಪಡೆಯಲ್ಪಡುವ ಮೌಲ್ಯವಾಗಿದೆ.
ಮಧ್ಯಸ್ಥ
ಮಧ್ಯಸ್ಥವು ಶ್ರೇಣಿಯ ಮೌಲ್ಯವಾಗಿದೆ, ಇದು ಜೋಡಿಸಲಾದ ಶ್ರೇಣಿಯನ್ನು ಎರಡು ಸಮಾನ ಸಂಖ್ಯೆಗಳಾಗಿ ವಿಭಜಿಸುತ್ತದೆ. ಇದು ನಿಜವಾದ ಮೌಲ್ಯದಿಂದ ಸ್ವತಂತ್ರವಾಗಿದೆ. ಡೇಟಾವನ್ನು ಆರೋಹಣ ಅಥವಾ ಅವರೋಹಣ ಕ್ರಮದಲ್ಲಿ ಜೋಡಿಸುವುದು ಮತ್ತು ನಂತರ ಮಧ್ಯದ ಶ್ರೇಣಿಯ ಸಂಖ್ಯೆಯ ಮೌಲ್ಯವನ್ನು ಕಂಡುಹಿಡಿಯುವುದು ಮಧ್ಯಸ್ಥವನ್ನು ಲೆಕ್ಕಾಚಾರ ಮಾಡುವಲ್ಲಿ ಅತ್ಯಂತ ಮಹತ್ವದ್ದಾಗಿದೆ. ಸಮ ಸಂಖ್ಯೆಗಳ ಸಂದರ್ಭದಲ್ಲಿ, ಎರಡು ಮಧ್ಯದ ಶ್ರೇಣಿಯ ಮೌಲ್ಯಗಳ ಸರಾಸರಿಯು ಮಧ್ಯಸ್ಥವಾಗಿರುತ್ತದೆ.
ಬಹುಲಕ
ಬಹುಲಕವು ಒಂದು ನಿರ್ದಿಷ್ಟ ಬಿಂದು ಅಥವಾ ಮೌಲ್ಯದಲ್ಲಿ ಗರಿಷ್ಠ ಸಂಭವ ಅಥವಾ ಆವರ್ತನವಾಗಿದೆ. ಈ ಪ್ರತಿಯೊಂದು ಅಳತೆಗಳು ವಿಭಿನ್ನ ರೀತಿಯ ಡೇಟಾ ಸೆಟ್ಗಳಿಗೆ ಸೂಕ್ತವಾದ ಒಂದೇ ಪ್ರತಿನಿಧಿ ಸಂಖ್ಯೆಯನ್ನು ನಿರ್ಧರಿಸುವ ವಿಭಿನ್ನ ವಿಧಾನವಾಗಿದೆ ಎಂದು ನೀವು ಗಮನಿಸಬಹುದು.
ಸರಾಸರಿ
ಸರಾಸರಿಯು ಒಂದು ವೇರಿಯೇಬಲ್ನ ವಿಭಿನ್ನ ಮೌಲ್ಯಗಳ ಸರಳ ಅಂಕಗಣಿತದ ಸರಾಸರಿಯಾಗಿದೆ. ಅಸಮೂಹಿತ ಮತ್ತು ಸಮೂಹಿತ ಡೇಟಾಗೆ, ಸರಾಸರಿಯನ್ನು ಲೆಕ್ಕಾಚಾರ ಮಾಡುವ ವಿಧಾನಗಳು ಅಗತ್ಯವಾಗಿ ವಿಭಿನ್ನವಾಗಿರುತ್ತವೆ. ಸರಾಸರಿಯನ್ನು ನೇರ ಅಥವಾ ಪರೋಕ್ಷ ವಿಧಾನಗಳಿಂದ, ಸಮೂಹಿತ ಮತ್ತು ಅಸಮೂಹಿತ ಡೇಟಾ ಎರಡಕ್ಕೂ ಲೆಕ್ಕಹಾಕಬಹುದು.
ಅಸಮೂಹಿತ ಡೇಟಾದಿಂದ ಸರಾಸರಿ ಲೆಕ್ಕಾಚಾರ
ನೇರ ವಿಧಾನ
ಅಸಮೂಹಿತ ಡೇಟಾದಿಂದ ಸರಾಸರಿಯನ್ನು ನೇರ ವಿಧಾನವನ್ನು ಬಳಸಿ ಲೆಕ್ಕಾಚಾರ ಮಾಡುವಾಗ, ಪ್ರತಿ ವೀಕ್ಷಣೆಗೆ ಮೌಲ್ಯಗಳನ್ನು ಸೇರಿಸಲಾಗುತ್ತದೆ ಮತ್ತು ಒಟ್ಟು ಸಂಭವಗಳ ಸಂಖ್ಯೆಯನ್ನು ಎಲ್ಲಾ ವೀಕ್ಷಣೆಗಳ ಮೊತ್ತದಿಂದ ಭಾಗಿಸಲಾಗುತ್ತದೆ. ಸರಾಸರಿಯನ್ನು ಈ ಕೆಳಗಿನ ಸೂತ್ರವನ್ನು ಬಳಸಿಕೊಂಡು ಲೆಕ್ಕಹಾಕಲಾಗುತ್ತದೆ:
$$ \overline{\mathrm{X}}=\frac{\sum x}{\mathrm{~N}} $$
ಎಲ್ಲಿ,
$$ \begin{aligned} \overline{\mathrm{X}} & =\text { Mean } \ \sum \quad & \text { Sum of a series of } \ & \text { measures } \end{aligned} $$
$x \quad=$ ಅಳತೆಗಳ ಶ್ರೇಣಿಯಲ್ಲಿ ಒಂದು ಕಚ್ಚಾ ಸ್ಕೋರ್
$\sum \mathrm{x}=$ ಎಲ್ಲಾ ಅಳತೆಗಳ ಮೊತ್ತ
$\mathrm{N} \quad$ = ಅಳತೆಗಳ ಸಂಖ್ಯೆ
ಉದಾಹರಣೆ 2.1 : ಟೇಬಲ್ 2.1 ರಲ್ಲಿ ನೀಡಲಾದ ಪ್ರದೇಶದ ಜಿಲ್ಲೆಗಳ ಮಳೆಯ ಆಧಾರದ ಮೇಲೆ ಮಧ್ಯಪ್ರದೇಶದ ಮಾಲ್ವಾ ಪ್ರಸ್ಥಭೂಮಿಗೆ ಸರಾಸರಿ ಮಳೆಯನ್ನು ಲೆಕ್ಕಹಾಕಿ:
$\hspace{1cm}$ ಟೇಬಲ್ 2.1 : ಸರಾಸರಿ ಮಳೆಯ ಲೆಕ್ಕಾಚಾರ
| ಮಾಲ್ವಾ ಪ್ರಸ್ಥಭೂಮಿಯ ಜಿಲ್ಲೆಗಳು |
ಸಾಮಾನ್ಯ ಮಳೆ ಮಿಮೀಗಳಲ್ಲಿ |
ಪರೋಕ್ಷ ವಿಧಾನ |
|---|---|---|
| x ನೇರ ವಿಧಾನ | $d=x-800^{*}$ | |
| ಇಂದೋರ್ | 979 | 179 |
| ದೇವಾಸ್ | 1083 | 283 |
| ಧಾರ್ | 833 | 33 |
| ರತ್ಲಾಮ್ | 896 | 96 |
| ಉಜ್ಜಯಿನಿ | 891 | 91 |
| ಮಂದಸೌರ್ | 825 | 25 |
| ಶಾಜಾಪುರ್ | 977 | 177 |
| $\sum x$ ಮತ್ತು $\sum d$ | 6484 | 884 |
| $\frac{\sum x}{N}$ ಮತ್ತು $\frac{\sum d}{N}$ | 926.29 | 126.29 |
- ಇಲ್ಲಿ 800 ಅನ್ನು ಊಹಿತ ಸರಾಸರಿಯಾಗಿ ತೆಗೆದುಕೊಳ್ಳಲಾಗಿದೆ.
$\mathrm{d}$ ಊಹಿತ ಸರಾಸರಿಯಿಂದ ವಿಚಲನ.
ಟೇಬಲ್ 2.1 ರಲ್ಲಿ ನೀಡಲಾದ ಡೇಟಾದ ಸರಾಸರಿಯನ್ನು ಈ ಕೆಳಗಿನಂತೆ ಲೆಕ್ಕಹಾಕಲಾಗಿದೆ:
$$ \begin{aligned} \overline{\mathrm{X}} & =\frac{\sum x}{N} \ & =\frac{6,484}{7} \ & =926.29 \end{aligned} $$
ಸರಾಸರಿಯ ಲೆಕ್ಕಾಚಾರದಿಂದ ಗಮನಿಸಬಹುದಾದಂತೆ, ಕಚ್ಚಾ ಮಳೆ ಡೇಟಾವನ್ನು ನೇರವಾಗಿ ಸೇರಿಸಲಾಗಿದೆ ಮತ್ತು ಮೊತ್ತವನ್ನು ವೀಕ್ಷಣೆಗಳ ಸಂಖ್ಯೆಯಿಂದ ಭಾಗಿಸಲಾಗಿದೆ ಅಂದರೆ, ಜಿಲ್ಲೆಗಳು. ಆದ್ದರಿಂದ, ಇದನ್ನು ನೇರ ವಿಧಾನ ಎಂದು ಕರೆಯಲಾಗುತ್ತದೆ.
ಪರೋಕ್ಷ ವಿಧಾನ
ಹೆಚ್ಚಿನ ಸಂಖ್ಯೆಯ ವೀಕ್ಷಣೆಗಳಿಗೆ, ಸರಾಸರಿಯನ್ನು ಲೆಕ್ಕಾಚಾರ ಮಾಡಲು ಸಾಮಾನ್ಯವಾಗಿ ಪರೋಕ್ಷ ವಿಧಾನವನ್ನು ಬಳಸಲಾಗುತ್ತದೆ. ಇದು ವೀಕ್ಷಣೆಗಳ ಮೌಲ್ಯಗಳಿಂದ ಒಂದು ಸ್ಥಿರ ಮೌಲ್ಯವನ್ನು ಕಳೆಯುವ ಮೂಲಕ ಅವುಗಳನ್ನು ಚಿಕ್ಕ ಸಂಖ್ಯೆಗಳಿಗೆ ಕಡಿಮೆ ಮಾಡಲು ಸಹಾಯ ಮಾಡುತ್ತದೆ. ಉದಾಹರಣೆಗೆ, ಟೇಬಲ್ 2.1 ರಲ್ಲಿ ತೋರಿಸಿರುವಂತೆ, ಮಳೆಯ ಮೌಲ್ಯಗಳು 800 ಮತ್ತು $1100 \mathrm{~mm}$ ನಡುವೆ ಇರುತ್ತವೆ. ನಾವು ‘ಊಹಿತ ಸರಾಸರಿ’ಯನ್ನು ಆಯ್ಕೆಮಾಡಿ ಮತ್ತು ಪ್ರತಿ ಮೌಲ್ಯದಿಂದ ಆಯ್ದ ಸಂಖ್ಯೆಯನ್ನು ಕಳೆಯುವ ಮೂಲಕ ಈ ಮೌಲ್ಯಗಳನ್ನು ಕಡಿಮೆ ಮಾಡಬಹುದು. ಪ್ರಸ್ತುತ ಸಂದರ್ಭದಲ್ಲಿ, ನಾವು 800 ಅನ್ನು ಊಹಿತ ಸರಾಸರಿಯಾಗಿ ತೆಗೆದುಕೊಂಡಿದ್ದೇವೆ. ಅಂತಹ ಕಾರ್ಯಾಚರಣೆಯನ್ನು ಕೋಡಿಂಗ್ ಎಂದು ಕರೆಯಲಾಗುತ್ತದೆ. ನಂತರ ಈ ಕಡಿಮೆ ಮಾಡಿದ ಸಂಖ್ಯೆಗಳಿಂದ ಸರಾಸರಿಯನ್ನು ಲೆಕ್ಕಹಾಕಲಾಗುತ್ತದೆ (ಟೇಬಲ್ 2.1 ರ ಕಾಲಮ್ 3).
ಪರೋಕ್ಷ ವಿಧಾನವನ್ನು ಬಳಸಿಕೊಂಡು ಸರಾಸರಿಯನ್ನು ಲೆಕ್ಕಾಚಾರ ಮಾಡಲು ಈ ಕೆಳಗಿನ ಸೂತ್ರವನ್ನು ಬಳಸಲಾಗುತ್ತದೆ:
$$ \overline{\mathrm{X}}=A+\frac{\sum d}{N} $$
ಎಲ್ಲಿ,
$$ \begin{aligned} A & =\text { Subtracted constant } \ \sum d & =\text { Sum of the coded scores } \ N & =\text { Number of individual observations in a series } \end{aligned} $$
ಟೇಬಲ್ 2.1 ರಲ್ಲಿ ತೋರಿಸಿರುವ ಡೇಟಾದ ಸರಾಸರಿಯನ್ನು ಪರೋಕ್ಷ ವಿಧಾನವನ್ನು ಬಳಸಿಕೊಂಡು ಈ ಕೆಳಗಿನ ರೀತಿಯಲ್ಲಿ ಲೆಕ್ಕಹಾಕಬಹುದು:
$$ \begin{aligned} \overline{\mathrm{X}} & =800+\frac{884}{7} \ & =800+\frac{884}{7} \ \overline{\mathrm{X}} & =926.29 \mathrm{~mm} \end{aligned} $$
ಲೆಕ್ಕಾಚಾರ ಮಾಡಿದ ಎರಡು ವಿಧಾನಗಳಲ್ಲಿ ಯಾವುದರಿಂದಲೂ ಸರಾಸರಿ ಮೌಲ್ಯ ಒಂದೇ ಆಗಿ ಬರುತ್ತದೆ ಎಂಬುದನ್ನು ಗಮನಿಸಿ.
ಸಮೂಹಿತ ಡೇಟಾದಿಂದ ಸರಾಸರಿ ಲೆಕ್ಕಾಚಾರ
ಸರಾಸರಿಯನ್ನು ಸಮೂಹಿತ ಡೇಟಾಗೆ ನೇರ ಅಥವಾ ಪರೋಕ್ಷ ವಿಧಾನವನ್ನು ಬಳಸಿಕೊಂಡು ಲೆಕ್ಕಹಾಕಲಾಗುತ್ತದೆ.
ನೇರ ವಿಧಾನ
ಸ್ಕೋರ್ಗಳನ್ನು ಆವರ್ತನ ವಿತರಣೆಯಲ್ಲಿ ಗುಂಪು ಮಾಡಿದಾಗ, ವೈಯಕ್ತಿಕ ಮೌಲ್ಯಗಳು ತಮ್ಮ ಗುರುತನ್ನು ಕಳೆದುಕೊಳ್ಳುತ್ತವೆ. ಈ ಮೌಲ್ಯಗಳನ್ನು ಅವು ಇರುವ ವರ್ಗ ${ }^{\circ}$ ಮಧ್ಯಂತರಗಳ ಮಧ್ಯಬಿಂದುಗಳಿಂದ ಪ್ರತಿನಿಧಿಸಲಾಗುತ್ತದೆ. ನೇರ ವಿಧಾನವನ್ನು ಬಳಸಿಕೊಂಡು ಸಮೂಹಿತ ಡೇಟಾದಿಂದ ಸರಾಸರಿಯನ್ನು ಲೆಕ್ಕಾಚಾರ ಮಾಡುವಾಗ, ಪ್ರತಿ ವರ್ಗ ಮಧ್ಯಂತರದ ಮಧ್ಯಬಿಂದುವನ್ನು ಅದರ ಅನುಗುಣವಾದ ಆವರ್ತನ $(f)$ ನಿಂದ ಗುಣಿಸಲಾಗುತ್ತದೆ; $f x$ ($\mathrm{X}$ ಮಧ್ಯಬಿಂದುಗಳು) ನ ಎಲ್ಲಾ ಮೌಲ್ಯಗಳನ್ನು $\sum f x$ ಪಡೆಯಲು ಸೇರಿಸಲಾಗುತ್ತದೆ, ಅದನ್ನು ಅಂತಿಮವಾಗಿ ವೀಕ್ಷಣೆಗಳ ಸಂಖ್ಯೆಯಿಂದ ಭಾಗಿಸಲಾಗುತ್ತದೆ ಅಂದರೆ, $\mathrm{N}$. ಆದ್ದರಿಂದ, ಸರಾಸರಿಯನ್ನು ಈ ಕೆಳಗಿನ ಸೂತ್ರವನ್ನು ಬಳಸಿಕೊಂಡು ಲೆಕ್ಕಹಾಕಲಾಗುತ್ತದೆ:
$$ \overline{\mathrm{X}}=\frac{\sum f x}{N} $$
ಎಲ್ಲಿ:
$$ \begin{aligned} \overline{\mathrm{X}} & =\text { Mean } \ f & =\text { Frequencies } \ x & =\text { Midpoints of class intervals } \ N & \left.=\text { Number of observations (it may also be defined as } \sum f\right) \end{aligned} $$
ಉದಾಹರಣೆ 2.2 : ಟೇಬಲ್ 2.2 ರಲ್ಲಿ ನೀಡಲಾದ ಡೇಟಾವನ್ನು ಬಳಸಿಕೊಂಡು ಕಾರ್ಖಾನೆಯ ಕೆಲಸಗಾರರ ಸರಾಸರಿ ವೇತನ ದರವನ್ನು ಲೆಕ್ಕಾಚಾರ ಮಾಡಿ:
ಟೇಬಲ್ 2.2 : ಕಾರ್ಖಾನೆಯ ಕೆಲಸಗಾರರ ವೇತನ ದರ
| ವೇತನ ದರ (ರೂ./ದಿನ) | ಕೆಲಸಗಾರರ ಸಂಖ್ಯೆ () |
|---|---|
| ವರ್ಗಗಳು | $\boldsymbol{f}$ |
| $50-70$ | 10 |
| $70-90$ | 20 |
| $90-110$ | 25 |
| $110-130$ | 35 |
| $130-150$ | 9 |
ಟೇಬಲ್ 2.3 : ಸರಾಸರಿಯ ಲೆಕ್ಕಾಚಾರ
| ವರ್ಗಗಳು | ಆವರ್ತನ (f) |
ಮಧ್ಯ- ಬಿಂದುಗಳು $(x)$ |
$f x x$ | $d=x-100$ | $f d$ | $U=$ $(x-100)$ 20 |
$f u$ |
|---|---|---|---|---|---|---|---|
| $50-70$ | 10 | 60 | 600 | -40 | -400 | -2 | -20 |
| $70-90$ | 20 | 80 | 1,600 | -20 | -400 | -1 | -20 |
| $\mathbf{9 0 - 1 1 0}$ | $\mathbf{2 5}$ | $\mathbf{1 0 0}$ | 2,500 | $\mathbf{0}$ | 0 | 0 | 0 |
| $110-130$ | 35 | 120 | 4,200 | 20 | 700 | 1 | 35 |
| $130-150$ | 9 | 140 | 1,260 | 40 | 360 | 2 | 18 |
| $\sum f x$ | |||||||
| ಮತ್ತು | $\sum f=99$ | $\sum f x=$ | $\sum f d=$ | $\sum f u=$ | |||
| $\sum f x$ | 10,160 | 260 | 13 |
ಎಲ್ಲಿ $\mathrm{N}=\sum f=99$
ಟೇಬಲ್ 2.3 ಸಮೂಹಿತ ಡೇಟಾಗೆ ಸರಾಸರಿಯನ್ನು ಲೆಕ್ಕಾಚಾರ ಮಾಡುವ ವಿಧಾನವನ್ನು ಒದಗಿಸುತ್ತದೆ. ನೀಡಲಾದ ಆವರ್ತನ ವಿತರಣೆಯಲ್ಲಿ, ತೊಂಬತ್ತೊಂಬತ್ತು ಕೆಲಸಗಾರರನ್ನು ವೇತನ ದರಗಳ ಐದು ವರ್ಗಗಳಲ್ಲಿ ಗುಂಪು ಮಾಡಲಾಗಿದೆ. ಈ ಗುಂಪುಗಳ ಮಧ್ಯಬಿಂದುಗಳನ್ನು ಮೂರನೇ ಕಾಲಮ್ನಲ್ಲಿ ಪಟ್ಟಿ ಮಾಡಲಾಗಿದೆ. ಸರಾಸರಿಯನ್ನು ಕಂಡುಹಿಡಿಯಲು, ಪ್ರತಿ ಮಧ್ಯಬಿಂದು $(\mathrm{X})$ ಅನ್ನು ಆವರ್ತನ $(f)$ ನಿಂದ ಗುಣಿಸಲಾಗಿದೆ ಮತ್ತು ಅವುಗಳ ಮೊತ್ತ ($\sum f_{x}$) ಅನ್ನು $N$ ನಿಂದ ಭಾಗಿಸಲಾಗಿದೆ.
ನೀಡಲಾದ ಸೂತ್ರವನ್ನು ಬಳಸಿಕೊಂಡು ಸರಾಸರಿಯನ್ನು ಈ ಕೆಳಗಿನಂತೆ ಲೆಕ್ಕಾಚಾರ ಮಾಡಬಹುದು:
$$ \begin{aligned} \overline{\mathrm{X}} & =\frac{\sum f x}{N} \ & =\frac{10,160}{99} \ & =102.6 \end{aligned} $$
ಪರೋಕ್ಷ ವಿಧಾನ
ಸಮೂಹಿತ ಡೇಟಾಗೆ ಪರೋಕ್ಷ ವಿಧಾನಕ್ಕಾಗಿ ಈ ಕೆಳಗಿನ ಸೂತ್ರವನ್ನು ಬಳಸಬಹುದು. ಈ ಸೂತ್ರದ ತತ್ವಗಳು ಅಸಮೂಹಿತ ಡೇಟಾಗೆ ನೀಡಲಾದ ಪರೋಕ್ಷ ವಿಧಾನದಂತೆಯೇ ಇರುತ್ತವೆ. ಇದನ್ನು ಈ ಕೆಳಗಿನಂತೆ ವ್ಯಕ್ತಪಡಿಸಲಾಗಿದೆ
$$ \bar{x}=A \pm \frac{\sum f d}{N} $$
ಎಲ್ಲಿ,
= ಊಹಿತ ಸರಾಸರಿ ಗುಂಪಿನ ಮಧ್ಯಬಿಂದು (ಟೇಬಲ್ 2.3 ರಲ್ಲಿ ಊಹಿತ ಸರಾಸರಿ ಗುಂಪು 90 – 110 ಆಗಿದೆ, ಇದರ ಮಧ್ಯಬಿಂದು 100.) f = ಆವರ್ತನ d = ಊಹಿತ ಸರಾಸರಿ ಗುಂಪಿನಿಂದ ವಿಚಲನ (A) N = ಪ್ರಕರಣಗಳ ಮೊತ್ತ ಅಥವಾ ∑ f i = ಮಧ್ಯಂತರ ಅಗಲ (ಈ ಸಂದರ್ಭದಲ್ಲಿ, ಅದು 20)
ಟೇಬಲ್ 2.3 ರಿಂದ, ನೇರ ವಿಧಾನವನ್ನು ಬಳಸಿಕೊಂಡು ಸರಾಸರಿಯನ್ನು ಲೆಕ್ಕಾಚಾರ ಮಾಡುವಲ್ಲಿ ಒಳಗೊಂಡಿರುವ ಈ ಕೆಳಗಿನ ಹಂತಗಳನ್ನು ತೀರ್ಮಾನಿಸಬಹುದು:
(i) 90 - 110 ಗುಂಪಿನಲ್ಲಿ ಸರಾಸರಿಯನ್ನು ಊಹಿಸಲಾಗಿದೆ. ಇದನ್ನು ಸಾಧ್ಯವಾದಷ್ಟು ಶ್ರೇಣಿಯ ಮಧ್ಯಭಾಗಕ್ಕೆ ಹತ್ತಿರದ ವರ್ಗದಿಂದ ಊಹಿಸಲಾಗುತ್ತದೆ. ಈ ವಿಧಾನವು ಲೆಕ್ಕಾಚಾರದ ಪ್ರಮಾಣವನ್ನು ಕನಿಷ್ಠಗೊಳಿಸುತ್ತದೆ. ಟೇಬಲ್ 2.3 ರಲ್ಲಿ, A (ಊಹಿತ ಸರಾಸರಿ) 100 ಆಗಿದೆ, ಇದು ವರ್ಗ $90-110$ ನ ಮಧ್ಯಬಿಂದುವಾಗಿದೆ.
(ii) ಐದನೇ ಕಾಲಮ್ (u) ಪ್ರತಿ ವರ್ಗದ ಮಧ್ಯಬಿಂದುವಿನಿಂದ ಊಹಿತ ಸರಾಸರಿ ಗುಂಪಿನ ಮಧ್ಯಬಿಂದು $(90-110)$ ನ ವಿಚಲನಗಳನ್ನು ಪಟ್ಟಿ ಮಾಡುತ್ತದೆ.
(iii) ಆರನೇ ಕಾಲಮ್ ಪ್ರತಿ $f$ ಅನ್ನು ಅದರ ಅನುಗುಣವಾದ $d$ ನಿಂದ ಗುಣಿಸಿದ ಮೌಲ್ಯಗಳನ್ನು ತೋರಿಸುತ್ತದೆ, ಇದು $f d$ ನೀಡುತ್ತದೆ. ನಂತರ, $f d$ ನ ಧನಾತ್ಮಕ ಮತ್ತು ಋಣಾತ್ಮಕ ಮೌಲ್ಯಗಳನ್ನು ಪ್ರತ್ಯೇಕವಾಗಿ ಸೇರಿಸಲಾಗುತ್ತದೆ ಮತ್ತು ಅವುಗಳ ಸಂಪೂರ್ಣ ವ್ಯತ್ಯಾಸವನ್ನು ಕಂಡುಹಿಡಿಯಲಾಗುತ್ತದೆ ($\sum f d$). $\sum f d$ ಗೆ ಲಗತ್ತಿಸಲಾದ ಚಿಹ್ನೆಯನ್ನು A ನಂತರದ ಸೂತ್ರದಲ್ಲಿ ಬದಲಾಯಿಸಲಾಗಿದೆ ಎಂಬುದನ್ನು ಗಮನಿಸಿ, ಅಲ್ಲಿ $\pm$ ನೀಡಲಾಗಿದೆ.
ಪರೋಕ್ಷ ವಿಧಾನವನ್ನು ಬಳಸಿಕೊಂಡು ಸರಾಸರಿಯನ್ನು ಈ ಕೆಳಗಿನಂತೆ ಲೆಕ್ಕಾಚಾರ ಮಾಡಲಾಗುತ್ತದೆ:
$$ \begin{aligned} \overline{\boldsymbol{x}} & =\boldsymbol{A} \pm \frac{\sum \boldsymbol{f} \boldsymbol{d}}{\boldsymbol{N}} \ & =100+\frac{260}{99} \ & =100+2.6 \ & =102.6 \end{aligned} $$
ಗಮನಿಸಿ : ಪರೋಕ್ಷ ಸರಾಸರಿ ವಿಧಾನವು ಸಮಾನ ಮತ್ತು ಅಸಮಾನ ವರ್ಗ ಮಧ್ಯಂತರಗಳೆರಡಕ್ಕೂ ಕಾರ್ಯನಿರ್ವಹಿಸುತ್ತದೆ.
ಮಧ್ಯಸ್ಥ
ಮಧ್ಯಸ್ಥವು ಸ್ಥಾನಿಕ ಸರಾಸರಿಯಾಗಿದೆ. ಇದನ್ನು “ವಿತರಣೆಯಲ್ಲಿ ಪ್ರತಿ ಬದಿಯಲ್ಲಿ ಸಮಾನ ಸಂಖ್ಯೆಯ ಪ್ರಕರಣಗಳನ್ನು ಹೊಂದಿರುವ ಬಿಂದು” ಎಂದು ವ್ಯಾಖ್ಯಾನಿಸಬಹುದು. ಮಧ್ಯಸ್ಥವನ್ನು ಚಿಹ್ನೆ $\mathrm{M}$ ಬಳಸಿ ವ್ಯಕ್ತಪಡಿಸಲಾಗುತ್ತದೆ.
ಅಸಮೂಹಿತ ಡೇಟಾಗೆ ಮಧ್ಯಸ್ಥ ಲೆಕ್ಕಾಚಾರ
ಸ್ಕೋರ್ಗಳು ಅಸಮೂಹಿತವಾಗಿರುವಾಗ, ಅವುಗಳನ್ನು ಆರೋಹಣ ಅಥವಾ ಅವರೋಹಣ ಕ್ರಮದಲ್ಲಿ ಜೋಡಿಸಲಾಗುತ್ತದೆ. ಜೋಡಿಸಲಾದ ಶ್ರೇಣಿಯಲ್ಲಿ ಕೇಂದ್ರೀಯ ವೀಕ್ಷಣೆ ಅಥವಾ ಮೌಲ್ಯವನ್ನು ಸ್ಥಾನ ನಿರ್ಧರಿಸುವ ಮೂಲಕ ಮಧ್ಯಸ್ಥವನ್ನು ಕಂಡುಹಿಡಿಯಬಹುದು. ಕೇಂದ್ರೀಯ ಮೌಲ್ಯವನ್ನು ಆರೋಹಣ ಅಥವಾ ಅವರೋಹಣ ಕ್ರಮದಲ್ಲಿ ಜೋಡಿಸಲಾದ ಶ್ರೇಣಿಯ ಯಾವುದೇ ತುದಿಯಿಂದ ಸ್ಥಾನ ನಿರ್ಧರಿಸಬಹುದು. ಮಧ್ಯಸ್ಥವನ್ನು ಲೆಕ್ಕಾಚಾರ ಮಾಡಲು ಈ ಕೆಳಗಿನ ಸಮೀಕರಣವನ್ನು ಬಳಸಲಾಗುತ್ತದೆ:
$\left(\frac{\mathrm{N}+1}{2}\right)$ ನೇ ವಸ್ತುವಿನ ಮೌಲ್ಯ
ಉದಾಹರಣೆ 2.3: ಈ ಕೆಳಗಿನವುಗಳನ್ನು ಬಳಸಿಕೊಂಡು ಹಿಮಾಲಯದ ಕೆಲವು ಭಾಗಗಳಲ್ಲಿನ ಪರ್ವತ ಶಿಖರಗಳ ಮಧ್ಯಸ್ಥ ಎತ್ತರವನ್ನು ಲೆಕ್ಕಾಚಾರ ಮಾಡಿ:
$8,126 \mathrm{~m}, 8,611 \mathrm{~m}, 7,817 \mathrm{~m}, 8,172 \mathrm{~m}, 8,076 \mathrm{~m}, 8,848 \mathrm{~m}, 8,598 \mathrm{~m}$.
ಲೆಕ್ಕಾಚಾರ : ಮಧ್ಯಸ್ಥ (M) ಅನ್ನು ಈ ಕೆಳಗಿನ ಹಂತಗಳಲ್ಲಿ ಲೆಕ್ಕಹಾಕಬಹುದು:
(i) ನೀಡಲಾದ ಡೇಟಾವನ್ನು ಆರೋಹಣ ಅಥವಾ ಅವರೋಹಣ ಕ್ರಮದಲ್ಲಿ ಜೋಡಿಸಿ.
(ii) ಶ್ರೇಣಿಯಲ್ಲಿ ಕೇಂದ್ರೀಯ ಮೌಲ್ಯವನ್ನು ಸ್ಥಾನ ನಿರ್ಧರಿಸಲು ಸೂತ್ರವನ್ನು ಅನ್ವಯಿಸಿ. ಹೀಗೆ:
($\frac{\mathrm{N}+1}{2}$) ನೇ ವಸ್ತುವಿನ ಮೌಲ್ಯ
$=\left(\frac{7+1}{2}\right)$ ನೇ ವಸ್ತು
$=\left(\frac{8}{2}\right)$ ನೇ ವಸ್ತು
ಜೋಡಿಸಲಾದ ಶ್ರೇಣಿಯಲ್ಲಿ 4ನೇ ವಸ್ತುವು ಮಧ್ಯಸ್ಥವಾಗಿರುತ್ತದೆ.
ಡೇಟಾವನ್ನು ಆರೋಹಣ ಕ್ರಮದಲ್ಲಿ ಜೋಡಿಸುವುದು -
7,$817 ; 8,076 ; 8,126 ; 8,172 ; 8,598 ; 8,611 ; 8,848$
ಆದ್ದರಿಂದ,
4ನೇ ವಸ್ತು
$$ \mathrm{M}=8,172 \mathrm{~m} $$
ಸಮೂಹಿತ ಡೇಟಾಗೆ ಮಧ್ಯಸ್ಥ ಲೆಕ್ಕಾಚಾರ
ಸ್ಕೋರ್ಗಳನ್ನು ಗುಂಪು ಮಾಡಿದಾಗ, ಒಬ್ಬ ವ್ಯಕ್ತಿ ಅಥವಾ ವೀಕ್ಷಣೆಯು ಗುಂಪಿನಲ್ಲಿ ಕೇಂದ್ರೀಯವಾಗಿ ಎಲ್ಲಿ ಇದೆ ಎಂಬ ಬಿಂದುವಿನ ಮೌಲ್ಯವನ್ನು ನಾವು ಕಂಡುಹಿಡಿಯಬೇಕು. ಇದನ್ನು ಈ ಕೆಳಗಿನ ಸೂತ್ರವನ್ನು ಬಳಸಿಕೊಂಡು ಲೆಕ್ಕಾಚಾರ ಮಾಡಬಹುದು:
$$ M=\boldsymbol{l}+\frac{\boldsymbol{i}}{\boldsymbol{f}}\left(\frac{\boldsymbol{N}}{2}-\boldsymbol{c}\right) $$
ಎಲ್ಲಿ,
M = ಸಮೂಹಿತ ಡೇಟಾಗೆ ಮಧ್ಯಸ್ಥ
l = ಮಧ್ಯಸ್ಥ ವರ್ಗದ ಕೆಳಗಿನ ಮಿತಿ
i = ಮಧ್ಯಂತರ
f = ಮಧ್ಯಸ್ಥ ವರ್ಗದ ಆವರ್ತನ
N = ಆವರ್ತನಗಳ ಒಟ್ಟು ಸಂಖ್ಯೆ ಅಥವಾ ವೀಕ್ಷಣೆಗಳ ಸಂಖ್ಯೆ
c = ಪೂರ್ವ-ಮಧ್ಯಸ್ಥ ವರ್ಗದ ಸಂಚಿತ ಆವರ್ತನ.
ಉದಾಹರಣೆ 2.4 : ಈ ಕೆಳಗಿನ ವಿತರಣೆಗೆ ಮಧ್ಯಸ್ಥವನ್ನು ಲೆಕ್ಕಾಚಾರ ಮಾಡಿ:
| ವರ್ಗ | $50-60$ | $60-70$ | $70-80$ | $80-90$ | $90-100$ | $100-110$ |
|---|---|---|---|---|---|---|
| $\boldsymbol{f}$ | 3 | 7 | 11 | 16 | 8 | 5 |
ಟೇಬಲ್ 2.4 : ಮಧ್ಯಸ್ಥದ ಲೆಕ್ಕಾಚಾರ
| ವರ್ಗ | ಆವರ್ತನ (f) |
ಸಂಚಿತ ಆವರ್ತನ (iv) |
ಮಧ್ಯಸ್ಥ ವರ್ಗದ ಲೆಕ್ಕಾಚಾರ |
|---|---|---|---|
| $50-60$ $60-70$ $70-80$ $\mathbf{8 0 - 9 0}$ (ಮಧ್ಯಸ್ಥ ಗುಂಪು) $90-100$ $100-110$ |
3 7 11 $16 \boldsymbol{f}$ 8 5 5 |
3 10 $21 c$ $\mathbf{3 7}$ 45 50 |
$M=\frac{N}{2}$ $=\frac{50}{4}$ |
| $\sum_{\mathbf{N}=\mathbf{5 0}} f$ ಅಥವಾ |
ಮಧ್ಯಸ್ಥವನ್ನು ಈ ಕೆಳಗಿನ ಹಂತಗಳಲ್ಲಿ ಲೆಕ್ಕಾಚಾರ ಮಾಡಲಾಗುತ್ತದೆ:
(i) ಟೇಬಲ್ 2.4 ರಲ್ಲಿ ನೀಡಿರುವಂತೆ ಆವರ್ತನ ಕೋಷ್ಟಕವನ್ನು ಸ್ಥಾಪಿಸಲಾಗಿದೆ.
(ii) ಟೇಬಲ್ 2.4 ರ ಕಾಲಮ್ 3 ರಲ್ಲಿ ನೀಡಿರುವಂತೆ, ಅನುಕ್ರಮ ಮಧ್ಯಂತರ ಗುಂಪುಗಳ ಸಾಮಾನ್ಯ ಆವರ್ತನವನ್ನು ಸೇರಿಸುವ ಮೂಲಕ ಸಂಚಿತ ಆವರ್ತನಗಳನ್ನು (F) ಪಡೆಯಲಾಗುತ್ತದೆ.
(iii) ಮಧ್ಯಸ್ಥ ಸಂಖ್ಯೆಯನ್ನು $\frac{N}{2}$ ಅಂದರೆ ಈ ಸಂದರ್ಭದಲ್ಲಿ $\frac{50}{2}=\mathbf{2 5}$ ಮೂಲಕ ಪಡೆಯಲಾಗುತ್ತದೆ, ಇದನ್ನು ಟೇಬಲ್ 2.4 ರ ಕಾಲಮ್ 4 ರಲ್ಲಿ ತೋರಿಸಲಾಗಿದೆ.
(iv) ಸಂಚಿತ ಆವರ್ತನ ವಿತರಣೆಯಲ್ಲಿ (F) ಮೇಲಿನಿಂದ ಕೆಳಗೆ ಎಣಿಸಿ, $\frac{N}{2}$ ಗಿಂತ ಮುಂದಿನ ಮೌಲ್ಯ ತಲುಪುವವರೆಗೆ. ಈ ಉದಾಹರಣೆಯಲ್ಲಿ, $\frac{N}{2}$ 25 ಆಗಿದೆ, ಇದು 40-44 ವರ್ಗ ಮಧ್ಯಂತರದಲ್ಲಿ ಬೀಳುತ್ತದೆ, ಇದರ ಸಂಚಿತ ಆವರ್ತನ 37 ಆಗಿದೆ, ಹೀಗಾಗಿ ಪೂರ್ವ-ಮಧ್ಯಸ್ಥ ವರ್ಗದ ಸಂಚಿತ ಆವರ್ತನ 21 ಮತ್ತು ಮಧ್ಯಸ್ಥ ವರ್ಗದ ನಿಜವಾದ ಆವರ್ತನ 16 ಆಗಿದೆ.
(v) ನಂತರ ಮಧ್ಯಸ್ಥವನ್ನು ಹಂತ 4 ರಲ್ಲಿ ನಿರ್ಧರಿಸಲಾದ ಎಲ್ಲಾ ಮೌಲ್ಯಗಳನ್ನು ಈ ಕೆಳಗಿನ ಸಮೀಕರಣದಲ್ಲಿ ಬದಲಿಸುವ ಮೂಲಕ ಲೆಕ್ಕಾಚಾರ ಮಾಡಲಾಗುತ್ತದೆ:
$$ M=l+\frac{i}{f}(m-c) $$
$$ \begin{aligned} & =80+\frac{10}{16}(25-21) \ & =80+\frac{5}{8} \times 4 \ & =80+\frac{5}{2} \ & =80+2.5 \ M & =82.5 \end{aligned} $$
ಬಹುಲಕ
ವಿತರಣೆಯಲ್ಲಿ ಹೆಚ್ಚಾಗಿ ಸಂಭವಿಸುವ ಮೌಲ್ಯವನ್ನು ಬಹುಲಕ ಎಂದು ಕರೆಯಲಾಗುತ್ತದೆ. ಇದನ್ನು $\mathbf{Z}$ ಅಥವಾ $\mathbf{M}_{\mathbf{0}}$ ಎಂದು ಸಂಕೇತಿಸಲಾಗುತ್ತದೆ. ಬಹುಲಕವು ಸರಾಸರಿ ಮತ್ತು ಮಧ್ಯಸ್ಥಕ್ಕೆ ಹೋಲಿಸಿದರೆ ಕಡಿಮೆ ವ್ಯಾಪಕವಾಗಿ ಬಳಸುವ ಅಳತೆಯಾಗಿದೆ. ನೀಡಲಾದ ಡೇಟಾ ಸೆಟ್ನಲ್ಲಿ ಒಂದಕ್ಕಿಂತ ಹೆಚ್ಚು ರೀತಿಯ ಬಹುಲಕಗಳು ಇರಬಹುದು.
ಅಸಮೂಹಿತ ಡೇಟಾಗೆ ಬಹುಲಕ ಲೆಕ್ಕಾಚಾರ
ನೀಡಲಾದ ಡೇಟಾ ಸೆಟ್ಗಳಿಂದ ಬಹುಲಕವನ್ನು ಲೆಕ್ಕಾಚಾರ ಮಾಡುವಾಗ, ಎಲ್ಲಾ ಅಳತೆಗಳನ್ನು ಮೊದಲು ಆರೋಹಣ ಅಥವಾ ಅವರೋಹಣ ಕ್ರಮದಲ್ಲಿ ಜೋಡಿಸಲಾಗುತ್ತದೆ. ಇದು ಹೆಚ್ಚಾಗಿ ಸಂಭವಿಸುವ ಅಳತೆಯನ್ನು ಸುಲಭವಾಗಿ ಗುರುತಿಸಲು ಸಹಾಯ ಮಾಡುತ್ತದೆ.
ಉದಾಹರಣೆ 2.5 : ಹ