ಅಧ್ಯಾಯ 03 ದತ್ತಾಂಶದ ವರ್ಗೀಕರಣ
1. ಪರಿಚಯ
ಹಿಂದಿನ ಅಧ್ಯಾಯದಲ್ಲಿ ದತ್ತಾಂಶವನ್ನು ಹೇಗೆ ಸಂಗ್ರಹಿಸಲಾಗುತ್ತದೆ ಎಂಬುದನ್ನು ನೀವು ಕಲಿತಿದ್ದೀರಿ. ಜನಗಣತಿ ಮತ್ತು ಮಾದರಿ ಸಂಗ್ರಹಣೆಯ ನಡುವಿನ ವ್ಯತ್ಯಾಸವನ್ನೂ ನೀವು ತಿಳಿದುಕೊಂಡಿದ್ದೀರಿ. ಈ ಅಧ್ಯಾಯದಲ್ಲಿ, ನೀವು ಸಂಗ್ರಹಿಸಿದ ದತ್ತಾಂಶಗಳನ್ನು ಹೇಗೆ ವರ್ಗೀಕರಿಸಬೇಕು ಎಂಬುದನ್ನು ನೀವು ತಿಳಿಯುವಿರಿ. ಕಚ್ಚಾ ದತ್ತಾಂಶವನ್ನು ವರ್ಗೀಕರಿಸುವ ಉದ್ದೇಶವೆಂದರೆ ಅವುಗಳಲ್ಲಿ ಕ್ರಮವನ್ನು ತರುವುದು, ಇದರಿಂದಾಗಿ ಅವುಗಳನ್ನು ಮುಂದಿನ ಸಂಖ್ಯಾಶಾಸ್ತ್ರೀಯ ವಿಶ್ಲೇಷಣೆಗೆ ಸುಲಭವಾಗಿ ಒಳಪಡಿಸಬಹುದು.
ನಿಮ್ಮ ಸ್ಥಳೀಯ ಕಸದ ವ್ಯಾಪಾರಿ ಅಥವಾ ಕಬಡಿವಾಲಾಳನ್ನು ನೀವು ಎಂದಾದರೂ ಗಮನಿಸಿದ್ದೀರಾ, ಅವರಿಗೆ ನೀವು ಹಳೆಯ ಪತ್ರಿಕೆಗಳು, ಮುರಿದ ಗೃಹೋಪಯೋಗಿ ವಸ್ತುಗಳು, ಖಾಲಿ ಗಾಜಿನ ಬಾಟಲಿಗಳು, ಪ್ಲಾಸ್ಟಿಕ್ಗಳು ಇತ್ಯಾದಿಗಳನ್ನು ಮಾರುತ್ತೀರಿ? ಅವನು ಈ ವಸ್ತುಗಳನ್ನು ನಿಮ್ಮಿಂದ ಖರೀದಿಸಿ, ಅವುಗಳನ್ನು ಮರುಬಳಕೆ ಮಾಡುವವರಿಗೆ ಮಾರುತ್ತಾನೆ. ಆದರೆ ಅವನ ಅಂಗಡಿಯಲ್ಲಿ ಇಷ್ಟು ಹೆಚ್ಚು ಕಸವಿದ್ದರೆ, ಅವನು ಅವುಗಳನ್ನು ಸರಿಯಾಗಿ ವ್ಯವಸ್ಥೆಗೊಳಿಸದಿದ್ದರೆ, ಅವನ ವ್ಯಾಪಾರವನ್ನು ನಿರ್ವಹಿಸುವುದು ಅವನಿಗೆ ತುಂಬಾ ಕಷ್ಟಕರವಾಗುತ್ತದೆ. ತನ್ನ ಪರಿಸ್ಥಿತಿಯನ್ನು ಸುಲಭಗೊಳಿಸಲು, ಅವನು ವಿವಿಧ ಕಸವನ್ನು ಸೂಕ್ತವಾಗಿ ಗುಂಪು ಮಾಡುತ್ತಾನೆ ಅಥವಾ “ವರ್ಗೀಕರಿಸುತ್ತಾನೆ”. ಅವನು ಹಳೆಯ ಪತ್ರಿಕೆಗಳನ್ನು ಒಟ್ಟಿಗೆ ಇಡುತ್ತಾನೆ ಮತ್ತು ಒಂದು ಹಗ್ಗದಿಂದ ಕಟ್ಟುತ್ತಾನೆ. ನಂತರ ಎಲ್ಲಾ ಖಾಲಿ ಗಾಜಿನ ಬಾಟಲಿಗಳನ್ನು ಒಂದು ಚೀಲದಲ್ಲಿ ಸಂಗ್ರಹಿಸುತ್ತಾನೆ. ಅವನು ಲೋಹದ ವಸ್ತುಗಳನ್ನು ಅಂಗಡಿಯ ಒಂದು ಮೂಲೆಯಲ್ಲಿ ರಾಶಿ ಹಾಕಿ, “ಕಬ್ಬಿಣ”, “ತಾಮ್ರ”, “ಅಲ್ಯೂಮಿನಿಯಂ”, “ಹಿತ್ತಾಳೆ” ಇತ್ಯಾದಿ ಗುಂಪುಗಳಾಗಿ ವಿಂಗಡಿಸುತ್ತಾನೆ. ಈ ರೀತಿಯಾಗಿ ಅವನು ತನ್ನ ಕಸವನ್ನು ವಿಭಿನ್ನ ವರ್ಗಗಳಾಗಿ ಗುಂಪು ಮಾಡುತ್ತಾನೆ - “ಪತ್ರಿಕೆಗಳು”, “ಪ್ಲಾಸ್ಟಿಕ್ಗಳು”, “ಗಾಜು”, “ಲೋಹಗಳು” ಇತ್ಯಾದಿ - ಮತ್ತು ಅವುಗಳಲ್ಲಿ ಕ್ರಮ ತರುತ್ತಾನೆ. ಒಮ್ಮೆ ಅವನ ಕಸವು ಜೋಡಿಸಲ್ಪಟ್ಟು ಮತ್ತು ವರ್ಗೀಕರಿಸಲ್ಪಟ್ಟ ನಂತರ, ಖರೀದಿದಾರನು ಬೇಡಿಕೆ ಮಾಡಬಹುದಾದ ನಿರ್ದಿಷ್ಟ ವಸ್ತುವನ್ನು ಕಂಡುಹಿಡಿಯುವುದು ಅವನಿಗೆ ಸುಲಭವಾಗುತ್ತದೆ.
ಅಂತೆಯೇ, ನೀವು ನಿಮ್ಮ ಶಾಲಾ ಪುಸ್ತಕಗಳನ್ನು ಒಂದು ನಿರ್ದಿಷ್ಟ ಕ್ರಮದಲ್ಲಿ ಜೋಡಿಸಿದಾಗ, ಅವುಗಳನ್ನು ನಿರ್ವಹಿಸುವುದು ನಿಮಗೆ ಸುಲಭವಾಗುತ್ತದೆ. ನೀವು ಅವುಗಳನ್ನು ವಿಷಯಗಳ ಪ್ರಕಾರ ವರ್ಗೀಕರಿಸಬಹುದು, ಅಲ್ಲಿ ಪ್ರತಿ ವಿಷಯವು ಒಂದು ಗುಂಪು ಅಥವಾ ವರ್ಗವಾಗುತ್ತದೆ. ಆದ್ದರಿಂದ, ಉದಾಹರಣೆಗೆ, ನಿಮಗೆ ಇತಿಹಾಸದ ಒಂದು ನಿರ್ದಿಷ್ಟ ಪುಸ್ತಕ ಬೇಕಾದಾಗ, ನೀವು ಮಾಡಬೇಕಾಗಿರುವುದು “ಇತಿಹಾಸ” ಗುಂಪಿನಲ್ಲಿ ಆ ಪುಸ್ತಕವನ್ನು ಹುಡುಕುವುದು ಮಾತ್ರ. ಇಲ್ಲದಿದ್ದರೆ, ನೀವು ಹುಡುಕುತ್ತಿರುವ ನಿರ್ದಿಷ್ಟ ಪುಸ್ತಕವನ್ನು ಕಂಡುಹಿಡಿಯಲು ನಿಮ್ಮ ಸಂಪೂರ್ಣ ಸಂಗ್ರಹದ ಮೂಲಕ ಹುಡುಕಬೇಕಾಗುತ್ತದೆ.
ವಸ್ತುಗಳನ್ನು ಅಥವಾ ವಸ್ತುಗಳ ವರ್ಗೀಕರಣವು ನಮ್ಮ ಬೆಲೆಬಾಳುವ ಸಮಯ ಮತ್ತು ಶ್ರಮವನ್ನು ಉಳಿಸುತ್ತದೆ, ಆದರೆ ಅದನ್ನು ನಿರಂಕುಶ ರೀತಿಯಲ್ಲಿ ಮಾಡಲಾಗುವುದಿಲ್ಲ. ಕಬಡಿವಾಲನು ಮರುಬಳಕೆಯ ಸರಕುಗಳ ಮಾರುಕಟ್ಟೆಗಳ ಪ್ರಕಾರ ತನ್ನ ಕಸವನ್ನು ಗುಂಪು ಮಾಡುತ್ತಾನೆ. ಉದಾಹರಣೆಗೆ, “ಗಾಜು” ಗುಂಪಿನ ಅಡಿಯಲ್ಲಿ ಅವನು ಖಾಲಿ ಬಾಟಲಿಗಳು, ಮುರಿದ ಕನ್ನಡಿಗಳು ಮತ್ತು ಕಿಟಕಿಯ ಗಾಜುಗಳು ಇತ್ಯಾದಿಗಳನ್ನು ಇಡುತ್ತಾನೆ. ಅಂತೆಯೇ, ನೀವು ನಿಮ್ಮ ಇತಿಹಾಸದ ಪುಸ್ತಕಗಳನ್ನು “ಇತಿಹಾಸ” ಗುಂಪಿನ ಅಡಿಯಲ್ಲಿ ವರ್ಗೀಕರಿಸುವಾಗ, ನೀವು ಬೇರೆ ವಿಷಯದ ಪುಸ್ತಕವನ್ನು ಆ ಗುಂಪಿನಲ್ಲಿ ಇಡುವುದಿಲ್ಲ. ಇಲ್ಲದಿದ್ದರೆ ಗುಂಪು ಮಾಡುವ ಸಂಪೂರ್ಣ ಉದ್ದೇಶವೇ ನಷ್ಟವಾಗುತ್ತದೆ. ಆದ್ದರಿಂದ, ವರ್ಗೀಕರಣ ಎಂದರೆ ಕೆಲವು ಮಾನದಂಡಗಳ ಆಧಾರದ ಮೇಲೆ ವಸ್ತುಗಳನ್ನು ಗುಂಪುಗಳಾಗಿ ಅಥವಾ ವರ್ಗಗಳಾಗಿ ಜೋಡಿಸುವುದು ಅಥವಾ ವ್ಯವಸ್ಥೆಗೊಳಿಸುವುದು.
ಕಾರ್ಯಾಚರಣೆ
- ಅಕ್ಷರಗಳನ್ನು ಹೇಗೆ ವಿಂಗಡಿಸಲಾಗುತ್ತದೆ ಎಂಬುದನ್ನು ಕಂಡುಹಿಡಿಯಲು ನಿಮ್ಮ ಸ್ಥಳೀಯ ಅಂಚೆ ಕಚೇರಿಗೆ ಭೇಟಿ ನೀಡಿ. ಅಂಚೆಯಲ್ಲಿನ ಪಿನ್-ಕೋಡ್ ಏನನ್ನು ಸೂಚಿಸುತ್ತದೆ ಎಂದು ನಿಮಗೆ ತಿಳಿದಿದೆಯೇ? ನಿಮ್ಮ ಅಂಚೆ ಕಾರ್ಯನಿರ್ವಾಹಕರನ್ನು ಕೇಳಿ.
2. ಕಚ್ಚಾ ದತ್ತಾಂಶ
ಕಬಡಿವಾಲನ ಕಸದಂತೆ, ವರ್ಗೀಕರಿಸದ ದತ್ತಾಂಶ ಅಥವಾ ಕಚ್ಚಾ ದತ್ತಾಂಶವು ಬಹಳ ಅಸಂಘಟಿತವಾಗಿರುತ್ತದೆ. ಅವು ಸಾಮಾನ್ಯವಾಗಿ ತುಂಬಾ ದೊಡ್ಡದಾಗಿರುತ್ತವೆ ಮತ್ತು ನಿರ್ವಹಿಸಲು ತೊಡಕಾಗಿರುತ್ತವೆ. ಅವುಗಳಿಂದ ಅರ್ಥಪೂರ್ಣ ತೀರ್ಮಾನಗಳನ್ನು ತೆಗೆದುಕೊಳ್ಳುವುದು ಬೇಸರದ ಕೆಲಸವಾಗಿದೆ ಏಕೆಂದರೆ ಅವು ಸಂಖ್ಯಾಶಾಸ್ತ್ರೀಯ ವಿಧಾನಗಳಿಗೆ ಸುಲಭವಾಗಿ ಒಳಪಡುವುದಿಲ್ಲ. ಆದ್ದರಿಂದ, ಯಾವುದೇ ವ್ಯವಸ್ಥಿತ ಸಂಖ್ಯಾಶಾಸ್ತ್ರೀಯ ವಿಶ್ಲೇಷಣೆಯನ್ನು ಕೈಗೊಳ್ಳುವ ಮೊದಲು ಅಂತಹ ದತ್ತಾಂಶದ ಸರಿಯಾದ ಸಂಘಟನೆ ಮತ್ತು ಪ್ರಸ್ತುತಿ ಅಗತ್ಯವಿದೆ. ಆದ್ದರಿಂದ ದತ್ತಾಂಶವನ್ನು ಸಂಗ್ರಹಿಸಿದ ನಂತರದ ಹಂತವೆಂದರೆ ಅವುಗಳನ್ನು ವರ್ಗೀಕರಿಸಿದ ರೂಪದಲ್ಲಿ ಸಂಘಟಿಸುವುದು ಮತ್ತು ಪ್ರಸ್ತುತಪಡಿಸುವುದು.
ನಿಮ್ಮ ಶಾಲೆಯ 100 ವಿದ್ಯಾರ್ಥಿಗಳ ಗಣಿತದ ಅಂಕಗಳ ಬಗ್ಗೆ ನೀವು ದತ್ತಾಂಶವನ್ನು ಸಂಗ್ರಹಿಸಿದ್ದೀರಿ ಎಂದು ಭಾವಿಸಿ. ನೀವು ಅವುಗಳನ್ನು ಒಂದು ಕೋಷ್ಟಕವಾಗಿ ಪ್ರಸ್ತುತಪಡಿಸಿದರೆ, ಅವು ಕೋಷ್ಟಕ 3.1 ರಂತೆ ಕಾಣಿಸಬಹುದು.
ಕೋಷ್ಟಕ 3.1 ಪರೀಕ್ಷೆಯಲ್ಲಿ 100 ವಿದ್ಯಾರ್ಥಿಗಳು ಪಡೆದ ಗಣಿತದ ಅಂಕಗಳು
| 47 | 45 | 10 | 60 | 51 | 56 | 66 | 100 | 49 | 40 |
| 60 | 59 | 56 | 55 | 62 | 48 | 59 | 55 | 51 | 41 |
| 42 | 69 | 64 | 66 | 50 | 59 | 57 | 65 | 62 | 50 |
| 64 | 30 | 37 | 75 | 17 | 56 | 20 | 14 | 55 | 90 |
| 62 | 51 | 55 | 14 | 25 | 34 | 90 | 49 | 56 | 54 |
| 70 | 47 | 49 | 82 | 40 | 82 | 60 | 85 | 65 | 66 |
| 49 | 44 | 64 | 69 | 70 | 48 | 12 | 28 | 55 | 65 |
| 49 | 40 | 25 | 41 | 71 | 80 | 0 | 56 | 14 | 22 |
| 66 | 53 | 46 | 70 | 43 | 61 | 59 | 12 | 30 | 35 |
| 45 | 44 | 57 | 76 | 82 | 39 | 32 | 14 | 90 | 25 |
ಅಥವಾ ನಿಮ್ಮ ನೆರೆಹೊರೆಯ 50 ಕುಟುಂಬಗಳ ಮಾಸಿಕ ಆಹಾರ ಖರ್ಚಿನ ಬಗ್ಗೆ ದತ್ತಾಂಶವನ್ನು ಸಂಗ್ರಹಿಸಿ, ಅವರ ಸರಾಸರಿ ಆಹಾರ ಖರ್ಚು ತಿಳಿಯಲು ಬಯಸಬಹುದು. ಸಂಗ್ರಹಿಸಿದ ದತ್ತಾಂಶವನ್ನು, ಆ ಸಂದರ್ಭದಲ್ಲಿ, ನೀವು ಕೋಷ್ಟಕವಾಗಿ ಪ್ರಸ್ತುತಪಡಿಸಿದ್ದರೆ, ಕೋಷ್ಟಕ 3.2 ಗೆ ಹೋಲುತ್ತದೆ. ಕೋಷ್ಟಕ 3.1 ಮತ್ತು 3.2 ಎರಡೂ ಕಚ್ಚಾ ಅಥವಾ ವರ್ಗೀಕರಿಸದ ದತ್ತಾಂಶವಾಗಿದೆ. ಎರಡೂ ಕೋಷ್ಟಕಗಳಲ್ಲಿ ಸಂಖ್ಯೆಗಳು ಯಾವುದೇ ಕ್ರಮದಲ್ಲಿ ಜೋಡಿಸಲ್ಪಟ್ಟಿಲ್ಲ ಎಂದು ನೀವು ಕಾಣುತ್ತೀರಿ. ಈಗ ನೀವು ಕೋಷ್ಟಕ 3.1 ರಿಂದ ಗಣಿತದಲ್ಲಿ ಅತ್ಯಧಿಕ ಅಂಕಗಳನ್ನು ಕೇಳಿದರೆ, ನೀವು ಮೊದಲು 100 ವಿದ್ಯಾರ್ಥಿಗಳ ಅಂಕಗಳನ್ನು ಆರೋಹಣ ಅಥವಾ ಅವರೋಹಣ ಕ್ರಮದಲ್ಲಿ ಜೋಡಿಸಬೇಕಾಗುತ್ತದೆ. ಅದು ಬೇಸರದ ಕೆಲಸವಾಗಿದೆ. 100 ಬದಲಿಗೆ ನೀವು 1,000 ವಿದ್ಯಾರ್ಥಿಗಳ ಅಂಕಗಳನ್ನು ನಿರ್ವಹಿಸಬೇಕಾದರೆ ಅದು ಇನ್ನಷ್ಟು ಬೇಸರದ ಕೆಲಸವಾಗುತ್ತದೆ. ಅಂತೆಯೇ, ಕೋಷ್ಟಕ 3.2 ರಲ್ಲಿ, 50 ಕುಟುಂಬಗಳ ಸರಾಸರಿ ಮಾಸಿಕ ಖರ್ಚನ್ನು ನಿರ್ಧರಿಸುವುದು ನಿಮಗೆ ಕಷ್ಟಕರವಾಗಿದೆ ಎಂದು ನೀವು ಗಮನಿಸುತ್ತೀರಿ. ಮತ್ತು ಸಂಖ್ಯೆಯು ದೊಡ್ಡದಾಗಿದ್ದರೆ - ಹೇಳಿ, 5,000 ಕುಟುಂಬಗಳು - ಈ ತೊಂದರೆ ಅನೇಕ ಪಟ್ಟು ಹೆಚ್ಚಾಗುತ್ತದೆ. ನಮ್ಮ ಕಬಡಿವಾಲನಂತೆ, ಅವನ ಕಸವು ದೊಡ್ಡದಾಗಿ ಮತ್ತು ಅಸ್ತವ್ಯಸ್ತವಾಗಿದ್ದಾಗ ಒಂದು ನಿರ್ದಿಷ್ಟ ವಸ್ತುವನ್ನು ಕಂಡುಹಿಡಿಯಲು ಅವನು ತೊಂದರೆಗೊಳಗಾಗುತ್ತಾನೆ, ದೊಡ್ಡದಾಗಿರುವ ಕಚ್ಚಾ ದತ್ತಾಂಶದಿಂದ ಯಾವುದೇ ಮಾಹಿತಿಯನ್ನು ಪಡೆಯಲು ನೀವು ಪ್ರಯತ್ನಿಸಿದಾಗ ನೀವು ಇದೇ ರೀತಿಯ ಪರಿಸ್ಥಿತಿಯನ್ನು ಎದುರಿಸುತ್ತೀರಿ. ಒಂದು ಪದದಲ್ಲಿ, ಆದ್ದರಿಂದ, ದೊಡ್ಡ ವರ್ಗೀಕರಿಸದ ದತ್ತಾಂಶದಿಂದ ಮಾಹಿತಿಯನ್ನು ಹೊರತೆಗೆಯುವುದು ಬೇಸರದ ಕೆಲಸವಾಗಿದೆ.
ಕೋಷ್ಟಕ 3.2 50 ಕುಟುಂಬಗಳ ಮಾಸಿಕ ಗೃಹೋಪಯೋಗಿ ಆಹಾರ ಖರ್ಚು (ರೂಪಾಯಿಗಳಲ್ಲಿ)
| — | — | — | — | — |
|---|---|---|---|---|
| 1904 | 1559 | 3473 | 1735 | 2760 |
| 2041 | 1612 | 1753 | 1855 | 4439 |
| 5090 | 1085 | 1823 | 2346 | 1523 |
| 1211 | 1360 | 1110 | 2152 | 1183 |
| 1218 | 1315 | 1105 | 2628 | 2712 |
| 4248 | 1812 | 1264 | 1183 | 1171 |
| 1007 | 1180 | 1953 | 1137 | 2048 |
| 2025 | 1583 | 1324 | 2621 | 3676 |
| 1397 | 1832 | 1962 | 2177 | 2575 |
| 1293 | 1365 | 1146 | 3222 | 1396 |
ಕಚ್ಚಾ ದತ್ತಾಂಶವನ್ನು ಸಂಕ್ಷೇಪಿಸಲಾಗುತ್ತದೆ ಮತ್ತು ವರ್ಗೀಕರಣದಿಂದ ಅರ್ಥವಾಗುವಂತೆ ಮಾಡಲಾಗುತ್ತದೆ. ಒಂದೇ ರೀತಿಯ ಗುಣಲಕ್ಷಣಗಳ ಸಂಗತಿಗಳನ್ನು ಒಂದೇ ವರ್ಗದಲ್ಲಿ ಇರಿಸಿದಾಗ, ಅವುಗಳನ್ನು ಸುಲಭವಾಗಿ ಕಂಡುಹಿಡಿಯಲು, ಹೋಲಿಕೆ ಮಾಡಲು ಮತ್ತು ಯಾವುದೇ ತೊಂದರೆ ಇಲ್ಲದೆ ತೀರ್ಮಾನಗಳನ್ನು ತೆಗೆದುಕೊಳ್ಳಲು ಸಾಧ್ಯವಾಗುತ್ತದೆ. ನೀವು ಅಧ್ಯಾಯ 2 ರಲ್ಲಿ ಅಧ್ಯಯನ ಮಾಡಿದಂತೆ, ಭಾರತ ಸರ್ಕಾರವು ಪ್ರತಿ ಹತ್ತು ವರ್ಷಗಳಿಗೊಮ್ಮೆ ಜನಗಣತಿಯನ್ನು ನಡೆಸುತ್ತದೆ. 2001 ರ ಜನಗಣತಿಯಲ್ಲಿ ಸುಮಾರು 20 ಕೋಟಿ ಜನರನ್ನು ಸಂಪರ್ಕಿಸಲಾಗಿದೆ. ಜನಗಣತಿಯ ಕಚ್ಚಾ ದತ್ತಾಂಶವು ತುಂಬಾ ದೊಡ್ಡದಾಗಿದೆ ಮತ್ತು ತುಂಡು ತುಂಡಾಗಿದೆ, ಅವುಗಳಿಂದ ಯಾವುದೇ ಅರ್ಥಪೂರ್ಣ ತೀರ್ಮಾನವನ್ನು ತೆಗೆದುಕೊಳ್ಳುವುದು ಬಹುತೇಕ ಅಸಾಧ್ಯ ಕಾರ್ಯವೆಂದು ತೋರುತ್ತದೆ. ಆದರೆ ಅದೇ ದತ್ತಾಂಶವನ್ನು ಲಿಂಗ, ಶಿಕ್ಷಣ, ವೈವಾಹಿಕ ಸ್ಥಿತಿ, ಉದ್ಯೋಗ ಇತ್ಯಾದಿಗಳ ಪ್ರಕಾರ ವರ್ಗೀಕರಿಸಿದಾಗ, ಭಾರತದ ಜನಸಂಖ್ಯೆಯ ರಚನೆ ಮತ್ತು ಸ್ವರೂಪವನ್ನು ನಂತರ ಸುಲಭವಾಗಿ ಅರ್ಥಮಾಡಿಕೊಳ್ಳಲಾಗುತ್ತದೆ.
ಕಚ್ಚಾ ದತ್ತಾಂಶವು ಚರಾಂಶಗಳ ಮೇಲಿನ ಅವಲೋಕನಗಳನ್ನು ಒಳಗೊಂಡಿರುತ್ತದೆ. ಕೋಷ್ಟಕ 3.1 ಮತ್ತು 3.2 ರಲ್ಲಿ ನೀಡಲಾದ ಕಚ್ಚಾ ದತ್ತಾಂಶವು ಒಂದು ನಿರ್ದಿಷ್ಟ ಅಥವಾ ಚರಾಂಶಗಳ ಗುಂಪಿನ ಮೇಲಿನ ಅವಲೋಕನಗಳನ್ನು ಒಳಗೊಂಡಿರುತ್ತದೆ. ಉದಾಹರಣೆಗೆ ಕೋಷ್ಟಕ 3.1 ಅನ್ನು ನೋಡಿ, ಇದು 100 ವಿದ್ಯಾರ್ಥಿಗಳು ಗಳಿಸಿದ ಗಣಿತದ ಅಂಕಗಳನ್ನು ಒಳಗೊಂಡಿದೆ. ಈ ಅಂಕಗಳಿಂದ ನಾವು ಹೇಗೆ ಅರ್ಥ ಮಾಡಿಕೊಳ್ಳಬಹುದು? ಈ ಅಂಕಗಳನ್ನು ನೋಡುವ ಗಣಿತ ಶಿಕ್ಷಕರು ಯೋಚಿಸುತ್ತಿರಬಹುದು-ನನ್ನ ವಿದ್ಯಾರ್ಥಿಗಳು ಹೇಗೆ ಮಾಡಿದ್ದಾರೆ? ಎಷ್ಟು ಮಂದಿ ಉತ್ತೀರ್ಣರಾಗಿಲ್ಲ? ನಾವು ದತ್ತಾಂಶವನ್ನು ಹೇಗೆ ವರ್ಗೀಕರಿಸುತ್ತೇವೆ ಎಂಬುದು ನಮ್ಮ ಮನಸ್ಸಿನಲ್ಲಿರುವ ಉದ್ದೇಶವನ್ನು ಅವಲಂಬಿಸಿರುತ್ತದೆ. ಈ ಸಂದರ್ಭದಲ್ಲಿ, ಶಿಕ್ಷಕರು ಕೆಲವು ಆಳದಲ್ಲಿ ಅರ್ಥಮಾಡಿಕೊಳ್ಳಲು ಬಯಸುತ್ತಾರೆ- ಈ ವಿದ್ಯಾರ್ಥಿಗಳು ಹೇಗೆ ಮಾಡಿದ್ದಾರೆ. ಅವರು ಬಹುಶಃ ಆವೃತ್ತಿ ವಿತರಣೆಯನ್ನು ರಚಿಸಲು ಆಯ್ಕೆ ಮಾಡುತ್ತಾರೆ. ಇದನ್ನು ಮುಂದಿನ ವಿಭಾಗದಲ್ಲಿ ಚರ್ಚಿಸಲಾಗಿದೆ.
ಕಾರ್ಯಾಚರಣೆ
- ಒಂದು ವರ್ಷದ ನಿಮ್ಮ ಕುಟುಂಬದ ಒಟ್ಟು ಸಾಪ್ತಾಹಿಕ ಖರ್ಚಿನ ದತ್ತಾಂಶವನ್ನು ಸಂಗ್ರಹಿಸಿ ಮತ್ತು ಅದನ್ನು ಕೋಷ್ಟಕದಲ್ಲಿ ಜೋಡಿಸಿ. ನೀವು ಎಷ್ಟು ಅವಲೋಕನಗಳನ್ನು ಹೊಂದಿದ್ದೀರಿ ಎಂಬುದನ್ನು ನೋಡಿ. ದತ್ತಾಂಶವನ್ನು ಮಾಸಿಕವಾಗಿ ಜೋಡಿಸಿ ಮತ್ತು ಅವಲೋಕನಗಳ ಸಂಖ್ಯೆಯನ್ನು ಕಂಡುಹಿಡಿಯಿರಿ.
3. ದತ್ತಾಂಶದ ವರ್ಗೀಕರಣ
ವರ್ಗೀಕರಣದ ಗುಂಪುಗಳು ಅಥವಾ ವರ್ಗಗಳನ್ನು ವಿವಿಧ ರೀತಿಯಲ್ಲಿ ಮಾಡಲಾಗುತ್ತದೆ. ನಿಮ್ಮ ಪುಸ್ತಕಗಳನ್ನು ವಿಷಯಗಳ ಪ್ರಕಾರ - “ಇತಿಹಾಸ”, “ಭೂಗೋಳ”, “ಗಣಿತ”, “ವಿಜ್ಞಾನ” ಇತ್ಯಾದಿ - ವರ್ಗೀಕರಿಸುವ ಬದಲು, ನೀವು ಅವುಗಳನ್ನು ಲೇಖಕರ ಪ್ರಕಾರ ವರ್ಣಮಾಲೆಯ ಕ್ರಮದಲ್ಲಿ ವರ್ಗೀಕರಿಸಬಹುದಿತ್ತು. ಅಥವಾ, ನೀವು ಅವುಗಳನ್ನು ಪ್ರಕಟಣೆಯ ವರ್ಷದ ಪ್ರಕಾರವೂ ವರ್ಗೀಕರಿಸಬಹುದಿತ್ತು. ನೀವು ಅವುಗಳನ್ನು ಹೇಗೆ ವರ್ಗೀಕರಿಸಲು ಬಯಸುತ್ತೀರಿ ಎಂಬುದು ನಿಮ್ಮ ಅವಶ್ಯಕತೆಯನ್ನು ಅವಲಂಬಿಸಿರುತ್ತದೆ.
ಅಂತೆಯೇ ಕಚ್ಚಾ ದತ್ತಾಂಶವನ್ನು ಉದ್ದೇಶವನ್ನು ಅವಲಂಬಿಸಿ ವಿವಿಧ ರೀತಿಯಲ್ಲಿ ವರ್ಗೀಕರಿಸಲಾಗುತ್ತದೆ. ಅವುಗಳನ್ನು ಸಮಯದ ಪ್ರಕಾರ ಗುಂಪು ಮಾಡಬಹುದು. ಅಂತಹ ವರ್ಗೀಕರಣವನ್ನು ಕಾಲಾನುಕ್ರಮದ ವರ್ಗೀಕರಣ ಎಂದು ಕರೆಯಲಾಗುತ್ತದೆ. ಅಂತಹ ವರ್ಗೀಕರಣದಲ್ಲಿ, ದತ್ತಾಂಶವನ್ನು ವರ್ಷಗಳು, ತ್ರೈಮಾಸಿಕಗಳು, ತಿಂಗಳುಗಳು, ವಾರಗಳು ಇತ್ಯಾದಿ ಸಮಯಕ್ಕೆ ಸಂಬಂಧಿಸಿದಂತೆ ಆರೋಹಣ ಅಥವಾ ಅವರೋಹಣ ಕ್ರಮದಲ್ಲಿ ವರ್ಗೀಕರಿಸಲಾಗುತ್ತದೆ. ಈ ಕೆಳಗಿನ ಉದಾಹರಣೆಯು ವರ್ಷಗಳ ಪ್ರಕಾರ ವರ್ಗೀಕರಿಸಲ್ಪಟ್ಟ ಭಾರತದ ಜನಸಂಖ್ಯೆಯನ್ನು ತೋರಿಸುತ್ತದೆ. ‘ಜನಸಂಖ್ಯೆ’ ಚರಾಂಶವು ಒಂದು ಕಾಲಾನುಕ್ರಮ ಶ್ರೇಣಿಯಾಗಿದೆ ಏಕೆಂದರೆ ಇದು ವಿವಿಧ ವರ್ಷಗಳಿಗೆ ಮೌಲ್ಯಗಳ ಶ್ರೇಣಿಯನ್ನು ಚಿತ್ರಿಸುತ್ತದೆ.
ಉದಾಹರಣೆ 1
ಭಾರತದ ಜನಸಂಖ್ಯೆ (ಕೋಟಿಗಳಲ್ಲಿ)
| ವರ್ಷ | ಜನಸಂಖ್ಯೆ (ಕೋಟಿ) |
|---|---|
| 1951 | 35.7 |
| 1961 | 43.8 |
| 1971 | 54.6 |
| 1981 | 68.4 |
| 1991 | 81.8 |
| 2001 | 102.7 |
| 2011 | 121.0 |
ಸ್ಥಳಿಕ ವರ್ಗೀಕರಣದಲ್ಲಿ ದತ್ತಾಂಶವನ್ನು ದೇಶಗಳು, ರಾಜ್ಯಗಳು, ನಗರಗಳು, ಜಿಲ್ಲೆಗಳು ಇತ್ಯಾದಿ ಭೌಗೋಳಿಕ ಸ್ಥಳಗಳಿಗೆ ಸಂಬಂಧಿಸಿದಂತೆ ವರ್ಗೀಕರಿಸಲಾಗುತ್ತದೆ.
ಉದಾಹರಣೆ 2 ವಿವಿಧ ದೇಶಗಳಲ್ಲಿ ಗೋಧಿ ಇಳುವರಿಯನ್ನು ತೋರಿಸುತ್ತದೆ.
ಉದಾಹರಣೆ 2
ವಿವಿಧ ದೇಶಗಳ ಗೋಧಿ ಇಳುವರಿ (2013)
| ದೇಶ | ಗೋಧಿ ಇಳುವರಿ (ಕೆಜಿ/ಹೆಕ್ಟೇರ್) |
|---|---|
| ಕೆನಡಾ | 3594 |
| ಚೀನಾ | 5055 |
| ಫ್ರಾನ್ಸ್ | 7254 |
| ಜರ್ಮನಿ | 7998 |
| ಭಾರತ | 3154 |
| ಪಾಕಿಸ್ತಾನ | 2787 |
ಮೂಲ: ಭಾರತೀಯ ಕೃಷಿ ಅಂಕಿಅಂಶಗಳು ಒಂದು ನೋಟದಲ್ಲಿ, 2015
ಕಾರ್ಯಾಚರಣೆಗಳು
- ಉದಾಹರಣೆ 1 ರಲ್ಲಿ, ಭಾರತದ ಜನಸಂಖ್ಯೆ ಕನಿಷ್ಠ ಮತ್ತು ಗರಿಷ್ಠವಾಗಿದ್ದ ವರ್ಷಗಳನ್ನು ಕಂಡುಹಿಡಿಯಿರಿ,
- ಉದಾಹರಣೆ 2 ರಲ್ಲಿ, ಭಾರತದ ಇಳುವರಿಗಿಂತ ಸ್ವಲ್ಪ ಹೆಚ್ಚು ಗೋಧಿ ಇಳುವರಿ ಹೊಂದಿರುವ ದೇಶವನ್ನು ಕಂಡುಹಿಡಿಯಿರಿ. ಅದು ಶೇಕಡಾವಾರು ಪ್ರಮಾಣದಲ್ಲಿ ಎಷ್ಟು ಇರುತ್ತದೆ?
- ಉದಾಹರಣೆ 2 ರ ದೇಶಗಳನ್ನು ಇಳುವರಿಯ ಆರೋಹಣ ಕ್ರಮದಲ್ಲಿ ಜೋಡಿಸಿ. ಇಳುವರಿಯ ಅವರೋಹಣ ಕ್ರಮಕ್ಕೆ ಅದೇ ವ್ಯಾಯಾಮವನ್ನು ಮಾಡಿ.
ಕೆಲವೊಮ್ಮೆ ನೀವು ಪರಿಮಾಣಾತ್ಮಕವಾಗಿ ವ್ಯಕ್ತಪಡಿಸಲಾಗದ ಗುಣಲಕ್ಷಣಗಳನ್ನು ಎದುರಿಸುತ್ತೀರಿ. ಅಂತಹ ಗುಣಲಕ್ಷಣಗಳನ್ನು ಗುಣಲಕ್ಷಣಗಳು ಎಂದು ಕರೆಯಲಾಗುತ್ತದೆ. ಉದಾಹರಣೆಗೆ, ರಾಷ್ಟ್ರೀಯತೆ, ಸಾಕ್ಷರತೆ, ಧರ್ಮ, ಲಿಂಗ, ವೈವಾಹಿಕ ಸ್ಥಿತಿ ಇತ್ಯಾದಿ. ಅವುಗಳನ್ನು ಅಳೆಯಲಾಗುವುದಿಲ್ಲ. ಆದರೆ ಈ ಗುಣಲಕ್ಷಣಗಳನ್ನು ಗುಣಾತ್ಮಕ ಗುಣಲಕ್ಷಣದ ಉಪಸ್ಥಿತಿ ಅಥವಾ ಅನುಪಸ್ಥಿತಿಯ ಆಧಾರದ ಮೇಲೆ ವರ್ಗೀಕರಿಸಬಹುದು. ಗುಣಲಕ್ಷಣಗಳ ಮೇಲಿನ ದತ್ತಾಂಶದ ಅಂತಹ ವರ್ಗೀಕರಣವನ್ನು ಗುಣಾತ್ಮಕ ವರ್ಗೀಕರಣ ಎಂದು ಕರೆಯಲಾಗುತ್ತದೆ. ಈ ಕೆಳಗಿನ ಉದಾಹರಣೆಯಲ್ಲಿ, ಒಂದು ದೇಶದ ಜನಸಂಖ್ಯೆಯನ್ನು ಗುಣಾತ್ಮಕ ಚರಾಂಶ “ಲಿಂಗ"ದ ಆಧಾರದ ಮೇಲೆ ಗುಂಪು ಮಾಡಲಾಗಿದೆ ಎಂದು ನಾವು ಕಾಣುತ್ತೇವೆ. ಒಂದು ಅವಲೋಕನವು ಪುರುಷ ಅಥವಾ ಸ್ತ್ರೀ ಆಗಿರಬಹುದು. ಈ ಎರಡು ಗುಣಲಕ್ಷಣಗಳನ್ನು ಕೆಳಗೆ ನೀಡಿರುವಂತೆ ವೈವಾಹಿಕ ಸ್ಥಿತಿಯ ಆಧಾರದ ಮೇಲೆ ಮತ್ತಷ್ಟು ಉಪವಿಭಾಗಿಸಬಹುದು:
ಉದಾಹರಣೆ 3
ಮೊದಲ ಹಂತದ ವರ್ಗೀಕರಣವು ಒಂದು ಗುಣಲಕ್ಷಣದ ಉಪಸ್ಥಿತಿ ಮತ್ತು ಅನುಪಸ್ಥಿತಿಯ ಆಧಾರದ ಮೇಲೆ ಇದೆ, ಅಂದರೆ ಪುರುಷ ಅಥವಾ ಪುರುಷ ಅಲ್ಲ (ಸ್ತ್ರೀ). ಎರಡನೇ ಹಂತದಲ್ಲಿ, ಪ್ರತಿ ವರ್ಗ - ಪುರುಷ ಮತ್ತು ಸ್ತ್ರೀ, ಇನ್ನೊಂದು ಗುಣಲಕ್ಷಣದ ಉಪಸ್ಥಿತಿ ಅಥವಾ ಅನುಪಸ್ಥಿತಿಯ ಆಧಾರದ ಮೇಲೆ ಮತ್ತಷ್ಟು ಉಪವಿಭಾಗಿಸಲ್ಪಡುತ್ತದೆ, ಅಂದರೆ ವಿವಾಹಿತ ಅಥವಾ ಅವಿವಾಹಿತ. ಎತ್ತರ, ತೂಕ, ವಯಸ್ಸು, ಆದಾಯ, ವಿದ್ಯಾರ್ಥಿಗಳ ಅಂಕಗಳು ಇತ್ಯಾದಿ ಗುಣಲಕ್ಷಣಗಳು ಪರಿಮಾಣಾತ್ಮಕ ಸ್ವಭಾವದ್ದಾಗಿವೆ. ಅಂತಹ ಗುಣಲಕ್ಷಣಗಳ ಸಂಗ್ರಹಿತ ದತ್ತಾಂಶವನ್ನು ವರ್ಗಗಳಾಗಿ ಗುಂಪು ಮಾಡಿದಾಗ, ಅದು ಪರಿಮಾಣಾತ್ಮಕ ವರ್ಗೀಕರಣವಾಗುತ್ತದೆ.
ಕಾರ್ಯಾಚರಣೆ
- ಸುತ್ತಮುತ್ತಲಿನ ವಸ್ತುಗಳನ್ನು ಜೀವಂತ ಅಥವಾ ನಿರ್ಜೀವ ಎಂದು ಗುಂಪು ಮಾಡಬಹುದು. ಇದು ಪರಿಮಾಣಾತ್ಮಕ ವರ್ಗೀಕರಣವೇ?
ಉದಾಹರಣೆ 4
100 ವಿದ್ಯಾರ್ಥಿಗಳ ಗಣಿತದ ಅಂಕಗಳ ಆವೃತ್ತಿ ವಿತರಣೆ
| ಅಂಕಗಳು | ಆವೃತ್ತಿ |
|---|---|
| 0-10 | 1 |
| 10-20 | 8 |
| 20-30 | 6 |
| 30-40 | 7 |
| 40-50 | 21 |
| 50-60 | 23 |
| 60-70 | 19 |
| 70-80 | 6 |
| 80-90 | 5 |
| 90-100 | 4 |
| ಒಟ್ಟು | 100 |
ಉದಾಹರಣೆ 4 ಕೋಷ್ಟಕ 3.1 ರಲ್ಲಿ ನೀಡಲಾದ 100 ವಿದ್ಯಾರ್ಥಿಗಳ ಗಣಿತದ ಅಂಕಗಳ ಪರಿಮಾಣಾತ್ಮಕ ವರ್ಗೀಕರಣವನ್ನು ತೋರಿಸುತ್ತದೆ.
ಕಾರ್ಯಾಚರಣೆ
- ಉದಾಹರಣೆ 4 ರ ಆವೃತ್ತಿಯ ಮೌಲ್ಯಗಳನ್ನು ಒಟ್ಟು ಆವೃತ್ತಿಯ ಪ್ರಮಾಣ ಅಥವಾ ಶೇಕಡಾವಾರು ಪ್ರಮಾಣದಲ್ಲಿ ವ್ಯಕ್ತಪಡಿಸಿ. ಈ ರೀತಿಯಲ್ಲಿ ವ್ಯಕ್ತಪಡಿಸಲಾದ ಆವೃತ್ತಿಯನ್ನು ಸಾಪೇಕ್ಷ ಆವೃತ್ತಿ ಎಂದು ಕರೆಯಲಾಗುತ್ತದೆ ಎಂಬುದನ್ನು ಗಮನಿಸಿ.
- ಉದಾಹರಣೆ 4 ರಲ್ಲಿ, ಯಾವ ವರ್ಗವು ದತ್ತಾಂಶದ ಗರಿಷ್ಠ ಸಾಂದ್ರತೆಯನ್ನು ಹೊಂದಿದೆ? ಅದನ್ನು ಒಟ್ಟು ಅವಲೋಕನಗಳ ಶೇಕಡಾವಾರು ಪ್ರಮಾಣದಲ್ಲಿ ವ್ಯಕ್ತಪಡಿಸಿ. ಯಾವ ವರ್ಗವು ಕನಿಷ್ಠ ಸಾಂದ್ರತೆಯ ದತ್ತಾಂಶವನ್ನು ಹೊಂದಿದೆ?
4. ಚರಾಂಶಗಳು: ಸತತ ಮತ್ತು ವಿವಿಕ್ತ
ಚರಾಂಶದ ಸರಳ ವ್ಯಾಖ್ಯಾನ, ನೀವು ಕಳೆದ ಅಧ್ಯಾಯದಲ್ಲಿ ಓದಿದ್ದೀರಿ, ಅದು ಹೇಗೆ ಬದಲಾಗುತ್ತದೆ ಎಂಬುದನ್ನು ನಿಮಗೆ ಹೇಳುವುದಿಲ್ಲ. ಚರಾಂಶಗಳು ನಿರ್ದಿಷ್ಟ ಮಾನದಂಡಗಳ ಆಧಾರದ ಮೇಲೆ ಭಿನ್ನವಾಗಿರು