ಅಧ್ಯಾಯ 03 ದತ್ತಾಂಶದ ಸಂಘಟನೆ
1. ಪರಿಚಯ
ಹಿಂದಿನ ಅಧ್ಯಾಯದಲ್ಲಿ ದತ್ತಾಂಶವನ್ನು ಹೇಗೆ ಸಂಗ್ರಹಿಸಲಾಗುತ್ತದೆ ಎಂಬುದನ್ನು ನೀವು ಕಲಿತಿದ್ದೀರಿ. ಜನಗಣತಿ ಮತ್ತು ಮಾದರಿ ಸಂಗ್ರಹಣೆಯ ನಡುವಿನ ವ್ಯತ್ಯಾಸವನ್ನೂ ನೀವು ತಿಳಿದುಕೊಂಡಿದ್ದೀರಿ. ಈ ಅಧ್ಯಾಯದಲ್ಲಿ, ನೀವು ಸಂಗ್ರಹಿಸಿದ ದತ್ತಾಂಶಗಳನ್ನು ಹೇಗೆ ವರ್ಗೀಕರಿಸಬೇಕು ಎಂಬುದನ್ನು ನೀವು ತಿಳಿಯುವಿರಿ. ಕಚ್ಚಾ ದತ್ತಾಂಶಗಳನ್ನು ವರ್ಗೀಕರಿಸುವ ಉದ್ದೇಶವೆಂದರೆ ಅವುಗಳಲ್ಲಿ ಕ್ರಮವನ್ನು ತರುವುದು, ಇದರಿಂದಾಗಿ ಅವುಗಳನ್ನು ಮುಂದಿನ ಸಂಖ್ಯಾಶಾಸ್ತ್ರೀಯ ವಿಶ್ಲೇಷಣೆಗೆ ಸುಲಭವಾಗಿ ಒಳಪಡಿಸಬಹುದು.
ನೀವು ಎಂದಾದರೂ ನಿಮ್ಮ ಸ್ಥಳೀಯ ಕಸದ ವ್ಯಾಪಾರಿ ಅಥವಾ ಕಬಡಿವಾಲರನ್ನು ಗಮನಿಸಿದ್ದೀರಾ, ಅವರಿಗೆ ನೀವು ಹಳೆಯ ಪತ್ರಿಕೆಗಳು, ಮುರಿದ ಗೃಹೋಪಯೋಗಿ ವಸ್ತುಗಳು, ಖಾಲಿ ಗಾಜಿನ ಬಾಟಲಿಗಳು, ಪ್ಲಾಸ್ಟಿಕ್ಗಳು ಇತ್ಯಾದಿಗಳನ್ನು ಮಾರುತ್ತೀರಿ? ಅವರು ನಿಮ್ಮಿಂದ ಈ ವಸ್ತುಗಳನ್ನು ಖರೀದಿಸಿ, ಅವುಗಳನ್ನು ಮರುಬಳಕೆ ಮಾಡುವವರಿಗೆ ಮಾರುತ್ತಾರೆ. ಆದರೆ ಅವರ ಅಂಗಡಿಯಲ್ಲಿ ಇಷ್ಟು ಹೆಚ್ಚು ಕಸ ಇರುವುದರಿಂದ, ಅವರು ಅವುಗಳನ್ನು ಸರಿಯಾಗಿ ವ್ಯವಸ್ಥೆಗೊಳಿಸದಿದ್ದರೆ, ಅವರ ವ್ಯಾಪಾರವನ್ನು ನಿರ್ವಹಿಸುವುದು ತುಂಬಾ ಕಷ್ಟಕರವಾಗುತ್ತಿತ್ತು. ತನ್ನ ಪರಿಸ್ಥಿತಿಯನ್ನು ಸುಲಭಗೊಳಿಸಲು, ಅವನು ವಿವಿಧ ಕಸವನ್ನು ಸೂಕ್ತವಾಗಿ ಗುಂಪುಗಳಾಗಿ ಅಥವಾ “ವರ್ಗೀಕರಿಸುತ್ತಾನೆ”. ಅವನು ಹಳೆಯ ಪತ್ರಿಕೆಗಳನ್ನು ಒಟ್ಟಿಗೆ ಇಡುತ್ತಾನೆ ಮತ್ತು ಅವುಗಳನ್ನು ದಾರದಿಂದ ಕಟ್ಟುತ್ತಾನೆ. ನಂತರ ಎಲ್ಲಾ ಖಾಲಿ ಗಾಜಿನ ಬಾಟಲಿಗಳನ್ನು ಒಂದು ಚೀಲದಲ್ಲಿ ಸಂಗ್ರಹಿಸುತ್ತಾನೆ. ಅವನು ಲೋಹದ ವಸ್ತುಗಳನ್ನು ತನ್ನ ಅಂಗಡಿಯ ಒಂದು ಮೂಲೆಯಲ್ಲಿ ರಾಶಿ ಹಾಕಿ, “ಕಬ್ಬಿಣ”, “ತಾಮ್ರ”, “ಅಲ್ಯೂಮಿನಿಯಂ”, “ಹಿತ್ತಾಳೆ” ಇತ್ಯಾದಿ ಗುಂಪುಗಳಾಗಿ ವಿಂಗಡಿಸುತ್ತಾನೆ. ಈ ರೀತಿಯಾಗಿ ಅವನು ತನ್ನ ಕಸವನ್ನು ವಿಭಿನ್ನ ವರ್ಗಗಳಾಗಿ - “ಪತ್ರಿಕೆಗಳು”, “ಪ್ಲಾಸ್ಟಿಕ್ಗಳು”, “ಗಾಜು”, “ಲೋಹಗಳು” ಇತ್ಯಾದಿ - ಗುಂಪು ಮಾಡಿ ಅವುಗಳಲ್ಲಿ ಕ್ರಮ ತರುತ್ತಾನೆ. ಒಮ್ಮೆ ಅವನ ಕಸವು ವ್ಯವಸ್ಥಿತವಾಗಿ ಮತ್ತು ವರ್ಗೀಕೃತವಾಗಿದ್ದರೆ, ಖರೀದಿದಾರರು ಬೇಡಿಕೆ ಮಾಡಬಹುದಾದ ನಿರ್ದಿಷ್ಟ ವಸ್ತುವನ್ನು ಕಂಡುಹಿಡಿಯುವುದು ಅವನಿಗೆ ಸುಲಭವಾಗುತ್ತದೆ.
ಅಂತೆಯೇ, ನೀವು ನಿಮ್ಮ ಶಾಲಾ ಪುಸ್ತಕಗಳನ್ನು ಒಂದು ನಿರ್ದಿಷ್ಟ ಕ್ರಮದಲ್ಲಿ ಜೋಡಿಸಿದಾಗ, ಅವುಗಳನ್ನು ನಿರ್ವಹಿಸುವುದು ನಿಮಗೆ ಸುಲಭವಾಗುತ್ತದೆ. ನೀವು ಅವುಗಳನ್ನು ವಿಷಯಗಳ ಪ್ರಕಾರ ವರ್ಗೀಕರಿಸಬಹುದು, ಅಲ್ಲಿ ಪ್ರತಿ ವಿಷಯವೂ ಒಂದು ಗುಂಪು ಅಥವಾ ವರ್ಗವಾಗುತ್ತದೆ. ಆದ್ದರಿಂದ, ಉದಾಹರಣೆಗೆ, ನಿಮಗೆ ಇತಿಹಾಸದ ಒಂದು ನಿರ್ದಿಷ್ಟ ಪುಸ್ತಕ ಬೇಕಾದಾಗ, ನೀವು ಮಾಡಬೇಕಾಗಿರುವುದು “ಇತಿಹಾಸ” ಗುಂಪಿನಲ್ಲಿ ಆ ಪುಸ್ತಕವನ್ನು ಹುಡುಕುವುದು ಮಾತ್ರ. ಇಲ್ಲದಿದ್ದರೆ, ನೀವು ಹುಡುಕುತ್ತಿರುವ ನಿರ್ದಿಷ್ಟ ಪುಸ್ತಕವನ್ನು ಕಂಡುಹಿಡಿಯಲು ನಿಮ್ಮ ಸಂಪೂರ್ಣ ಸಂಗ್ರಹದ ಮೂಲಕ ಹುಡುಕಬೇಕಾಗುತ್ತದೆ.
ವಸ್ತುಗಳನ್ನು ಅಥವಾ ವಸ್ತುಗಳನ್ನು ವರ್ಗೀಕರಿಸುವುದು ನಮ್ಮ ಅಮೂಲ್ಯವಾದ ಸಮಯ ಮತ್ತು ಶ್ರಮವನ್ನು ಉಳಿಸುತ್ತದೆ, ಆದರೆ ಅದನ್ನು ನಿರಂಕುಶ ರೀತಿಯಲ್ಲಿ ಮಾಡಲಾಗುವುದಿಲ್ಲ. ಕಬಡಿವಾಲನು ಮರುಬಳಕೆಯ ಸರಕುಗಳ ಮಾರುಕಟ್ಟೆಗಳ ಪ್ರಕಾರ ತನ್ನ ಕಸವನ್ನು ಗುಂಪು ಮಾಡುತ್ತಾನೆ. ಉದಾಹರಣೆಗೆ, “ಗಾಜು” ಗುಂಪಿನ ಅಡಿಯಲ್ಲಿ ಅವನು ಖಾಲಿ ಬಾಟಲಿಗಳು, ಮುರಿದ ಕನ್ನಡಿಗಳು ಮತ್ತು ಕಿಟಕಿಯ ಗಾಜುಗಳು ಇತ್ಯಾದಿಗಳನ್ನು ಇಡುತ್ತಾನೆ. ಅಂತೆಯೇ, ನೀವು ನಿಮ್ಮ ಇತಿಹಾಸದ ಪುಸ್ತಕಗಳನ್ನು “ಇತಿಹಾಸ” ಗುಂಪಿನ ಅಡಿಯಲ್ಲಿ ವರ್ಗೀಕರಿಸುವಾಗ, ನೀವು ಬೇರೆ ವಿಷಯದ ಪುಸ್ತಕವನ್ನು ಆ ಗುಂಪಿನಲ್ಲಿ ಇಡುವುದಿಲ್ಲ. ಇಲ್ಲದಿದ್ದರೆ ಗುಂಪು ಮಾಡುವ ಸಂಪೂರ್ಣ ಉದ್ದೇಶವೇ ನಷ್ಟವಾಗುತ್ತದೆ. ಆದ್ದರಿಂದ, ವರ್ಗೀಕರಣವೆಂದರೆ ಕೆಲವು ಮಾನದಂಡಗಳ ಆಧಾರದ ಮೇಲೆ ವಸ್ತುಗಳನ್ನು ಗುಂಪುಗಳಾಗಿ ಅಥವಾ ವರ್ಗಗಳಾಗಿ ಜೋಡಿಸುವುದು ಅಥವಾ ವ್ಯವಸ್ಥೆಗೊಳಿಸುವುದು.
ಕಾರ್ಯಾಚರಣೆ
- ಅಂಚೆ ಕಚೇರಿಗೆ ಭೇಟಿ ನೀಡಿ, ಅಂಚೆಗಳನ್ನು ಹೇಗೆ ವಿಂಗಡಿಸಲಾಗುತ್ತದೆ ಎಂಬುದನ್ನು ಕಂಡುಹಿಡಿಯಿರಿ. ಅಂಚೆಯಲ್ಲಿರುವ ಪಿನ್-ಕೋಡ್ ಏನನ್ನು ಸೂಚಿಸುತ್ತದೆ ಎಂದು ನಿಮಗೆ ತಿಳಿದಿದೆಯೇ? ನಿಮ್ಮ ಅಂಚೆ ಹಂಗಾಮಿಯನ್ನು ಕೇಳಿ.
2. ಕಚ್ಚಾ ದತ್ತಾಂಶ
ಕಬಡಿವಾಲನ ಕಸದಂತೆ, ವರ್ಗೀಕರಿಸದ ದತ್ತಾಂಶ ಅಥವಾ ಕಚ್ಚಾ ದತ್ತಾಂಶಗಳು ಬಹಳ ಅವ್ಯವಸ್ಥಿತವಾಗಿರುತ್ತವೆ. ಅವುಗಳನ್ನು ನಿರ್ವಹಿಸಲು ಸಾಮಾನ್ಯವಾಗಿ ತುಂಬಾ ದೊಡ್ಡದಾಗಿರುತ್ತವೆ ಮತ್ತು ತೊಡಕಾಗಿರುತ್ತವೆ. ಅವುಗಳಿಂದ ಅರ್ಥಪೂರ್ಣ ತೀರ್ಮಾನಗಳನ್ನು ತೆಗೆದುಕೊಳ್ಳುವುದು ಬೇಸರಿಕೆಯ ಕೆಲಸವಾಗಿದೆ, ಏಕೆಂದರೆ ಅವು ಸಂಖ್ಯಾಶಾಸ್ತ್ರೀಯ ವಿಧಾನಗಳಿಗೆ ಸುಲಭವಾಗಿ ಒಳಪಡುವುದಿಲ್ಲ. ಆದ್ದರಿಂದ, ಯಾವುದೇ ವ್ಯವಸ್ಥಿತ ಸಂಖ್ಯಾಶಾಸ್ತ್ರೀಯ ವಿಶ್ಲೇಷಣೆಯನ್ನು ಕೈಗೊಳ್ಳುವ ಮೊದಲು ಅಂತಹ ದತ್ತಾಂಶಗಳ ಸರಿಯಾದ ಸಂಘಟನೆ ಮತ್ತು ಪ್ರಸ್ತುತಿ ಅಗತ್ಯವಿದೆ. ಆದ್ದರಿಂದ ದತ್ತಾಂಶವನ್ನು ಸಂಗ್ರಹಿಸಿದ ನಂತರದ ಹಂತವೆಂದರೆ ಅವುಗಳನ್ನು ವರ್ಗೀಕೃತ ರೂಪದಲ್ಲಿ ಸಂಘಟಿಸುವುದು ಮತ್ತು ಪ್ರಸ್ತುತಪಡಿಸುವುದು.
ನಿಮ್ಮ ಶಾಲೆಯ 100 ವಿದ್ಯಾರ್ಥಿಗಳ ಗಣಿತದ ಅಂಕಗಳ ಬಗ್ಗೆ ದತ್ತಾಂಶವನ್ನು ನೀವು ಸಂಗ್ರಹಿಸಿದ್ದೀರಿ ಎಂದು ಭಾವಿಸಿ. ನೀವು ಅವುಗಳನ್ನು ಒಂದು ಕೋಷ್ಟಕವಾಗಿ ಪ್ರಸ್ತುತಪಡಿಸಿದರೆ, ಅವು ಕೋಷ್ಟಕ 3.1 ರಂತೆ ಕಾಣಿಸಬಹುದು.
ಕೋಷ್ಟಕ 3.1 ಪರೀಕ್ಷೆಯಲ್ಲಿ 100 ವಿದ್ಯಾರ್ಥಿಗಳು ಪಡೆದ ಗಣಿತದ ಅಂಕಗಳು
| 47 | 45 | 10 | 60 | 51 | 56 | 66 | 100 | 49 | 40 |
| 60 | 59 | 56 | 55 | 62 | 48 | 59 | 55 | 51 | 41 |
| 42 | 69 | 64 | 66 | 50 | 59 | 57 | 65 | 62 | 50 |
| 64 | 30 | 37 | 75 | 17 | 56 | 20 | 14 | 55 | 90 |
| 62 | 51 | 55 | 14 | 25 | 34 | 90 | 49 | 56 | 54 |
| 70 | 47 | 49 | 82 | 40 | 82 | 60 | 85 | 65 | 66 |
| 49 | 44 | 64 | 69 | 70 | 48 | 12 | 28 | 55 | 65 |
| 49 | 40 | 25 | 41 | 71 | 80 | 0 | 56 | 14 | 22 |
| 66 | 53 | 46 | 70 | 43 | 61 | 59 | 12 | 30 | 35 |
| 45 | 44 | 57 | 76 | 82 | 39 | 32 | 14 | 90 | 25 |
ಅಥವಾ ನಿಮ್ಮ ನೆರೆಹೊರೆಯ 50 ಕುಟುಂಬಗಳ ಮಾಸಿಕ ಆಹಾರ ಖರ್ಚಿನ ಬಗ್ಗೆ ದತ್ತಾಂಶವನ್ನು ಸಂಗ್ರಹಿಸಿ, ಅವರ ಸರಾಸರಿ ಆಹಾರ ಖರ್ಚನ್ನು ತಿಳಿಯಲು ನೀವು ಬಯಸಿರಬಹುದು. ಸಂಗ್ರಹಿಸಿದ ದತ್ತಾಂಶ, ಆ ಸಂದರ್ಭದಲ್ಲಿ, ನೀವು ಕೋಷ್ಟಕವಾಗಿ ಪ್ರಸ್ತುತಪಡಿಸಿದ್ದರೆ, ಕೋಷ್ಟಕ 3.2 ಗೆ ಹೋಲುತ್ತದೆ. ಕೋಷ್ಟಕ 3.1 ಮತ್ತು 3.2 ಎರಡೂ ಕಚ್ಚಾ ಅಥವಾ ವರ್ಗೀಕರಿಸದ ದತ್ತಾಂಶಗಳಾಗಿವೆ. ಎರಡೂ ಕೋಷ್ಟಕಗಳಲ್ಲಿ ಸಂಖ್ಯೆಗಳು ಯಾವುದೇ ಕ್ರಮದಲ್ಲಿ ಜೋಡಿಸಲ್ಪಟ್ಟಿಲ್ಲ ಎಂದು ನೀವು ಕಾಣುತ್ತೀರಿ. ಈಗ ಕೋಷ್ಟಕ 3.1 ರಿಂದ ಗಣಿತದಲ್ಲಿ ಅತ್ಯಧಿಕ ಅಂಕಗಳನ್ನು ಕೇಳಿದರೆ, ನೀವು ಮೊದಲು 100 ವಿದ್ಯಾರ್ಥಿಗಳ ಅಂಕಗಳನ್ನು ಆರೋಹಣ ಅಥವಾ ಅವರೋಹಣ ಕ್ರಮದಲ್ಲಿ ಜೋಡಿಸಬೇಕಾಗುತ್ತದೆ. ಅದು ಬೇಸರಿಕೆಯ ಕೆಲಸವಾಗಿದೆ. 100 ಬದಲಿಗೆ 1,000 ವಿದ್ಯಾರ್ಥಿಗಳ ಅಂಕಗಳನ್ನು ನಿರ್ವಹಿಸಬೇಕಾದರೆ ಅದು ಇನ್ನಷ್ಟು ಬೇಸರಿಕೆಯಾಗುತ್ತದೆ. ಅಂತೆಯೇ, ಕೋಷ್ಟಕ 3.2 ರಲ್ಲಿ, 50 ಕುಟುಂಬಗಳ ಸರಾಸರಿ ಮಾಸಿಕ ಖರ್ಚನ್ನು ನಿರ್ಧರಿಸುವುದು ನಿಮಗೆ ಕಷ್ಟಕರವಾಗಿದೆ ಎಂದು ನೀವು ಗಮನಿಸುತ್ತೀರಿ. ಮತ್ತು ಸಂಖ್ಯೆಯು ದೊಡ್ಡದಾಗಿದ್ದರೆ - ಹೇಳಿ, 5,000 ಕುಟುಂಬಗಳು - ಈ ತೊಂದರೆ ಹಲವು ಪಟ್ಟು ಹೆಚ್ಚಾಗುತ್ತದೆ. ನಮ್ಮ ಕಬಡಿವಾಲನಂತೆ, ಅವನ ಕಸವು ದೊಡ್ಡದಾಗಿ ಮತ್ತು ಅವ್ಯವಸ್ಥಿತವಾಗಿದ್ದಾಗ ಒಂದು ನಿರ್ದಿಷ್ಟ ವಸ್ತುವನ್ನು ಕಂಡುಹಿಡಿಯಲು ಅವನು ತೊಂದರೆಗೊಳಗಾಗುತ್ತಾನೆ, ದೊಡ್ಡದಾಗಿರುವ ಕಚ್ಚಾ ದತ್ತಾಂಶಗಳಿಂದ ಯಾವುದೇ ಮಾಹಿತಿಯನ್ನು ಪಡೆಯಲು ನೀವು ಪ್ರಯತ್ನಿಸಿದಾಗ ನೀವು ಇದೇ ರೀತಿಯ ಪರಿಸ್ಥಿತಿಯನ್ನು ಎದುರಿಸುತ್ತೀರಿ. ಒಂದು ಪದದಲ್ಲಿ, ಆದ್ದರಿಂದ, ದೊಡ್ಡ ವರ್ಗೀಕರಿಸದ ದತ್ತಾಂಶಗಳಿಂದ ಮಾಹಿತಿಯನ್ನು ಹೊರತೆಗೆಯುವುದು ಬೇಸರಿಕೆಯ ಕೆಲಸವಾಗಿದೆ.
ಕೋಷ್ಟಕ 3.2 50 ಕುಟುಂಬಗಳ ಮಾಸಿಕ ಆಹಾರ ಖರ್ಚು (ರೂಪಾಯಿಗಳಲ್ಲಿ)
| 1904 | 1559 | 3473 | 1735 | 2760 |
| 2041 | 1612 | 1753 | 1855 | 4439 |
| 5090 | 1085 | 1823 | 2346 | 1523 |
| 1211 | 1360 | 1110 | 2152 | 1183 |
| 1218 | 1315 | 1105 | 2628 | 2712 |
| 4248 | 1812 | 1264 | 1183 | 1171 |
| 1007 | 1180 | 1953 | 1137 | 2048 |
| 2025 | 1583 | 1324 | 2621 | 3676 |
| 1397 | 1832 | 1962 | 2177 | 2575 |
| 1293 | 1365 | 1146 | 3222 | 1396 |
ಕಚ್ಚಾ ದತ್ತಾಂಶವನ್ನು ಸಂಕ್ಷೇಪಿಸಲಾಗುತ್ತದೆ ಮತ್ತು ವರ್ಗೀಕರಣದ ಮೂಲಕ ಅರ್ಥವಾಗುವಂತೆ ಮಾಡಲಾಗುತ್ತದೆ. ಒಂದೇ ರೀತಿಯ ಗುಣಲಕ್ಷಣಗಳನ್ನು ಹೊಂದಿರುವ ಸಂಗತಿಗಳನ್ನು ಒಂದೇ ವರ್ಗದಲ್ಲಿ ಇರಿಸಿದಾಗ, ಅವುಗಳನ್ನು ಸುಲಭವಾಗಿ ಕಂಡುಹಿಡಿಯಲು, ಹೋಲಿಕೆ ಮಾಡಲು ಮತ್ತು ಯಾವುದೇ ತೊಂದರೆ ಇಲ್ಲದೆ ತೀರ್ಮಾನಗಳನ್ನು ತೆಗೆದುಕೊಳ್ಳಲು ಸಾಧ್ಯವಾಗುತ್ತದೆ. ನೀವು ಅಧ್ಯಾಯ 2 ರಲ್ಲಿ ಅಧ್ಯಯನ ಮಾಡಿದಂತೆ, ಭಾರತ ಸರ್ಕಾರವು ಪ್ರತಿ ಹತ್ತು ವರ್ಷಗಳಿಗೊಮ್ಮೆ ಜನಗಣತಿಯನ್ನು ನಡೆಸುತ್ತದೆ. 2001 ರ ಜನಗಣತಿಯಲ್ಲಿ ಸುಮಾರು 20 ಕೋಟಿ ಜನರನ್ನು ಸಂಪರ್ಕಿಸಲಾಗಿತ್ತು. ಜನಗಣತಿಯ ಕಚ್ಚಾ ದತ್ತಾಂಶಗಳು ತುಂಬಾ ದೊಡ್ಡದಾಗಿದ್ದು ಮತ್ತು ತುಂಡು ತುಂಡಾಗಿದ್ದು, ಅವುಗಳಿಂದ ಯಾವುದೇ ಅರ್ಥಪೂರ್ಣ ತೀರ್ಮಾನವನ್ನು ತೆಗೆದುಕೊಳ್ಳುವುದು ಬಹುತೇಕ ಅಸಾಧ್ಯ ಕಾರ್ಯವೆಂದು ಕಾಣುತ್ತದೆ. ಆದರೆ ಅದೇ ದತ್ತಾಂಶವನ್ನು ಲಿಂಗ, ಶಿಕ್ಷಣ, ವೈವಾಹಿಕ ಸ್ಥಿತಿ, ಉದ್ಯೋಗ ಇತ್ಯಾದಿಗಳ ಪ್ರಕಾರ ವರ್ಗೀಕರಿಸಿದಾಗ, ಭಾರತದ ಜನಸಂಖ್ಯೆಯ ರಚನೆ ಮತ್ತು ಸ್ವರೂಪವನ್ನು, ನಂತರ, ಸುಲಭವಾಗಿ ಅರ್ಥಮಾಡಿಕೊಳ್ಳಲಾಗುತ್ತದೆ.
ಕಚ್ಚಾ ದತ್ತಾಂಶವು ಚರಾಂಶಗಳ ಮೇಲಿನ ಅವಲೋಕನಗಳನ್ನು ಒಳಗೊಂಡಿರುತ್ತದೆ. ಕೋಷ್ಟಕ 3.1 ಮತ್ತು 3.2 ರಲ್ಲಿ ನೀಡಿರುವಂತೆ ಕಚ್ಚಾ ದತ್ತಾಂಶವು ಒಂದು ನಿರ್ದಿಷ್ಟ ಅಥವಾ ಚರಾಂಶಗಳ ಗುಂಪಿನ ಮೇಲಿನ ಅವಲೋಕನಗಳನ್ನು ಒಳಗೊಂಡಿರುತ್ತದೆ. ಉದಾಹರಣೆಗೆ ಕೋಷ್ಟಕ 3.1 ಅನ್ನು ನೋಡಿ, ಇದು 100 ವಿದ್ಯಾರ್ಥಿಗಳು ಗಳಿಸಿದ ಗಣಿತದ ಅಂಕಗಳನ್ನು ಒಳಗೊಂಡಿದೆ. ಈ ಅಂಕಗಳಿಂದ ನಾವು ಹೇಗೆ ಅರ್ಥ ಮಾಡಿಕೊಳ್ಳಬಹುದು? ಈ ಅಂಕಗಳನ್ನು ನೋಡುವ ಗಣಿತ ಶಿಕ್ಷಕರು ಯೋಚಿಸುತ್ತಿರಬಹುದು-ನನ್ನ ವಿದ್ಯಾರ್ಥಿಗಳು ಹೇಗೆ ಮಾಡಿದ್ದಾರೆ? ಎಷ್ಟು ಮಂದಿ ಉತ್ತೀರ್ಣರಾಗಿಲ್ಲ? ನಾವು ದತ್ತಾಂಶವನ್ನು ಹೇಗೆ ವರ್ಗೀಕರಿಸುತ್ತೇವೆ ಎಂಬುದು ನಮ್ಮ ಮನಸ್ಸಿನಲ್ಲಿರುವ ಉದ್ದೇಶವನ್ನು ಅವಲಂಬಿಸಿರುತ್ತದೆ. ಈ ಸಂದರ್ಭದಲ್ಲಿ, ಶಿಕ್ಷಕರು ಕೆಲವು ಆಳದಲ್ಲಿ ಅರ್ಥಮಾಡಿಕೊಳ್ಳಲು ಬಯಸುತ್ತಾರೆ- ಈ ವಿದ್ಯಾರ್ಥಿಗಳು ಹೇಗೆ ಮಾಡಿದ್ದಾರೆ ಎಂದು. ಅವರು ಬಹುಶಃ ಆವೃತ್ತಿ ವಿತರಣೆಯನ್ನು ರಚಿಸಲು ಆಯ್ಕೆ ಮಾಡುತ್ತಾರೆ. ಇದನ್ನು ಮುಂದಿನ ವಿಭಾಗದಲ್ಲಿ ಚರ್ಚಿಸಲಾಗಿದೆ.
ಕಾರ್ಯಾಚರಣೆ
- ಒಂದು ವರ್ಷದ ನಿಮ್ಮ ಕುಟುಂಬದ ಒಟ್ಟು ಸಾಪ್ತಾಹಿಕ ಖರ್ಚಿನ ದತ್ತಾಂಶವನ್ನು ಸಂಗ್ರಹಿಸಿ ಮತ್ತು ಅದನ್ನು ಕೋಷ್ಟಕದಲ್ಲಿ ಜೋಡಿಸಿ. ನೀವು ಎಷ್ಟು ಅವಲೋಕನಗಳನ್ನು ಹೊಂದಿದ್ದೀರಿ ಎಂಬುದನ್ನು ನೋಡಿ. ದತ್ತಾಂಶವನ್ನು ಮಾಸಿಕವಾಗಿ ಜೋಡಿಸಿ ಮತ್ತು ಅವಲೋಕನಗಳ ಸಂಖ್ಯೆಯನ್ನು ಕಂಡುಹಿಡಿಯಿರಿ.
3. ದತ್ತಾಂಶದ ವರ್ಗೀಕರಣ
ವರ್ಗೀಕರಣದ ಗುಂಪುಗಳು ಅಥವಾ ವರ್ಗಗಳನ್ನು ವಿವಿಧ ರೀತಿಯಲ್ಲಿ ಮಾಡಲಾಗುತ್ತದೆ. ನಿಮ್ಮ ಪುಸ್ತಕಗಳನ್ನು ವಿಷಯಗಳ ಪ್ರಕಾರ - “ಇತಿಹಾಸ”, “ಭೂಗೋಳ”, “ಗಣಿತ”, “ವಿಜ್ಞಾನ”, ಇತ್ಯಾದಿ - ವರ್ಗೀಕರಿಸುವ ಬದಲು, ನೀವು ಅವುಗಳನ್ನು ಲೇಖಕರ ಪ್ರಕಾರ ವರ್ಣಮಾಲೆಯ ಕ್ರಮದಲ್ಲಿ ವರ್ಗೀಕರಿಸಬಹುದಿತ್ತು. ಅಥವಾ, ನೀವು ಅವುಗಳನ್ನು ಪ್ರಕಟಣೆಯ ವರ್ಷದ ಪ್ರಕಾರವೂ ವರ್ಗೀಕರಿಸಬಹುದಿತ್ತು. ನೀವು ಅವುಗಳನ್ನು ಹೇಗೆ ವರ್ಗೀಕರಿಸಲು ಬಯಸುತ್ತೀರಿ ಎಂಬುದು ನಿಮ್ಮ ಅವಶ್ಯಕತೆಯನ್ನು ಅವಲಂಬಿಸಿರುತ್ತದೆ.
ಅಂತೆಯೇ ಕಚ್ಚಾ ದತ್ತಾಂಶವನ್ನು ಉದ್ದೇಶವನ್ನು ಅವಲಂಬಿಸಿ ವಿವಿಧ ರೀತಿಯಲ್ಲಿ ವರ್ಗೀಕರಿಸಲಾಗುತ್ತದೆ. ಅವುಗಳನ್ನು ಸಮಯದ ಪ್ರಕಾರ ಗುಂಪು ಮಾಡಬಹುದು. ಅಂತಹ ವರ್ಗೀಕರಣವನ್ನು ಕಾಲಾನುಕ್ರಮದ ವರ್ಗೀಕರಣ ಎಂದು ಕರೆಯಲಾಗುತ್ತದೆ. ಅಂತಹ ವರ್ಗೀಕರಣದಲ್ಲಿ, ದತ್ತಾಂಶವನ್ನು ವರ್ಷಗಳು, ತ್ರೈಮಾಸಿಕಗಳು, ತಿಂಗಳುಗಳು, ವಾರಗಳು ಇತ್ಯಾದಿ ಸಮಯಕ್ಕೆ ಸಂಬಂಧಿಸಿದಂತೆ ಆರೋಹಣ ಅಥವಾ ಅವರೋಹಣ ಕ್ರಮದಲ್ಲಿ ವರ್ಗೀಕರಿಸಲಾಗುತ್ತದೆ. ಈ ಕೆಳಗಿನ ಉದಾಹರಣೆಯು ವರ್ಷಗಳ ಪ್ರಕಾರ ವರ್ಗೀಕರಿಸಲಾದ ಭಾರತದ ಜನಸಂಖ್ಯೆಯನ್ನು ತೋರಿಸುತ್ತದೆ. ‘ಜನಸಂಖ್ಯೆ’ ಚರಾಂಶವು ಒಂದು ಕಾಲಾನುಕ್ರಮ ಶ್ರೇಣಿಯಾಗಿದೆ, ಏಕೆಂದರೆ ಇದು ವಿವಿಧ ವರ್ಷಗಳಿಗೆ ಮೌಲ್ಯಗಳ ಶ್ರೇಣಿಯನ್ನು ಚಿತ್ರಿಸುತ್ತದೆ.
ಉದಾಹರಣೆ 1
ಭಾರತದ ಜನಸಂಖ್ಯೆ (ಕೋಟಿಗಳಲ್ಲಿ)
| ವರ್ಷ | ಜನಸಂಖ್ಯೆ (ಕೋಟಿ) |
|---|---|
| 1951 | 35.7 |
| 1961 | 43.8 |
| 1971 | 54.6 |
| 1981 | 68.4 |
| 1991 | 81.8 |
| 2001 | 102.7 |
| 2011 | 121.0 |
ಪ್ರಾದೇಶಿಕ ವರ್ಗೀಕರಣದಲ್ಲಿ ದತ್ತಾಂಶವನ್ನು ದೇಶಗಳು, ರಾಜ್ಯಗಳು, ನಗರಗಳು, ಜಿಲ್ಲೆಗಳು ಇತ್ಯಾದಿ ಭೌಗೋಳಿಕ ಸ್ಥಳಗಳಿಗೆ ಸಂಬಂಧಿಸಿದಂತೆ ವರ್ಗೀಕರಿಸಲಾಗುತ್ತದೆ.
ಉದಾಹರಣೆ 2 ವಿವಿಧ ದೇಶಗಳಲ್ಲಿ ಗೋಧಿ ಇಳುವರಿಯನ್ನು ತೋರಿಸುತ್ತದೆ.
ಉದಾಹರಣೆ 2
ವಿವಿಧ ದೇಶಗಳ ಗೋಧಿ ಇಳುವರಿ (2013)
| ದೇಶ | ಗೋಧಿ ಇಳುವರಿ (ಕೆಜಿ/ಹೆಕ್ಟೇರ್) |
|---|---|
| ಕೆನಡಾ | 3594 |
| ಚೀನಾ | 5055 |
| ಫ್ರಾನ್ಸ್ | 7254 |
| ಜರ್ಮನಿ | 7998 |
| ಭಾರತ | 3154 |
| ಪಾಕಿಸ್ತಾನ | 2787 |
ಮೂಲ: ಭಾರತೀಯ ಕೃಷಿ ಅಂಕಿಅಂಶಗಳು ಒಂದು ನೋಟದಲ್ಲಿ, 2015
ಕಾರ್ಯಾಚರಣೆಗಳು
- ಉದಾಹರಣೆ 1 ರಲ್ಲಿ, ಭಾರತದ ಜನಸಂಖ್ಯೆ ಕನಿಷ್ಠ ಮತ್ತು ಗರಿಷ್ಠವಾಗಿದ್ದ ವರ್ಷಗಳನ್ನು ಕಂಡುಹಿಡಿಯಿರಿ,
- ಉದಾಹರಣೆ 2 ರಲ್ಲಿ, ಭಾರತದ ಇಳುವರಿಗಿಂತ ಸ್ವಲ್ಪ ಹೆಚ್ಚು ಗೋಧಿ ಇಳುವರಿ ಹೊಂದಿರುವ ದೇಶವನ್ನು ಕಂಡುಹಿಡಿಯಿರಿ. ಅದು ಶೇಕಡಾವಾರು ಪ್ರಮಾಣದಲ್ಲಿ ಎಷ್ಟು ಇರುತ್ತದೆ?
- ಉದಾಹರಣೆ 2 ರ ದೇಶಗಳನ್ನು ಇಳುವರಿಯ ಆರೋಹಣ ಕ್ರಮದಲ್ಲಿ ಜೋಡಿಸಿ. ಇಳುವರಿಯ ಅವರೋಹಣ ಕ್ರಮಕ್ಕೆ ಅದೇ ವ್ಯಾಯಾಮವನ್ನು ಮಾಡಿ.
ಕೆಲವೊಮ್ಮೆ ನೀವು ಪರಿಮಾಣಾತ್ಮಕವಾಗಿ ವ್ಯಕ್ತಪಡಿಸಲಾಗದ ಗುಣಲಕ್ಷಣಗಳನ್ನು ಎದುರಿಸುತ್ತೀರಿ. ಅಂತಹ ಗುಣಲಕ್ಷಣಗಳನ್ನು ಗುಣಾತ್ಮಕ ಗುಣಲಕ್ಷಣಗಳು ಅಥವಾ ಗುಣಗಳು ಎಂದು ಕರೆಯಲಾಗುತ್ತದೆ. ಉದಾಹರಣೆಗೆ, ರಾಷ್ಟ್ರೀಯತೆ, ಸಾಕ್ಷರತೆ, ಧರ್ಮ, ಲಿಂಗ, ವೈವಾಹಿಕ ಸ್ಥಿತಿ, ಇತ್ಯಾದಿ. ಅವುಗಳನ್ನು ಅಳೆಯಲಾಗುವುದಿಲ್ಲ. ಆದರೆ ಈ ಗುಣಲಕ್ಷಣಗಳನ್ನು ಗುಣಾತ್ಮಕ ಗುಣಲಕ್ಷಣದ ಉಪಸ್ಥಿತಿ ಅಥವಾ ಅನುಪಸ್ಥಿತಿಯ ಆಧಾರದ ಮೇಲೆ ವರ್ಗೀಕರಿಸಬಹುದು. ಗುಣಲಕ್ಷಣಗಳ ಮೇಲಿನ ದತ್ತಾಂಶದ ಅಂತಹ ವರ್ಗೀಕರಣವನ್ನು ಗುಣಾತ್ಮಕ ವರ್ಗೀಕರಣ ಎಂದು ಕರೆಯಲಾಗುತ್ತದೆ. ಈ ಕೆಳಗಿನ ಉದಾಹರಣೆಯಲ್ಲಿ, ಒಂದು ದೇಶದ ಜನಸಂಖ್ಯೆಯನ್ನು ಗುಣಾತ್ಮಕ ಚರಾಂಶ “ಲಿಂಗ"ದ ಆಧಾರದ ಮೇಲೆ ಗುಂಪು ಮಾಡಲಾಗಿದೆ ಎಂದು ನಾವು ಕಾಣುತ್ತೇವೆ. ಒಂದು ಅವಲೋಕನವು ಪುರುಷ ಅಥವಾ ಸ್ತ್ರೀ ಆಗಿರಬಹುದು. ಈ ಎರಡು ಗುಣಲಕ್ಷಣಗಳನ್ನು ವೈವಾಹಿಕ ಸ್ಥಿತಿಯ ಆಧಾರದ ಮೇಲೆ ಮತ್ತಷ್ಟು ವರ್ಗೀಕರಿಸಬಹುದು, ಕೆಳಗೆ ನೀಡಿದಂತೆ:
ಉದಾಹರಣೆ 3
ಮೊದಲ ಹಂತದ ವರ್ಗೀಕರಣವು ಒಂದು ಗುಣಲಕ್ಷಣದ ಉಪಸ್ಥಿತಿ ಮತ್ತು ಅನುಪಸ್ಥಿತಿಯ ಆಧಾರದ ಮೇಲೆ ಇದೆ, ಅಂದರೆ ಪುರುಷ ಅಥವಾ ಪುರುಷ ಅಲ್ಲ (ಸ್ತ್ರೀ). ಎರಡನೇ ಹಂತದಲ್ಲಿ, ಪ್ರತಿ ವರ್ಗ - ಪುರುಷ ಮತ್ತು ಸ್ತ್ರೀ, ಇನ್ನೊಂದು ಗುಣಲಕ್ಷಣದ ಉಪಸ್ಥಿತಿ ಅಥವಾ ಅನುಪಸ್ಥಿತಿಯ ಆಧಾರದ ಮೇಲೆ ಮತ್ತಷ್ಟು ಉಪವಿಭಾಗಿಸಲಾಗಿದೆ, ಅಂದರೆ ವಿವಾಹಿತ ಅಥವಾ ಅವಿವಾಹಿತ ಎಂಬುದರ ಆಧಾರದ ಮೇಲೆ. ಎತ್ತರ, ತೂಕ, ವಯಸ್ಸು, ಆದಾಯ, ವಿದ್ಯಾರ್ಥಿಗಳ ಅಂಕಗಳು ಇತ್ಯಾದಿ ಗುಣಲಕ್ಷಣಗಳು ಪರಿಮಾಣಾತ್ಮಕ ಸ್ವರೂಪದ್ದಾಗಿವೆ. ಅಂತಹ ಗುಣಲಕ್ಷಣಗಳ ಸಂಗ್ರಹಿತ ದತ್ತಾಂಶವನ್ನು ವರ್ಗಗಳಾಗಿ ಗುಂಪು ಮಾಡಿದಾಗ, ಅದು ಪರಿಮಾಣಾತ್ಮಕ ವರ್ಗೀಕರಣವಾಗುತ್ತದೆ.
ಕಾರ್ಯಾಚರಣೆ
- ಸುತ್ತಮುತ್ತಲಿನ ವಸ್ತುಗಳನ್ನು ಜೀವಂತ ಅಥವಾ ನಿರ್ಜೀವ ಎಂದು ಗುಂಪು ಮಾಡಬಹುದು. ಇದು ಪರಿಮಾಣಾತ್ಮಕ ವರ್ಗೀಕರಣವೇ?
ಉದಾಹರಣೆ 4
100 ವಿದ್ಯಾರ್ಥಿಗಳ ಗಣಿತದ ಅಂಕಗಳ ಆವೃತ್ತಿ ವಿತರಣೆ
| ಅಂಕಗಳು | ಆವೃತ್ತಿ |
|---|---|
| 0-10 | 1 |
| 10-20 | 8 |
| 20-30 | 6 |
| 30-40 | 7 |
| 40-50 | 21 |
| 50-60 | 23 |
| 60-70 | 19 |
| 70-80 | 6 |
| 80-90 | 5 |
| 90-100 | 4 |
| ಒಟ್ಟು | 100 |
ಉದಾಹರಣೆ 4 ಕೋಷ್ಟಕ 3.1 ರಲ್ಲಿ ನೀಡಲಾದ 100 ವಿದ್ಯಾರ್ಥಿಗಳ ಗಣಿತದ ಅಂಕಗಳ ಪರಿಮಾಣಾತ್ಮಕ ವರ್ಗೀಕರಣವನ್ನು ತೋರಿಸುತ್ತದೆ.
ಕಾರ್ಯಾಚರಣೆ
- ಉದಾಹರಣೆ 4 ರ ಆವೃತ್ತಿಯ ಮೌಲ್ಯಗಳನ್ನು ಒಟ್ಟು ಆವೃತ್ತಿಯ ಪ್ರಮಾಣ ಅಥವಾ ಶೇಕಡಾವಾರು ಪ್ರಮಾಣದಲ್ಲಿ ವ್ಯಕ್ತಪಡಿಸಿ. ಈ ರೀತಿಯಲ್ಲಿ ವ್ಯಕ್ತಪಡಿಸಿದ ಆವೃತ್ತಿಯನ್ನು ಸಾಪೇಕ್ಷ ಆವೃತ್ತಿ ಎಂದು ಕರೆಯಲಾಗುತ್ತದೆ ಎಂಬುದನ್ನು ಗಮನಿಸಿ.
- ಉದಾಹರಣೆ 4 ರಲ್ಲಿ, ಯಾವ ವರ್ಗವು ದತ್ತಾಂಶದ ಗರಿಷ್ಠ ಸಾಂದ್ರತೆಯನ್ನು ಹೊಂದಿದೆ? ಅದನ್ನು ಒಟ್ಟು ಅವಲೋಕನಗಳ ಶೇಕಡಾವಾರು ಪ್ರಮಾಣದಲ್ಲಿ ವ್ಯಕ್ತಪಡಿಸಿ. ಯಾವ ವರ್ಗವು ಕನಿಷ್ಠ ಸಾಂದ್ರತೆಯ ದತ್ತಾಂಶವನ್ನು ಹೊಂದಿದೆ?
4. ಚರಾಂಶಗಳು: ಸತತ ಮತ್ತು ವಿವಿಕ್ತ
ಚರಾಂಶದ ಸರಳ ವ್ಯಾಖ್ಯಾನ, ನೀವು ಕಳೆದ ಅಧ್ಯಾಯದಲ್ಲಿ ಓದಿದ್ದೀರಿ, ಅದು ಹೇಗೆ ಬದಲಾಗುತ್ತದೆ ಎಂಬುದನ್ನು ನಿಮಗೆ ಹೇಳುವುದಿಲ್ಲ. ಚರಾಂಶಗಳು ನಿರ್ದಿಷ್ಟ ಮಾನದಂ