ಅಧ್ಯಾಯ 03 ದತ್ತಾಂಶದ ವರ್ಗೀಕರಣ

1. ಪರಿಚಯ

ಹಿಂದಿನ ಅಧ್ಯಾಯದಲ್ಲಿ ದತ್ತಾಂಶವನ್ನು ಹೇಗೆ ಸಂಗ್ರಹಿಸಲಾಗುತ್ತದೆ ಎಂಬುದನ್ನು ನೀವು ಕಲಿತಿದ್ದೀರಿ. ಜನಗಣತಿ ಮತ್ತು ಮಾದರಿ ಸಂಗ್ರಹಣೆಯ ನಡುವಿನ ವ್ಯತ್ಯಾಸವನ್ನೂ ನೀವು ತಿಳಿದುಕೊಂಡಿದ್ದೀರಿ. ಈ ಅಧ್ಯಾಯದಲ್ಲಿ, ನೀವು ಸಂಗ್ರಹಿಸಿದ ದತ್ತಾಂಶಗಳನ್ನು ಹೇಗೆ ವರ್ಗೀಕರಿಸಬೇಕು ಎಂಬುದನ್ನು ನೀವು ತಿಳಿಯುವಿರಿ. ಕಚ್ಚಾ ದತ್ತಾಂಶವನ್ನು ವರ್ಗೀಕರಿಸುವ ಉದ್ದೇಶವೆಂದರೆ ಅವುಗಳಲ್ಲಿ ಕ್ರಮವನ್ನು ತರುವುದು, ಇದರಿಂದಾಗಿ ಅವುಗಳನ್ನು ಮುಂದಿನ ಸಂಖ್ಯಾಶಾಸ್ತ್ರೀಯ ವಿಶ್ಲೇಷಣೆಗೆ ಸುಲಭವಾಗಿ ಒಳಪಡಿಸಬಹುದು.

ನಿಮ್ಮ ಸ್ಥಳೀಯ ಕಸದ ವ್ಯಾಪಾರಿ ಅಥವಾ ಕಬಡಿವಾಲಾಳನ್ನು ನೀವು ಎಂದಾದರೂ ಗಮನಿಸಿದ್ದೀರಾ, ಅವರಿಗೆ ನೀವು ಹಳೆಯ ಪತ್ರಿಕೆಗಳು, ಮುರಿದ ಗೃಹೋಪಯೋಗಿ ವಸ್ತುಗಳು, ಖಾಲಿ ಗಾಜಿನ ಬಾಟಲಿಗಳು, ಪ್ಲಾಸ್ಟಿಕ್ಗಳು ಇತ್ಯಾದಿಗಳನ್ನು ಮಾರುತ್ತೀರಿ? ಅವನು ಈ ವಸ್ತುಗಳನ್ನು ನಿಮ್ಮಿಂದ ಖರೀದಿಸಿ, ಅವುಗಳನ್ನು ಮರುಬಳಕೆ ಮಾಡುವವರಿಗೆ ಮಾರುತ್ತಾನೆ. ಆದರೆ ಅವನ ಅಂಗಡಿಯಲ್ಲಿ ಇಷ್ಟು ಹೆಚ್ಚು ಕಸವಿದ್ದರೆ, ಅವನು ಅವುಗಳನ್ನು ಸರಿಯಾಗಿ ವ್ಯವಸ್ಥೆಗೊಳಿಸದಿದ್ದರೆ, ಅವನ ವ್ಯಾಪಾರವನ್ನು ನಿರ್ವಹಿಸುವುದು ಅವನಿಗೆ ತುಂಬಾ ಕಷ್ಟಕರವಾಗುತ್ತದೆ. ತನ್ನ ಪರಿಸ್ಥಿತಿಯನ್ನು ಸುಲಭಗೊಳಿಸಲು, ಅವನು ವಿವಿಧ ಕಸವನ್ನು ಸೂಕ್ತವಾಗಿ ಗುಂಪು ಮಾಡುತ್ತಾನೆ ಅಥವಾ “ವರ್ಗೀಕರಿಸುತ್ತಾನೆ”. ಅವನು ಹಳೆಯ ಪತ್ರಿಕೆಗಳನ್ನು ಒಟ್ಟಿಗೆ ಇಡುತ್ತಾನೆ ಮತ್ತು ಒಂದು ಹಗ್ಗದಿಂದ ಕಟ್ಟುತ್ತಾನೆ. ನಂತರ ಎಲ್ಲಾ ಖಾಲಿ ಗಾಜಿನ ಬಾಟಲಿಗಳನ್ನು ಒಂದು ಚೀಲದಲ್ಲಿ ಸಂಗ್ರಹಿಸುತ್ತಾನೆ. ಅವನು ಲೋಹದ ವಸ್ತುಗಳನ್ನು ಅಂಗಡಿಯ ಒಂದು ಮೂಲೆಯಲ್ಲಿ ರಾಶಿ ಹಾಕಿ, “ಕಬ್ಬಿಣ”, “ತಾಮ್ರ”, “ಅಲ್ಯೂಮಿನಿಯಂ”, “ಹಿತ್ತಾಳೆ” ಇತ್ಯಾದಿ ಗುಂಪುಗಳಾಗಿ ವಿಂಗಡಿಸುತ್ತಾನೆ. ಈ ರೀತಿಯಾಗಿ ಅವನು ತನ್ನ ಕಸವನ್ನು ವಿಭಿನ್ನ ವರ್ಗಗಳಾಗಿ ಗುಂಪು ಮಾಡುತ್ತಾನೆ - “ಪತ್ರಿಕೆಗಳು”, “ಪ್ಲಾಸ್ಟಿಕ್ಗಳು”, “ಗಾಜು”, “ಲೋಹಗಳು” ಇತ್ಯಾದಿ - ಮತ್ತು ಅವುಗಳಲ್ಲಿ ಕ್ರಮ ತರುತ್ತಾನೆ. ಒಮ್ಮೆ ಅವನ ಕಸವು ಜೋಡಿಸಲ್ಪಟ್ಟು ಮತ್ತು ವರ್ಗೀಕರಿಸಲ್ಪಟ್ಟ ನಂತರ, ಖರೀದಿದಾರನು ಬೇಡಿಕೆ ಮಾಡಬಹುದಾದ ನಿರ್ದಿಷ್ಟ ವಸ್ತುವನ್ನು ಕಂಡುಹಿಡಿಯುವುದು ಅವನಿಗೆ ಸುಲಭವಾಗುತ್ತದೆ.

ಅಂತೆಯೇ, ನೀವು ನಿಮ್ಮ ಶಾಲಾ ಪುಸ್ತಕಗಳನ್ನು ಒಂದು ನಿರ್ದಿಷ್ಟ ಕ್ರಮದಲ್ಲಿ ಜೋಡಿಸಿದಾಗ, ಅವುಗಳನ್ನು ನಿರ್ವಹಿಸುವುದು ನಿಮಗೆ ಸುಲಭವಾಗುತ್ತದೆ. ನೀವು ಅವುಗಳನ್ನು ವಿಷಯಗಳ ಪ್ರಕಾರ ವರ್ಗೀಕರಿಸಬಹುದು, ಅಲ್ಲಿ ಪ್ರತಿ ವಿಷಯವು ಒಂದು ಗುಂಪು ಅಥವಾ ವರ್ಗವಾಗುತ್ತದೆ. ಆದ್ದರಿಂದ, ಉದಾಹರಣೆಗೆ, ನಿಮಗೆ ಇತಿಹಾಸದ ಒಂದು ನಿರ್ದಿಷ್ಟ ಪುಸ್ತಕ ಬೇಕಾದಾಗ, ನೀವು ಮಾಡಬೇಕಾಗಿರುವುದು “ಇತಿಹಾಸ” ಗುಂಪಿನಲ್ಲಿ ಆ ಪುಸ್ತಕವನ್ನು ಹುಡುಕುವುದು ಮಾತ್ರ. ಇಲ್ಲದಿದ್ದರೆ, ನೀವು ಹುಡುಕುತ್ತಿರುವ ನಿರ್ದಿಷ್ಟ ಪುಸ್ತಕವನ್ನು ಕಂಡುಹಿಡಿಯಲು ನಿಮ್ಮ ಸಂಪೂರ್ಣ ಸಂಗ್ರಹದ ಮೂಲಕ ಹುಡುಕಬೇಕಾಗುತ್ತದೆ.

ವಸ್ತುಗಳನ್ನು ಅಥವಾ ವಸ್ತುಗಳ ವರ್ಗೀಕರಣವು ನಮ್ಮ ಬೆಲೆಬಾಳುವ ಸಮಯ ಮತ್ತು ಶ್ರಮವನ್ನು ಉಳಿಸುತ್ತದೆ, ಆದರೆ ಅದನ್ನು ನಿರಂಕುಶ ರೀತಿಯಲ್ಲಿ ಮಾಡಲಾಗುವುದಿಲ್ಲ. ಕಬಡಿವಾಲನು ಮರುಬಳಕೆಯ ಸರಕುಗಳ ಮಾರುಕಟ್ಟೆಗಳ ಪ್ರಕಾರ ತನ್ನ ಕಸವನ್ನು ಗುಂಪು ಮಾಡುತ್ತಾನೆ. ಉದಾಹರಣೆಗೆ, “ಗಾಜು” ಗುಂಪಿನ ಅಡಿಯಲ್ಲಿ ಅವನು ಖಾಲಿ ಬಾಟಲಿಗಳು, ಮುರಿದ ಕನ್ನಡಿಗಳು ಮತ್ತು ಕಿಟಕಿಯ ಗಾಜುಗಳು ಇತ್ಯಾದಿಗಳನ್ನು ಇಡುತ್ತಾನೆ. ಅಂತೆಯೇ, ನೀವು ನಿಮ್ಮ ಇತಿಹಾಸದ ಪುಸ್ತಕಗಳನ್ನು “ಇತಿಹಾಸ” ಗುಂಪಿನ ಅಡಿಯಲ್ಲಿ ವರ್ಗೀಕರಿಸುವಾಗ, ನೀವು ಬೇರೆ ವಿಷಯದ ಪುಸ್ತಕವನ್ನು ಆ ಗುಂಪಿನಲ್ಲಿ ಇಡುವುದಿಲ್ಲ. ಇಲ್ಲದಿದ್ದರೆ ಗುಂಪು ಮಾಡುವ ಸಂಪೂರ್ಣ ಉದ್ದೇಶವೇ ನಷ್ಟವಾಗುತ್ತದೆ. ಆದ್ದರಿಂದ, ವರ್ಗೀಕರಣ ಎಂದರೆ ಕೆಲವು ಮಾನದಂಡಗಳ ಆಧಾರದ ಮೇಲೆ ವಸ್ತುಗಳನ್ನು ಗುಂಪುಗಳಾಗಿ ಅಥವಾ ವರ್ಗಗಳಾಗಿ ಜೋಡಿಸುವುದು ಅಥವಾ ವ್ಯವಸ್ಥೆಗೊಳಿಸುವುದು.

ಕಾರ್ಯಾಚರಣೆ

  • ಅಕ್ಷರಗಳನ್ನು ಹೇಗೆ ವಿಂಗಡಿಸಲಾಗುತ್ತದೆ ಎಂಬುದನ್ನು ಕಂಡುಹಿಡಿಯಲು ನಿಮ್ಮ ಸ್ಥಳೀಯ ಅಂಚೆ ಕಚೇರಿಗೆ ಭೇಟಿ ನೀಡಿ. ಅಂಚೆಯಲ್ಲಿನ ಪಿನ್-ಕೋಡ್ ಏನನ್ನು ಸೂಚಿಸುತ್ತದೆ ಎಂದು ನಿಮಗೆ ತಿಳಿದಿದೆಯೇ? ನಿಮ್ಮ ಅಂಚೆ ಕಾರ್ಯನಿರ್ವಾಹಕರನ್ನು ಕೇಳಿ.

2. ಕಚ್ಚಾ ದತ್ತಾಂಶ

ಕಬಡಿವಾಲನ ಕಸದಂತೆ, ವರ್ಗೀಕರಿಸದ ದತ್ತಾಂಶ ಅಥವಾ ಕಚ್ಚಾ ದತ್ತಾಂಶವು ಬಹಳ ಅಸಂಘಟಿತವಾಗಿರುತ್ತದೆ. ಅವು ಸಾಮಾನ್ಯವಾಗಿ ತುಂಬಾ ದೊಡ್ಡದಾಗಿರುತ್ತವೆ ಮತ್ತು ನಿರ್ವಹಿಸಲು ತೊಡಕಾಗಿರುತ್ತವೆ. ಅವುಗಳಿಂದ ಅರ್ಥಪೂರ್ಣ ತೀರ್ಮಾನಗಳನ್ನು ತೆಗೆದುಕೊಳ್ಳುವುದು ಬೇಸರದ ಕೆಲಸವಾಗಿದೆ ಏಕೆಂದರೆ ಅವು ಸಂಖ್ಯಾಶಾಸ್ತ್ರೀಯ ವಿಧಾನಗಳಿಗೆ ಸುಲಭವಾಗಿ ಒಳಪಡುವುದಿಲ್ಲ. ಆದ್ದರಿಂದ, ಯಾವುದೇ ವ್ಯವಸ್ಥಿತ ಸಂಖ್ಯಾಶಾಸ್ತ್ರೀಯ ವಿಶ್ಲೇಷಣೆಯನ್ನು ಕೈಗೊಳ್ಳುವ ಮೊದಲು ಅಂತಹ ದತ್ತಾಂಶದ ಸರಿಯಾದ ಸಂಘಟನೆ ಮತ್ತು ಪ್ರಸ್ತುತಿ ಅಗತ್ಯವಿದೆ. ಆದ್ದರಿಂದ ದತ್ತಾಂಶವನ್ನು ಸಂಗ್ರಹಿಸಿದ ನಂತರದ ಹಂತವೆಂದರೆ ಅವುಗಳನ್ನು ವರ್ಗೀಕರಿಸಿದ ರೂಪದಲ್ಲಿ ಸಂಘಟಿಸುವುದು ಮತ್ತು ಪ್ರಸ್ತುತಪಡಿಸುವುದು.

ನಿಮ್ಮ ಶಾಲೆಯ 100 ವಿದ್ಯಾರ್ಥಿಗಳ ಗಣಿತದ ಅಂಕಗಳ ಬಗ್ಗೆ ನೀವು ದತ್ತಾಂಶವನ್ನು ಸಂಗ್ರಹಿಸಿದ್ದೀರಿ ಎಂದು ಭಾವಿಸಿ. ನೀವು ಅವುಗಳನ್ನು ಒಂದು ಕೋಷ್ಟಕವಾಗಿ ಪ್ರಸ್ತುತಪಡಿಸಿದರೆ, ಅವು ಕೋಷ್ಟಕ 3.1 ರಂತೆ ಕಾಣಿಸಬಹುದು.

ಕೋಷ್ಟಕ 3.1 ಪರೀಕ್ಷೆಯಲ್ಲಿ 100 ವಿದ್ಯಾರ್ಥಿಗಳು ಪಡೆದ ಗಣಿತದ ಅಂಕಗಳು

47 45 10 60 51 56 66 100 49 40
60 59 56 55 62 48 59 55 51 41
42 69 64 66 50 59 57 65 62 50
64 30 37 75 17 56 20 14 55 90
62 51 55 14 25 34 90 49 56 54
70 47 49 82 40 82 60 85 65 66
49 44 64 69 70 48 12 28 55 65
49 40 25 41 71 80 0 56 14 22
66 53 46 70 43 61 59 12 30 35
45 44 57 76 82 39 32 14 90 25

ಅಥವಾ ನಿಮ್ಮ ನೆರೆಹೊರೆಯ 50 ಕುಟುಂಬಗಳ ಮಾಸಿಕ ಆಹಾರ ಖರ್ಚಿನ ಬಗ್ಗೆ ದತ್ತಾಂಶವನ್ನು ಸಂಗ್ರಹಿಸಿ, ಅವರ ಸರಾಸರಿ ಆಹಾರ ಖರ್ಚು ತಿಳಿಯಲು ಬಯಸಬಹುದು. ಸಂಗ್ರಹಿಸಿದ ದತ್ತಾಂಶವನ್ನು, ಆ ಸಂದರ್ಭದಲ್ಲಿ, ನೀವು ಕೋಷ್ಟಕವಾಗಿ ಪ್ರಸ್ತುತಪಡಿಸಿದ್ದರೆ, ಕೋಷ್ಟಕ 3.2 ಗೆ ಹೋಲುತ್ತದೆ. ಕೋಷ್ಟಕ 3.1 ಮತ್ತು 3.2 ಎರಡೂ ಕಚ್ಚಾ ಅಥವಾ ವರ್ಗೀಕರಿಸದ ದತ್ತಾಂಶವಾಗಿದೆ. ಎರಡೂ ಕೋಷ್ಟಕಗಳಲ್ಲಿ ಸಂಖ್ಯೆಗಳು ಯಾವುದೇ ಕ್ರಮದಲ್ಲಿ ಜೋಡಿಸಲ್ಪಟ್ಟಿಲ್ಲ ಎಂದು ನೀವು ಕಾಣುತ್ತೀರಿ. ಈಗ ನೀವು ಕೋಷ್ಟಕ 3.1 ರಿಂದ ಗಣಿತದಲ್ಲಿ ಅತ್ಯಧಿಕ ಅಂಕಗಳನ್ನು ಕೇಳಿದರೆ, ನೀವು ಮೊದಲು 100 ವಿದ್ಯಾರ್ಥಿಗಳ ಅಂಕಗಳನ್ನು ಆರೋಹಣ ಅಥವಾ ಅವರೋಹಣ ಕ್ರಮದಲ್ಲಿ ಜೋಡಿಸಬೇಕಾಗುತ್ತದೆ. ಅದು ಬೇಸರದ ಕೆಲಸವಾಗಿದೆ. 100 ಬದಲಿಗೆ ನೀವು 1,000 ವಿದ್ಯಾರ್ಥಿಗಳ ಅಂಕಗಳನ್ನು ನಿರ್ವಹಿಸಬೇಕಾದರೆ ಅದು ಇನ್ನಷ್ಟು ಬೇಸರದ ಕೆಲಸವಾಗುತ್ತದೆ. ಅಂತೆಯೇ, ಕೋಷ್ಟಕ 3.2 ರಲ್ಲಿ, 50 ಕುಟುಂಬಗಳ ಸರಾಸರಿ ಮಾಸಿಕ ಖರ್ಚನ್ನು ನಿರ್ಧರಿಸುವುದು ನಿಮಗೆ ಕಷ್ಟಕರವಾಗಿದೆ ಎಂದು ನೀವು ಗಮನಿಸುತ್ತೀರಿ. ಮತ್ತು ಸಂಖ್ಯೆಯು ದೊಡ್ಡದಾಗಿದ್ದರೆ - ಹೇಳಿ, 5,000 ಕುಟುಂಬಗಳು - ಈ ತೊಂದರೆ ಅನೇಕ ಪಟ್ಟು ಹೆಚ್ಚಾಗುತ್ತದೆ. ನಮ್ಮ ಕಬಡಿವಾಲನಂತೆ, ಅವನ ಕಸವು ದೊಡ್ಡದಾಗಿ ಮತ್ತು ಅಸ್ತವ್ಯಸ್ತವಾಗಿದ್ದಾಗ ಒಂದು ನಿರ್ದಿಷ್ಟ ವಸ್ತುವನ್ನು ಕಂಡುಹಿಡಿಯಲು ಅವನು ತೊಂದರೆಗೊಳಗಾಗುತ್ತಾನೆ, ದೊಡ್ಡದಾಗಿರುವ ಕಚ್ಚಾ ದತ್ತಾಂಶದಿಂದ ಯಾವುದೇ ಮಾಹಿತಿಯನ್ನು ಪಡೆಯಲು ನೀವು ಪ್ರಯತ್ನಿಸಿದಾಗ ನೀವು ಇದೇ ರೀತಿಯ ಪರಿಸ್ಥಿತಿಯನ್ನು ಎದುರಿಸುತ್ತೀರಿ. ಒಂದು ಪದದಲ್ಲಿ, ಆದ್ದರಿಂದ, ದೊಡ್ಡ ವರ್ಗೀಕರಿಸದ ದತ್ತಾಂಶದಿಂದ ಮಾಹಿತಿಯನ್ನು ಹೊರತೆಗೆಯುವುದು ಬೇಸರದ ಕೆಲಸವಾಗಿದೆ.

ಕೋಷ್ಟಕ 3.2 50 ಕುಟುಂಬಗಳ ಮಾಸಿಕ ಗೃಹೋಪಯೋಗಿ ಆಹಾರ ಖರ್ಚು (ರೂಪಾಯಿಗಳಲ್ಲಿ)

1904 1559 3473 1735 2760
2041 1612 1753 1855 4439
5090 1085 1823 2346 1523
1211 1360 1110 2152 1183
1218 1315 1105 2628 2712
4248 1812 1264 1183 1171
1007 1180 1953 1137 2048
2025 1583 1324 2621 3676
1397 1832 1962 2177 2575
1293 1365 1146 3222 1396

ಕಚ್ಚಾ ದತ್ತಾಂಶವನ್ನು ಸಂಕ್ಷೇಪಿಸಲಾಗುತ್ತದೆ ಮತ್ತು ವರ್ಗೀಕರಣದಿಂದ ಅರ್ಥವಾಗುವಂತೆ ಮಾಡಲಾಗುತ್ತದೆ. ಒಂದೇ ರೀತಿಯ ಗುಣಲಕ್ಷಣಗಳ ಸಂಗತಿಗಳನ್ನು ಒಂದೇ ವರ್ಗದಲ್ಲಿ ಇರಿಸಿದಾಗ, ಅವುಗಳನ್ನು ಸುಲಭವಾಗಿ ಕಂಡುಹಿಡಿಯಲು, ಹೋಲಿಕೆ ಮಾಡಲು ಮತ್ತು ಯಾವುದೇ ತೊಂದರೆ ಇಲ್ಲದೆ ತೀರ್ಮಾನಗಳನ್ನು ತೆಗೆದುಕೊಳ್ಳಲು ಸಾಧ್ಯವಾಗುತ್ತದೆ. ನೀವು ಅಧ್ಯಾಯ 2 ರಲ್ಲಿ ಅಧ್ಯಯನ ಮಾಡಿದಂತೆ, ಭಾರತ ಸರ್ಕಾರವು ಪ್ರತಿ ಹತ್ತು ವರ್ಷಗಳಿಗೊಮ್ಮೆ ಜನಗಣತಿಯನ್ನು ನಡೆಸುತ್ತದೆ. 2001 ರ ಜನಗಣತಿಯಲ್ಲಿ ಸುಮಾರು 20 ಕೋಟಿ ಜನರನ್ನು ಸಂಪರ್ಕಿಸಲಾಗಿದೆ. ಜನಗಣತಿಯ ಕಚ್ಚಾ ದತ್ತಾಂಶವು ತುಂಬಾ ದೊಡ್ಡದಾಗಿದೆ ಮತ್ತು ತುಂಡು ತುಂಡಾಗಿದೆ, ಅವುಗಳಿಂದ ಯಾವುದೇ ಅರ್ಥಪೂರ್ಣ ತೀರ್ಮಾನವನ್ನು ತೆಗೆದುಕೊಳ್ಳುವುದು ಬಹುತೇಕ ಅಸಾಧ್ಯ ಕಾರ್ಯವೆಂದು ತೋರುತ್ತದೆ. ಆದರೆ ಅದೇ ದತ್ತಾಂಶವನ್ನು ಲಿಂಗ, ಶಿಕ್ಷಣ, ವೈವಾಹಿಕ ಸ್ಥಿತಿ, ಉದ್ಯೋಗ ಇತ್ಯಾದಿಗಳ ಪ್ರಕಾರ ವರ್ಗೀಕರಿಸಿದಾಗ, ಭಾರತದ ಜನಸಂಖ್ಯೆಯ ರಚನೆ ಮತ್ತು ಸ್ವರೂಪವನ್ನು ನಂತರ ಸುಲಭವಾಗಿ ಅರ್ಥಮಾಡಿಕೊಳ್ಳಲಾಗುತ್ತದೆ.

ಕಚ್ಚಾ ದತ್ತಾಂಶವು ಚರಾಂಶಗಳ ಮೇಲಿನ ಅವಲೋಕನಗಳನ್ನು ಒಳಗೊಂಡಿರುತ್ತದೆ. ಕೋಷ್ಟಕ 3.1 ಮತ್ತು 3.2 ರಲ್ಲಿ ನೀಡಲಾದ ಕಚ್ಚಾ ದತ್ತಾಂಶವು ಒಂದು ನಿರ್ದಿಷ್ಟ ಅಥವಾ ಚರಾಂಶಗಳ ಗುಂಪಿನ ಮೇಲಿನ ಅವಲೋಕನಗಳನ್ನು ಒಳಗೊಂಡಿರುತ್ತದೆ. ಉದಾಹರಣೆಗೆ ಕೋಷ್ಟಕ 3.1 ಅನ್ನು ನೋಡಿ, ಇದು 100 ವಿದ್ಯಾರ್ಥಿಗಳು ಗಳಿಸಿದ ಗಣಿತದ ಅಂಕಗಳನ್ನು ಒಳಗೊಂಡಿದೆ. ಈ ಅಂಕಗಳಿಂದ ನಾವು ಹೇಗೆ ಅರ್ಥ ಮಾಡಿಕೊಳ್ಳಬಹುದು? ಈ ಅಂಕಗಳನ್ನು ನೋಡುವ ಗಣಿತ ಶಿಕ್ಷಕರು ಯೋಚಿಸುತ್ತಿರಬಹುದು-ನನ್ನ ವಿದ್ಯಾರ್ಥಿಗಳು ಹೇಗೆ ಮಾಡಿದ್ದಾರೆ? ಎಷ್ಟು ಮಂದಿ ಉತ್ತೀರ್ಣರಾಗಿಲ್ಲ? ನಾವು ದತ್ತಾಂಶವನ್ನು ಹೇಗೆ ವರ್ಗೀಕರಿಸುತ್ತೇವೆ ಎಂಬುದು ನಮ್ಮ ಮನಸ್ಸಿನಲ್ಲಿರುವ ಉದ್ದೇಶವನ್ನು ಅವಲಂಬಿಸಿರುತ್ತದೆ. ಈ ಸಂದರ್ಭದಲ್ಲಿ, ಶಿಕ್ಷಕರು ಕೆಲವು ಆಳದಲ್ಲಿ ಅರ್ಥಮಾಡಿಕೊಳ್ಳಲು ಬಯಸುತ್ತಾರೆ- ಈ ವಿದ್ಯಾರ್ಥಿಗಳು ಹೇಗೆ ಮಾಡಿದ್ದಾರೆ. ಅವರು ಬಹುಶಃ ಆವೃತ್ತಿ ವಿತರಣೆಯನ್ನು ರಚಿಸಲು ಆಯ್ಕೆ ಮಾಡುತ್ತಾರೆ. ಇದನ್ನು ಮುಂದಿನ ವಿಭಾಗದಲ್ಲಿ ಚರ್ಚಿಸಲಾಗಿದೆ.

ಕಾರ್ಯಾಚರಣೆ

  • ಒಂದು ವರ್ಷದ ನಿಮ್ಮ ಕುಟುಂಬದ ಒಟ್ಟು ಸಾಪ್ತಾಹಿಕ ಖರ್ಚಿನ ದತ್ತಾಂಶವನ್ನು ಸಂಗ್ರಹಿಸಿ ಮತ್ತು ಅದನ್ನು ಕೋಷ್ಟಕದಲ್ಲಿ ಜೋಡಿಸಿ. ನೀವು ಎಷ್ಟು ಅವಲೋಕನಗಳನ್ನು ಹೊಂದಿದ್ದೀರಿ ಎಂಬುದನ್ನು ನೋಡಿ. ದತ್ತಾಂಶವನ್ನು ಮಾಸಿಕವಾಗಿ ಜೋಡಿಸಿ ಮತ್ತು ಅವಲೋಕನಗಳ ಸಂಖ್ಯೆಯನ್ನು ಕಂಡುಹಿಡಿಯಿರಿ.

3. ದತ್ತಾಂಶದ ವರ್ಗೀಕರಣ

ವರ್ಗೀಕರಣದ ಗುಂಪುಗಳು ಅಥವಾ ವರ್ಗಗಳನ್ನು ವಿವಿಧ ರೀತಿಯಲ್ಲಿ ಮಾಡಲಾಗುತ್ತದೆ. ನಿಮ್ಮ ಪುಸ್ತಕಗಳನ್ನು ವಿಷಯಗಳ ಪ್ರಕಾರ - “ಇತಿಹಾಸ”, “ಭೂಗೋಳ”, “ಗಣಿತ”, “ವಿಜ್ಞಾನ” ಇತ್ಯಾದಿ - ವರ್ಗೀಕರಿಸುವ ಬದಲು, ನೀವು ಅವುಗಳನ್ನು ಲೇಖಕರ ಪ್ರಕಾರ ವರ್ಣಮಾಲೆಯ ಕ್ರಮದಲ್ಲಿ ವರ್ಗೀಕರಿಸಬಹುದಿತ್ತು. ಅಥವಾ, ನೀವು ಅವುಗಳನ್ನು ಪ್ರಕಟಣೆಯ ವರ್ಷದ ಪ್ರಕಾರವೂ ವರ್ಗೀಕರಿಸಬಹುದಿತ್ತು. ನೀವು ಅವುಗಳನ್ನು ಹೇಗೆ ವರ್ಗೀಕರಿಸಲು ಬಯಸುತ್ತೀರಿ ಎಂಬುದು ನಿಮ್ಮ ಅವಶ್ಯಕತೆಯನ್ನು ಅವಲಂಬಿಸಿರುತ್ತದೆ.

ಅಂತೆಯೇ ಕಚ್ಚಾ ದತ್ತಾಂಶವನ್ನು ಉದ್ದೇಶವನ್ನು ಅವಲಂಬಿಸಿ ವಿವಿಧ ರೀತಿಯಲ್ಲಿ ವರ್ಗೀಕರಿಸಲಾಗುತ್ತದೆ. ಅವುಗಳನ್ನು ಸಮಯದ ಪ್ರಕಾರ ಗುಂಪು ಮಾಡಬಹುದು. ಅಂತಹ ವರ್ಗೀಕರಣವನ್ನು ಕಾಲಾನುಕ್ರಮದ ವರ್ಗೀಕರಣ ಎಂದು ಕರೆಯಲಾಗುತ್ತದೆ. ಅಂತಹ ವರ್ಗೀಕರಣದಲ್ಲಿ, ದತ್ತಾಂಶವನ್ನು ವರ್ಷಗಳು, ತ್ರೈಮಾಸಿಕಗಳು, ತಿಂಗಳುಗಳು, ವಾರಗಳು ಇತ್ಯಾದಿ ಸಮಯಕ್ಕೆ ಸಂಬಂಧಿಸಿದಂತೆ ಆರೋಹಣ ಅಥವಾ ಅವರೋಹಣ ಕ್ರಮದಲ್ಲಿ ವರ್ಗೀಕರಿಸಲಾಗುತ್ತದೆ. ಈ ಕೆಳಗಿನ ಉದಾಹರಣೆಯು ವರ್ಷಗಳ ಪ್ರಕಾರ ವರ್ಗೀಕರಿಸಲ್ಪಟ್ಟ ಭಾರತದ ಜನಸಂಖ್ಯೆಯನ್ನು ತೋರಿಸುತ್ತದೆ. ‘ಜನಸಂಖ್ಯೆ’ ಚರಾಂಶವು ಒಂದು ಕಾಲಾನುಕ್ರಮ ಶ್ರೇಣಿಯಾಗಿದೆ ಏಕೆಂದರೆ ಇದು ವಿವಿಧ ವರ್ಷಗಳಿಗೆ ಮೌಲ್ಯಗಳ ಶ್ರೇಣಿಯನ್ನು ಚಿತ್ರಿಸುತ್ತದೆ.

ಉದಾಹರಣೆ 1

ಭಾರತದ ಜನಸಂಖ್ಯೆ (ಕೋಟಿಗಳಲ್ಲಿ)

ವರ್ಷ ಜನಸಂಖ್ಯೆ (ಕೋಟಿ)
1951 35.7
1961 43.8
1971 54.6
1981 68.4
1991 81.8
2001 102.7
2011 121.0

ಸ್ಥಳಿಕ ವರ್ಗೀಕರಣದಲ್ಲಿ ದತ್ತಾಂಶವನ್ನು ದೇಶಗಳು, ರಾಜ್ಯಗಳು, ನಗರಗಳು, ಜಿಲ್ಲೆಗಳು ಇತ್ಯಾದಿ ಭೌಗೋಳಿಕ ಸ್ಥಳಗಳಿಗೆ ಸಂಬಂಧಿಸಿದಂತೆ ವರ್ಗೀಕರಿಸಲಾಗುತ್ತದೆ.

ಉದಾಹರಣೆ 2 ವಿವಿಧ ದೇಶಗಳಲ್ಲಿ ಗೋಧಿ ಇಳುವರಿಯನ್ನು ತೋರಿಸುತ್ತದೆ.

ಉದಾಹರಣೆ 2

ವಿವಿಧ ದೇಶಗಳ ಗೋಧಿ ಇಳುವರಿ (2013)

ದೇಶ ಗೋಧಿ ಇಳುವರಿ (ಕೆಜಿ/ಹೆಕ್ಟೇರ್)
ಕೆನಡಾ 3594
ಚೀನಾ 5055
ಫ್ರಾನ್ಸ್ 7254
ಜರ್ಮನಿ 7998
ಭಾರತ 3154
ಪಾಕಿಸ್ತಾನ 2787

ಮೂಲ: ಭಾರತೀಯ ಕೃಷಿ ಅಂಕಿಅಂಶಗಳು ಒಂದು ನೋಟದಲ್ಲಿ, 2015

ಕಾರ್ಯಾಚರಣೆಗಳು

  • ಉದಾಹರಣೆ 1 ರಲ್ಲಿ, ಭಾರತದ ಜನಸಂಖ್ಯೆ ಕನಿಷ್ಠ ಮತ್ತು ಗರಿಷ್ಠವಾಗಿದ್ದ ವರ್ಷಗಳನ್ನು ಕಂಡುಹಿಡಿಯಿರಿ,
  • ಉದಾಹರಣೆ 2 ರಲ್ಲಿ, ಭಾರತದ ಇಳುವರಿಗಿಂತ ಸ್ವಲ್ಪ ಹೆಚ್ಚು ಗೋಧಿ ಇಳುವರಿ ಹೊಂದಿರುವ ದೇಶವನ್ನು ಕಂಡುಹಿಡಿಯಿರಿ. ಅದು ಶೇಕಡಾವಾರು ಪ್ರಮಾಣದಲ್ಲಿ ಎಷ್ಟು ಇರುತ್ತದೆ?
  • ಉದಾಹರಣೆ 2 ರ ದೇಶಗಳನ್ನು ಇಳುವರಿಯ ಆರೋಹಣ ಕ್ರಮದಲ್ಲಿ ಜೋಡಿಸಿ. ಇಳುವರಿಯ ಅವರೋಹಣ ಕ್ರಮಕ್ಕೆ ಅದೇ ವ್ಯಾಯಾಮವನ್ನು ಮಾಡಿ.

ಕೆಲವೊಮ್ಮೆ ನೀವು ಪರಿಮಾಣಾತ್ಮಕವಾಗಿ ವ್ಯಕ್ತಪಡಿಸಲಾಗದ ಗುಣಲಕ್ಷಣಗಳನ್ನು ಎದುರಿಸುತ್ತೀರಿ. ಅಂತಹ ಗುಣಲಕ್ಷಣಗಳನ್ನು ಗುಣಲಕ್ಷಣಗಳು ಎಂದು ಕರೆಯಲಾಗುತ್ತದೆ. ಉದಾಹರಣೆಗೆ, ರಾಷ್ಟ್ರೀಯತೆ, ಸಾಕ್ಷರತೆ, ಧರ್ಮ, ಲಿಂಗ, ವೈವಾಹಿಕ ಸ್ಥಿತಿ ಇತ್ಯಾದಿ. ಅವುಗಳನ್ನು ಅಳೆಯಲಾಗುವುದಿಲ್ಲ. ಆದರೆ ಈ ಗುಣಲಕ್ಷಣಗಳನ್ನು ಗುಣಾತ್ಮಕ ಗುಣಲಕ್ಷಣದ ಉಪಸ್ಥಿತಿ ಅಥವಾ ಅನುಪಸ್ಥಿತಿಯ ಆಧಾರದ ಮೇಲೆ ವರ್ಗೀಕರಿಸಬಹುದು. ಗುಣಲಕ್ಷಣಗಳ ಮೇಲಿನ ದತ್ತಾಂಶದ ಅಂತಹ ವರ್ಗೀಕರಣವನ್ನು ಗುಣಾತ್ಮಕ ವರ್ಗೀಕರಣ ಎಂದು ಕರೆಯಲಾಗುತ್ತದೆ. ಈ ಕೆಳಗಿನ ಉದಾಹರಣೆಯಲ್ಲಿ, ಒಂದು ದೇಶದ ಜನಸಂಖ್ಯೆಯನ್ನು ಗುಣಾತ್ಮಕ ಚರಾಂಶ “ಲಿಂಗ"ದ ಆಧಾರದ ಮೇಲೆ ಗುಂಪು ಮಾಡಲಾಗಿದೆ ಎಂದು ನಾವು ಕಾಣುತ್ತೇವೆ. ಒಂದು ಅವಲೋಕನವು ಪುರುಷ ಅಥವಾ ಸ್ತ್ರೀ ಆಗಿರಬಹುದು. ಈ ಎರಡು ಗುಣಲಕ್ಷಣಗಳನ್ನು ಕೆಳಗೆ ನೀಡಿರುವಂತೆ ವೈವಾಹಿಕ ಸ್ಥಿತಿಯ ಆಧಾರದ ಮೇಲೆ ಮತ್ತಷ್ಟು ಉಪವಿಭಾಗಿಸಬಹುದು:

ಉದಾಹರಣೆ 3

ಮೊದಲ ಹಂತದ ವರ್ಗೀಕರಣವು ಒಂದು ಗುಣಲಕ್ಷಣದ ಉಪಸ್ಥಿತಿ ಮತ್ತು ಅನುಪಸ್ಥಿತಿಯ ಆಧಾರದ ಮೇಲೆ ಇದೆ, ಅಂದರೆ ಪುರುಷ ಅಥವಾ ಪುರುಷ ಅಲ್ಲ (ಸ್ತ್ರೀ). ಎರಡನೇ ಹಂತದಲ್ಲಿ, ಪ್ರತಿ ವರ್ಗ - ಪುರುಷ ಮತ್ತು ಸ್ತ್ರೀ, ಇನ್ನೊಂದು ಗುಣಲಕ್ಷಣದ ಉಪಸ್ಥಿತಿ ಅಥವಾ ಅನುಪಸ್ಥಿತಿಯ ಆಧಾರದ ಮೇಲೆ ಮತ್ತಷ್ಟು ಉಪವಿಭಾಗಿಸಲ್ಪಡುತ್ತದೆ, ಅಂದರೆ ವಿವಾಹಿತ ಅಥವಾ ಅವಿವಾಹಿತ. ಎತ್ತರ, ತೂಕ, ವಯಸ್ಸು, ಆದಾಯ, ವಿದ್ಯಾರ್ಥಿಗಳ ಅಂಕಗಳು ಇತ್ಯಾದಿ ಗುಣಲಕ್ಷಣಗಳು ಪರಿಮಾಣಾತ್ಮಕ ಸ್ವಭಾವದ್ದಾಗಿವೆ. ಅಂತಹ ಗುಣಲಕ್ಷಣಗಳ ಸಂಗ್ರಹಿತ ದತ್ತಾಂಶವನ್ನು ವರ್ಗಗಳಾಗಿ ಗುಂಪು ಮಾಡಿದಾಗ, ಅದು ಪರಿಮಾಣಾತ್ಮಕ ವರ್ಗೀಕರಣವಾಗುತ್ತದೆ.

ಕಾರ್ಯಾಚರಣೆ

  • ಸುತ್ತಮುತ್ತಲಿನ ವಸ್ತುಗಳನ್ನು ಜೀವಂತ ಅಥವಾ ನಿರ್ಜೀವ ಎಂದು ಗುಂಪು ಮಾಡಬಹುದು. ಇದು ಪರಿಮಾಣಾತ್ಮಕ ವರ್ಗೀಕರಣವೇ?

ಉದಾಹರಣೆ 4

100 ವಿದ್ಯಾರ್ಥಿಗಳ ಗಣಿತದ ಅಂಕಗಳ ಆವೃತ್ತಿ ವಿತರಣೆ

ಅಂಕಗಳು ಆವೃತ್ತಿ
0-10 1
10-20 8
20-30 6
30-40 7
40-50 21
50-60 23
60-70 19
70-80 6
80-90 5
90-100 4
ಒಟ್ಟು 100

ಉದಾಹರಣೆ 4 ಕೋಷ್ಟಕ 3.1 ರಲ್ಲಿ ನೀಡಲಾದ 100 ವಿದ್ಯಾರ್ಥಿಗಳ ಗಣಿತದ ಅಂಕಗಳ ಪರಿಮಾಣಾತ್ಮಕ ವರ್ಗೀಕರಣವನ್ನು ತೋರಿಸುತ್ತದೆ.

ಕಾರ್ಯಾಚರಣೆ

  • ಉದಾಹರಣೆ 4 ರ ಆವೃತ್ತಿಯ ಮೌಲ್ಯಗಳನ್ನು ಒಟ್ಟು ಆವೃತ್ತಿಯ ಪ್ರಮಾಣ ಅಥವಾ ಶೇಕಡಾವಾರು ಪ್ರಮಾಣದಲ್ಲಿ ವ್ಯಕ್ತಪಡಿಸಿ. ಈ ರೀತಿಯಲ್ಲಿ ವ್ಯಕ್ತಪಡಿಸಲಾದ ಆವೃತ್ತಿಯನ್ನು ಸಾಪೇಕ್ಷ ಆವೃತ್ತಿ ಎಂದು ಕರೆಯಲಾಗುತ್ತದೆ ಎಂಬುದನ್ನು ಗಮನಿಸಿ.
  • ಉದಾಹರಣೆ 4 ರಲ್ಲಿ, ಯಾವ ವರ್ಗವು ದತ್ತಾಂಶದ ಗರಿಷ್ಠ ಸಾಂದ್ರತೆಯನ್ನು ಹೊಂದಿದೆ? ಅದನ್ನು ಒಟ್ಟು ಅವಲೋಕನಗಳ ಶೇಕಡಾವಾರು ಪ್ರಮಾಣದಲ್ಲಿ ವ್ಯಕ್ತಪಡಿಸಿ. ಯಾವ ವರ್ಗವು ಕನಿಷ್ಠ ಸಾಂದ್ರತೆಯ ದತ್ತಾಂಶವನ್ನು ಹೊಂದಿದೆ?

4. ಚರಾಂಶಗಳು: ಸತತ ಮತ್ತು ವಿವಿಕ್ತ

ಚರಾಂಶದ ಸರಳ ವ್ಯಾಖ್ಯಾನ, ನೀವು ಕಳೆದ ಅಧ್ಯಾಯದಲ್ಲಿ ಓದಿದ್ದೀರಿ, ಅದು ಹೇಗೆ ಬದಲಾಗುತ್ತದೆ ಎಂಬುದನ್ನು ನಿಮಗೆ ಹೇಳುವುದಿಲ್ಲ. ಚರಾಂಶಗಳು ನಿರ್ದಿಷ್ಟ ಮಾನದಂಡಗಳ ಆಧಾರದ ಮೇಲೆ ಭಿನ್ನವಾಗಿರು