SATHEE: ಅಧ್ಯಾಯ 03 ದತ್ತಾಂಶದ ವರ್ಗೀಕರಣ

ಅಧ್ಯಾಯ 03 ದತ್ತಾಂಶದ ವರ್ಗೀಕರಣ

1. ಪರಿಚಯ

ಹಿಂದಿನ ಅಧ್ಯಾಯದಲ್ಲಿ ದತ್ತಾಂಶವನ್ನು ಹೇಗೆ ಸಂಗ್ರಹಿಸಲಾಗುತ್ತದೆ ಎಂಬುದನ್ನು ನೀವು ಕಲಿತಿದ್ದೀರಿ. ಜನಗಣತಿ ಮತ್ತು ಮಾದರಿ ಸಂಗ್ರಹಣೆಯ ನಡುವಿನ ವ್ಯತ್ಯಾಸವನ್ನೂ ನೀವು ತಿಳಿದುಕೊಂಡಿದ್ದೀರಿ. ಈ ಅಧ್ಯಾಯದಲ್ಲಿ, ನೀವು ಸಂಗ್ರಹಿಸಿದ ದತ್ತಾಂಶಗಳನ್ನು ಹೇಗೆ ವರ್ಗೀಕರಿಸಬೇಕು ಎಂಬುದನ್ನು ನೀವು ತಿಳಿಯುವಿರಿ. ಕಚ್ಚಾ ದತ್ತಾಂಶವನ್ನು ವರ್ಗೀಕರಿಸುವ ಉದ್ದೇಶವೆಂದರೆ ಅವುಗಳಲ್ಲಿ ಕ್ರಮವನ್ನು ತರುವುದು, ಇದರಿಂದಾಗಿ ಅವುಗಳನ್ನು ಮುಂದಿನ ಸಂಖ್ಯಾಶಾಸ್ತ್ರೀಯ ವಿಶ್ಲೇಷಣೆಗೆ ಸುಲಭವಾಗಿ ಒಳಪಡಿಸಬಹುದು.

ನಿಮ್ಮ ಸ್ಥಳೀಯ ಕಸದ ವ್ಯಾಪಾರಿ ಅಥವಾ ಕಬಡಿವಾಲಾಳನ್ನು ನೀವು ಎಂದಾದರೂ ಗಮನಿಸಿದ್ದೀರಾ, ಅವರಿಗೆ ನೀವು ಹಳೆಯ ಪತ್ರಿಕೆಗಳು, ಮುರಿದ ಗೃಹೋಪಯೋಗಿ ವಸ್ತುಗಳು, ಖಾಲಿ ಗಾಜಿನ ಬಾಟಲಿಗಳು, ಪ್ಲಾಸ್ಟಿಕ್ಗಳು ಇತ್ಯಾದಿಗಳನ್ನು ಮಾರುತ್ತೀರಿ? ಅವನು ಈ ವಸ್ತುಗಳನ್ನು ನಿಮ್ಮಿಂದ ಖರೀದಿಸಿ, ಅವುಗಳನ್ನು ಮರುಬಳಕೆ ಮಾಡುವವರಿಗೆ ಮಾರುತ್ತಾನೆ. ಆದರೆ ಅವನ ಅಂಗಡಿಯಲ್ಲಿ ಇಷ್ಟು ಹೆಚ್ಚು ಕಸವಿದ್ದರೆ, ಅವನು ಅವುಗಳನ್ನು ಸರಿಯಾಗಿ ವ್ಯವಸ್ಥೆಗೊಳಿಸದಿದ್ದರೆ, ಅವನ ವ್ಯಾಪಾರವನ್ನು ನಿರ್ವಹಿಸುವುದು ಅವನಿಗೆ ತುಂಬಾ ಕಷ್ಟಕರವಾಗುತ್ತದೆ. ತನ್ನ ಪರಿಸ್ಥಿತಿಯನ್ನು ಸುಲಭಗೊಳಿಸಲು, ಅವನು ವಿವಿಧ ಕಸವನ್ನು ಸೂಕ್ತವಾಗಿ ಗುಂಪು ಮಾಡುತ್ತಾನೆ ಅಥವಾ “ವರ್ಗೀಕರಿಸುತ್ತಾನೆ”. ಅವನು ಹಳೆಯ ಪತ್ರಿಕೆಗಳನ್ನು ಒಟ್ಟಿಗೆ ಇಡುತ್ತಾನೆ ಮತ್ತು ಒಂದು ಹಗ್ಗದಿಂದ ಕಟ್ಟುತ್ತಾನೆ. ನಂತರ ಎಲ್ಲಾ ಖಾಲಿ ಗಾಜಿನ ಬಾಟಲಿಗಳನ್ನು ಒಂದು ಚೀಲದಲ್ಲಿ ಸಂಗ್ರಹಿಸುತ್ತಾನೆ. ಅವನು ಲೋಹದ ವಸ್ತುಗಳನ್ನು ಅಂಗಡಿಯ ಒಂದು ಮೂಲೆಯಲ್ಲಿ ರಾಶಿ ಹಾಕಿ, “ಕಬ್ಬಿಣ”, “ತಾಮ್ರ”, “ಅಲ್ಯೂಮಿನಿಯಂ”, “ಹಿತ್ತಾಳೆ” ಇತ್ಯಾದಿ ಗುಂಪುಗಳಾಗಿ ವಿಂಗಡಿಸುತ್ತಾನೆ. ಈ ರೀತಿಯಾಗಿ ಅವನು ತನ್ನ ಕಸವನ್ನು ವಿಭಿನ್ನ ವರ್ಗಗಳಾಗಿ ಗುಂಪು ಮಾಡುತ್ತಾನೆ - “ಪತ್ರಿಕೆಗಳು”, “ಪ್ಲಾಸ್ಟಿಕ್ಗಳು”, “ಗಾಜು”, “ಲೋಹಗಳು” ಇತ್ಯಾದಿ - ಮತ್ತು ಅವುಗಳಲ್ಲಿ ಕ್ರಮ ತರುತ್ತಾನೆ. ಒಮ್ಮೆ ಅವನ ಕಸವು ಜೋಡಿಸಲ್ಪಟ್ಟು ಮತ್ತು ವರ್ಗೀಕರಿಸಲ್ಪಟ್ಟ ನಂತರ, ಖರೀದಿದಾರನು ಬೇಡಿಕೆ ಮಾಡಬಹುದಾದ ನಿರ್ದಿಷ್ಟ ವಸ್ತುವನ್ನು ಕಂಡುಹಿಡಿಯುವುದು ಅವನಿಗೆ ಸುಲಭವಾಗುತ್ತದೆ.

ಅಂತೆಯೇ, ನೀವು ನಿಮ್ಮ ಶಾಲಾ ಪುಸ್ತಕಗಳನ್ನು ಒಂದು ನಿರ್ದಿಷ್ಟ ಕ್ರಮದಲ್ಲಿ ಜೋಡಿಸಿದಾಗ, ಅವುಗಳನ್ನು ನಿರ್ವಹಿಸುವುದು ನಿಮಗೆ ಸುಲಭವಾಗುತ್ತದೆ. ನೀವು ಅವುಗಳನ್ನು ವಿಷಯಗಳ ಪ್ರಕಾರ ವರ್ಗೀಕರಿಸಬಹುದು, ಅಲ್ಲಿ ಪ್ರತಿ ವಿಷಯವು ಒಂದು ಗುಂಪು ಅಥವಾ ವರ್ಗವಾಗುತ್ತದೆ. ಆದ್ದರಿಂದ, ಉದಾಹರಣೆಗೆ, ನಿಮಗೆ ಇತಿಹಾಸದ ಒಂದು ನಿರ್ದಿಷ್ಟ ಪುಸ್ತಕ ಬೇಕಾದಾಗ, ನೀವು ಮಾಡಬೇಕಾಗಿರುವುದು “ಇತಿಹಾಸ” ಗುಂಪಿನಲ್ಲಿ ಆ ಪುಸ್ತಕವನ್ನು ಹುಡುಕುವುದು ಮಾತ್ರ. ಇಲ್ಲದಿದ್ದರೆ, ನೀವು ಹುಡುಕುತ್ತಿರುವ ನಿರ್ದಿಷ್ಟ ಪುಸ್ತಕವನ್ನು ಕಂಡುಹಿಡಿಯಲು ನಿಮ್ಮ ಸಂಪೂರ್ಣ ಸಂಗ್ರಹದ ಮೂಲಕ ಹುಡುಕಬೇಕಾಗುತ್ತದೆ.

ವಸ್ತುಗಳನ್ನು ಅಥವಾ ವಸ್ತುಗಳ ವರ್ಗೀಕರಣವು ನಮ್ಮ ಬೆಲೆಬಾಳುವ ಸಮಯ ಮತ್ತು ಶ್ರಮವನ್ನು ಉಳಿಸುತ್ತದೆ, ಆದರೆ ಅದನ್ನು ನಿರಂಕುಶ ರೀತಿಯಲ್ಲಿ ಮಾಡಲಾಗುವುದಿಲ್ಲ. ಕಬಡಿವಾಲನು ಮರುಬಳಕೆಯ ಸರಕುಗಳ ಮಾರುಕಟ್ಟೆಗಳ ಪ್ರಕಾರ ತನ್ನ ಕಸವನ್ನು ಗುಂಪು ಮಾಡುತ್ತಾನೆ. ಉದಾಹರಣೆಗೆ, “ಗಾಜು” ಗುಂಪಿನ ಅಡಿಯಲ್ಲಿ ಅವನು ಖಾಲಿ ಬಾಟಲಿಗಳು, ಮುರಿದ ಕನ್ನಡಿಗಳು ಮತ್ತು ಕಿಟಕಿಯ ಗಾಜುಗಳು ಇತ್ಯಾದಿಗಳನ್ನು ಇಡುತ್ತಾನೆ. ಅಂತೆಯೇ, ನೀವು ನಿಮ್ಮ ಇತಿಹಾಸದ ಪುಸ್ತಕಗಳನ್ನು “ಇತಿಹಾಸ” ಗುಂಪಿನ ಅಡಿಯಲ್ಲಿ ವರ್ಗೀಕರಿಸುವಾಗ, ನೀವು ಬೇರೆ ವಿಷಯದ ಪುಸ್ತಕವನ್ನು ಆ ಗುಂಪಿನಲ್ಲಿ ಇಡುವುದಿಲ್ಲ. ಇಲ್ಲದಿದ್ದರೆ ಗುಂಪು ಮಾಡುವ ಸಂಪೂರ್ಣ ಉದ್ದೇಶವೇ ನಷ್ಟವಾಗುತ್ತದೆ. ಆದ್ದರಿಂದ, ವರ್ಗೀಕರಣ ಎಂದರೆ ಕೆಲವು ಮಾನದಂಡಗಳ ಆಧಾರದ ಮೇಲೆ ವಸ್ತುಗಳನ್ನು ಗುಂಪುಗಳಾಗಿ ಅಥವಾ ವರ್ಗಗಳಾಗಿ ಜೋಡಿಸುವುದು ಅಥವಾ ವ್ಯವಸ್ಥೆಗೊಳಿಸುವುದು.

ಕಾರ್ಯಾಚರಣೆ

ಅಕ್ಷರಗಳನ್ನು ಹೇಗೆ ವಿಂಗಡಿಸಲಾಗುತ್ತದೆ ಎಂಬುದನ್ನು ಕಂಡುಹಿಡಿಯಲು ನಿಮ್ಮ ಸ್ಥಳೀಯ ಅಂಚೆ ಕಚೇರಿಗೆ ಭೇಟಿ ನೀಡಿ. ಅಂಚೆಯಲ್ಲಿನ ಪಿನ್-ಕೋಡ್ ಏನನ್ನು ಸೂಚಿಸುತ್ತದೆ ಎಂದು ನಿಮಗೆ ತಿಳಿದಿದೆಯೇ? ನಿಮ್ಮ ಅಂಚೆ ಕಾರ್ಯನಿರ್ವಾಹಕರನ್ನು ಕೇಳಿ.

2. ಕಚ್ಚಾ ದತ್ತಾಂಶ

ಕಬಡಿವಾಲನ ಕಸದಂತೆ, ವರ್ಗೀಕರಿಸದ ದತ್ತಾಂಶ ಅಥವಾ ಕಚ್ಚಾ ದತ್ತಾಂಶವು ಬಹಳ ಅಸಂಘಟಿತವಾಗಿರುತ್ತದೆ. ಅವು ಸಾಮಾನ್ಯವಾಗಿ ತುಂಬಾ ದೊಡ್ಡದಾಗಿರುತ್ತವೆ ಮತ್ತು ನಿರ್ವಹಿಸಲು ತೊಡಕಾಗಿರುತ್ತವೆ. ಅವುಗಳಿಂದ ಅರ್ಥಪೂರ್ಣ ತೀರ್ಮಾನಗಳನ್ನು ತೆಗೆದುಕೊಳ್ಳುವುದು ಬೇಸರದ ಕೆಲಸವಾಗಿದೆ ಏಕೆಂದರೆ ಅವು ಸಂಖ್ಯಾಶಾಸ್ತ್ರೀಯ ವಿಧಾನಗಳಿಗೆ ಸುಲಭವಾಗಿ ಒಳಪಡುವುದಿಲ್ಲ. ಆದ್ದರಿಂದ, ಯಾವುದೇ ವ್ಯವಸ್ಥಿತ ಸಂಖ್ಯಾಶಾಸ್ತ್ರೀಯ ವಿಶ್ಲೇಷಣೆಯನ್ನು ಕೈಗೊಳ್ಳುವ ಮೊದಲು ಅಂತಹ ದತ್ತಾಂಶದ ಸರಿಯಾದ ಸಂಘಟನೆ ಮತ್ತು ಪ್ರಸ್ತುತಿ ಅಗತ್ಯವಿದೆ. ಆದ್ದರಿಂದ ದತ್ತಾಂಶವನ್ನು ಸಂಗ್ರಹಿಸಿದ ನಂತರದ ಹಂತವೆಂದರೆ ಅವುಗಳನ್ನು ವರ್ಗೀಕರಿಸಿದ ರೂಪದಲ್ಲಿ ಸಂಘಟಿಸುವುದು ಮತ್ತು ಪ್ರಸ್ತುತಪಡಿಸುವುದು.

ನಿಮ್ಮ ಶಾಲೆಯ 100 ವಿದ್ಯಾರ್ಥಿಗಳ ಗಣಿತದ ಅಂಕಗಳ ಬಗ್ಗೆ ನೀವು ದತ್ತಾಂಶವನ್ನು ಸಂಗ್ರಹಿಸಿದ್ದೀರಿ ಎಂದು ಭಾವಿಸಿ. ನೀವು ಅವುಗಳನ್ನು ಒಂದು ಕೋಷ್ಟಕವಾಗಿ ಪ್ರಸ್ತುತಪಡಿಸಿದರೆ, ಅವು ಕೋಷ್ಟಕ 3.1 ರಂತೆ ಕಾಣಿಸಬಹುದು.

ಕೋಷ್ಟಕ 3.1 ಪರೀಕ್ಷೆಯಲ್ಲಿ 100 ವಿದ್ಯಾರ್ಥಿಗಳು ಪಡೆದ ಗಣಿತದ ಅಂಕಗಳು


47	45	10	60	51	56	66	100	49	40
60	59	56	55	62	48	59	55	51	41
42	69	64	66	50	59	57	65	62	50
64	30	37	75	17	56	20	14	55	90
62	51	55	14	25	34	90	49	56	54
70	47	49	82	40	82	60	85	65	66
49	44	64	69	70	48	12	28	55	65
49	40	25	41	71	80	0	56	14	22
66	53	46	70	43	61	59	12	30	35
45	44	57	76	82	39	32	14	90	25

ಅಥವಾ ನಿಮ್ಮ ನೆರೆಹೊರೆಯ 50 ಕುಟುಂಬಗಳ ಮಾಸಿಕ ಆಹಾರ ಖರ್ಚಿನ ಬಗ್ಗೆ ದತ್ತಾಂಶವನ್ನು ಸಂಗ್ರಹಿಸಿ, ಅವರ ಸರಾಸರಿ ಆಹಾರ ಖರ್ಚು ತಿಳಿಯಲು ಬಯಸಬಹುದು. ಸಂಗ್ರಹಿಸಿದ ದತ್ತಾಂಶವನ್ನು, ಆ ಸಂದರ್ಭದಲ್ಲಿ, ನೀವು ಕೋಷ್ಟಕವಾಗಿ ಪ್ರಸ್ತುತಪಡಿಸಿದ್ದರೆ, ಕೋಷ್ಟಕ 3.2 ಗೆ ಹೋಲುತ್ತದೆ. ಕೋಷ್ಟಕ 3.1 ಮತ್ತು 3.2 ಎರಡೂ ಕಚ್ಚಾ ಅಥವಾ ವರ್ಗೀಕರಿಸದ ದತ್ತಾಂಶವಾಗಿದೆ. ಎರಡೂ ಕೋಷ್ಟಕಗಳಲ್ಲಿ ಸಂಖ್ಯೆಗಳು ಯಾವುದೇ ಕ್ರಮದಲ್ಲಿ ಜೋಡಿಸಲ್ಪಟ್ಟಿಲ್ಲ ಎಂದು ನೀವು ಕಾಣುತ್ತೀರಿ. ಈಗ ನೀವು ಕೋಷ್ಟಕ 3.1 ರಿಂದ ಗಣಿತದಲ್ಲಿ ಅತ್ಯಧಿಕ ಅಂಕಗಳನ್ನು ಕೇಳಿದರೆ, ನೀವು ಮೊದಲು 100 ವಿದ್ಯಾರ್ಥಿಗಳ ಅಂಕಗಳನ್ನು ಆರೋಹಣ ಅಥವಾ ಅವರೋಹಣ ಕ್ರಮದಲ್ಲಿ ಜೋಡಿಸಬೇಕಾಗುತ್ತದೆ. ಅದು ಬೇಸರದ ಕೆಲಸವಾಗಿದೆ. 100 ಬದಲಿಗೆ ನೀವು 1,000 ವಿದ್ಯಾರ್ಥಿಗಳ ಅಂಕಗಳನ್ನು ನಿರ್ವಹಿಸಬೇಕಾದರೆ ಅದು ಇನ್ನಷ್ಟು ಬೇಸರದ ಕೆಲಸವಾಗುತ್ತದೆ. ಅಂತೆಯೇ, ಕೋಷ್ಟಕ 3.2 ರಲ್ಲಿ, 50 ಕುಟುಂಬಗಳ ಸರಾಸರಿ ಮಾಸಿಕ ಖರ್ಚನ್ನು ನಿರ್ಧರಿಸುವುದು ನಿಮಗೆ ಕಷ್ಟಕರವಾಗಿದೆ ಎಂದು ನೀವು ಗಮನಿಸುತ್ತೀರಿ. ಮತ್ತು ಸಂಖ್ಯೆಯು ದೊಡ್ಡದಾಗಿದ್ದರೆ - ಹೇಳಿ, 5,000 ಕುಟುಂಬಗಳು - ಈ ತೊಂದರೆ ಅನೇಕ ಪಟ್ಟು ಹೆಚ್ಚಾಗುತ್ತದೆ. ನಮ್ಮ ಕಬಡಿವಾಲನಂತೆ, ಅವನ ಕಸವು ದೊಡ್ಡದಾಗಿ ಮತ್ತು ಅಸ್ತವ್ಯಸ್ತವಾಗಿದ್ದಾಗ ಒಂದು ನಿರ್ದಿಷ್ಟ ವಸ್ತುವನ್ನು ಕಂಡುಹಿಡಿಯಲು ಅವನು ತೊಂದರೆಗೊಳಗಾಗುತ್ತಾನೆ, ದೊಡ್ಡದಾಗಿರುವ ಕಚ್ಚಾ ದತ್ತಾಂಶದಿಂದ ಯಾವುದೇ ಮಾಹಿತಿಯನ್ನು ಪಡೆಯಲು ನೀವು ಪ್ರಯತ್ನಿಸಿದಾಗ ನೀವು ಇದೇ ರೀತಿಯ ಪರಿಸ್ಥಿತಿಯನ್ನು ಎದುರಿಸುತ್ತೀರಿ. ಒಂದು ಪದದಲ್ಲಿ, ಆದ್ದರಿಂದ, ದೊಡ್ಡ ವರ್ಗೀಕರಿಸದ ದತ್ತಾಂಶದಿಂದ ಮಾಹಿತಿಯನ್ನು ಹೊರತೆಗೆಯುವುದು ಬೇಸರದ ಕೆಲಸವಾಗಿದೆ.

ಕೋಷ್ಟಕ 3.2 50 ಕುಟುಂಬಗಳ ಮಾಸಿಕ ಗೃಹೋಪಯೋಗಿ ಆಹಾರ ಖರ್ಚು (ರೂಪಾಯಿಗಳಲ್ಲಿ)

—	—	—	—	—
1904	1559	3473	1735	2760
2041	1612	1753	1855	4439
5090	1085	1823	2346	1523
1211	1360	1110	2152	1183
1218	1315	1105	2628	2712
4248	1812	1264	1183	1171
1007	1180	1953	1137	2048
2025	1583	1324	2621	3676
1397	1832	1962	2177	2575
1293	1365	1146	3222	1396

ಕಚ್ಚಾ ದತ್ತಾಂಶವನ್ನು ಸಂಕ್ಷೇಪಿಸಲಾಗುತ್ತದೆ ಮತ್ತು ವರ್ಗೀಕರಣದಿಂದ ಅರ್ಥವಾಗುವಂತೆ ಮಾಡಲಾಗುತ್ತದೆ. ಒಂದೇ ರೀತಿಯ ಗುಣಲಕ್ಷಣಗಳ ಸಂಗತಿಗಳನ್ನು ಒಂದೇ ವರ್ಗದಲ್ಲಿ ಇರಿಸಿದಾಗ, ಅವುಗಳನ್ನು ಸುಲಭವಾಗಿ ಕಂಡುಹಿಡಿಯಲು, ಹೋಲಿಕೆ ಮಾಡಲು ಮತ್ತು ಯಾವುದೇ ತೊಂದರೆ ಇಲ್ಲದೆ ತೀರ್ಮಾನಗಳನ್ನು ತೆಗೆದುಕೊಳ್ಳಲು ಸಾಧ್ಯವಾಗುತ್ತದೆ. ನೀವು ಅಧ್ಯಾಯ 2 ರಲ್ಲಿ ಅಧ್ಯಯನ ಮಾಡಿದಂತೆ, ಭಾರತ ಸರ್ಕಾರವು ಪ್ರತಿ ಹತ್ತು ವರ್ಷಗಳಿಗೊಮ್ಮೆ ಜನಗಣತಿಯನ್ನು ನಡೆಸುತ್ತದೆ. 2001 ರ ಜನಗಣತಿಯಲ್ಲಿ ಸುಮಾರು 20 ಕೋಟಿ ಜನರನ್ನು ಸಂಪರ್ಕಿಸಲಾಗಿದೆ. ಜನಗಣತಿಯ ಕಚ್ಚಾ ದತ್ತಾಂಶವು ತುಂಬಾ ದೊಡ್ಡದಾಗಿದೆ ಮತ್ತು ತುಂಡು ತುಂಡಾಗಿದೆ, ಅವುಗಳಿಂದ ಯಾವುದೇ ಅರ್ಥಪೂರ್ಣ ತೀರ್ಮಾನವನ್ನು ತೆಗೆದುಕೊಳ್ಳುವುದು ಬಹುತೇಕ ಅಸಾಧ್ಯ ಕಾರ್ಯವೆಂದು ತೋರುತ್ತದೆ. ಆದರೆ ಅದೇ ದತ್ತಾಂಶವನ್ನು ಲಿಂಗ, ಶಿಕ್ಷಣ, ವೈವಾಹಿಕ ಸ್ಥಿತಿ, ಉದ್ಯೋಗ ಇತ್ಯಾದಿಗಳ ಪ್ರಕಾರ ವರ್ಗೀಕರಿಸಿದಾಗ, ಭಾರತದ ಜನಸಂಖ್ಯೆಯ ರಚನೆ ಮತ್ತು ಸ್ವರೂಪವನ್ನು ನಂತರ ಸುಲಭವಾಗಿ ಅರ್ಥಮಾಡಿಕೊಳ್ಳಲಾಗುತ್ತದೆ.

ಕಚ್ಚಾ ದತ್ತಾಂಶವು ಚರಾಂಶಗಳ ಮೇಲಿನ ಅವಲೋಕನಗಳನ್ನು ಒಳಗೊಂಡಿರುತ್ತದೆ. ಕೋಷ್ಟಕ 3.1 ಮತ್ತು 3.2 ರಲ್ಲಿ ನೀಡಲಾದ ಕಚ್ಚಾ ದತ್ತಾಂಶವು ಒಂದು ನಿರ್ದಿಷ್ಟ ಅಥವಾ ಚರಾಂಶಗಳ ಗುಂಪಿನ ಮೇಲಿನ ಅವಲೋಕನಗಳನ್ನು ಒಳಗೊಂಡಿರುತ್ತದೆ. ಉದಾಹರಣೆಗೆ ಕೋಷ್ಟಕ 3.1 ಅನ್ನು ನೋಡಿ, ಇದು 100 ವಿದ್ಯಾರ್ಥಿಗಳು ಗಳಿಸಿದ ಗಣಿತದ ಅಂಕಗಳನ್ನು ಒಳಗೊಂಡಿದೆ. ಈ ಅಂಕಗಳಿಂದ ನಾವು ಹೇಗೆ ಅರ್ಥ ಮಾಡಿಕೊಳ್ಳಬಹುದು? ಈ ಅಂಕಗಳನ್ನು ನೋಡುವ ಗಣಿತ ಶಿಕ್ಷಕರು ಯೋಚಿಸುತ್ತಿರಬಹುದು-ನನ್ನ ವಿದ್ಯಾರ್ಥಿಗಳು ಹೇಗೆ ಮಾಡಿದ್ದಾರೆ? ಎಷ್ಟು ಮಂದಿ ಉತ್ತೀರ್ಣರಾಗಿಲ್ಲ? ನಾವು ದತ್ತಾಂಶವನ್ನು ಹೇಗೆ ವರ್ಗೀಕರಿಸುತ್ತೇವೆ ಎಂಬುದು ನಮ್ಮ ಮನಸ್ಸಿನಲ್ಲಿರುವ ಉದ್ದೇಶವನ್ನು ಅವಲಂಬಿಸಿರುತ್ತದೆ. ಈ ಸಂದರ್ಭದಲ್ಲಿ, ಶಿಕ್ಷಕರು ಕೆಲವು ಆಳದಲ್ಲಿ ಅರ್ಥಮಾಡಿಕೊಳ್ಳಲು ಬಯಸುತ್ತಾರೆ- ಈ ವಿದ್ಯಾರ್ಥಿಗಳು ಹೇಗೆ ಮಾಡಿದ್ದಾರೆ. ಅವರು ಬಹುಶಃ ಆವೃತ್ತಿ ವಿತರಣೆಯನ್ನು ರಚಿಸಲು ಆಯ್ಕೆ ಮಾಡುತ್ತಾರೆ. ಇದನ್ನು ಮುಂದಿನ ವಿಭಾಗದಲ್ಲಿ ಚರ್ಚಿಸಲಾಗಿದೆ.

ಕಾರ್ಯಾಚರಣೆ

ಒಂದು ವರ್ಷದ ನಿಮ್ಮ ಕುಟುಂಬದ ಒಟ್ಟು ಸಾಪ್ತಾಹಿಕ ಖರ್ಚಿನ ದತ್ತಾಂಶವನ್ನು ಸಂಗ್ರಹಿಸಿ ಮತ್ತು ಅದನ್ನು ಕೋಷ್ಟಕದಲ್ಲಿ ಜೋಡಿಸಿ. ನೀವು ಎಷ್ಟು ಅವಲೋಕನಗಳನ್ನು ಹೊಂದಿದ್ದೀರಿ ಎಂಬುದನ್ನು ನೋಡಿ. ದತ್ತಾಂಶವನ್ನು ಮಾಸಿಕವಾಗಿ ಜೋಡಿಸಿ ಮತ್ತು ಅವಲೋಕನಗಳ ಸಂಖ್ಯೆಯನ್ನು ಕಂಡುಹಿಡಿಯಿರಿ.

3. ದತ್ತಾಂಶದ ವರ್ಗೀಕರಣ

ವರ್ಗೀಕರಣದ ಗುಂಪುಗಳು ಅಥವಾ ವರ್ಗಗಳನ್ನು ವಿವಿಧ ರೀತಿಯಲ್ಲಿ ಮಾಡಲಾಗುತ್ತದೆ. ನಿಮ್ಮ ಪುಸ್ತಕಗಳನ್ನು ವಿಷಯಗಳ ಪ್ರಕಾರ - “ಇತಿಹಾಸ”, “ಭೂಗೋಳ”, “ಗಣಿತ”, “ವಿಜ್ಞಾನ” ಇತ್ಯಾದಿ - ವರ್ಗೀಕರಿಸುವ ಬದಲು, ನೀವು ಅವುಗಳನ್ನು ಲೇಖಕರ ಪ್ರಕಾರ ವರ್ಣಮಾಲೆಯ ಕ್ರಮದಲ್ಲಿ ವರ್ಗೀಕರಿಸಬಹುದಿತ್ತು. ಅಥವಾ, ನೀವು ಅವುಗಳನ್ನು ಪ್ರಕಟಣೆಯ ವರ್ಷದ ಪ್ರಕಾರವೂ ವರ್ಗೀಕರಿಸಬಹುದಿತ್ತು. ನೀವು ಅವುಗಳನ್ನು ಹೇಗೆ ವರ್ಗೀಕರಿಸಲು ಬಯಸುತ್ತೀರಿ ಎಂಬುದು ನಿಮ್ಮ ಅವಶ್ಯಕತೆಯನ್ನು ಅವಲಂಬಿಸಿರುತ್ತದೆ.

ಅಂತೆಯೇ ಕಚ್ಚಾ ದತ್ತಾಂಶವನ್ನು ಉದ್ದೇಶವನ್ನು ಅವಲಂಬಿಸಿ ವಿವಿಧ ರೀತಿಯಲ್ಲಿ ವರ್ಗೀಕರಿಸಲಾಗುತ್ತದೆ. ಅವುಗಳನ್ನು ಸಮಯದ ಪ್ರಕಾರ ಗುಂಪು ಮಾಡಬಹುದು. ಅಂತಹ ವರ್ಗೀಕರಣವನ್ನು ಕಾಲಾನುಕ್ರಮದ ವರ್ಗೀಕರಣ ಎಂದು ಕರೆಯಲಾಗುತ್ತದೆ. ಅಂತಹ ವರ್ಗೀಕರಣದಲ್ಲಿ, ದತ್ತಾಂಶವನ್ನು ವರ್ಷಗಳು, ತ್ರೈಮಾಸಿಕಗಳು, ತಿಂಗಳುಗಳು, ವಾರಗಳು ಇತ್ಯಾದಿ ಸಮಯಕ್ಕೆ ಸಂಬಂಧಿಸಿದಂತೆ ಆರೋಹಣ ಅಥವಾ ಅವರೋಹಣ ಕ್ರಮದಲ್ಲಿ ವರ್ಗೀಕರಿಸಲಾಗುತ್ತದೆ. ಈ ಕೆಳಗಿನ ಉದಾಹರಣೆಯು ವರ್ಷಗಳ ಪ್ರಕಾರ ವರ್ಗೀಕರಿಸಲ್ಪಟ್ಟ ಭಾರತದ ಜನಸಂಖ್ಯೆಯನ್ನು ತೋರಿಸುತ್ತದೆ. ‘ಜನಸಂಖ್ಯೆ’ ಚರಾಂಶವು ಒಂದು ಕಾಲಾನುಕ್ರಮ ಶ್ರೇಣಿಯಾಗಿದೆ ಏಕೆಂದರೆ ಇದು ವಿವಿಧ ವರ್ಷಗಳಿಗೆ ಮೌಲ್ಯಗಳ ಶ್ರೇಣಿಯನ್ನು ಚಿತ್ರಿಸುತ್ತದೆ.

ಉದಾಹರಣೆ 1

ಭಾರತದ ಜನಸಂಖ್ಯೆ (ಕೋಟಿಗಳಲ್ಲಿ)

ವರ್ಷ	ಜನಸಂಖ್ಯೆ (ಕೋಟಿ)
1951	35.7
1961	43.8
1971	54.6
1981	68.4
1991	81.8
2001	102.7
2011	121.0

ಸ್ಥಳಿಕ ವರ್ಗೀಕರಣದಲ್ಲಿ ದತ್ತಾಂಶವನ್ನು ದೇಶಗಳು, ರಾಜ್ಯಗಳು, ನಗರಗಳು, ಜಿಲ್ಲೆಗಳು ಇತ್ಯಾದಿ ಭೌಗೋಳಿಕ ಸ್ಥಳಗಳಿಗೆ ಸಂಬಂಧಿಸಿದಂತೆ ವರ್ಗೀಕರಿಸಲಾಗುತ್ತದೆ.

ಉದಾಹರಣೆ 2 ವಿವಿಧ ದೇಶಗಳಲ್ಲಿ ಗೋಧಿ ಇಳುವರಿಯನ್ನು ತೋರಿಸುತ್ತದೆ.

ಉದಾಹರಣೆ 2

ವಿವಿಧ ದೇಶಗಳ ಗೋಧಿ ಇಳುವರಿ (2013)

ದೇಶ	ಗೋಧಿ ಇಳುವರಿ (ಕೆಜಿ/ಹೆಕ್ಟೇರ್)
ಕೆನಡಾ	3594
ಚೀನಾ	5055
ಫ್ರಾನ್ಸ್	7254
ಜರ್ಮನಿ	7998
ಭಾರತ	3154
ಪಾಕಿಸ್ತಾನ	2787

ಮೂಲ: ಭಾರತೀಯ ಕೃಷಿ ಅಂಕಿಅಂಶಗಳು ಒಂದು ನೋಟದಲ್ಲಿ, 2015

ಕಾರ್ಯಾಚರಣೆಗಳು

ಉದಾಹರಣೆ 1 ರಲ್ಲಿ, ಭಾರತದ ಜನಸಂಖ್ಯೆ ಕನಿಷ್ಠ ಮತ್ತು ಗರಿಷ್ಠವಾಗಿದ್ದ ವರ್ಷಗಳನ್ನು ಕಂಡುಹಿಡಿಯಿರಿ,

ಉದಾಹರಣೆ 2 ರಲ್ಲಿ, ಭಾರತದ ಇಳುವರಿಗಿಂತ ಸ್ವಲ್ಪ ಹೆಚ್ಚು ಗೋಧಿ ಇಳುವರಿ ಹೊಂದಿರುವ ದೇಶವನ್ನು ಕಂಡುಹಿಡಿಯಿರಿ. ಅದು ಶೇಕಡಾವಾರು ಪ್ರಮಾಣದಲ್ಲಿ ಎಷ್ಟು ಇರುತ್ತದೆ?

ಉದಾಹರಣೆ 2 ರ ದೇಶಗಳನ್ನು ಇಳುವರಿಯ ಆರೋಹಣ ಕ್ರಮದಲ್ಲಿ ಜೋಡಿಸಿ. ಇಳುವರಿಯ ಅವರೋಹಣ ಕ್ರಮಕ್ಕೆ ಅದೇ ವ್ಯಾಯಾಮವನ್ನು ಮಾಡಿ.

ಕೆಲವೊಮ್ಮೆ ನೀವು ಪರಿಮಾಣಾತ್ಮಕವಾಗಿ ವ್ಯಕ್ತಪಡಿಸಲಾಗದ ಗುಣಲಕ್ಷಣಗಳನ್ನು ಎದುರಿಸುತ್ತೀರಿ. ಅಂತಹ ಗುಣಲಕ್ಷಣಗಳನ್ನು ಗುಣಲಕ್ಷಣಗಳು ಎಂದು ಕರೆಯಲಾಗುತ್ತದೆ. ಉದಾಹರಣೆಗೆ, ರಾಷ್ಟ್ರೀಯತೆ, ಸಾಕ್ಷರತೆ, ಧರ್ಮ, ಲಿಂಗ, ವೈವಾಹಿಕ ಸ್ಥಿತಿ ಇತ್ಯಾದಿ. ಅವುಗಳನ್ನು ಅಳೆಯಲಾಗುವುದಿಲ್ಲ. ಆದರೆ ಈ ಗುಣಲಕ್ಷಣಗಳನ್ನು ಗುಣಾತ್ಮಕ ಗುಣಲಕ್ಷಣದ ಉಪಸ್ಥಿತಿ ಅಥವಾ ಅನುಪಸ್ಥಿತಿಯ ಆಧಾರದ ಮೇಲೆ ವರ್ಗೀಕರಿಸಬಹುದು. ಗುಣಲಕ್ಷಣಗಳ ಮೇಲಿನ ದತ್ತಾಂಶದ ಅಂತಹ ವರ್ಗೀಕರಣವನ್ನು ಗುಣಾತ್ಮಕ ವರ್ಗೀಕರಣ ಎಂದು ಕರೆಯಲಾಗುತ್ತದೆ. ಈ ಕೆಳಗಿನ ಉದಾಹರಣೆಯಲ್ಲಿ, ಒಂದು ದೇಶದ ಜನಸಂಖ್ಯೆಯನ್ನು ಗುಣಾತ್ಮಕ ಚರಾಂಶ “ಲಿಂಗ"ದ ಆಧಾರದ ಮೇಲೆ ಗುಂಪು ಮಾಡಲಾಗಿದೆ ಎಂದು ನಾವು ಕಾಣುತ್ತೇವೆ. ಒಂದು ಅವಲೋಕನವು ಪುರುಷ ಅಥವಾ ಸ್ತ್ರೀ ಆಗಿರಬಹುದು. ಈ ಎರಡು ಗುಣಲಕ್ಷಣಗಳನ್ನು ಕೆಳಗೆ ನೀಡಿರುವಂತೆ ವೈವಾಹಿಕ ಸ್ಥಿತಿಯ ಆಧಾರದ ಮೇಲೆ ಮತ್ತಷ್ಟು ಉಪವಿಭಾಗಿಸಬಹುದು:

ಉದಾಹರಣೆ 3

ಮೊದಲ ಹಂತದ ವರ್ಗೀಕರಣವು ಒಂದು ಗುಣಲಕ್ಷಣದ ಉಪಸ್ಥಿತಿ ಮತ್ತು ಅನುಪಸ್ಥಿತಿಯ ಆಧಾರದ ಮೇಲೆ ಇದೆ, ಅಂದರೆ ಪುರುಷ ಅಥವಾ ಪುರುಷ ಅಲ್ಲ (ಸ್ತ್ರೀ). ಎರಡನೇ ಹಂತದಲ್ಲಿ, ಪ್ರತಿ ವರ್ಗ - ಪುರುಷ ಮತ್ತು ಸ್ತ್ರೀ, ಇನ್ನೊಂದು ಗುಣಲಕ್ಷಣದ ಉಪಸ್ಥಿತಿ ಅಥವಾ ಅನುಪಸ್ಥಿತಿಯ ಆಧಾರದ ಮೇಲೆ ಮತ್ತಷ್ಟು ಉಪವಿಭಾಗಿಸಲ್ಪಡುತ್ತದೆ, ಅಂದರೆ ವಿವಾಹಿತ ಅಥವಾ ಅವಿವಾಹಿತ. ಎತ್ತರ, ತೂಕ, ವಯಸ್ಸು, ಆದಾಯ, ವಿದ್ಯಾರ್ಥಿಗಳ ಅಂಕಗಳು ಇತ್ಯಾದಿ ಗುಣಲಕ್ಷಣಗಳು ಪರಿಮಾಣಾತ್ಮಕ ಸ್ವಭಾವದ್ದಾಗಿವೆ. ಅಂತಹ ಗುಣಲಕ್ಷಣಗಳ ಸಂಗ್ರಹಿತ ದತ್ತಾಂಶವನ್ನು ವರ್ಗಗಳಾಗಿ ಗುಂಪು ಮಾಡಿದಾಗ, ಅದು ಪರಿಮಾಣಾತ್ಮಕ ವರ್ಗೀಕರಣವಾಗುತ್ತದೆ.

ಕಾರ್ಯಾಚರಣೆ

ಸುತ್ತಮುತ್ತಲಿನ ವಸ್ತುಗಳನ್ನು ಜೀವಂತ ಅಥವಾ ನಿರ್ಜೀವ ಎಂದು ಗುಂಪು ಮಾಡಬಹುದು. ಇದು ಪರಿಮಾಣಾತ್ಮಕ ವರ್ಗೀಕರಣವೇ?

ಉದಾಹರಣೆ 4

100 ವಿದ್ಯಾರ್ಥಿಗಳ ಗಣಿತದ ಅಂಕಗಳ ಆವೃತ್ತಿ ವಿತರಣೆ

ಅಂಕಗಳು	ಆವೃತ್ತಿ
0-10	1
10-20	8
20-30	6
30-40	7
40-50	21
50-60	23
60-70	19
70-80	6
80-90	5
90-100	4
ಒಟ್ಟು	100

ಉದಾಹರಣೆ 4 ಕೋಷ್ಟಕ 3.1 ರಲ್ಲಿ ನೀಡಲಾದ 100 ವಿದ್ಯಾರ್ಥಿಗಳ ಗಣಿತದ ಅಂಕಗಳ ಪರಿಮಾಣಾತ್ಮಕ ವರ್ಗೀಕರಣವನ್ನು ತೋರಿಸುತ್ತದೆ.

ಕಾರ್ಯಾಚರಣೆ

ಉದಾಹರಣೆ 4 ರ ಆವೃತ್ತಿಯ ಮೌಲ್ಯಗಳನ್ನು ಒಟ್ಟು ಆವೃತ್ತಿಯ ಪ್ರಮಾಣ ಅಥವಾ ಶೇಕಡಾವಾರು ಪ್ರಮಾಣದಲ್ಲಿ ವ್ಯಕ್ತಪಡಿಸಿ. ಈ ರೀತಿಯಲ್ಲಿ ವ್ಯಕ್ತಪಡಿಸಲಾದ ಆವೃತ್ತಿಯನ್ನು ಸಾಪೇಕ್ಷ ಆವೃತ್ತಿ ಎಂದು ಕರೆಯಲಾಗುತ್ತದೆ ಎಂಬುದನ್ನು ಗಮನಿಸಿ.

ಉದಾಹರಣೆ 4 ರಲ್ಲಿ, ಯಾವ ವರ್ಗವು ದತ್ತಾಂಶದ ಗರಿಷ್ಠ ಸಾಂದ್ರತೆಯನ್ನು ಹೊಂದಿದೆ? ಅದನ್ನು ಒಟ್ಟು ಅವಲೋಕನಗಳ ಶೇಕಡಾವಾರು ಪ್ರಮಾಣದಲ್ಲಿ ವ್ಯಕ್ತಪಡಿಸಿ. ಯಾವ ವರ್ಗವು ಕನಿಷ್ಠ ಸಾಂದ್ರತೆಯ ದತ್ತಾಂಶವನ್ನು ಹೊಂದಿದೆ?

4. ಚರಾಂಶಗಳು: ಸತತ ಮತ್ತು ವಿವಿಕ್ತ

ಚರಾಂಶದ ಸರಳ ವ್ಯಾಖ್ಯಾನ, ನೀವು ಕಳೆದ ಅಧ್ಯಾಯದಲ್ಲಿ ಓದಿದ್ದೀರಿ, ಅದು ಹೇಗೆ ಬದಲಾಗುತ್ತದೆ ಎಂಬುದನ್ನು ನಿಮಗೆ ಹೇಳುವುದಿಲ್ಲ. ಚರಾಂಶಗಳು ನಿರ್ದಿಷ್ಟ ಮಾನದಂಡಗಳ ಆಧಾರದ ಮೇಲೆ ಭಿನ್ನವಾಗಿರು

ಅಧ್ಯಾಯ 03 ದತ್ತಾಂಶದ ವರ್ಗೀಕರಣ

1. ಪರಿಚಯ

2. ಕಚ್ಚಾ ದತ್ತಾಂಶ

3. ದತ್ತಾಂಶದ ವರ್ಗೀಕರಣ

4. ಚರಾಂಶಗಳು: ಸತತ ಮತ್ತು ವಿವಿಕ್ತ

RRB GROUP D

RRB NTPC

RPF SI

RPF CONSTABLE

RRB JE

RRB ALP

RRB TECHNICIAN

NCERT Books

Important Resources

Forums


47	45	10	60	51	56	66	100	49	40
60	59	56	55	62	48	59	55	51	41
42	69	64	66	50	59	57	65	62	50
64	30	37	75	17	56	20	14	55	90
62	51	55	14	25	34	90	49	56	54
70	47	49	82	40	82	60	85	65	66
49	44	64	69	70	48	12	28	55	65
49	40	25	41	71	80	0	56	14	22
66	53	46	70	43	61	59	12	30	35
45	44	57	76	82	39	32	14	90	25


47	45	10	60	51	56	66	100	49	40
60	59	56	55	62	48	59	55	51	41
42	69	64	66	50	59	57	65	62	50
64	30	37	75	17	56	20	14	55	90
62	51	55	14	25	34	90	49	56	54
70	47	49	82	40	82	60	85	65	66
49	44	64	69	70	48	12	28	55	65
49	40	25	41	71	80	0	56	14	22
66	53	46	70	43	61	59	12	30	35
45	44	57	76	82	39	32	14	90	25


47	45	10	60	51	56	66	100	49	40
60	59	56	55	62	48	59	55	51	41
42	69	64	66	50	59	57	65	62	50
64	30	37	75	17	56	20	14	55	90
62	51	55	14	25	34	90	49	56	54
70	47	49	82	40	82	60	85	65	66
49	44	64	69	70	48	12	28	55	65
49	40	25	41	71	80	0	56	14	22
66	53	46	70	43	61	59	12	30	35
45	44	57	76	82	39	32	14	90	25