అధ్యాయం 01 డేటా - దాని మూలం మరియు సంకలనం

మీరు వివిధ రూపాలలో డేటాను చూసి ఉండవచ్చు, ఉపయోగించి ఉండవచ్చు. ఉదాహరణకు, టెలివిజన్లో దాదాపు ప్రతి వార్తా బులెటిన్ చివర, ఆ రోజున ప్రధాన నగరాలలో నమోదైన ఉష్ణోగ్రతలు ప్రదర్శించబడతాయి. అదేవిధంగా, భారతదేశ భౌగోళిక శాస్త్రంపై గల పుస్తకాలు జనాభా వృద్ధి మరియు పంపిణీ, మరియు వివిధ పంటలు, ఖనిజాలు మరియు పారిశ్రామిక ఉత్పత్తుల ఉత్పత్తి, పంపిణీ మరియు వాణిజ్యం సంబంధిత డేటాను పట్టిక రూపంలో చూపిస్తాయి. అవి ఏమి అర్థం చేసుకుంటాయని మీరు ఎప్పుడైనా ఆలోచించారా? ఈ డేటా ఎక్కడ నుండి పొందబడుతుంది? అవి ఎలా పట్టిక చేయబడతాయి మరియు వాటి నుండి అర్థవంతమైన సమాచారాన్ని సంగ్రహించడానికి ఎలా ప్రాసెస్ చేయబడతాయి? ఈ అధ్యాయంలో, మేము డేటా యొక్క ఈ అంశాలపై చర్చిస్తాము మరియు ఈ అనేక ప్రశ్నలకు సమాధానం ఇవ్వడానికి ప్రయత్నిస్తాము.

డేటా అంటే ఏమిటి?

డేటా అనేది నిజమైన ప్రపంచం నుండి కొలతలను సూచించే సంఖ్యలుగా నిర్వచించబడింది. డేటమ్ అనేది ఒకే కొలత. మనం తరచుగా బార్మెర్లో 20 సెంటీమీటర్ల నిరంతర వర్షం లేదా 24 గంటల్లో బాన్స్వారాలో ఒకేసారి 35 సెంటీమీటర్ల వర్షం వంటి వార్తలు లేదా కోటా వడోదరా ద్వారా న్యూఢిల్లీ - ముంబై దూరం 1385 కిలోమీటర్లు మరియు ఇటార్సి - మన్మాడ్ ద్వారా 1542 కిలోమీటర్లు (రైలు ద్వారా) వంటి సమాచారాన్ని చదువుతాము. ఈ సంఖ్యా సమాచారాన్ని డేటా అంటారు. నేడు ప్రపంచంలో పెద్ద మొత్తంలో డేటా అందుబాటులో ఉందని సులభంగా గ్రహించవచ్చు. అయితే, కొన్నిసార్లు, ఈ డేటా ముడి రూపంలో ఉంటే వాటి నుండి తార్కిక నిర్ధారణలను రాబట్టడం కష్టంగా మారుతుంది. అందువల్ల, కొలత సమాచారం అల్గారిథమిక్గా ఉత్పన్నమై మరియు/లేదా తార్కికంగా తీసివేయబడి మరియు/లేదా బహుళ డేటా నుండి గణాంకపరంగా లెక్కించబడిందని నిర్ధారించుకోవడం ముఖ్యం. సమాచారం అనేది ప్రశ్నకు అర్థవంతమైన సమాధానం లేదా మరింత ప్రశ్నలను క్యాస్కేడ్ చేయగల అర్థవంతమైన ప్రేరణగా నిర్వచించబడింది.

డేటా యొక్క అవసరం

భూగోళ శాస్త్రం అధ్యయనంలో మ్యాప్లు ముఖ్యమైన సాధనాలు. అంతేకాకుండా, దృగ్విషయాల పంపిణీ మరియు వృద్ధి కూడా పట్టిక రూపంలో డేటా ద్వారా వివరించబడతాయి. భూమి ఉపరితలంపై అనేక దృగ్విషయాల మధ్య పరస్పర సంబంధం ఉందని మనకు తెలుసు. ఈ పరస్పర చర్యలు అనేక వేరియబుల్స్ ద్వారా ప్రభావితమవుతాయి, అవి పరిమాణాత్మక పదాలలో ఉత్తమంగా వివరించబడతాయి. ఆ వేరియబుల్స్ యొక్క గణాంక విశ్లేషణ నేడు ఒక అవసరంగా మారింది. ఉదాహరణకు, ఒక ప్రాంతం యొక్క పంట నమూనాను అధ్యయనం చేయడానికి, పంట విస్తీర్ణం, పంట దిగుబడి మరియు ఉత్పత్తి, నీటిపారుదల విస్తీర్ణం, వర్షపాతం మొత్తం మరియు ఎరువులు, కీటకనాశకాలు, పురుగుమందులు మొదలైనవి వాడకం వంటి ఇన్పుట్ల గురించి గణాంక సమాచారం ఉండటం అవసరం. అదేవిధంగా, ఒక నగరం యొక్క వృద్ధిని అధ్యయనం చేయడానికి మొత్తం జనాభా, సాంద్రత, వలస వచ్చినవారి సంఖ్య, ప్రజల వృత్తి, వారి జీతాలు, పరిశ్రమలు, రవాణా మరియు సంభాషణ సాధనాలకు సంబంధించిన డేటా అవసరం. అందువలన, డేటా భౌగోళిక విశ్లేషణలో ముఖ్యమైన పాత్ర పోషిస్తుంది.

డేటా యొక్క ప్రదర్శన

తన భార్య మరియు ఐదు సంవత్సరాల బిడ్డతో ప్రయాణిస్తున్న ఒక వ్యక్తి కథ మీరు విని ఉండవచ్చు. తన మార్గంలో, అతను ఒక నదిని దాటవలసి వచ్చింది. మొదట, అతను నది లోతును నాలుగు బిందువుల వద్ద $0.6,0.8,0.9$ మరియు 1.5 మీటర్లుగా కొలిచాడు. అతను సగటు లోతును 0.95 మీటర్లుగా లెక్కించాడు. అతని బిడ్డ ఎత్తు 1 మీటరు. కాబట్టి, అతను వారిని నది దాటడానికి నడిపించాడు మరియు అతని బిడ్డ నదిలో మునిగిపోయాడు. ఇతర ఒడ్డున, అతను ఆలోచిస్తూ కూర్చున్నాడు: “లేఖ జోఖా థహే, తో బచ్చా దూబా కాహే?” (సగటు లోతు ప్రతి ఒక్కరి చేరుకోగలిగిన పరిధిలో ఉన్నప్పుడు బిడ్డ ఎందుకు మునిగిపోయాడు?). దీనిని గణాంక భ్రమ అంటారు, ఇది మిమ్మల్ని వాస్తవ పరిస్థితి నుండి తప్పుదారి పట్టించవచ్చు. కాబట్టి, వాస్తవాలు మరియు సంఖ్యలను తెలుసుకోవడానికి డేటాను సేకరించడం ముఖ్యం, కానీ డేటా ప్రదర్శన కూడా సమానంగా ముఖ్యమైనది. నేడు, విశ్లేషణ, ప్రదర్శన మరియు నిర్ధారణలను రూపొందించడంలో గణాంక పద్ధతుల ఉపయోగం డేటాను ఉపయోగించే భౌగోళిక శాస్త్రం సహా దాదాపు అన్ని విభాగాలలో ముఖ్యమైన పాత్ర పోషిస్తుంది. అందువలన, ఒక దృగ్విషయం యొక్క సాంద్రత, ఉదా., జనాభా, అడవి లేదా రవాణా లేదా సంభాషణ నెట్వర్క్ స్థలం మరియు సమయం మీద మాత్రమే కాకుండా, డేటాను ఉపయోగించి సౌకర్యవంతంగా వివరించవచ్చు అని నిర్ధారించవచ్చు. మరో మాటలో చెప్పాలంటే, వేరియబుల్స్ మధ్య సంబంధాన్ని వివరించడంలో గుణాత్మక వివరణ నుండి పరిమాణాత్మక విశ్లేషణకు మార్పు ఉందని మీరు చెప్పవచ్చు. అందువలన, అధ్యయనాన్ని మరింత తార్కికంగా చేయడానికి మరియు ఖచ్చితమైన నిర్ధారణను రాబట్టడానికి విశ్లేషణాత్మక సాధనాలు మరియు పద్ధతులు ఈ రోజుల్లో మరింత ముఖ్యమైనవి. డేటాను సేకరించడం మరియు సంకలనం చేయడం ప్రారంభం నుండి దాని పట్టిక, సంస్థ, క్రమబద్ధీకరణ మరియు విశ్లేషణ వరకు నిర్ధారణలను రాబట్టే వరకు ఖచ్చితమైన పరిమాణాత్మక పద్ధతులు ఉపయోగించబడతాయి.

డేటా యొక్క మూలాలు

డేటా ఈ క్రింది మార్గాల ద్వారా సేకరించబడుతుంది. అవి: 1. ప్రాథమిక మూలాలు, మరియు 2. ద్వితీయ మూలాలు.

ఒక వ్యక్తి లేదా వ్యక్తుల సమూహం, సంస్థ/సంస్థలు మొదటిసారిగా సేకరించిన డేటాను డేటా యొక్క ప్రాథమిక మూలాలు అంటారు. మరోవైపు, ఏదైనా ప్రచురించబడిన లేదా ప్రచురించబడని మూలాల నుండి సేకరించిన డేటాను ద్వితీయ మూలాలు అంటారు. ఫిగ్. 1.1 డేటా సేకరణ యొక్క వివిధ పద్ధతులను చూపుతుంది.

ప్రాథమిక డేటా యొక్క మూలాలు

1. వ్యక్తిగత పరిశీలనలు

ఇది ఫీల్డ్లో నేరుగా పరిశీలనల ద్వారా ఒక వ్యక్తి లేదా వ్యక్తుల సమూహం చేత సమాచార సేకరణను సూచిస్తుంది. ఫీల్డ్ సర్వే ద్వారా, ఉపరితల లక్షణాలు, డ్రైనేజీ నమూనాలు, నేల రకాలు మరియు సహజ వృక్షసంపద, అలాగే, జనాభా నిర్మాణం, లింగ నిష్పత్తి, అక్షరాస్యత, రవాణా మరియు సంభాషణ సాధనాలు, పట్టణ మరియు గ్రామీణ స్థావరాలు మొదలైన వాటి గురించి సమాచారం సేకరించబడుతుంది. అయితే,

ఫిగ్. 1.1 : డేటా సేకరణ పద్ధతులు

వ్యక్తిగత పరిశీలనలను నిర్వహించడంలో, పాల్గొన్న వ్యక్తి(లు) విషయం యొక్క సైద్ధాంతిక జ్ఞానం మరియు పక్షపాత రహిత మూల్యాంకనం కోసం శాస్త్రీయ వైఖరిని కలిగి ఉండాలి.

2. ఇంటర్వ్యూ

ఈ పద్ధతిలో, పరిశోధకుడు ప్రతివాది నుండి సంభాషణలు మరియు సంభాషణల ద్వారా నేరుగా సమాచారాన్ని పొందుతాడు. అయితే, ఆ ప్రాంతం ప్రజలతో ఇంటర్వ్యూ నిర్వహించేటప్పుడు ఇంటర్వ్యూయర్ ఈ క్రింది జాగ్రత్తలు తీసుకోవాలి:

(i) ఇంటర్వ్యూ చేయబడిన వ్యక్తుల నుండి సేకరించవలసిన సమాచారం గురించి అంశాల యొక్క ఖచ్చితమైన జాబితా తయారు చేయబడాలి.

(ii) ఇంటర్వ్యూ నిర్వహించడంలో పాల్గొన్న వ్యక్తి(లు) సర్వే యొక్క లక్ష్యం గురించి స్పష్టంగా ఉండాలి.

(iii) ఏదైనా సున్నితమైన ప్రశ్నను అడగడానికి ముందు ప్రతివాదులను విశ్వాసంలోకి తీసుకోవాలి మరియు గోప్యత నిర్వహించబడుతుందని అతనికి/ఆమెకు హామీ ఇవ్వాలి.

(iv) ప్రతివాది ఎటువంటి సంకోచం లేకుండా వాస్తవాలను వివరించేలా సుఖకరమైన వాతావరణం సృష్టించబడాలి.

(v) ప్రశ్నల భాష సరళంగా మరియు మర్యాదగా ఉండాలి, తద్వారా ప్రతివాదులు ప్రేరణ పొంది, అడిగిన సమాచారాన్ని ఇవ్వడానికి సిద్ధంగా అంగీకరిస్తారు.

(vi) ప్రతివాది యొక్క మతపరమైన భావాల గౌరవాన్ని దెబ్బతీసే ఏదైనా ప్రశ్నను అడగకుండా ఉండండి.

(vii) ఇంటర్వ్యూ చివరిలో, అతను/ఆమె ఇప్పటికే అందించిన దానికి అదనంగా ఏ అదనపు సమాచారాన్ని అందించగలరో ప్రతివాదిని అడగండి.

(viii) మీ కోసం తన/ఆమె విలువైన సమయాన్ని వెచ్చించినందుకు మీ కృతజ్ఞతలు మరియు కృతజ్ఞతలు తెలియజేయండి.

3. ప్రశ్నాపత్రం/శెడ్యూల్

ఈ పద్ధతిలో, సాధారణ ప్రశ్నలు మరియు వాటి సాధ్యమైన సమాధానాలు సాదా కాగితంపై వ్రాయబడతాయి మరియు ప్రతివాదులు ఇచ్చిన ఎంపికల నుండి సాధ్యమైన సమాధానాలపై టిక్-మార్క్ చేయాలి. కొన్నిసార్లు, నిర్మాణాత్మక ప్రశ్నల సమితి వ్రాయబడుతుంది మరియు ప్రశ్నాపత్రంలో ప్రతివాదులు తమ అభిప్రాయాన్ని వ్రాయడానికి తగినంత స్థలం అందించబడుతుంది. సర్వే యొక్క లక్ష్యాలు ప్రశ్నాపత్రంలో స్పష్టంగా పేర్కొనబడాలి. ఈ పద్ధతి పెద్ద ప్రాంతం యొక్క సర్వేని నిర్వహించడంలో ఉపయోగపడుతుంది. ప్రశ్నాపత్రాన్ని దూర ప్రాంతాలకు కూడా పోస్ట్ చేయవచ్చు. ఈ పద్ధతి యొక్క పరిమితి ఏమిటంటే, అక్షరాస్యులు మరియు విద్యావంతులను మాత్రమే అవసరమైన సమాచారాన్ని అందించడానికి సంప్రదించవచ్చు. పరిశోధన విషయానికి సంబంధించిన ప్రశ్నలను కలిగి ఉన్న ప్రశ్నాపత్రానికి సమానమైనది శెడ్యూల్. ప్రశ్నాపత్రం మరియు శెడ్యూల్ మధ్య ఉన్న ఏకైక తేడా ఏమిటంటే, ప్రతివాది స్వయంగా ప్రశ్నాపత్రాలను పూరించడం, అయితే, సరిగ్గా శిక్షణ పొందిన గణకుడు స్వయంగా ప్రతివాదులను సంబోధించే ప్రశ్నలను అడిగి శెడ్యూల్లను పూరిస్తాడు. ప్రశ్నాపత్రంపై శెడ్యూల్ యొక్క ప్రధాన ప్రయోజనం ఏమిటంటే, అక్షరాస్యులు మరియు నిరక్షరాస్యులు రెండు రకాల ప్రతివాదుల నుండి సమాచారాన్ని సేకరించవచ్చు.

4. ఇతర పద్ధతులు

నేల మరియు నీటి లక్షణాల గురించిన డేటా నేల కిట్ మరియు నీటి నాణ్యత కిట్ ఉపయోగించి వాటి లక్షణాలను కొలవడం ద్వారా నేరుగా ఫీల్డ్లో సేకరించబడుతుంది. అదేవిధంగా, ఫీల్డ్ శాస్త్రవేత్తలు ట్రాన్స్డ్యూసర్లను ఉపయోగించి పంటలు మరియు వృక్షసంపద యొక్క ఆరోగ్యం గురించి డేటాను సేకరిస్తారు (ఫిగ్. 1.2).

ద్వితీయ డేటా మూలం

ద్వితీయ డేటా మూలాలు ప్రచురించబడిన మరియు ప్రచురించబడని రికార్డులను కలిగి ఉంటాయి, వీటిలో ప్రభుత్వ ప్రచురణలు, పత్రాలు మరియు నివేదికలు ఉంటాయి.

ప్రచురించబడిన మూలాలు

1. ప్రభుత్వ ప్రచురణలు

భారత ప్రభుత్వం, రాష్ట్ర ప్రభుత్వాలు మరియు జిల్లా బులెటిన్ల వివిధ మంత్రిత్వ శాఖలు మరియు శాఖల ప్రచురణలు ద్వితీయ సమాచారం యొక్క అత్యంత ముఖ్యమైన మూలాలలో ఒకటి. వీటిలో రిజిస్ట్రార్ జనరల్ ఆఫ్ ఇండియా కార్యాలయం ప్రచురించిన భారత జనగణన, జాతీయ నమూనా సర్వే నివేదికలు, ఇండియన్ మెటీరియాలాజికల్ డిపార్ట్మెంట్ వెదర్ రిపోర్ట్స్ మరియు రాష్ట్ర ప్రభుత్వాలు ప్రచురించిన గణాంక సారాంశాలు మరియు వివిధ కమిషన్లు ప్రచురించే ఆవర్తన నివేదికలు ఉన్నాయి. కొన్ని ప్రభుత్వ ప్రచురణలు ఫిగ్. 1.3లో చూపబడ్డాయి.

ఫిగ్. 1.2 : పంట ఆరోగ్యం యొక్క కొలతలను తీసుకుంటున్న ఫీల్డ్ శాస్త్రవేత్త

ఫిగ్. 1.3 : కొన్ని ప్రభుత్వ ప్రచురణలు

2. సెమీ/క్వాసి-ప్రభుత్వ ప్రచురణలు

వివిధ నగరాలు మరియు పట్టణాల శాసనసభా ప్రాంత అభివృద్ధి అధికారులు మరియు మునిసిపల్ కార్పొరేషన్ల ప్రచురణలు మరియు నివేదికలు, జిల్లా పరిషత్తులు మొదలైనవి ఈ వర్గంలోకి వస్తాయి.

3. అంతర్జాతీయ ప్రచురణలు

అంతర్జాతీయ ప్రచురణలలో యునైటెడ్ నేషన్స్ యొక్క వివిధ సంస్థలు ప్రచురించిన ఇయర్బుక్లు, నివేదికలు మరియు మోనోగ్రాఫ్లు ఉంటాయి, ఉదాహరణకు యునైటెడ్ నేషన్స్ ఎడ్యుకేషనల్, సైంటిఫిక్ అండ్ కల్చరల్ ఆర్గనైజేషన్ (UNESCO), యునైటెడ్ నేషన్స్ డెవలప్మెంట్ ప్రోగ్రామ్ (UNDP), వరల్డ్ హెల్త్ ఆర్గనైజేషన్ (WHO), ఫుడ్ అండ్ అగ్రికల్చరల్ ఆర్గనైజేషన్ (FAO) మొదలైనవి. యునైటెడ్ నేషన్స్ యొక్క కొన్ని ముఖ్యమైన ప్రచురణలు ఆవర్తనంగా ప్రచురించబడతాయి: డెమోగ్రాఫిక్ ఇయర్ బుక్, స్టాటిస్టికల్ ఇయర్ బుక్ మరియు హ్యూమన్ డెవలప్మెంట్ రిపోర్ట్ (ఫిగ్. 1.4).

ఫిగ్. 1.4 : యునైటెడ్ నేషన్స్ యొక్క కొన్ని ప్రచురణలు

4. ప్రైవేట్ ప్రచురణలు

వార్తాపత్రికలు మరియు ప్రైవేట్ సంస్థలు ప్రచురించిన ఇయర్బుక్లు, సర్వేలు, పరిశోధన నివేదికలు మరియు మోనోగ్రాఫ్లు ఈ వర్గంలోకి వస్తాయి.

5. వార్తాపత్రికలు మరియు మ్యాగజైన్లు

రోజువారీ వార్తాపత్రికలు మరియు వార, పక్ష మరియు నెలవారీ మ్యాగజైన్లు ద్వితీయ డేటా యొక్క సులభంగా అందుబాటులో ఉండే మూలాలుగా పనిచేస్తాయి.

6. ఎలక్ట్రానిక్ మీడియా

ఎలక్ట్రానిక్ మీడియా, ముఖ్యంగా ఇంటర్నెట్, ఇటీవలి కాలంలో ద్వితీయ డేటా యొక్క ప్రధాన మూలంగా ఉద్భవించింది.

ప్రచురించబడని మూలాలు

1. ప్రభుత్వ పత్రాలు

ప్రచురించబడని నివేదికలు, మోనోగ్రాఫ్లు మరియు పత్రాలు ద్వితీయ డేటా యొక్క మరొక మూలం. ఈ పత్రాలు పాలన యొక్క వివిధ స్థాయిలలో ప్రచురించబడని రికార్డుగా తయారు చేయబడి నిర్వహించబడతాయి. ఉదాహరణకు, సంబంధిత గ్రామాల పట్వారి నిర్వహించే గ్రామ స్థాయి రెవెన్యూ రికార్డులు గ్రామ స్థాయి సమాచారం యొక్క ముఖ్యమైన మూలంగా పనిచేస్తాయి.

2. క్వాసి-ప్రభుత్వ రికార్డులు

వివిధ మునిసిపల్ కార్పొరేషన్లు, జిల్లా పరిషత్తులు మరియు సివిల్ సర్వీసెస్ శాఖలు తయారు చేసి నిర్వహించే ఆవర్తన నివేదికలు మరియు అభివృద్ధి ప్రణాళికలు క్వాసి-ప్రభుత్వ రికార్డులలో చేర్చబడ్డాయి.

3. ప్రైవేట్ పత్రాలు

వీటిలో కంపెనీలు, ట్రేడ్ యూనియన్లు, వివిధ రాజకీయ మరియు అరాజకీయ సంస్థలు మరియు నివాసితుల సంక్షేమ సంఘాల ప్రచురించబడని నివేదికలు మరియు రికార్డులు ఉంటాయి.

డేటా యొక్క పట్టిక మరియు వర్గీకరణ

ప్రాథమిక లేదా ద్వితీయ మూలాల నుండి సేకరించబడిన డేటా మొదట్లో అతి తక్కువ అవగాహనతో సమాచారం యొక్క పెద్ద గందరగోళంగా కనిపిస్తుంది. దీనిని ముడి డేటా అంటారు. అర్థవంతమైన అనుమితులను రాబట్టడానికి మరియు వాటిని ఉపయోగకరంగా మార్చడానికి ముడి డేటాకు పట్టిక మరియు వర్గీకరణ అవసరం.

డేటాను సంగ్రహించడానికి మరియు ప్రదర్శించడానికి సరళమైన పరికరాలలో ఒకటి గణాంక పట్టిక. ఇది నిలువు వరుసలు మరియు అడ్డు వరుసలలో డేటా యొక్క క్రమబద్ధమైన అమరిక. పట్టిక యొక్క ఉద్దేశ్యం ప్రదర్శనను సరళీకరించడం మరియు పోలికలను సులభతరం చేయడం. ఈ పట్ట