अध्याय 04 आंकड़ों की प्रस्तुति

1. परिचय

आपने पिछले अध्यायों में सीखा है कि डेटा कैसे एकत्र और संगठित किए जाते हैं। चूँकि डेटा आमतौर पर बड़ी मात्रा में होते हैं, उन्हें संक्षिप्त और प्रस्तुत करने योग्य रूप में रखना आवश्यक होता है। यह अध्याय डेटा की सटीक प्रस्तुति से संबंधित है ताकि एकत्र किए गए विशाल डेटा को तुरंत उपयोगी बनाया जा सके और उन्हें आसानी से समझा जा सके। आमतौर पर डेटा प्रस्तुति के तीन रूप होते हैं:

  • पाठात्मक या वर्णनात्मक प्रस्तुति
  • सारणीबद्ध प्रस्तुति
  • आरेखीय प्रस्तुति

2. डेटा की पाठात्मक प्रस्तुति

पाठात्मक प्रस्तुति में, डेटा को पाठ के भीतर वर्णित किया जाता है। जब डेटा की मात्रा अधिक नहीं होती है, तो यह प्रस्तुति रूप अधिक उपयुक्त होता है। निम्नलिखित उदाहरणों को देखें:

उदाहरण 1

08 सितंबर 2005 को पेट्रोल और डीज़ल की कीमतों में वृद्धि के विरोध में दिए गए बंद आह्वान के दौरान, बिहार के एक शहर में 5 पेट्रोल पंप खुले पाए गए और 17 बंद थे, जबकि 2 स्कूल बंद थे और शेष 9 स्कूल खुले पाए गए।

उदाहरण 2

भारत की जनगणना 2001 ने बताया कि भारत की जनसंख्या बढ़कर 102 करोड़ हो गई थी, जिसमें केवल 49 करोड़ महिलाएँ थीं और 53 करोड़ पुरुष थे। चौहत्तर करोड़ लोग ग्रामीण भारत में रहते थे और केवल 28 करोड़ लोग शहरों या नगरों में रहते थे। जबकि पूरे देश में 62 करोड़ गैर-कार्यरत जनसंख्या थी और 40 करोड़ कार्यरत जनसंख्या थी। शहरी जनसंख्या में गैर-कार्यरत लोगों की हिस्सेदारी (19 करोड़) कार्यरत लोगों (9 करोड़) की तुलना में अधिक थी, जबकि ग्रामीण जनसंख्या में 74 करोड़ की कुल जनसंख्या में से 31 करोड़ कार्यरत लोग थे…

दोनों ही स्थितियों में आंकड़े केवल पाठ के रूप में प्रस्तुत किए गए हैं। इस प्रस्तुति विधि की एक गंभीर कमी यह है कि समझने के लिए किसी को प्रस्तुति के संपूर्ण पाठ से गुजरना पड़ता है। परंतु यह भी सत्य है कि यह विषय प्रस्तुति के कुछ बिंदुओं पर जोर देने में सक्षम बनाता है।

जब वर्गीकरण विशेषताओं के अनुसार किया जाता है, जैसे सामाजिक स्थिति, शारीरिक स्थिति, राष्ट्रीयता आदि, तो इसे गुणात्मक वर्गीकरण कहा जाता है। उदाहरण के लिए, तालिका 4.1 में वर्गीकरण के लिए विशेषताएँ लिंग और स्थान हैं जो प्रकृति में गुणात्मक हैं।

तालिका 4.1 लिंग और स्थान के अनुसार भारत में साक्षरता (प्रतिशत)

स्थान कुल
लिंग ग्रामीण शहरी
पुरुष 79 90 82
महिला 59 80 65
कुल 68 84 74

स्रोत: भारत की जनगणना 2011। (साक्षरता दर 7 वर्ष और उससे अधिक आयु की आबादी से संबंधित है)

मात्रात्मक वर्गीकरण

मात्रात्मक वर्गीकरण में, आंकड़ों को उन विशेषताओं के आधार पर वर्गीकृत किया जाता है जो प्रकृति में मात्रात्मक होती हैं। दूसरे शब्दों में, इन विशेषताओं को मात्रात्मक रूप से मापा जा सकता है। उदाहरण के लिए, आयु, ऊँचाई, उत्पादन, आय आदि मात्रात्मक विशेषताएँ हैं। वर्गों का निर्माण उन मानों के लिए सीमा निर्धारित करके किया जाता है जिसे वर्ग सीमा कहा जाता है, जिसकी विचाराधीन विशेषता के लिए मान रखे जाते हैं। मात्रात्मक वर्गीकरण का एक उदाहरण तालिका 4.2 में दिया गया है। तालिका में लुप्त आंकड़ों की गणना कीजिए।

तालिका 4.2 बिहार में एक चुनाव अध्ययन में उनकी आयु के अनुसार 542 उत्तरदाताओं का वितरण

आयु समूह (वर्ष) उत्तरदाताओं की संख्या प्रतिशत
20-30 3 0.55
30-40 61 11.25
40-50 132 24.35
50-60 153 28.24
60-70 $? $?
70-80 51 9.41
80-90 2 0.37
सभी ? 100.00

स्रोत: विधानसभा चुनाव पटना मध्य निर्वाचन क्षेत्र 2005, ए.एन. सिन्हा इंस्टीट्यूट ऑफ सोशल स्टडीज, पटना।

यहाँ वर्गीकरण की विशेषता आयु वर्षों में है और यह मात्रात्मक है।

गतिविधियाँ

  • चर्चा करें कि तालिका 4.1 में कुल मान कैसे आए हैं।
  • एक तालिका बनाएँ जो आपकी कक्षा के छात्रों की स्टार न्यूज़, ज़ी न्यूज़, बीबीसी वर्ल्ड, सीएनएन, आज तक और डीडी न्यूज़ के प्रति पसंदीदा रुचि को प्रस्तुत करे।
  • एक तालिका तैयार करें

(i) ऊँचाइयों (सेमी में) और

(ii) वजन (किग्रा में) आपकी कक्षा के छात्रों की।

अस्थायी वर्गीकरण

इस वर्गीकरण में समय वर्गीकरण चर बन जाता है और आँकड़ों को समय के अनुसार श्रेणीबद्ध किया जाता है। समय घंटों, दिनों, सप्ताहों, महीनों, वर्षों आदि में हो सकता है। उदाहरण के लिए, तालिका 4.3 देखें।

तालिका 4.3 1995 से 2000 तक एक चाय की दुकान की वार्षिक बिक्री

वर्ष बिक्री (रुपये लाख में)
1995 79.2
1996 81.3
1997 8.4
1998 80.5
1999 100.2
2000 91.2

आँकड़ा स्रोत: अप्रकाशित आँकड़े।

इस तालिका में वर्गीकरण की विशेषता एक वर्ष में बिक्री है और यह समय की स्केल में मान लेती है।

गतिविधि

  • अपने स्कूल के कार्यालय जाएँ और पिछले दस वर्षों में प्रत्येक कक्षा में अध्ययन करने वाले छात्रों की संख्या के आँकड़े एकत्र करें और उन्हें एक तालिका में प्रस्तुत करें।

स्थानिक वर्गीकरण

जब वर्गीकरण स्थान के आधार पर किया जाता है, तो इसे स्थानिक वर्गीकरण कहा जाता है। स्थान गाँव/नगर, ब्लॉक, जिला, राज्य, देश आदि हो सकता है।

तालिका 4.4 एक स्थानिक वर्गीकरण का उदाहरण है।

तालिका 4.4 वर्ष 2013-14 में भारत से शेष विश्व को निर्यात का कुल निर्यात में हिस्सा (प्रतिशत में)

गंतव्य निर्यात हिस्सा
USA 12.5
जर्मनी 2.4
अन्य EU 10.9
UK 3.1
जापान 2.2
रूस 0.7
चीन 4.7
पश्चिम एशिया - खाड़ी सहयोग परिषद् 15.3
अन्य एशिया 29.4
अन्य 18.8
सभी 100.0

(कुल निर्यात: US $\$$ 314.40 अरब)

गतिविधि

  • अपनी कक्षा के विद्यार्थियों के मूल राज्यों/आवासीय क्षेत्रों के अनुसार एकत्रित आँकड़ों को प्रस्तुत करने वाली एक तालिका बनाएँ।

4. आँकड़ों का सारणीयकरण और तालिका के भाग

एक तालिका बनाने के लिए यह जानना आवश्यक है कि एक अच्छी सांख्यिकीय तालिका के कौन-कौन से भाग होते हैं। जब इन भागों को क्रमबद्ध रूप से एक साथ रखा जाता है तो वे एक तालिका बनाते हैं। तालिका की अवधारणा का सबसे सरल तरीका यह है कि आँकड़ों को कुछ व्याख्यात्मक नोटों के साथ पंक्तियों और स्तंभों में प्रस्तुत किया जाए। सारणीयकरण एकल-तरीके, द्वि-तरीके या त्रि-तरीके वर्गीकरण द्वारा किया जा सकता है, यह इस बात पर निर्भर करता है कि कितनी विशेषताएँ शामिल हैं। एक अच्छी तालिका में अनिवार्य रूप से निम्नलिखित होना चाहिए:

(i) तालिका संख्या

टेबल संख्या को पहचान के उद्देश्य से एक टेबल को दी जाती है। यदि एक से अधिक टेबल प्रस्तुत किए जाते हैं, तो यह टेबल संख्या ही होती है जो एक टेबल को दूसरे से अलग करती है। यह टेबल के शीर्षक के शीर्ष या प्रारंभ में दी जाती है। सामान्यतः, यदि पुस्तक में कई टेबल हों तो टेबल संख्याएँ आरोही क्रम में पूर्ण संख्याएँ होती हैं। अधोलेखित संख्याएँ, जैसे $1.2,3.1$, आदि, भी टेबल की स्थिति के अनुसार उसकी पहचान के लिए प्रयुक्त होती हैं। उदाहरण के लिए, टेबल 4.5 को चौथे अध्याय की पाँचवीं टेबल के रूप में पढ़ा जाना चाहिए, और इसी तरह आगे (टेबल 4.5 देखें)।

(ii) शीर्षक

टेबल का शीर्षक टेबल की सामग्री के बारे में बताता है। इसे स्पष्ट, संक्षिप्त और सावधानीपूर्वक शब्दों में लिखा जाना चाहिए ताकि टेबल से की गई व्याख्याएँ स्पष्ट हों और अस्पष्टता से मुक्त हों। यह टेबल संख्या के बाद या उसके ठीक नीचे टेबल के शीर्ष पर स्थान पाता है (टेबल 4.5 देखें)।

(iii) कैप्शन या स्तंभ शीर्षक

टेबल में प्रत्येक स्तंभ के शीर्ष पर स्तंभ की व्याख्या करने के लिए एक स्तंभ पदनाम दिया जाता है। इसे कैप्शन या स्तंभ शीर्षक कहा जाता है (टेबल 4.5 देखें)।

(iv) स्टब या पंक्ति शीर्षक

कैप्शन या स्तंभ शीर्षक की तरह, टेबल की प्रत्येक पंक्ति को भी एक शीर्षक देना होता है। पंक्तियों के पदनामों को स्टब या स्टब आइटम भी कहा जाता है, और पूरी बाईं ओर की स्तंभ को स्टब स्तंभ के रूप में जाना जाता है। पंक्ति शीर्षकों का संक्षिप्त विवरण टेबल के बाईं ओर ऊपर भी दिया जा सकता है (टेबल $4.5)$ देखें)।

(v) टेबल का मुख्य भाग

सारणी का मुख्य भाग उसका मुख्य भाग होता है और इसमें वास्तविक आंकड़े होते हैं। सारणी में किसी एक आकृति/आंकड़े का स्थान निश्चित होता है और यह सारणी की पंक्ति तथा स्तंभ से निर्धारित होता है। उदाहरण के लिए, दूसरी पंक्ति और चौथे स्तंभ में दिया गया आंकड़ा बताता है कि 2001 में ग्रामीण भारत में 25 करोड़ महिलाएं गैर-कार्यरत थीं (सारणी 4.5 देखें)।

(vi) मापन की इकाई

सारणी में दिखाए गए आंकड़ों (वास्तविक आंकड़ों) की मापन की इकाई हमेशा शीर्षक के साथ दी जानी चाहिए। यदि सारणी की पंक्तियों या स्तंभों के लिए भिन्न-भिन्न इकाइयाँ हैं, तो ये इकाइयाँ ‘स्टब्स’ या ‘कैप्शन’ के साथ अवश्य दी जानी चाहिए। यदि आंकड़े बड़े हैं, तो उन्हें गोल किया जाना चाहिए और गोल करने की विधि को दर्शाया जाना चाहिए (सारणी 4.5 देखें)।

(नोट : सारणी 4.5 वही आंकड़े सारणीबद्ध रूप में प्रस्तुत करती है जो आंकड़ों के पाठात्मक प्रस्तुति में केस 2 के माध्यम से पहले ही दिखाए जा चुके हैं)

(vii) स्रोत

यह एक संक्षिप्त कथन या वाक्यांश होता है जो सारणी में प्रस्तुत आंकड़ों के स्रोत को दर्शाता है। यदि एक से अधिक स्रोत हैं, तो सभी स्रोतों को स्रोत में लिखा जाना चाहिए। स्रोत आमतौर पर सारणी के नीचे लिखा जाता है (सारणी 4.5 देखें)।

(viii) नोट

नोट सारणी का अंतिम भाग होता है। यह सारणी के आंकड़ों की सामग्री की उस विशिष्ट विशेषता की व्याख्या करता है जो स्वयं स्पष्ट नहीं होती और जिसे पहले समझाया नहीं गया है।

गतिविधियाँ

  • एक सारणी बनाने के लिए न्यूनतम कितनी पंक्तियाँ और स्तंभों की आवश्यकता होती है?
  • क्या सारणी के स्तंभ/पंक्ति शीर्षलेख मात्रात्मक हो सकते हैं?
  • क्या आप सारणियाँ 4.2 और 4.3 को आँकड़ों को उपयुक्त रूप से पूर्णांकित करके प्रस्तुत कर सकते हैं?
  • पृष्ठ 41 पर दिए गए केस 2 के पहले दो वाक्यों को एक सारणी के रूप में प्रस्तुत करें। इसके लिए कुछ विवरण इस अध्याय के अन्य भागों में मिलेंगे।

5. आँकड़ों की आरेखीय प्रस्तुति

यह आँकड़ों को प्रस्तुत करने की तीसरी विधि है। यह विधि तालिकीय या पाठात्मक प्रस्तुति की तुलना में डेटा द्वारा समझाए जाने वाली वास्तविक स्थिति को सबसे तेज़ी से समझने में सहायक होती है। आँकड़ों की आरेखीय प्रस्तुति संख्याओं में निहित अत्यंत अमूर्त विचारों को अधिक ठोस और सरलतः समझ में आने वाले रूप में अत्यंत प्रभावी ढंग से अनुवादित करती है।

आरेख कम सटीक हो सकते हैं, लेकिन आँकड़ों को प्रस्तुत करने में सारणियों की तुलना में अधिक प्रभावी होते हैं।

सामान्य उपयोग में विभिन्न प्रकार के आरेख होते हैं। उनमें से महत्वपूर्ण निम्नलिखित हैं:

(i) ज्यामितीय आरेख

(ii) बारंबारता आरेख

(iii) अंकगणितीय रेखा ग्राफ

ज्यामितीय आरेख

बार आरेख और पाई आरेख ज्यामितीय आरेख की श्रेणी में आते हैं। बार आरेख तीन प्रकार के होते हैं - सरल, बहु और संघटक बार आरेख।

बार आरेख

सरल बार आरेख

दंड आरेख प्रत्येक वर्ग या श्रेणी के लिए समान अंतराल व समान चौड़ाई के आयताकार दंडों के एक समूह से बना होता है। दंड की ऊँचाई या लंबाई आँकड़े के परिमाण को दर्शाती है। दंड का निचला सिरा आधार रेखा को स्पर्श करता है ताकि दंड की ऊँचाई शून्य इकाई से प्रारंभ हो। दंड आरेख के दंडों की सापेक्ष ऊँचाई को देखकर उनकी तुलना दृष्टिगत रूप से की जा सकती है और इस प्रकार आँकड़े शीघ्र समझे जाते हैं। इसके लिए आँकड़े बारंबारता या अ-बारंबारता प्रकार के हो सकते हैं। अ-बारंबारता प्रकार के आँकड़ों में किसी विशेष लक्षण—जैसे उत्पादन, उपज, जनसंख्या आदि—के विभिन्न समय बिंदुओं या विभिन्न राज्यों के मान दर्ज किए जाते हैं और संबंधित लक्षण के मानों के अनुरूप संबंधित ऊँचाई के दंड बनाकर आरेख बनाया जाता है। लक्षणों के मान (मापे गए या गिने गए) प्रत्येक मान की पहचान बनाए रखते हैं। आकृति 4.1 एक दंड आरेख का उदाहरण है।

गतिविधि

  • अपने विद्यालय में वर्तमान वर्ष में पढ़ने वाले प्रत्येक कक्षा के विद्यार्थियों की संख्या एकत्र करें। उसी सारणी के लिए एक दंड आरेख बनाएँ।

विभिन्न प्रकार के आँकड़ों के लिए विभिन्न प्रकार की आरेखीय प्रस्तुति आवश्यक हो सकती है। बार आरेख आवृत्ति प्रकार और गैर-आवृत्ति प्रकार के चर तथा गुण दोनों के लिए उपयुक्त होते हैं। पारिवारिक आकार, पासों के ऊपर बिंदु, परीक्षा में ग्रेड आदि जैसे विच्छिन्न चर और लिंग, धर्म, जाति, देश आदि जैसे गुण बार आरेखों द्वारा प्रस्तुत किए जा सकते हैं। बार आरेख आय-व्यय प्रोफ़ाइल, वर्षों के दौरान निर्यात/आयात आदि जैसे गैर-आवृत्ति आँकड़ों के लिए अधिक सुविधाजनक होते हैं।

एक श्रेणी जिसकी बार (केरल की साक्षरता) दूसरी श्रेणी (पश्चिम बंगाल की साक्षरता) से लंबी है, उसमें मापी गई (या गिनी गई) विशेषता अधिक है। बारों (जिन्हें स्तंभ भी कहा जाता है) का प्रयोग सामान्यतः समय श्रेणी आँकड़ों में किया जाता है (1980 से 2000 के बीच खाद्यान्न उत्पादन, दशकीय कार्य भागीदारी दर में परिवर्तन, वर्षों के दौरान पंजीकृत बेरोज़गार, साक्षरता दर आदि) (आकृति 4.2)।

TABLE 4.6 Literacy Rates of Major States of India

2001 2011
प्रमुख भारतीय राज्य पुरुष महिला पुरुष महिला
आंध्र प्रदेश (AP) 70.3 50.4 75.6 59.7
असम (AS) 71.3 54.6 78.8 67.3
बिहार (BR) 59.7 33.1 73.4 53.3
झारखंड (JH) 67.3 38.9 78.4 56.2
गुजरात (GJ) 79.7 57.8 87.2 70.7
हरियाणा (HR) 78.5 55.7 85.3 66.8
कर्नाटक (KA) 76.1 56.9 82.9 68.1
केरल (KE) 94.2 87.7 96.0 92.0
मध्य प्रदेश (MP) 76.1 50.3 80.5 60.0
छत्तीसगढ़ (CH) 77.4 51.9 81.5 60.6
महाराष्ट्र (MR) 86.0 67.0 89.8 75.5
ओडिशा (OD) 75.3 50.5 82.4 64.4
पंजाब (PB) 75.2 63.4 81.5 71.3
राजस्थान (RJ) 75.7 43.9 80.5 52.7
तमिलनाडु (TN) 82.4 64.4 86.8 73.9
उत्तर प्रदेश (UP) 68.8 42.2 79.2 59.3
उत्तराखंड (UK) 83.3 59.6 88.3 70.7
पश्चिम बंगाल (WB) 77.0 59.6 82.7 71.2
भारत 75.3 53.7 82.1 65.5

आकृति 4.1: भारत के प्रमुख राज्यों के पुरुष साक्षरता दर को दर्शाता स्तंभ आरेख, 2011. (साक्षरता दर 7 वर्ष और उससे अधिक आयु की आबादी से संबंधित है)

स्तंभ आरेख विभिन्न रूपों में हो सकते हैं जैसे बहु-स्तंभ आरेख और संघटक स्तंभ आरेख।

गतिविधियाँ

  • 2011 में भारत के प्रमुख राज्यों में से कितने राज्यों में महिला साक्षरता दर राष्ट्रीय औसत से अधिक थी?
  • क्या दो क्रमिक जनगणना वर्षों 2001 और 2011 में राज्यों पर महिला साक्षरता दर के अधिकतम और न्यूनतम मान के बीच का अंतर घटा है?

बहु-बार आरेख

बहु-बार आरेख (चित्र 4.2) का उपयोग दो या अधिक आँकड़ा समूहों की तुलना के लिए किया जाता है, उदाहरण के लिए विभिन्न वर्षों की आय और व्यय या आयात और निर्यात, विभिन्न कक्षाओं में विभिन्न विषयों में प्राप्त अंक आदि।

घटक-बार आरेख

घटक-बार आरेख या चार्ट (चित्र 4.3), जिन्हें उप-आरेख भी कहा जाता है, विभिन्न घटक भागों (वे तत्व या भाग जिनसे कोई वस्तु बनी होती है) के आकारों की तुलना करने में अत्यंत उपयोगी होते हैं और साथ ही इन अभिन्न भागों के बीच संबंध को स्पष्ट करने में भी। उदाहरण के लिए, विभिन्न उत्पादों से प्राप्त बिक्री आय, एक विशिष्ट भारतीय परिवार में व्यय प्रतिरूप (घटक होते हैं—भोजन, किराया, दवा, शिक्षा, बिजली आदि), प्राप्तियों और व्यय के लिए बजट आवंटन, श्रम बल के घटक, जनसंख्या आदि। घटक-बार आरेखों को सामान्यतः उपयुक्त रूप से छायांकित या रंगा जाता है।

चित्र 4.2: भारत के प्रमुख राज्यों द्वारा दो जनगणना वर्षों 2001 और 2011 में महिला साक्षरता दर दिखाता बहु-बार (स्तंभ) आरेख। (आँकड़ा स्रोत—तालिका 4.6)

व्याख्या: चित्र 4.2 से यह बहुत आसानी से निकाला जा सकता है कि देश भर में वर्षों से महिला साक्षरता दर में वृद्धि हो रही थी। चित्र से इसी तरह की अन्य व्याख्याएँ भी की जा सकती हैं। उदाहरण के लिए, चित्र दिखाता है कि बिहार, झारखंड और उत्तर प्रदेश राज्यों में महिला साक्षरता में सबसे तेज वृद्धि हुई है, आदि।

तालिका 4.7 बिहार के एक जिले में विद्यालयों में लिंग के अनुसार नामांकन (प्रतिशत) 6-14 वर्ष आयु के बच्चों का

लिंग नामांकित (प्रतिशत) विद्यालय से बाहर (प्रतिशत)
लड़का 91.5 8.5
लड़की 58.6 41.4
सभी 78.0 22.0

डेटा स्रोत: अप्रकाशित डेटा

एक घटक स्तंभ आरेख स्तंभ और उसके दो या अधिक घटकों में विभाजन को दर्शाता है। उदाहरण के लिए, स्तंभ 6-14 वर्ष आयु वर्ग के बच्चों की कुल जनसंख्या को दिखा सकता है। घटक उन लोगों के अनुपात को दिखाते हैं जो नामांकित हैं और जो नहीं हैं। एक घटक स्तंभ आरेख में दिए गए आयु वर्ग सीमा में लड़कों, लड़कियों और बच्चों के कुल के लिए विभिन्न घटक स्तंभ भी हो सकते हैं, जैसा कि चित्र 4.3 में दिखाया गया है। एक घटक स्तंभ आरेख बनाने के लिए, सबसे पहले $\mathrm{x}$-अक्ष पर एक स्तंभ बनाया जाता है जिसकी ऊँचाई स्तंभ के कुल मान के बराबर होती है [प्रतिशत डेटा के लिए स्तंभ की ऊँचाई 100 इकाई होती है (चित्र 4.3)]। अन्यथा ऊँचाई स्तंभ के कुल मान के बराबर होती है और घटकों की समानुपातिक ऊँचाइयाँ यूनिटरी विधि का उपयोग करके निकाली जाती हैं। स्तंभ को विभाजित करने में छोटे घटकों को प्राथमिकता दी जाती है।

चित्र 4.3: बिहार के एक जिले में प्राथमिक स्तर पर नामांकन (घटक स्तंभ आरेख)

पाई आरेख

पाई आरेख भी एक घटक आरेख है, लेकिन स्तंभ आरेख के विपरीत, यहाँ यह एक वृत्त होता है जिसका क्षेत्रफल उन घटकों के बीच अनुपात में बाँटा जाता है (चित्र 4.4) जिन्हें यह दर्शाता है। इसे पाई चार्ट भी कहा जाता है। वृत्त को केंद्र से परिधि तक सीधी रेखाएँ खींचकर उतने ही भागों में बाँटा जाता है जितने घटक होते हैं।

पाई चार्ट आमतौर पर किसी श्रेणी के निरपेक्ष मानों के साथ नहीं बनाए जाते। प्रत्येक श्रेणी के मानों को पहले सभी श्रेणियों के कुल मान का प्रतिशत व्यक्त किया जाता है। पाई चार्ट में एक वृत्त, अपनी त्रिज्या के मान की परवाह किए बिना, 100 समान भागों में सोचा जाता है जिनमें से प्रत्येक $3.6^{\circ}\left(360^{\circ} / 100\right)$ का होता है। यह ज्ञात करने के लिए कि कोई घटक वृत्त के केंद्र पर कितना कोण बनाएगा, प्रत्येक घटक के प्रतिशत आंकड़े को $3.6^{\circ}$ से गुणा किया जाता है। वृत्त के कोणीय घटकों में घटकों के प्रतिशत के इस रूपांतरण का एक उदाहरण तालिका 4.8 में दिखाया गया है।

यह जानना रोचक हो सकता है कि एक संयुक्त दंड आरेख द्वारा दर्शाए गए डेटा को पाई चार्ट द्वारा भी समान रूप से अच्छी तरह दर्शाया जा सकता है, एकमात्र आवश्यकता यह है कि घटकों के निरपेक्ष मानों को प्रतिशत में बदलना होता है, इससे पहले कि उन्हें पाई आरेख के लिए प्रयोग किया जा सके।

TABLE 4.8 भारतीय जनसंख्या का वितरण (2011) उनकी कार्य स्थिति के अनुसार (करोड़)

स्थिति जनसंख्या प्रतिशत कोणीय घटक
सीमांत श्रमिक 12 9.9 $36^{\circ}$
मुख्य-श्रमिक 36 29.8 $107^{\circ}$
गैर-श्रमिक 73 60.3 $217^{\circ}$
सभी 102 100.0 $360^{\circ}$

Fig. 4.4: भारतीय जनसंख्या के विभिन्न वर्गों के लिए पाई आरेख कार्य स्थिति के अनुसार 2011.


गतिविधियाँ

  • आकृति 4.4 के माध्यम से प्रस्तुत डेटा को एक संयुक्त दंड आरेख द्वारा दर्शाएँ।
  • क्या पाई का क्षेत्रफल पाई आरेख द्वारा दर्शाए जाने वाले डेटा के कुल मान से कोई संबंध रखता है?

आवृत्ति आरेख

समूहीकृत आवृत्ति बंटन के रूप में डेटा को आमतौर पर आवृत्ति आरेख जैसे हिस्टोग्राम, आवृत्ति बहुभुज, आवृत्ति वक्र और ओजाइव द्वारा दर्शाया जाता है।

हिस्टोग्राम

एक हिस्टोग्राम एक द्वि-आयामी आरेख है। यह आयतों का एक समूह होता है जिसका आधार वर्ग सीमाओं के बीच के अंतराल (X-अक्ष के अनुदिश) होता है और जिसका क्षेत्रफल वर्ग आवृत्ति के अनुपात में होता है (चित्र 4.5)। यदि वर्ग अंतराल समान चौड़ाई के हों, जैसा कि आमतौर पर होता है, तो आयतों का क्षेत्रफल उनकी संबंधित आवृत्तियों के अनुपात में होता है। हालांकि, कुछ प्रकार के आंकड़ों में, कभी-कभी सुविधाजनक और कभी-कभी आवश्यक भी होता है कि वर्ग अंतरालों की चौड़ाई भिन्न-भिन्न रखी जाए। उदाहरण के लिए, जब मृत्यु के समय की आयु के अनुसार मृत्युओं की सारणी बनाई जाती है, तो आरंभ में बहुत छोटी आयु अंतरालों (0,1,2,… वर्ष/0,7,28,… दिन) का होना बहुत सार्थक और उपयोगी होगा, क्योंकि उच्च आयु वर्गों की तुलना में प्रारंभिक आयु में मृत्यु दर बहुत अधिक होती है। ऐसे आंकड़ों की आलेखीय निरूपण के लिए, आयत की ऊंचाई (या क्षेत्रफल) ऊंचाई (यहां आवृत्ति) और आधार (यहां वर्ग अंतराल की चौड़ाई) का भागफल होता है। जब सभी अंतराल समान हों, अर्थात् सभी आयतों का आधार समान हो, तो तुलना के उद्देश्य से क्षेत्रफल को किसी भी अंतराल की आवृत्ति से सुविधाजनक रूप से निरूपित किया जा सकता है।

जब आधार की चौड़ाई भिन्न-भिन्न हो, तो आयतों की ऊंचाइयों को तुलनात्मक माप देने के लिए समायोजित करना पड़ता है। ऐसी स्थिति में समाधान है आवृत्ति घनत्व (वर्ग आवृत्ति को वर्ग अंतराल की चौड़ाई से विभाजित करना) न कि निरपेक्ष आवृत्ति।

TABLE 4.9 एक कस्बे के क्षेत्र में दैनिक वेतन भोगियों का वितरण

दैनिक कमाई (रु) मजदूरी कमाने वालों की संख्या (f)
45-49 2
50-54 3
55-59 5
60-64 3
65-69 6
70-74 7
75-79 12
80-84 13
85-89 9
90-94 7
95-99 6
100-104 4
105-109 2
110-114 3
115-119 3

स्रोत: अप्रकाशित आंकड़े

चूँकि हिस्टोग्राम आयताकार होते हैं, आधार रेखा के समानांतर और समान परिमाण की एक रेखा खींची जाती है, जो वर्ग अंतराल की आवृत्ति (या आवृत्ति घनत्व) के बराबर ऊर्ध्वाधर दूरी पर होती है। एक हिस्टोग्राम कभी नहीं खींचा जाता। चूँकि, सतत चर के लिए, किसी वर्ग अंतराल की निचली वर्ग सीमा पिछले अंतराल की ऊपरी वर्ग सीमा से मिल जाती है, चाहे वे समान हों या असमान, आयत सभी संलग्न होते हैं और दो क्रमागत आयतों के बीच कोई खुला स्थान नहीं होता। यदि वर्ग सतत नहीं हैं तो उन्हें पहले सतत वर्गों में बदला जाता है जैसा कि अध्याय 3 में चर्चा की गई है। कभी-कभी दो संलग्न आयतों के बीच की सामान्य भाग (चित्र 4.6) को छोड़ दिया जाता है जिससे सतता का बेहतर प्रभाव मिलता है। परिणामी आकृति दोहरी सीढ़ी के समान प्रभाव देती है।

एक हिस्टोग्राम एक बार आरेख से मिलता-जुलता दिखता है। लेकिन पहली नज़र में जितना प्रतीत होता है, उससे कहीं अधिक अंतर हैं और समानताएँ कम हैं। बारों के बीच की दूरी और चौड़ाई या क्षेत्रफल सभी मनमाने होते हैं। यह ऊँचाई है न कि चौड़ाई या क्षेत्रफल जो वास्तव में मायने रखती है। एक ही ऊँचाई की एकल ऊर्ध्वाधर रेखा भी उसी उद्देश्य की पूर्ति कर सकती है जो समान चौड़ाई की बार करती है। इसके अतिरिक्त, हिस्टोग्राम में दो आयतों के बीच कोई स्थान नहीं छोड़ा जाता, परंतु बार आरेख में लगातार बारों के बीच कुछ स्थान अवश्य छोड़ा जाता है (बहु-बार या संघटित बार आरेख को छोड़कर)। यद्यपि बारों की चौड़ाई समान होती है, तुलना के उद्देश्य से बार की चौड़ाई महत्वहीन होती है। हिस्टोग्राम में चौड़ाई उतनी ही महत्वपूर्ण है जितनी इसकी ऊँचाई। हम विविक्त और सतत दोनों चरों के लिए बार आरेख बना सकते हैं, परंतु हिस्टोग्राम केवल सतत चर के लिए ही खींचा जाता है। हिस्टोग्राम आवृत्ति बंटन के बहुलक का मान आलेखीय रूप से भी देता है जैसा कि चित्र 4.5 में दिखाया गया है और बिंदित ऊर्ध्वाधर रेखा का $\mathrm{x}$-निर्देशांक बहुलक देता है।

आवृत्ति बहुभुज

एक बारंभता बहुभुज एक समतल होता है जो सीधी रेखाओं से घिरा होता है, आमतौर पर चार या अधिक रेखाओं से। बारंभता बहुभुज हिस्टोग्राम का विकल्प है और यह स्वयं हिस्टोग्राम से ही व्युत्पन्न भी किया जाता है। एक बारंभता बहुभुज को किसी हिस्टोग्राम पर फिट किया जा सकता है ताकि वक्र के आकार का अध्ययन किया जा सके। बारंभता बहुभुज बनाने की सबसे सरल विधि यह है कि हिस्टोग्राम के क्रमागत आयतों के ऊपरी भाग के मध्य-बिंदुओं को मिलाया जाए। इससे हमारे पास दोनों सिरे आधार रेखा से दूर रह जाते हैं, जिससे वक्र के नीचे के क्षेत्रफल की गणना नहीं हो पाती। समाधान यह है कि इस प्रकार प्राप्त दोनों अंतिम बिंदुओं को वितरण के दोनों सिरों पर तुरंत बाद आने वाली शून्य बारंभता वाली दोनों वर्गों के मध्य-मानों पर आधार रेखा से जोड़ा जाए। दोनों सिरों को आधार रेखा से टूटी हुई रेखाएँ या बिंदुओं द्वारा जोड़ा जा सकता है। अब वक्र के नीचे का कुल क्षेत्रफल, हिस्टोग्राम के क्षेत्रफल की तरह, कुल बारंभता या नमूना आकार को दर्शाता है।

आकृति 4.5: एक कस्बे के क्षेत्र में 85 दैनिक वेतनभोगियों के वितरण के लिए हिस्टोग्राम।

आवृत्ति बहुभुज समूहीकृत आवृत्ति बंटन को प्रस्तुत करने की सबसे सामान्य विधि है। वर्ग सीमाओं और वर्ग चिह्न दोनों को $\mathrm{X}$-अक्ष के साथ प्रयोग किया जा सकता है, दो क्रमागत वर्ग चिह्नों के बीच की दूरियाँ वर्ग अंतराल की चौड़ाई के समानुपातिक/बराबर होती हैं। यदि वर्ग चिह्न ग्राफ पेपर की मोटी रेखाओं पर आते हैं तो आँकड़ों का आलेखन आसान हो जाता है। चाहे $\mathrm{X}$-अक्ष में वर्ग सीमाएँ प्रयोग की गई हों या मध्य बिंदु, आवृत्तियाँ (ऑर्डिनेट के रूप में) सदैव वर्ग अंतराल के मध्य बिंदु के विरुद्ध आलेखित की जाती हैं। जब सभी बिंदु आलेख में आलेखित हो जाते हैं, तो उन्हें सावधानीपूर्वक छोटी-छोटी सीधी रेखाओं की श्रृंखला द्वारा जोड़ा जाता है। टूटी हुई रेखाएँ दो अंतरालों के मध्य बिंदुओं को जोड़ती हैं, एक प्रारंभ में और दूसरा अंत में, आलेखित वक्र के दोनों सिरों के साथ (चित्र 4.6)। जब एक ही अक्षों पर आलेखित दो या अधिक बंटनों की तुलना की जाती है, तो आवृत्ति बहुभुज अधिक उपयोगी हो सकता है क्योंकि दो या अधिक बंटनों की ऊर्ध्वाधर और क्षैतिज रेखाएँ हिस्टोग्राम में संपाती हो सकती हैं।

चित्र 4.6: सारणी 4.9 में दिए गए आँकड़ों के लिए आलेखित आवृत्ति बहुभुज

चित्र 4.7: सारणी 4.9 के लिए आवृत्ति वक्र

आवृत्ति वक्र

आवृत्ति वक्र प्राप्त किया जाता है आवृत्ति बहुभुज के बिंदुओं से यथासंभव निकटता से गुजरती हुई एक सहज हस्त-खींची वक्र खींचकर। यह आवश्यक नहीं कि वह आवृत्ति बहुभुज के सभी बिंदुओं से गुजरे, पर वह उनसे यथासंभव निकटता से गुजरती है (चित्र 4.7)।

ओजाइव

ओजाइव को संचयी आवृत्ति वक्र भी कहा जाता है। चूँकि दो प्रकार की संचयी आवृत्तियाँ होती हैं, उदाहरण के लिए “से कम” प्रकार और “से अधिक” प्रकार, इसलिए किसी भी समूहीकृत आवृत्ति बंटन आँकड़ों के लिए दो ओजाइव होते हैं। यहाँ आवृत्ति बहुभुज के मामले की भाँति सरल आवृत्तियों के स्थान पर, संचयी आवृत्तियाँ $y$-अक्ष के विरुद्ध आवृत्ति बंटन की वर्ग सीमाओं के खिलाफ आलेखित की जाती हैं। “से कम” ओजाइव के लिए संचयी आवृत्तियाँ वर्ग अंतरालों की संबंधित ऊपरी सीमाओं के खिलाफ आलेखित की जाती हैं, जबकि “से अधिक” ओजाइव के लिए संचयी आवृत्तियाँ वर्ग अंतराल की संबंधित निचली सीमाओं के खिलाफ आलेखित की जाती हैं। दोनों ओजाइवों की एक रोचक विशेषता यह है कि उनका प्रतिच्छेद बिंदु आवृत्ति बंटन की माध्यिका देता है चित्र 4.8 (b)। जैसा कि दोनों ओजाइवों के आकार सुझाते हैं, “से कम” ओजाइव कभी घटता नहीं और “से अधिक” ओजाइव कभी बढ़ता नहीं।

अंकगणितीय रेखा ग्राफ

एक समांतर रेखा ग्राफ को समय श्रेणी ग्राफ भी कहा जाता है। इस ग्राफ में समय (घंटा, दिन/तिथि, सप्ताह, माह, वर्ष आदि) को $\mathrm{x}$-अक्ष पर और चर का मान (समय श्रेणी आंकड़े) को y-अक्ष पर प्लॉट किया जाता है। इन प्लॉट किए गए बिंदुओं को मिलाकर बनाई गई रेखा ग्राफ को समांतर रेखा ग्राफ (समय श्रेणी ग्राफ) कहा जाता है। यह दीर्घकालिक समय श्रेणी आंकड़ों में प्रवृत्ति, आवर्तिता आदि को समझने में सहायक होता है।

TABLE 4.10 गणित में प्राप्त अंकों की बारंबारता बंटन

Fig. 4.8(a): TABLE 4.10 में दिए गए आंकड़ों के लिए ‘से कम’ और ‘से अधिक’ ओजाइव

Fig. 4.8(b): TABLE 4.10 में दिए गए आंकड़ों के लिए ‘से कम’ और ‘से अधिक’ ओजाइव

यहाँ आप Fig. 4.9 से देख सकते हैं कि 1993-94 से 2013-14 की अवधि के दौरान पूरे समय आयात निर्यात से अधिक रहे। आप देख सकते हैं कि 2001-02 के बाद निर्यात और आयात दोनों के मान तेजी से बढ़ रहे हैं। साथ ही 2001-02 के बाद इन दोनों (आयात और निर्यात) के बीच का अंतर भी बढ़ गया है।

6. निष्कर्ष

अब तक आप यह सीख चुके होंगे कि डेटा को विभिन्न प्रस्तुति रूपों—पाठ्य, सारणीय और आरेखीय—का उपयोग करके कैसे प्रस्तुत किया जा सकता है। अब आप किसी दिए गए डेटा सेट के लिए डेटा प्रस्तुति के उपयुक्त रूप के साथ-साथ प्रयुक्त होने वाले आरेख के प्रकार का भी उचित चयन करने में सक्षम हैं। इस प्रकार आप डेटा की प्रस्तुति को सार्थक, व्यापक और उद्देश्यपूर्ण बना सकते हैं।

TABLE 4.11 भारत के निर्यात और आयात का मूल्य (100 करोड़ रुपये में)

वर्ष निर्यात आयात
1993-94 698 731
1994-95 827 900
1995-96 1064 1227
1996-97 1188 1389
1997-98 1301 1542
1998-99 1398 1783
1999-2000 1591 2155
2000-01 2036 2309
2001-02 2090 2452
2002-03 2549 2964
2003-04 2934 3591
2004-05 3753 5011
2005-06 4564 6604
2006-07 5718 8815
2007-08 6559 10123
2008-09 8408 13744
2009-10 8455 13637
2010-11 11370 16835
2011-12 14660 23455
2012-13 16343 26692
2013-14 19050 27154

स्रोत: DGCI&S, कोलकाता

Fig. 4.9: सारणी 4.11 में दिए गए समय श्रेणी डेटा के लिए अंकगणितीय रेखा ग्राफ

Let’s break this down step by step.

  1. Understanding Bar Diagrams: A bar diagram is a one-dimensional diagram, which means it represents data using bars where the length (or height) is proportional to the value it represents. The width of the bars is arbitrary and does not carry any value.

  2. Analyzing the Statement: The statement says, “Bar diagram is a one-dimensional diagram.” This is True because, as mentioned, a bar diagram uses bars where the length corresponds to the value, making it one-dimensional in terms of data representation.

  3. Evaluating “Width of bars in a bar diagram need not be equal”: This is True. The width of bars in a bar diagram is indeed arbitrary and can be uniform or varied as per design choice; it doesn’t have to be equal for the diagram to still represent the data correctly.

  4. Evaluating “Width of rectangles in a histogram should essentially be equal”: This is False. In a histogram, the width of rectangles (bins) should be equal because the width represents the class interval, and unequal widths would distort the area representation of frequencies. Equal width ensures accurate area representation for frequency distribution.

  5. Evaluating “Histogram can only be formed with continuous classification of data”: This is False. Histograms are most commonly used for continuous data, but they can also be adapted for discrete data with appropriate binning. The key is that the data must be ordered in a way that allows for meaningful binning, whether discrete or continuous.

  6. Conclusion: The provided answers are:

    • 1. one-dimensional diagram → True
    • 3. Width of bars in a bar diagram need not be equal → True
    • 5. Width of rectangles in a histogram should essentially be equal → False
    • 6. Histogram and column diagram are the same method of presentation of data. → False
    • 7. Histogram can only be formed with continuous classification of data → False

However, looking closely at the questions and the instructions, it seems the task is to translate the provided Hindi text to English and then answer the questions based on the content, but the questions themselves are already in English. So, the task is to:

  1. Translate the provided Hindi text to English:

    • The text seems to be a mix of Hindi and some formatting or placeholder text (like “NO” and “TRUE”). The core Hindi part appears to be: “बार आरेख एक विमीय आरेख है” which translates to “Bar diagram is a one-dimensional diagram.”
  2. Answer the questions 1 to 10 based on the content (now in English after translation).

But since the questions are already in English, let’s proceed to answer them directly.

Answers:

  1. Bar diagram is a one-dimensional diagram.

    • True
  2. Data represented through a histogram can help in finding graphically the

    • (i) mean
    • (ii) mode
    • (iii) median
    • (iv) all the above
    • Answer: (iv) all the above
  3. Width of bars in a bar diagram need not be equal.

    • True
  4. Width of rectangles in a histogram should essentially be equal.

    • False
  5. Histogram can only be formed with continuous classification of data.

    • False
  6. Histogram and column diagram are the same method of presentation of data.

    • False

Exercises with Answers:

1. Bar diagram is a one-dimensional diagram.
Answer: True

2. Data represented through a histogram can help in finding graphically the
Answer: (iv) all the above

3. Width of bars in a bar diagram need not be equal.
Answer: True

4. Width of rectangles in a histogram should essentially be equal.
Answer: False

5. Histogram can only be formed with continuous classification of data.
Answer: False

6. Histogram and column diagram are the same method of presentation of data.
Answer: False

9. आवृत्ति बंटन की विधा हिस्टोग्राम की सहायता से आलेखीय रूप से जानी जा सकती है। (सत्य/असत्य)

10. आवृत्ति बंटन की माध्यिका ओजाइव्स से नहीं जानी जा सकती। (सत्य/असत्य)

11. निम्नलिखित को दर्शाने के लिए किस प्रकार के आरेख अधिक प्रभावी हैं?

(i) एक वर्ष में मासिक वर्षा

(ii) धर्म के आधार पर दिल्ली की जनसंख्या की संरचना

(iii) एक कारखाने में लागत के घटक

12. मान लीजिए आप भारत में शहरी गैर-श्रमिकों की हिस्सेदारी में वृद्धि और शहरीकरण के निम्न स्तर पर जोर देना चाहते हैं जैसा कि उदाहरण 4.2 में दिखाया गया है। आप इसे सारणीबद्ध रूप में कैसे करेंगे?

13. जब आवृत्ति सारणी में वर्ग अंतराल असमान होते हैं तो हिस्टोग्राम बनाने की प्रक्रिया समान वर्ग अंतरालों की तुलना में किस प्रकार भिन्न होती है?

14. इंडियन शुगर मिल्स एसोसिएशन ने रिपोर्ट किया कि, ‘दिसंबर 2001 के पहले पखवाड़े के दौरान चीनी उत्पादन लगभग 3,87,000 टन था, जबकि पिछले वर्ष (2000) की इसी अवधि के दौरान यह 3,78,000 टन था। दिसंबर 2001 के पहले पखवाड़े के दौरान कारखानों से चीनी की लिफ्टिंग आंतरिक उपभोग के लिए 2,83,000 टन और निर्यात के लिए 41,000 टन थी, जबकि पिछले सीजन की इसी अवधि के दौरान आंतरिक उपभोग के लिए $1,54,000$ टन और निर्यात के लिए शून्य थी।’

(i) आंकड़ों को सारणीबद्ध रूप में प्रस्तुत कीजिए।

(ii) मान लीजिए आपको इन आंकड़ों को आलेखीय रूप में प्रस्तुत करना है तो आप किस आरेख का उपयोग करेंगे और क्यों?

(iii) इन आंकड़ों को आलेखीय रूप में प्रस्तुत कीजिए।

१५. निम्नलिखित सारणी GDP के कारक-लागत पर आधारित क्षेत्रवार अनुमानित वास्तविक वृद्धि दरों (पिछले वर्ष की तुलना में प्रतिशत परिवर्तन) को दर्शाती है।

वर्ष कृषि और संबद्ध क्षेत्र उद्योग सेवाएँ
1994-95 5.0 9.2 7.0
1995-96 -0.9 11.8 10.3
1996-97 9.6 6.0 7.1
1997-98 -1.9 5.9 9.0
1998-99 7.2 4.0 8.3
1999-2000 0.8 6.9 8.2

इस आँकड़े को एकाधिक समय-श्रेणी ग्राफ़ों के रूप में प्रस्तुत करें।