અધ્યાય 03 માહિતીનું વર્ગીકરણ

1. પ્રસ્તાવના

પાછલા અધ્યાયમાં તમે શીખ્યા હતા કે માહિતી કેવી રીતે એકત્રિત કરવામાં આવે છે. તમે જનગણના અને નમૂનાની વચ્ચેનો તફાવત પણ જાણ્યો હતો. આ અધ્યાયમાં, તમે જાણશો કે તમે એકત્રિત કરેલી માહિતીને કેવી રીતે વર્ગીકૃત કરવી. કાચી માહિતીનું વર્ગીકરણ કરવાનો હેતુ તેમાં ક્રમ લાવવાનો છે જેથી તેને વધુ આંકડાકીય વિશ્લેષણ માટે સરળતાથી લાગુ પાડી શકાય.

શું તમે ક્યારેય તમારા સ્થાનિક કચરા વેચનાર અથવા કબાડીવાળાને જોયો છે જેને તમે જૂનાં અખબારો, તૂટેલા ઘરેલુ સામાન, ખાલી કાચની બાટલીઓ, પ્લાસ્ટિક વગેરે વેચો છો? તે તમારી પાસેથી આ વસ્તુઓ ખરીદે છે અને તેમને પુનઃચક્રીય કરનારાઓને વેચે છે. પરંતુ તેની દુકાનમાં આટલા બધા કચરા સાથે તેના માટે તેનો વ્યવસાય સંચાલિત કરવો ખૂબ જ મુશ્કેલ હોય, જો તે તેમને યોગ્ય રીતે વ્યવસ્થિત ન કર્યા હોય. તેની પરિસ્થિતિને સરળ બનાવવા માટે તે વિવિધ કચરાને યોગ્ય રીતે જૂથોમાં અથવા “વર્ગીકૃત” કરે છે. તે જૂના અખબારોને એકસાથે મૂકે છે અને તેમને દોરડાથી બાંધે છે. પછી બધી ખાલી કાચની બાટલીઓ એક થેલીમાં એકત્રિત કરે છે. તે ધાતુની વસ્તુઓને તેની દુકાનના એક ખૂણામાં ઢગલો કરે છે અને તેમને “લોખંડ”, “તાંબુ”, “એલ્યુમિનિયમ”, “પિત્તળ” વગેરે જૂથોમાં વર્ગીકૃત કરે છે, અને આમ જ. આ રીતે તે તેના કચરાને વિવિધ વર્ગોમાં જૂથબદ્ધ કરે છે - “અખબારો”, “પ્લાસ્ટિક”, “કાચ”, “ધાતુઓ” વગેરે - અને તેમાં ક્રમ લાવે છે. એકવાર તેનો કચરો ગોઠવાય અને વર્ગીકૃત થઈ જાય, તો તેના માટે ખરીદનારને જોઈતી ચોક્કસ વસ્તુ શોધવી સરળ બની જાય છે.

તે જ રીતે જ્યારે તમે તમારી શાળાની પુસ્તકોને ચોક્કસ ક્રમમાં ગોઠવો છો, તો તેને સંભાળવું તમારા માટે સરળ બની જાય છે. તમે તેમને વિષયો અનુસાર વર્ગીકૃત કરી શકો છો જ્યાં દરેક વિષય એક જૂથ અથવા વર્ગ બને છે. તેથી, જ્યારે તમને ઉદાહરણ તરીકે, ઇતિહાસની ચોક્કસ પુસ્તકની જરૂર હોય, તો તમારે ફક્ત “ઇતિહાસ” જૂથમાં તે પુસ્તક શોધવાની જરૂર છે. નહિંતર, તમે જે ચોક્કસ પુસ્તક શોધી રહ્યા છો તે શોધવા માટે તમારે તમારા સંગ્રહની આખી શોધખોળ કરવી પડે.

જ્યારે વસ્તુઓ અથવા વસ્તુઓનું વર્ગીકરણ આપણો મૂલ્યવાન સમય અને પ્રયત્ન બચાવે છે, તે મનસ્વી રીતે કરવામાં આવતું નથી. કબાડીવાળો પુનઃઉપયોગિત માલના બજારો અનુસાર તેના કચરાને જૂથબદ્ધ કરે છે. ઉદાહરણ તરીકે, “કાચ” જૂથ હેઠળ તે ખાલી બાટલીઓ, તૂટેલા અરીસા અને વિન્ડોપેન વગેરે મૂકશે. તે જ રીતે જ્યારે તમે તમારી ઇતિહાસની પુસ્તકોને “ઇતિહાસ” જૂથ હેઠળ વર્ગીકૃત કરો છો, ત્યારે તમે તે જૂથમાં અલગ વિષયની પુસ્તક મૂકશો નહીં. નહિંતર જૂથબદ્ધ કરવાનો સમગ્ર હેતુ ખોવાઈ જશે. તેથી, વર્ગીકરણ એ કેટલાક માપદંડોના આધારે વસ્તુઓને જૂથો અથવા વર્ગોમાં ગોઠવવી અથવા વ્યવસ્થિત કરવી છે.

પ્રવૃત્તિ

  • તમારા સ્થાનિક પોસ્ટ-ઓફિસની મુલાકાત લો અને જાણો કે પત્રો કેવી રીતે સૉર્ટ કરવામાં આવે છે. શું તમે જાણો છો કે પત્રમાં પિન-કોડ શું સૂચવે છે? તમારા પોસ્ટમેનને પૂછો.

2. કાચી માહિતી

કબાડીવાળાના કચરા જેવી, અવર્ગીકૃત માહિતી અથવા કાચી માહિતી ખૂબ જ અવ્યવસ્થિત હોય છે. તે ઘણી વખત ખૂબ મોટી અને હેરફેર કરવા માટે બોજારૂપ હોય છે. તેમાંથી અર્થપૂર્ણ તારણો કાઢવું એ કંટાળાજનક કાર્ય છે કારણ કે તે સરળતાથી આંકડાકીય પદ્ધતિઓને ઉપયોગમાં લેતી નથી. તેથી કોઈ પણ વ્યવસ્થિત આંકડાકીય વિશ્લેષણ કરતા પહેલા આવી માહિતીનું યોગ્ય સંગઠન અને પ્રસ્તુતિ જરૂરી છે. તેથી માહિતી એકત્રિત કર્યા પછીનું પગલું તેને વર્ગીકૃત સ્વરૂપમાં ગોઠવવી અને પ્રસ્તુત કરવી છે.

ધારો કે તમે ગણિતમાં વિદ્યાર્થીઓનું પ્રદર્શન જાણવા માંગો છો અને તમે તમારી શાળાના 100 વિદ્યાર્થીઓના ગણિતના ગુણ પર માહિતી એકત્રિત કરી છે. જો તમે તેને કોષ્ટક તરીકે પ્રસ્તુત કરો, તો તે કોષ્ટક 3.1 જેવું દેખાઈ શકે છે.

કોષ્ટક 3.1 પરીક્ષામાં 100 વિદ્યાર્થીઓએ મેળવેલ ગણિતના ગુણ

47 45 10 60 51 56 66 100 49 40
60 59 56 55 62 48 59 55 51 41
42 69 64 66 50 59 57 65 62 50
64 30 37 75 17 56 20 14 55 90
62 51 55 14 25 34 90 49 56 54
70 47 49 82 40 82 60 85 65 66
49 44 64 69 70 48 12 28 55 65
49 40 25 41 71 80 0 56 14 22
66 53 46 70 43 61 59 12 30 35
45 44 57 76 82 39 32 14 90 25

અથવા તમે તમારા પડોશમાં 50 ઘરગથ્થુઓના ખોરાક પર માસિક ખર્ચ પર માહિતી એકત્રિત કરી હોય તેમને ખોરાક પર તેમના સરેરાશ ખર્ચ જાણવા માટે. એકત્રિત કરેલી માહિતી, તે કિસ્સામાં, જો તમે કોષ્ટક તરીકે પ્રસ્તુત કરી હોય, તો કોષ્ટક 3.2 જેવી દેખાઈ હોત. બંને કોષ્ટક 3.1 અને 3.2 કાચી અથવા અવર્ગીકૃત માહિતી છે. બંને કોષ્ટકોમાં તમે જોશો કે સંખ્યાઓ કોઈપણ ક્રમમાં ગોઠવાયેલી નથી. હવે જો તમને કોષ્ટક 3.1 માંથી ગણિતમાં સૌથી વધુ ગુણ માટે પૂછવામાં આવે તો તમારે પહેલા 100 વિદ્યાર્થીઓના ગુણોને ચડતા અથવા ઉતરતા ક્રમમાં ગોઠવવા પડશે. તે એક કંટાળાજનક કાર્ય છે. તે વધુ કંટાળાજનક બને છે, જો 100 ને બદલે તમારી પાસે 1,000 વિદ્યાર્થીઓના ગુણો હોય. તે જ રીતે, કોષ્ટક 3.2 માં, તમે નોંધશો કે 50 ઘરગથ્થુઓનો સરેરાશ માસિક ખર્ચ નક્કી કરવો તમારા માટે મુશ્કેલ છે. અને આ મુશ્કેલી ઘણી ગણી વધી જશે જો સંખ્યા વધુ હોય - ધારો કે, 5,000 ઘરગથ્થુઓ. આપણા કબાડીવાળા જેવું, જેને તેનો કચરો મોટો અને અવ્યવસ્થિત થઈ જાય ત્યારે ચોક્કસ વસ્તુ શોધવામાં તકલીફ પડે, તમે પણ જ્યારે મોટી કાચી માહિતીમાંથી કોઈ માહિતી મેળવવાનો પ્રયત્ન કરો ત્યારે સમાન પરિસ્થિતિનો સામનો કરશો. એક શબ્દમાં, તેથી, મોટી અવર્ગીકૃત માહિતીમાંથી માહિતી ખેંચવી એ કંટાળાજનક કાર્ય છે.

કોષ્ટક 3.2 50 ઘરગથ્થુઓનો ખોરાક પર માસિક ઘરગથ્થુ ખર્ચ (રૂપિયામાં)

1904 1559 3473 1735 2760
2041 1612 1753 1855 4439
5090 1085 1823 2346 1523
1211 1360 1110 2152 1183
1218 1315 1105 2628 2712
4248 1812 1264 1183 1171
1007 1180 1953 1137 2048
2025 1583 1324 2621 3676
1397 1832 1962 2177 2575
1293 1365 1146 3222 1396

કાચી માહિતીનો સારાંશ આપવામાં આવે છે, અને વર્ગીકરણ દ્વારા સમજી શકાય તેવી બનાવવામાં આવે છે. જ્યારે સમાન લક્ષણોવાળા તથ્યોને એ જ વર્ગમાં મૂકવામાં આવે છે, ત્યારે તે તેમને સરળતાથી શોધવા, તુલના કરવા અને કોઈપણ મુશ્કેલી વિના તારણો કાઢવા માટે સક્ષમ બનાવે છે. તમે અધ્યાય 2 માં અભ્યાસ કર્યો છે કે ભારત સરકાર દર દસ વર્ષે જનગણના કરે છે. જનગણના 2001 માં લગભગ 20 કરોડ લોકોનો સંપર્ક કરવામાં આવ્યો હતો. જનગણનાની કાચી માહિતી એટલી મોટી અને વિખંડિત છે કે તેમાંથી કોઈ અર્થપૂર્ણ તારણ કાઢવું લગભગ અશક્ય કાર્ય લાગે છે. પરંતુ જ્યારે સમાન માહિતીને લિંગ, શિક્ષણ, વૈવાહિક સ્થિતિ, વ્યવસાય વગેરે અનુસાર વર્ગીકૃત કરવામાં આવે છે, ત્યારે ભારતની વસ્તીની રચના અને પ્રકૃતિ સરળતાથી સમજી શકાય છે.

કાચી માહિતીમાં ચલો પરના અવલોકનોનો સમાવેશ થાય છે. કોષ્ટક 3.1 અને 3.2 માં આપેલી કાચી માહિતીમાં ચોક્કસ અથવા ચલોના જૂથ પરના અવલોકનોનો સમાવેશ થાય છે. ઉદાહરણ તરીકે કોષ્ટક 3.1 જુઓ જેમાં 100 વિદ્યાર્થીઓદ્વારા મેળવેલા ગણિતના ગુણો છે. આ ગુણોનો અર્થ આપણે કેવી રીતે કાઢી શકીએ? આ ગુણો જોઈને ગણિતના શિક્ષક વિચારતા હશે-મારા વિદ્યાર્થીઓએ કેવું કર્યું છે? કેટલા પાસ થયા નથી? આપણે માહિતીને કેવી રીતે વર્ગીકૃત કરીએ તે આપણા મનમાં હોય તે હેતુ પર આધારિત છે. આ કિસ્સામાં, શિક્ષક કેટલીક ઊંડાણમાં સમજવા માંગે છે- આ વિદ્યાર્થીઓએ કેવું કર્યું છે. તે કદાચ આવૃત્તિ વિતરણ બનાવવાનું પસંદ કરશે. આ આગળના વિભાગમાં ચર્ચા કરવામાં આવી છે.

પ્રવૃત્તિ

  • તમારા પરિવારનો એક વર્ષ માટેનો કુલ સાપ્તાહિક ખર્ચની માહિતી એકત્રિત કરો અને તેને કોષ્ટકમાં ગોઠવો. જુઓ કે તમારી પાસે કેટલા અવલોકનો છે. માહિતીને માસિક ગોઠવો અને અવલોકનોની સંખ્યા શોધો.

3. માહિતીનું વર્ગીકરણ

વર્ગીકરણના જૂથો અથવા વર્ગો વિવિધ રીતે કરવામાં આવે છે. તમારી પુસ્તકોને વિષયો - “ઇતિહાસ”, “ભૂગોળ”, “ગણિત”, “વિજ્ઞાન” વગેરે - અનુસાર વર્ગીકૃત કરવાને બદલે તમે તેમને લેખક-વાર મૂળાક્ષરોના ક્રમમાં વર્ગીકૃત કરી શક્યા હોત. અથવા, તમે તેમને પ્રકાશનના વર્ષ અનુસાર પણ વર્ગીકૃત કરી શક્યા હોત. તમે તેમને કેવી રીતે વર્ગીકૃત કરવા માંગો છો તે તમારી જરૂરિયાત પર આધારિત હશે.

તે જ રીતે કાચી માહિતી હેતુના આધારે વિવિધ રીતે વર્ગીકૃત કરવામાં આવે છે. તેમને સમય અનુસાર જૂથબદ્ધ કરી શકાય છે. આવા વર્ગીકરણને કાલક્રમિક વર્ગીકરણ તરીકે ઓળખવામાં આવે છે. આવા વર્ગીકરણમાં, માહિતીને વર્ષો, ત્રિમાસિક, મહિનાઓ, અઠવાડિયા વગેરે જેવા સમયનો સંદર્ભ લઈને ચડતા અથવા ઉતરતા ક્રમમાં વર્ગીકૃત કરવામાં આવે છે. નીચેનું ઉદાહરણ વર્ષોની દ્રષ્ટિએ વર્ગીકૃત ભારતની વસ્તી દર્શાવે છે. ચલ ‘વસ્તી’ એક સમય શ્રેણી છે કારણ કે તે વિવિધ વર્ષો માટે મૂલ્યોની શ્રેણી દર્શાવે છે.

ઉદાહરણ 1

ભારતની વસ્તી (કરોડમાં)

વર્ષ વસ્તી (કરોડ)
1951 35.7
1961 43.8
1971 54.6
1981 68.4
1991 81.8
2001 102.7
2011 121.0

આધિભૌતિક વર્ગીકરણમાં માહિતીને ભૌગોલિક સ્થાનો જેવા કે દેશો, રાજ્યો, શહેરો, જિલ્લાઓ વગેરેના સંદર્ભમાં વર્ગીકૃત કરવામાં આવે છે.

ઉદાહરણ 2 વિવિધ દેશોમાં ઘઉંની ઉપજ દર્શાવે છે.

ઉદાહરણ 2

વિવિધ દેશો માટે ઘઉંની ઉપજ (2013)

દેશ ઘઉંની ઉપજ (કિલોગ્રામ/હેક્ટર)
કેનેડા 3594
ચીન 5055
ફ્રાંસ 7254
જર્મની 7998
ભારત 3154
પાકિસ્તાન 2787

સ્ત્રોત: Indian Agricultural Statistics at a Glance, 2015

પ્રવૃત્તિઓ

  • ઉદાહરણ 1 માં, તે વર્ષો શોધો જ્યારે ભારતની વસ્તી ન્યૂનતમ અને મહત્તમ હતી,
  • ઉદાહરણ 2 માં, તે દેશ શોધો જેની ઘઉંની ઉપજ ભારત કરતા થોડી વધુ છે. ટકાવારીના દ્રષ્ટિએ તે કેટલી હશે?
  • ઉદાહરણ 2 ના દેશોને ઉપજના ચડતા ક્રમમાં ગોઠવો. ઉપજના ઉતરતા ક્રમ માટે સમાન કસરત કરો.

કેટલીકવાર તમે એવી લાક્ષણિકતાઓ સામે આવો છો જેને માત્રાત્મક રીતે વ્યક્ત કરી શકાતી નથી. આવી લાક્ષણિકતાઓને ગુણધર્મો કહેવામાં આવે છે. ઉદાહરણ તરીકે, રાષ્ટ્રીયતા, સાક્ષરતા, ધર્મ, લિંગ, વૈવાહિક સ્થિતિ વગેરે. તેમને માપી શકાતા નથી. છતાં આ ગુણધર્મોને ક્યાં તો ગુણાત્મક લાક્ષણિકતાની હાજરી અથવા ગેરહાજરીના આધારે વર્ગીકૃત કરી શકાય છે. ગુણધર્મો પરની માહિતીના આવા વર્ગીકરણને ગુણાત્મક વર્ગીકરણ કહેવામાં આવે છે. નીચેના ઉદાહરણમાં, આપણે દેશની વસ્તીને ગુણાત્મક ચલ “લિંગ"ના આધારે જૂથબદ્ધ દેખીએ છીએ. એક અવલોકન પુરુષ અથવા સ્ત્રી હોઈ શકે છે. આ બે લાક્ષણિકતાઓને વૈવાહિક સ્થિતિના આધારે આગળ નીચે પ્રમાણે વર્ગીકૃત કરી શકાય છે:

ઉદાહરણ 3

પ્રથમ તબક્કે વર્ગીકરણ ગુણધર્મની હાજરી અને ગેરહાજરીના આધારે છે, એટલે કે, પુરુષ અથવા પુરુષ નહીં (સ્ત્રી). બીજા તબક્કે, દરેક વર્ગ - પુરુષ અને સ્ત્રી, બીજા ગુણધર્મની હાજરી અથવા ગેરહાજરીના આધારે આગળ ઉપવિભાગિત કરવામાં આવે છે, એટલે કે, શાદી થયેલ છે કે અપરિણીત છે. લાક્ષણિકતાઓ, જેમ કે ઊંચાઈ, વજન, ઉંમર, આવક, વિદ્યાર્થીઓના ગુણ વગેરે, પ્રકૃતિમાં માત્રાત્મક છે. જ્યારે આવી લાક્ષણિકતાઓની એકત્રિત માહિતીને વર્ગોમાં જૂથબદ્ધ કરવામાં આવે છે, ત્યારે તે માત્રાત્મક વર્ગીકરણ બને છે.

પ્રવૃત્તિ

  • આસપાસની વસ્તુઓને જીવંત અથવા નિર્જીવ તરીકે જૂથબદ્ધ કરી શકાય છે. શું તે માત્રાત્મક વર્ગીકરણ છે?

ઉદાહરણ 4

100 વિદ્યાર્થીઓના ગણિતના ગુણોનું આવૃત્તિ વિતરણ

ગુણ આવૃત્તિ
0-10 1
10-20 8
20-30 6
30-40 7
40-50 21
50-60 23
60-70 19
70-80 6
80-90 5
90-100 4
કુલ 100

ઉદાહરણ 4 કોષ્ટક 3.1 માં આપેલા 100 વિદ્યાર્થીઓના ગણિતના ગુણોનું માત્રાત્મક વર્ગીકરણ દર્શાવે છે.

પ્રવૃત્તિ

  • ઉદાહરણ 4 ની આવૃત્તિના મૂલ્યોને કુલ આવૃત્તિના પ્રમાણ અથવા ટકાવારી તરીકે વ્યક્ત કરો. નોંધ કરો કે આ રીતે વ્યક્ત કરવામાં આવેલી આવૃત્તિને સાપેક્ષ આવૃત્તિ તરીકે ઓળખવામાં આવે છે.
  • ઉદાહરણ 4 માં, કયા વર્ગમાં માહિતીનું મહત્તમ સાંદ્રણ છે? તેને કુલ અવલોકનોના ટકા ત