વિષય: પરિચય · વિષય: વિજ્ઞાન · વિષય: સમાચાર

બિગ ડેટા

વિજ્ઞાન માનવજીવનમાં વણકલ્પ્યાં પરિવર્તનો લાવી રહ્યું છે. માનવીના જીવનના દૈનિક વ્યવહારો હોય, આનંદપ્રમોદની પ્રવૃત્તિઓ હોય કે આર્થિક-વ્યાવસાયિક પ્રવૃત્તિઓ હોય, બધે જ ભિન્ન ભિન્ન ટેકનોલોજી છવાતી જાય છે. આર્ટિફિશિયલ ઇન્ટેલિજન્સ (એઆઇ) માનવને સ્પર્શતા તમામ ક્ષેત્રોમાં પ્રવેશી ચૂકી છે. સાયન્સ અને ટેકનોલોજી જીવનના પ્રત્યેક પાસાનાં અભિન્ન અંગ બની ગયાં છે.

બિગ ડેટા, ક્લાઉડ ટેકનોલોજી અને આર્ટિફિશિયલ ઇન્ટેલિજન્સ આપણા વર્તમાનને જ નહીં, ભવિષ્યને પણ ઘડી રહ્યાં છે.

પહેલો પ્રશ્ન થાય: બિગ ડેટા શું છે?

સુવિકસિત રાષ્ટ્રીય અને આંતરરાષ્ટ્રીય પરિવહન અને સંચાર વ્યવસ્થાઓએ વૈશ્વિક આર્થિક વ્યવહારોને સરળ કર્યા છે.  બહુરાષ્ટ્રીય વાણિજ્ય વ્યવસ્થામાં ઉત્પાદનો તથા સેવાઓ વિપુલ માત્રામાં ઉપલબ્ધ છે. અહીં પ્રત્યેક સ્તર પર માહિતીની આપલે થાય છે. ફળસ્વરૂપે, ઇન્ફર્મેશન ટેકનોલોજીનો અકલ્પ્ય વિકાસ થયો છે.

જાહેર – ખાનગી એકમો અને સંસ્થાઓને જંગી પ્રમાણમાં ડેટાની આવશ્યકતા રહે છે. આજના વિશ્વમાં રોજે રોજ પ્રચંડ માત્રામાં ડેટા – “બિગ ડેટા” જનરેટ થાય છે. આવા સ્ટ્રક્ચર્ડ-અનસ્ટ્રક્ચર્ડ ડેટાને ઉચિત રીતે સ્ટોર કરી તેની ત્વરિત, પરિણામલક્ષી એનાલિસિસ કરવામાં પ્રણાલિકાગત કમ્પ્યુટર સિસ્ટમ્સ અને સોફ્ટવેર્સ સક્ષમ હોતાં નથી. તેના માટે બિગ ડેટા એનાલિટિક્સની જરૂર પડે છે.

બિગ ડેટાનો સંબંધ આવા અતિ જંગી માત્રાના ડેટા સાથે તો છે જ, તે ઉપરાંત તેના પર થતી પ્રૉસેસિંગ અને એનાલિટિકલ મેથડ્સ સાથે પણ છે. બિગ ડેટા અને હડૂપ આજે ‘બઝ વર્ડ્ઝ્સ’ બન્યાં છે.

આવો, ‘અનામિકા’ના આજના લેખમાં બિગ ડેટા, બિગ ડેટા એનાલિટિક્સ તથા હડૂપ વિશે સરળ ભાષામાં જાણીએ.

[આપના સ્ક્રીન પર આ રસપ્રદ લેખ અહીંથી આગળ, નીચે ન દેખાય, તો લેખના શીર્ષક / ટાઇટલ પર ક્લિક કરશો. ત્યાં  ક્લિક કરતાં જ નીચે પૂરો લેખ આવી જશે. – હરીશ દવે]

** આપ આ લેખ લોકપ્રિય ગુજરાતી બ્લૉગ ‘અનામિકા’ પર વાંચી રહ્યા છો © હરીશ દવે **

ડેટા અને ડેટાબેઝ શું છે?

તદ્દન સાદા શબ્દોમાં, ડેટા એટલે ચોક્કસ પ્રકારની માહિતીનો સહેતુક સંગ્રહ.

માહિતી કે ડેટા આપના મગજની સ્મૃતિમાં હોઈ શકે, લેખિત કે પ્રિન્ટ સ્વરૂપે પેપર પર હોઈ શકે કે બિટ્સ/ બાઇટ્સ રૂપે ઇલેક્ટ્રોનિક ડિવાઇસ (જેમકે કમ્પ્યુટર મેમરી) માં હોઈ શકે.

મગજ કે પેપરના ડેટાને ત્વરિત પ્રોસેસ કરવો સરળ નથી; કમ્પ્યુટર ડિસ્ક પર સ્ટોર થયેલ બાઇનરી ડેટાને ક્ષણાર્ધમાં પ્રોસેસ કરી નિષ્કર્ષ કાઢી શકાય છે.

ડેટાનું સાદુંસીધું ઉદાહરણ: આપના કુટુંબના સભ્યોનાં નામ, જાતિ, દરેકની ઉંમર અને વજન. બીજું ઉદાહરણ, એક સ્કૂલના અમુક ક્લાસના વિદ્યાર્થીઓનાં રોલ નંબર, નામ અને તે દરેક વિદ્યાર્થીએ વિવિધ વિષયમાં મેળવેલ માર્ક્સની માહિતી. આવી માહિતીને કોષ્ટક કે ટેબલ સ્વરૂપે મૂકી શકાય. મોટા પાયાના ઉદાહરણ  પર વિચારીએ તો, સમગ્ર દેશના નાગરિકોનાં નામ, ધર્મ, તેમની ઉંમર અને શૈક્ષણિક લાયકાત વિશેની માહિતી.

આ માહિતી-સંગ્રહ ઉપયોગી તો જ બને જો તેને કોઈ અર્થપૂર્ણ ફોર્મેટમાં ગોઠવવામાં આવે. વ્યવસ્થિત ફોર્મેટમાં ગોઠવણી ન થાય ત્યાં સુધી તે ‘રૉ ડેટા’ બનીને રહે છે. આવો રૉ ડેટા વિભિન્ન સ્વરૂપનો હોઈ શકે જેમકે: ટેક્સ્ટ, ન્યુમરલ્સ, ઇમેજીસ-ચિત્રો, ફોટોગ્રાફિક ડેટા, ઑડિયો – વિડીયો ડેટા વગેરે.

ડેટાને ડેટાબેઝમાં ગોઠવવાથી તે વિશેષ ઉપયોગી બને છે. ડેટાબેઝ એ ડેટાની એવી વ્યવસ્થિત ગોઠવણી છે જેમાંથી કમ્પ્યુટર પ્રોગ્રામ જોઈતી માહિતી સહેલાઈથી આપી શકે છે કે જરૂરી તારણો મેળવી શકે છે.

આ બધી ટર્મ્સ ભારે જટિલ હોવાથી શબ્દોમાં વ્યાખ્યાયિત કરવી અને સમજાવવી મુશ્કેલ છે. આપણે ટેકનિકલ વિગતોમાં નહીં ઊતરીએ; સામાન્ય વાચકને લક્ષ્યમાં રાખી નન-ટેકનિકલ, પ્રાથમિક જાણકારી જ લઈશું તે નોંધશો.

** આપ આ લેખ લોકપ્રિય ગુજરાતી બ્લૉગ ‘અનામિકા’ પર વાંચી રહ્યા છો © હરીશ દવે **

ડેટાના પ્રકાર: સ્ટ્રક્ચર્ડ ડેટા તથા અનસ્ટ્રક્ચર્ડ ડેટા 

ડેટા મુખ્યત્વે બે પ્રકારના હોઈ શકે: સ્ટ્રક્ચર્ડ ડેટા અને અનસ્ટ્રક્ચર્ડ ડેટા.

સ્ટ્રક્ચર્ડ ડેટાનાં ઘટકોને સરળતાથી અલગ અલગ રેકોર્ડ અને કેટેગરીમાં ગોઠવી શકાય છે. સ્ટ્રક્ચર્ડ ડેટાને  ટેબલ બનાવી રો અને કોલમમાં સહેલાઈથી મૂકી શકાય છે. આવાં ટેબલ્સ બનાવીને તેમનો ડેટાબેઝ બનાવી શકાય છે. જેમકે: કોઈ સંસ્થાનાં કર્મચારીઓનાં નામ અને જુદાં જુદાં મહિનામાં તેમને ચૂકવાયેલ વેતન તથા ઇન્સેન્ટિવની  રકમ. અથવા તો કોઈ કંપનીની પ્રોડક્ટ્સનાં નામ, તે દરેકનાં વેચાયેલ યુનિટની સંખ્યા અને તે વેચાણની કુલ રકમ.

અનસ્ટ્રક્ચર્ડ ડેટાને ભિન્ન ભિન્ન કેટેગરીમાં મૂકવો સરળ નથી. અનસ્ટ્રક્ચર્ડ ડેટા જેમકે કંપનીની પ્રૉડક્ટ્સનાં નામ, તેનાં ફોટો, વર્ણનાત્મક ટેક્સ્ટ ડૉક્યુમેન્ટ્સ, તેના કસ્ટમર રિવ્યુઝ, ઇ મેઇલ, ઑડિયો-વિડીયો ક્લિપ્સ વગેરે. આવો ડેટા ઘણો સંકુલ – કોમ્પ્લેક્સ હોવાથી વર્ગીકૃત કરવો અશક્યવત અથવા તો ખૂબ અઘરો બને છે, અથવા તેમાંથી ચોક્કસ તારણો કાઢવાં મુશ્કેલ બને છે. આવા ડેટાનો રીલેશનલ ડેટાબેઝ બનાવી શકાતો નથી.

જે સ્ટ્રક્ચર્ડ ડેટામાં પરસ્પર સંબંધ કે કોઈ પેટર્ન સ્પષ્ટ હોય છે, તેનું પૃથક્કરણ – એનાલિસિસ – સરળતાથી થઈ શકે છે. મોટા ઓર્ગેનાઇઝેશનમાં કે કોર્પોરેટ કંપનીઓમાં જે ડેટા વ્યવસ્થિત ડેટાબેઝમાં ગોઠવાય છે, તેના વિવિધ ટેબલ્સમાંથી જોઈતી માહિતી પલકારામાં પ્રાપ્ત થઈ શકે છે. સાથે સાથે તેના પરથી તારણો પણ મેળવી શકાય છે.

ડેટા ઇન્ફર્મેશન ટેકનોલોજીનો આધાર છે.

વિશ્વમાં રોજબરોજ સર્જાતો જંગી ડેટા: બિગ ડેટા?

આજની દુનિયા કમ્યુનિકેશન પર ચાલે છે. સમગ્ર વિશ્વના તમામ વ્યવહારો કમ્પ્યુટિંગ સિસ્ટમ્સ, ટેલિફોનિક સેવા અને ટ્રાન્સપોર્ટેશન પર નભતા થઈ ગયા છે. સંચાર-પરિવહન સેવાઓના વિસ્તાર સાથે આંતરરાષ્ટ્રિય વાણિજ્ય-વ્યાપારનો વ્યાપ અભૂતપૂર્વ સ્કેલ પર પહોંચ્યો છે. ક્લાઉડ ટેકનોલોજીએ તેમાં ખૂબ મદદ કરી છે. વળી દેશ-દેશ અને કંપની-કંપનીઓ વચ્ચે જેટલો સહયોગ વધ્યો છે, તેટલી જ સ્પર્ધા પણ વધી છે. સરકારી, સહકારી અને ખાનગી વ્યવસ્થાતંત્રો તેમજ બિઝનેસ એકમોના નાગરિકો અને ઉપભોક્તાઓ સાથેના વ્યવહારો અતિ જટિલ થતાં રોજેરોજ અમાપ ડેટા પેદા થાય છે. કમ્પ્યુટર સિસ્ટમ્સ ઉપરાંત સ્માર્ટ મોબાઇલ ફોન જેવાં ઉપકરણો બ્રાઉઝર્સ – વેબસાઇટ કુકિઝ અને અન્ય સોફ્ટવેરની મદદથી સર્ફર (વિઝિટર/ યુઝર) વિશે ઢગલાબંધ માહિતી એકઠી કરે છે.

વળી આર્ટિફિશિયલ ઇન્ટેલિજન્સ (એઆઇ) ના ડેવલપમેન્ટથી ઇન્ટરનેટ ઑફ થિંગ્સ – આઇઓટી – સાથે સંલગ્ન ઉપકરણો (જેવાં કે સ્માર્ટ વેરેબલ ડિવાઇસિસ, સ્માર્ટ હોમ કે સ્માર્ટ ટ્રાન્સ્પોર્ટેશન) પણ મબલખ ડેટા સર્જે છે.

આ તમામ પ્રકારના જંગી માત્રાના ડેટાને સામાન્ય રીતે ‘બિગ ડેટા’ કહેવામાં આવે છે. તેથી, માસિવ વોલ્યુમના ડેટાને બિગ ડેટા કહી શકાય, પણ યાદ રાખશો કે આધુનિક ટેકનોલોજીના મતે ‘બિગ ડેટા’ની વ્યાખ્યા આટલી મર્યાદિત નથી.

** આપ આ લેખ લોકપ્રિય ગુજરાતી બ્લૉગ ‘અનામિકા’ પર વાંચી રહ્યા છો © હરીશ દવે **

બિગ ડેટા શું છે?

‘બિગ ડેટા’ ને વ્યાખ્યાયિત કરવા લાંબી સમજૂતિ પણ ટૂંકી પડે!!! બિગ ડેટાને શબ્દોમાં ‘બાંધી’ શકાય નહીં.

બિગ ડેટાની વ્યાખ્યા સમયાંતરે બદલાય છે, ક્ષેત્રે-ક્ષેત્રે બદલાય છે. બિગ ડેટાની વ્યાખ્યા બિઝનેસના વિવિધ સેગ્મેન્ટ અનુસાર, કંપની અનુસાર, પ્રૉજેક્ટ અનુસાર પણ બદલાય છે.

સાવ સરળ ભાષામાં, ‘બિગ ડેટા’ એટલે વિવિધતાસભર, વિશાળ, જટિલ ડેટા.

બિગ ડેટા એટલે સ્ટ્રક્ચર્ડ, સેમી-સ્ટ્રક્ચર્ડ અને અનસ્ટ્રક્ચર્ડ ડેટાસેટ્સ ધરાવતો કોમ્પ્લેક્સ, માસિવ, વોલ્યુમિનસ ડેટા.

આપના લેપટોપની હાર્ડ ડિસ્ક કેપેસિટી એક ટેરાબાઇટ (1000 ગીગાબાઇટ) હોઈ શકે. સામાન્ય બિઝનેસ ઓફિસમાં ડેસ્કટોપની સ્ટોરેજ કેપેસિટી બે-પાંચ ટેરાબાઇટની હોય. આવાં કેટલાંક કમ્પ્યુટર્સનું નેટવર્ક પચ્ચીસ-પચાસ ટેરાબાઈટ ડેટા સ્ટોર કરી શકે. જ્યારે બિગ ડેટા તો સેંકડો ટેરાબાઇટ્સ કે પેટાબાઇટ્સ સાથે સંબંધિત છે.

બિગ ડેટા અતિ મોટી માત્રાનો એવો જંગી અને સંકુલ ડેટા છે જેને કોમન કમ્પ્યુટર સિસ્ટમ કે સામાન્ય સોફ્ટવેર (એપ્લિકેશન/ પ્રોગ્રામ) થી હેન્ડલ ન કરી શકાય. ટેરાબાઇટ્સ કે પેટાબાઇટ્સમાં જનરેટ થતા બિગ ડેટાના સ્ટોરેજ અને પ્રોસેસિંગ માટે અસાધારણ સ્ટોરેજ કેપેસિટી સાથે હાઇ પ્રોસેસિંગ પાવર ધરાવતી કમ્પ્યુટિંગ સિસ્ટમ્સ તેમજ અદ્યતન સોફ્ટવેર જોઈએ.

બિગ ડેટા એવો પ્રચંડ માત્રાનો ડેટા છે જેને ખાસ પ્રકારની કમ્પ્યુટર સર્વર સિસ્ટમ્સ પર ખાસ પ્રકારના સોફ્ટવેરની મદદથી જ પ્રૉસેસ-એનાલાઇઝ કરી શકાય.

હડૂપ શું છે?

બિગ ડેટાને હેન્ડલ કરવા હડૂપ નામના સોફ્ટવેર ફ્રેમવર્કનો ઉપયોગ થાય છે.

બિગ ડેટા પ્રશ્ન છે, તો તેને  માટે હડૂપ એક સોલ્યુશન છે.

હડૂપ પ્રચલિત ઓપન સોર્સ સોફ્ટવેર ફ્રેમવર્ક છે, જે અનેક કમ્પ્યુટર-સર્વર્સથી બનેલ ક્લસ્ટર્ડ સિસ્ટમ્સ પર જંગી ડેટાને અતિશય ઝડપથી પ્રોસેસ કરી શકે છે. હડૂપ એક પ્રકારનું પેરેલલ પ્રોસેસિંગ પ્રોગ્રામિંગ પૂરૂં પાડે છે.

એક સાથે ઘણા ક્લસ્ટર યુનિટ્સ પર ચાલતી બિગ ડેટા એપ્લિકેશન્સને તેમજ તેમના સ્ટોરેજને હડૂપ સફળતાથી હેન્ડલ કરે છે. આમ, હડૂપ ભિન્ન ભિન્ન તમામ પ્રકારના, કોઈ પણ વોલ્યુમના ડેટાને સ્ટોરેજ આપે છે, હાઇ કેપેસિટી પ્રૉસેસિંગ પાવર આપે છે, તદુપરાંત  ડેટા પર એક સાથે અસંખ્ય પ્રકારનાં મલ્ટિપલ ટાસ્ક કરવાની સગવડ આપે છે.

** આપ આ લેખ લોકપ્રિય ગુજરાતી બ્લૉગ ‘અનામિકા’ પર વાંચી રહ્યા છો © હરીશ દવે **

બિગ ડેટાનો આધુનિક અર્થ અને બિગ ડેટા એનાલિટિક્સ
  • અહીં એક વાત ફલિત થાય છે કે ‘બિગ ડેટા’નો સંબંધ માત્ર ડેટાના ‘વોલ્યુમ’ સાથે જ નથી, પરંતુ ટેકનોલોજી સાથે પણ છે. જેમકે ડેટામાંથી તારણો મેળવવા કયા ટૂલ્સ કે પ્રૉસેસિસ કે સોફ્ટવેર (ટેકનોલોજી) પ્રયોજાય છે.
  • ટ્રેડિશનલ ડેટાબેઝ-સોફ્ટવેર ટેકનિક્સ મહા જંગી કદના જટિલ બિગ ડેટામાં ‘છુપાયેલ’ અર્થપૂર્ણ પેટર્ન શોધી શકતાં નથી.
  • ટ્રેડિશનલ કમ્યુટિંગ સિસ્ટમ્સમાં મર્યાદિત સ્ટોરેજ અને સીમિત પ્રૉસેસિંગ કેપેસિટી હોવાથી તે બિગ ડેટાની ત્વરિત એનાલિસિસ કરી શકતાં નથી.
  • બિગ ડેટાના સ્ટોરેજ-એનાલિસિસ-પ્રોસેસિંગ માટે સોફિસ્ટિકેટેડ કમ્પ્યુટર સિસ્ટમ્સ અને ખાસ પ્રકારનો સોફ્ટવેર અનિવાર્ય છે.
  • ‘બિગ ડેટા’ શબ્દસમૂહ (ટર્મ) માત્ર કદાવર સાઇઝના ડેટા સેટ્સ કે પ્રચંડ કદના ડેટા માટે જ નથી વપરાતો; તે ડેટા એનાલિટિક્સની ટેકનોલોજી માટે પણ વપરાય છે.
  • આધુનિક સંદર્ભમાં ‘બિગ ડેટા’ ટર્મ એનાલિટિકલ મેથડ્સ સૂચવે છે. આવા એડવાન્સ્ડ બિગ ડેટા એનાલિટિક્સમાં આર્ટિફિશિયલ ઇન્ટેલિજન્સ (એઆઇ) અને મશીન લર્નિંગ (એમ એલ) જેવી અત્યાધુનિક ટેકનોલોજી પ્રયોજાય છે.
  • ‘બિગ ડેટા’ ટર્મનો ઉપયોગ પ્રિડિક્ટિવ એનાલિટિક્સ અને ડેટા એનાલિટિક્સ મેથડ્સ સૂચવવા પણ થાય છે.
  • જેનેટિક્સ રિસર્ચ અને જીનોમિક્સ સ્ટડીમાં જેનેટિક સાયન્ટિસ્ટ્સ અને બાયોલોજીસ્ટ્સ જીનોમના પ્રચુર પ્રમાણના ડેટાના અભ્યાસ માટે પ્રિડિક્ટિવ એનાલિટિક્સ પદ્ધતિઓ વાપરે છે.
  • કટ થ્રોટ કોમ્પિટિશનના જમાનામાં બિઝનેસને માર્કેટમાં સફળતાથી ટકાવી રાખવા બિઝનેસ ઇન્ટેલિજન્સની જરૂર પડે છે. બિગ ડેટા બિઝનેસ ઇન્ટેલિજન્સમાં મદદરૂપ છે.
  • જાયન્ટ મલ્ટિનેશનલ કંપનીઓ અને બિઝનેસ કોર્પોરેટ હાઉસિસ માટે માર્કેટ ટ્રેન્ડ્સ, કોમ્પિટિટર મુવમેન્ટ અને કન્ઝ્યુમર બિહેવિયર માટે જંગી કદના બિગ ડેટામાંથી બિઝનેસ ટ્રેન્ડ્ઝની વિવિધ પેટર્ન શોધવી આવશ્યક હોય છે. આવી બિઝનેસ કંપનીઓ ‘બિગ ડેટા’ ટર્મનો ઉપયોગ બિઝનેસ એનાલિટિક્સ કે કન્ઝ્યુમર બિહેવિયર એનાલિટિક્સ માટે કરે છે.
  • અમેરિકામાં યુનિવર્સિટી ઑફ કેલિફોર્નિયા, બર્કલી (યુસીબી) અને બ્રેક-થ્રુ લિસન પ્રૉજેક્ટમાં પ્રસિદ્ધ થનાર ગુજરાતી યુવાન એસ્ટ્રોફિઝિસિસ્ટ વિશાલ ગજ્જરના ફાસ્ટ રેડિયો બર્સ્ટ (એફ આર બી) ના સ્રોતના અભૂતપૂર્વ સંશોધન સાથે સંલગ્ન ડેટા 400 ટેરાબાઇટનો હતો. બર્કલી સેટી રિસર્ચ સેન્ટર (યુસીબી સેટી, બર્કલી, યુએસએ) ખાતે તેના પર પુન: સંશોધનમાં – એસ્ટ્રોનોમી – એસ્ટ્રોફિઝિક્સ ક્ષેત્રમાં – આર્ટિફિશિયલ ઇન્ટેલિજન્સ અને મશીન લર્નિંગ આલ્ગોરિધમનો પ્રથમ વખત ઉપયોગ થયો.
  • બિગ ડેટા એનાલિટિક્સની સફળતામાં આર્ટિફિશિયલ ઇન્ટેલિજન્સ – મશીન લર્નિંગ અલ્ગોરિધમન્યુરાલ નેટવર્ક આધારિત ટેકનોલોજીનું મોટું યોગદાન છે.

** આપ આ લેખ લોકપ્રિય ગુજરાતી બ્લૉગ ‘અનામિકા’ પર વાંચી રહ્યા છો © હરીશ દવે **

બિગ ડેટાનાં લક્ષણો: ત્રણ ‘વી’

‘બિગ ડેટા’નાં કેરેક્ટરિસ્ટિક્સ (લક્ષણો) કયાં? ‘બિગ ડેટા’ની પરખ માટેનાં મૂળભૂત લક્ષણો અંગ્રેજી આલ્ફાબેટ ‘વી’ થી શરૂ થતા ‘થ્રી વી’ છે.

બિગ ડેટાનાં આ ‘થ્રી વી’ કેરેક્ટરિસ્ટિક્સ છે: વોલ્યુમ (Volume), વેરાયટી (Variety) તથા વેલોસિટી (Velocity).

આલ્ફાબેટ ‘વી’ થી શરૂ થતા ત્રણ શબ્દો બિગ ડેટાનાં લક્ષણો સૂચવે છે. આ ત્રણ વી છે: વોલ્યુમ અર્થાત કદ, વેરાયટી અર્થાત વિવિધતા, વેલોસિટી અર્થાત ઝડપ કે ત્વરા.

બિગ ડેટાને વર્ણવવા માટેનાં લક્ષણોનાં ‘ત્રણ વી’માં પ્રથમ છે વોલ્યુમ. ડેટાનું કદ અતિ જંગી હોવું જોઈએ. બીજો ‘વી’ છે વેરાયટી. તેના ડેટામાં વૈવિધ્ય હોવું જોઈએ. જેમકે ડેટામાં ટેક્સ્ટ, ઇમેજ, વોઇસ ડેટા, વિડીયો ડેટા જેવી વિવિધતા હોવી જોઈએ. ત્રીજો ‘વી’ છે વેલોસિટી. ડેટા કેટલી ત્વરા (ઝડપ કે સ્પીડ) થી જનરેટ થાય છે કે પ્રોસેસ થઈ શકે છે તે પણ મહત્ત્વનું લક્ષણ છે.

આમ, વોલ્યુમ, વેરાયટી તથા વેલોસિટી આ ત્રણ ‘વી’ બિગ ડેટાનાં મુખ્ય કેરેક્ટરિસ્ટિક્સ છે.

** આપ આ લેખ લોકપ્રિય ગુજરાતી બ્લૉગ ‘અનામિકા’ પર વાંચી રહ્યા છો © હરીશ દવે **

બિગ ડેટાની ઉપયોગિતા – બિગ ડેટા એપ્લિકેશન્સ

બિગ ડેટા રોજિંદા માનવ વ્યવહારમાં અતિ ઉપયોગી છે.

આર્ટિફિશિયલ ઇન્ટેલિજન્સ, મશીન લર્નિંગ અને ન્યુરાલ નેટવર્ક જેવી ટેકનોલોજીના વિકાસ સાથે બિગ ડેટાની વ્યાવહારિક ઉપયોગિતા ઇન્ટરનેટ એડવર્ટાઇઝિંગ અને ઓન-લાઇન શોપિંગથી લઈને કોર્પોરેટ સેક્ટરમાં પડકારરૂપ બિઝનેસ ડિસિશન સુધી વિસ્તરી છે.

વ્યાપાર-વાણિજ્ય અને ઉદ્યોગ ક્ષેત્રે અત્યારે જ જનરેટ થતા ડેટાને રિયલ ટાઇમમાં એનાલાઇઝ કરી તાત્કાલિક નિર્ણય (રિયલ ટાઇમ ડિસિશન) લેવા માટે ‘બિગ ડેટા’ અનિવાર્ય છે.

સોશિયલ મીડિયા, રીટેઇલ બિઝનેસ, ઇ-કોમર્સ, હેલ્થ કેર, બેંકિંગ, ઇંસ્યોરન્સ,  એજ્યુકેશન જેવા સમાજવ્યાપી ક્ષેત્રોમાં  બિગ ડેટા (બિગ ડેટા એનાલિટિક્સ) મોટો રોલ ભજવે છે.

વિજ્ઞાન ક્ષેત્રે સંશોધનો અને બ્રહ્માંડને ફંફોસતા ખગોળશાસ્ત્રમાં તેની ઉપયોગિતા સિદ્ધ થઈ ચૂકી છે.

બિગ ડેટાની એપ્લિકેશન્સ સરકારી ક્ષેત્રોમાં સ્માર્ટ ફાર્મિંગ-એગ્રીકલ્ચરથી લઈ અર્બન ડેવલમેન્ટ, ટ્રાન્સપોર્ટ સિસ્ટમ્સથી લઈ કાયદો-વ્યવસ્થા સુધીનાં ક્ષેત્રોમાં ખૂબ જ ઉપયોગી છે.

સંક્ષિપ્તમાં કહીએ તો, બિગ ડેટા માનવજીવનના રોજિંદા વ્યવહારોમાં છવાઈ ગયેલ છે.

** આપ આ લેખ લોકપ્રિય ગુજરાતી બ્લૉગ ‘અનામિકા’ પર વાંચી રહ્યા છો © હરીશ દવે **

** * *** * **** ** * ** * * ** *

અનામિકા-લેખ: બિગ ડેટા
  • કમ્યુનિકેશન, ઇન્ટરનેટ અને ટ્રાન્સપોર્ટ ક્ષેત્રોમાં ક્રાંતિકારી પ્રગતિથી નજીક આવ્યા દુનિયાના દેશો
  • વિશ્વમાં વાણિજ્ય-વ્યાપાર-ઉદ્યોગ સહિતના આર્થિક ક્ષેત્રોમાં ગાઢ બન્યા વ્યવહારો
  • વિશ્વમાં રોજ જનરેટ થતો વિવિધ પ્રકારનો જંગી ડેટા
  • બિગ ડેટામાં પ્રગતિનાં પ્રેરક પરિબળો છે આર્ટિફિશિયલ ઇન્ટેલિજન્સ, મશીન લર્નિંગ, ન્યુરાલ નેટવર્ક, ક્લાઉડ કમ્પ્યુટિંગ અને વિસ્તરતી ઇન્ટરનેટ ઓફ થિંગ્સ (આઇઓટી) ટેકનોલોજી
  • એઆઇ અને મશીન લર્નિંગ અલ્ગોરિધમથી બિગ ડેટા એનાલિટિક્સ ક્ષેત્રે હરણફાળ
  • બિગ ડેટા એનાલિટિક્સનો ઉપયોગ દુનિયાના વ્યવહારોના પ્રત્યેક ક્ષેત્રમાં: ટ્રેડ-કોમર્સ-ઇન્ડસ્ટ્રી જેમકે ઇ-કોમર્સ, ઓન-લાઇન શોપિંગ, ઇંટરનેટ એડવર્ટાઇઝિંગ, એજ્યુકેશન, ફાઇનાન્સ-બેન્કિંગ, ઇન્સ્યોરન્સ, એસ્ટ્રોનોમી-એસ્ટ્રોફિઝિક્સ જેવાં વિવિધ વિજ્ઞાન ક્ષેત્રે અને સાયન્ટિફિક રિસર્ચ, હેલ્થકેર, સરકારી ગવર્નન્સ વગેરેમાં
  • એક ટેરાબાઇટ = 1000 ગીગાબાઇટ, એક પેટાબાઇટ = 1000 ટેરાબાઇટ, એક એક્ઝાબાઇટ = 1000 પેટાબાઇટ …..   વિશેષ માહિતી માટે અહીં ક્લિક કરો
  • બિગ ડેટા: Big Data
  • બિગ ડેટા એનાલિટિક્સ: Big Data Analytics
  • હડૂપ એક પ્રચલિત ઓપન સોર્સ સોફ્ટવેર ફ્રેમવર્ક: Hadoop – an Open-source software framework
  • સ્ટ્રક્ચર્ડ ડેટા તથા અનસ્ટ્રક્ચર્ડ ડેટા: Structured Data / Unstrctured Data
  • આર્ટિફિશિયલ ઇન્ટેલિજન્સ – એઆઇ: Artificial Intelligence – AI
  • ઇન્ટરનેટ ઑફ થિંગ્સ – આઇઓટી: Internet of Things – IoT
  • ગીગાબાઇટ, ટેરાબાઇટ, પેટાબાઇટ: Gigabyte, Terrabyte, Petabyte
  • વિશાલ ગજ્જર – યુનિવર્સિટી ઑફ કેલિફોર્નિયા ખાતે ફાસ્ટ રેડિયો બર્સ્ટ (એફઆરબી) પર સંશોધન: Vishal Gajjar – Research work on Fast Radio Burst (FRB) at University of California, USA
  • સેટી – સર્ચ ફોર એક્સ્ટ્રા ટેરેસ્ટ્રિયલ ઇન્ટેલિજન્સ: SETI – Search for Extraterrestrial Intelligence
  • બર્કલી સેટી રિસર્ચ સેન્ટર (યુસીબી સેટી, યુનિવર્સિટી ઑફ કેલિફોર્નિયા, બર્કલી, યુએસએ): Berkeley SETI Research Centre (UCB SETI, University of California, Berkeley, USA)
  • બિગ ડેટાનાં ‘થ્રી વી’ લક્ષણો – વોલ્યુમ, વેરાયટી, વેલોસિટી: Three characteristics – Three ‘V’ of Big Data – Volume, Variety, Velocity

*** * * ** * *** ** ** *** *** ** *** **** * * *** ** **

** આપ આ લેખ લોકપ્રિય ગુજરાતી બ્લૉગ ‘અનામિકા’ પર વાંચી રહ્યા છો © હરીશ દવે **

*** * * ** * *** ** ** *** *** ** *** **** * * *** ** **

*** * * ** * *** ** ** *** *** ** *** **** * * *** ** **

6 thoughts on “બિગ ડેટા

પ્રતિસાદ આપો

Fill in your details below or click an icon to log in:

WordPress.com Logo

You are commenting using your WordPress.com account. Log Out /  બદલો )

Facebook photo

You are commenting using your Facebook account. Log Out /  બદલો )

Connecting to %s