વિષય: પરિચય · વિષય: વિજ્ઞાન · વિષય: સમાચાર

બિગ ડેટા

વિજ્ઞાન માનવજીવનમાં વણકલ્પ્યાં પરિવર્તનો લાવી રહ્યું છે. માનવીના જીવનના દૈનિક વ્યવહારો હોય, આનંદપ્રમોદની પ્રવૃત્તિઓ હોય કે આર્થિક-વ્યાવસાયિક પ્રવૃત્તિઓ હોય, બધે જ ભિન્ન ભિન્ન ટેકનોલોજી છવાતી જાય છે. આર્ટિફિશિયલ ઇન્ટેલિજન્સ (એઆઇ) માનવને સ્પર્શતા તમામ ક્ષેત્રોમાં પ્રવેશી ચૂકી છે. સાયન્સ અને ટેકનોલોજી જીવનના પ્રત્યેક પાસાનાં અભિન્ન અંગ બની ગયાં છે.

બિગ ડેટા, ક્લાઉડ ટેકનોલોજી અને આર્ટિફિશિયલ ઇન્ટેલિજન્સ આપણા વર્તમાનને જ નહીં, ભવિષ્યને પણ ઘડી રહ્યાં છે.

પહેલો પ્રશ્ન થાય: બિગ ડેટા શું છે?

સુવિકસિત રાષ્ટ્રીય અને આંતરરાષ્ટ્રીય પરિવહન અને સંચાર વ્યવસ્થાઓએ વૈશ્વિક આર્થિક વ્યવહારોને સરળ કર્યા છે.  બહુરાષ્ટ્રીય વાણિજ્ય વ્યવસ્થામાં ઉત્પાદનો તથા સેવાઓ વિપુલ માત્રામાં ઉપલબ્ધ છે. અહીં પ્રત્યેક સ્તર પર માહિતીની આપલે થાય છે. ફળસ્વરૂપે, ઇન્ફર્મેશન ટેકનોલોજીનો અકલ્પ્ય વિકાસ થયો છે.

જાહેર – ખાનગી એકમો અને સંસ્થાઓને જંગી પ્રમાણમાં ડેટાની આવશ્યકતા રહે છે. આજના વિશ્વમાં રોજે રોજ પ્રચંડ માત્રામાં ડેટા – “બિગ ડેટા” જનરેટ થાય છે. આવા સ્ટ્રક્ચર્ડ-અનસ્ટ્રક્ચર્ડ ડેટાને ઉચિત રીતે સ્ટોર કરી તેની ત્વરિત, પરિણામલક્ષી એનાલિસિસ કરવામાં પ્રણાલિકાગત કમ્પ્યુટર સિસ્ટમ્સ અને સોફ્ટવેર્સ સક્ષમ હોતાં નથી. તેના માટે બિગ ડેટા એનાલિટિક્સની જરૂર પડે છે.

બિગ ડેટાનો સંબંધ આવા અતિ જંગી માત્રાના ડેટા સાથે તો છે જ, તે ઉપરાંત તેના પર થતી પ્રૉસેસિંગ અને એનાલિટિકલ મેથડ્સ સાથે પણ છે. બિગ ડેટા અને હડૂપ આજે ‘બઝ વર્ડ્ઝ્સ’ બન્યાં છે.

આવો, ‘અનામિકા’ના આજના લેખમાં બિગ ડેટા, બિગ ડેટા એનાલિટિક્સ તથા હડૂપ વિશે સરળ ભાષામાં જાણીએ.

[આપના સ્ક્રીન પર આ રસપ્રદ લેખ અહીંથી આગળ, નીચે ન દેખાય, તો લેખના શીર્ષક / ટાઇટલ પર ક્લિક કરશો. ત્યાં  ક્લિક કરતાં જ નીચે પૂરો લેખ આવી જશે. – હરીશ દવે]

** આપ આ લેખ લોકપ્રિય ગુજરાતી બ્લૉગ ‘અનામિકા’ પર વાંચી રહ્યા છો © હરીશ દવે **

ડેટા અને ડેટાબેઝ શું છે?

તદ્દન સાદા શબ્દોમાં, ડેટા એટલે ચોક્કસ પ્રકારની માહિતીનો સહેતુક સંગ્રહ.

માહિતી કે ડેટા આપના મગજની સ્મૃતિમાં હોઈ શકે, લેખિત કે પ્રિન્ટ સ્વરૂપે પેપર પર હોઈ શકે કે બિટ્સ/ બાઇટ્સ રૂપે ઇલેક્ટ્રોનિક ડિવાઇસ (જેમકે કમ્પ્યુટર મેમરી) માં હોઈ શકે.

મગજ કે પેપરના ડેટાને ત્વરિત પ્રોસેસ કરવો સરળ નથી; કમ્પ્યુટર ડિસ્ક પર સ્ટોર થયેલ બાઇનરી ડેટાને ક્ષણાર્ધમાં પ્રોસેસ કરી નિષ્કર્ષ કાઢી શકાય છે.

ડેટાનું સાદુંસીધું ઉદાહરણ: આપના કુટુંબના સભ્યોનાં નામ, જાતિ, દરેકની ઉંમર અને વજન. બીજું ઉદાહરણ, એક સ્કૂલના અમુક ક્લાસના વિદ્યાર્થીઓનાં રોલ નંબર, નામ અને તે દરેક વિદ્યાર્થીએ વિવિધ વિષયમાં મેળવેલ માર્ક્સની માહિતી. આવી માહિતીને કોષ્ટક કે ટેબલ સ્વરૂપે મૂકી શકાય. મોટા પાયાના ઉદાહરણ  પર વિચારીએ તો, સમગ્ર દેશના નાગરિકોનાં નામ, ધર્મ, તેમની ઉંમર અને શૈક્ષણિક લાયકાત વિશેની માહિતી.

આ માહિતી-સંગ્રહ ઉપયોગી તો જ બને જો તેને કોઈ અર્થપૂર્ણ ફોર્મેટમાં ગોઠવવામાં આવે. વ્યવસ્થિત ફોર્મેટમાં ગોઠવણી ન થાય ત્યાં સુધી તે ‘રૉ ડેટા’ બનીને રહે છે. આવો રૉ ડેટા વિભિન્ન સ્વરૂપનો હોઈ શકે જેમકે: ટેક્સ્ટ, ન્યુમરલ્સ, ઇમેજીસ-ચિત્રો, ફોટોગ્રાફિક ડેટા, ઑડિયો – વિડીયો ડેટા વગેરે.

ડેટાને ડેટાબેઝમાં ગોઠવવાથી તે વિશેષ ઉપયોગી બને છે. ડેટાબેઝ એ ડેટાની એવી વ્યવસ્થિત ગોઠવણી છે જેમાંથી કમ્પ્યુટર પ્રોગ્રામ જોઈતી માહિતી સહેલાઈથી આપી શકે છે કે જરૂરી તારણો મેળવી શકે છે.

આ બધી ટર્મ્સ ભારે જટિલ હોવાથી શબ્દોમાં વ્યાખ્યાયિત કરવી અને સમજાવવી મુશ્કેલ છે. આપણે ટેકનિકલ વિગતોમાં નહીં ઊતરીએ; સામાન્ય વાચકને લક્ષ્યમાં રાખી નન-ટેકનિકલ, પ્રાથમિક જાણકારી જ લઈશું તે નોંધશો.

** આપ આ લેખ લોકપ્રિય ગુજરાતી બ્લૉગ ‘અનામિકા’ પર વાંચી રહ્યા છો © હરીશ દવે **

ડેટાના પ્રકાર: સ્ટ્રક્ચર્ડ ડેટા તથા અનસ્ટ્રક્ચર્ડ ડેટા 

ડેટા મુખ્યત્વે બે પ્રકારના હોઈ શકે: સ્ટ્રક્ચર્ડ ડેટા અને અનસ્ટ્રક્ચર્ડ ડેટા.

સ્ટ્રક્ચર્ડ ડેટાનાં ઘટકોને સરળતાથી અલગ અલગ રેકોર્ડ અને કેટેગરીમાં ગોઠવી શકાય છે. સ્ટ્રક્ચર્ડ ડેટાને  ટેબલ બનાવી રો અને કોલમમાં સહેલાઈથી મૂકી શકાય છે. આવાં ટેબલ્સ બનાવીને તેમનો ડેટાબેઝ બનાવી શકાય છે. જેમકે: કોઈ સંસ્થાનાં કર્મચારીઓનાં નામ અને જુદાં જુદાં મહિનામાં તેમને ચૂકવાયેલ વેતન તથા ઇન્સેન્ટિવની  રકમ. અથવા તો કોઈ કંપનીની પ્રોડક્ટ્સનાં નામ, તે દરેકનાં વેચાયેલ યુનિટની સંખ્યા અને તે વેચાણની કુલ રકમ.

અનસ્ટ્રક્ચર્ડ ડેટાને ભિન્ન ભિન્ન કેટેગરીમાં મૂકવો સરળ નથી. અનસ્ટ્રક્ચર્ડ ડેટા જેમકે કંપનીની પ્રૉડક્ટ્સનાં નામ, તેનાં ફોટો, વર્ણનાત્મક ટેક્સ્ટ ડૉક્યુમેન્ટ્સ, તેના કસ્ટમર રિવ્યુઝ, ઇ મેઇલ, ઑડિયો-વિડીયો ક્લિપ્સ વગેરે. આવો ડેટા ઘણો સંકુલ – કોમ્પ્લેક્સ હોવાથી વર્ગીકૃત કરવો અશક્યવત અથવા તો ખૂબ અઘરો બને છે, અથવા તેમાંથી ચોક્કસ તારણો કાઢવાં મુશ્કેલ બને છે. આવા ડેટાનો રીલેશનલ ડેટાબેઝ બનાવી શકાતો નથી.

જે સ્ટ્રક્ચર્ડ ડેટામાં પરસ્પર સંબંધ કે કોઈ પેટર્ન સ્પષ્ટ હોય છે, તેનું પૃથક્કરણ – એનાલિસિસ – સરળતાથી થઈ શકે છે. મોટા ઓર્ગેનાઇઝેશનમાં કે કોર્પોરેટ કંપનીઓમાં જે ડેટા વ્યવસ્થિત ડેટાબેઝમાં ગોઠવાય છે, તેના વિવિધ ટેબલ્સમાંથી જોઈતી માહિતી પલકારામાં પ્રાપ્ત થઈ શકે છે. સાથે સાથે તેના પરથી તારણો પણ મેળવી શકાય છે.

ડેટા ઇન્ફર્મેશન ટેકનોલોજીનો આધાર છે.

વિશ્વમાં રોજબરોજ સર્જાતો જંગી ડેટા: બિગ ડેટા?

આજની દુનિયા કમ્યુનિકેશન પર ચાલે છે. સમગ્ર વિશ્વના તમામ વ્યવહારો કમ્પ્યુટિંગ સિસ્ટમ્સ, ટેલિફોનિક સેવા અને ટ્રાન્સપોર્ટેશન પર નભતા થઈ ગયા છે. સંચાર-પરિવહન સેવાઓના વિસ્તાર સાથે આંતરરાષ્ટ્રિય વાણિજ્ય-વ્યાપારનો વ્યાપ અભૂતપૂર્વ સ્કેલ પર પહોંચ્યો છે. ક્લાઉડ ટેકનોલોજીએ તેમાં ખૂબ મદદ કરી છે. વળી દેશ-દેશ અને કંપની-કંપનીઓ વચ્ચે જેટલો સહયોગ વધ્યો છે, તેટલી જ સ્પર્ધા પણ વધી છે. સરકારી, સહકારી અને ખાનગી વ્યવસ્થાતંત્રો તેમજ બિઝનેસ એકમોના નાગરિકો અને ઉપભોક્તાઓ સાથેના વ્યવહારો અતિ જટિલ થતાં રોજેરોજ અમાપ ડેટા પેદા થાય છે. કમ્પ્યુટર સિસ્ટમ્સ ઉપરાંત સ્માર્ટ મોબાઇલ ફોન જેવાં ઉપકરણો બ્રાઉઝર્સ – વેબસાઇટ કુકિઝ અને અન્ય સોફ્ટવેરની મદદથી સર્ફર (વિઝિટર/ યુઝર) વિશે ઢગલાબંધ માહિતી એકઠી કરે છે.

વળી આર્ટિફિશિયલ ઇન્ટેલિજન્સ (એઆઇ) ના ડેવલપમેન્ટથી ઇન્ટરનેટ ઑફ થિંગ્સ – આઇઓટી – સાથે સંલગ્ન ઉપકરણો (જેવાં કે સ્માર્ટ વેરેબલ ડિવાઇસિસ, સ્માર્ટ હોમ કે સ્માર્ટ ટ્રાન્સ્પોર્ટેશન) પણ મબલખ ડેટા સર્જે છે.

આ તમામ પ્રકારના જંગી માત્રાના ડેટાને સામાન્ય રીતે ‘બિગ ડેટા’ કહેવામાં આવે છે. તેથી, માસિવ વોલ્યુમના ડેટાને બિગ ડેટા કહી શકાય, પણ યાદ રાખશો કે આધુનિક ટેકનોલોજીના મતે ‘બિગ ડેટા’ની વ્યાખ્યા આટલી મર્યાદિત નથી.

** આપ આ લેખ લોકપ્રિય ગુજરાતી બ્લૉગ ‘અનામિકા’ પર વાંચી રહ્યા છો © હરીશ દવે **

બિગ ડેટા શું છે?

‘બિગ ડેટા’ ને વ્યાખ્યાયિત કરવા લાંબી સમજૂતિ પણ ટૂંકી પડે!!! બિગ ડેટાને શબ્દોમાં ‘બાંધી’ શકાય નહીં.

બિગ ડેટાની વ્યાખ્યા સમયાંતરે બદલાય છે, ક્ષેત્રે-ક્ષેત્રે બદલાય છે. બિગ ડેટાની વ્યાખ્યા બિઝનેસના વિવિધ સેગ્મેન્ટ અનુસાર, કંપની અનુસાર, પ્રૉજેક્ટ અનુસાર પણ બદલાય છે.

સાવ સરળ ભાષામાં, ‘બિગ ડેટા’ એટલે વિવિધતાસભર, વિશાળ, જટિલ ડેટા.

બિગ ડેટા એટલે સ્ટ્રક્ચર્ડ, સેમી-સ્ટ્રક્ચર્ડ અને અનસ્ટ્રક્ચર્ડ ડેટાસેટ્સ ધરાવતો કોમ્પ્લેક્સ, માસિવ, વોલ્યુમિનસ ડેટા.

આપના લેપટોપની હાર્ડ ડિસ્ક કેપેસિટી એક ટેરાબાઇટ (1000 ગીગાબાઇટ) હોઈ શકે. સામાન્ય બિઝનેસ ઓફિસમાં ડેસ્કટોપની સ્ટોરેજ કેપેસિટી બે-પાંચ ટેરાબાઇટની હોય. આવાં કેટલાંક કમ્પ્યુટર્સનું નેટવર્ક પચ્ચીસ-પચાસ ટેરાબાઈટ ડેટા સ્ટોર કરી શકે. જ્યારે બિગ ડેટા તો સેંકડો ટેરાબાઇટ્સ કે પેટાબાઇટ્સ સાથે સંબંધિત છે.

બિગ ડેટા અતિ મોટી માત્રાનો એવો જંગી અને સંકુલ ડેટા છે જેને કોમન કમ્પ્યુટર સિસ્ટમ કે સામાન્ય સોફ્ટવેર (એપ્લિકેશન/ પ્રોગ્રામ) થી હેન્ડલ ન કરી શકાય. ટેરાબાઇટ્સ કે પેટાબાઇટ્સમાં જનરેટ થતા બિગ ડેટાના સ્ટોરેજ અને પ્રોસેસિંગ માટે અસાધારણ સ્ટોરેજ કેપેસિટી સાથે હાઇ પ્રોસેસિંગ પાવર ધરાવતી કમ્પ્યુટિંગ સિસ્ટમ્સ તેમજ અદ્યતન સોફ્ટવેર જોઈએ.

બિગ ડેટા એવો પ્રચંડ માત્રાનો ડેટા છે જેને ખાસ પ્રકારની કમ્પ્યુટર સર્વર સિસ્ટમ્સ પર ખાસ પ્રકારના સોફ્ટવેરની મદદથી જ પ્રૉસેસ-એનાલાઇઝ કરી શકાય.

હડૂપ શું છે?

બિગ ડેટાને હેન્ડલ કરવા હડૂપ નામના સોફ્ટવેર ફ્રેમવર્કનો ઉપયોગ થાય છે.

બિગ ડેટા પ્રશ્ન છે, તો તેને  માટે હડૂપ એક સોલ્યુશન છે.

હડૂપ પ્રચલિત ઓપન સોર્સ સોફ્ટવેર ફ્રેમવર્ક છે, જે અનેક કમ્પ્યુટર-સર્વર્સથી બનેલ ક્લસ્ટર્ડ સિસ્ટમ્સ પર જંગી ડેટાને અતિશય ઝડપથી પ્રોસેસ કરી શકે છે. હડૂપ એક પ્રકારનું પેરેલલ પ્રોસેસિંગ પ્રોગ્રામિંગ પૂરૂં પાડે છે.

એક સાથે ઘણા ક્લસ્ટર યુનિટ્સ પર ચાલતી બિગ ડેટા એપ્લિકેશન્સને તેમજ તેમના સ્ટોરેજને હડૂપ સફળતાથી હેન્ડલ કરે છે. આમ, હડૂપ ભિન્ન ભિન્ન તમામ પ્રકારના, કોઈ પણ વોલ્યુમના ડેટાને સ્ટોરેજ આપે છે, હાઇ કેપેસિટી પ્રૉસેસિંગ પાવર આપે છે, તદુપરાંત  ડેટા પર એક સાથે અસંખ્ય પ્રકારનાં મલ્ટિપલ ટાસ્ક કરવાની સગવડ આપે છે.

** આપ આ લેખ લોકપ્રિય ગુજરાતી બ્લૉગ ‘અનામિકા’ પર વાંચી રહ્યા છો © હરીશ દવે **

બિગ ડેટાનો આધુનિક અર્થ અને બિગ ડેટા એનાલિટિક્સ
  • અહીં એક વાત ફલિત થાય છે કે ‘બિગ ડેટા’નો સંબંધ માત્ર ડેટાના ‘વોલ્યુમ’ સાથે જ નથી, પરંતુ ટેકનોલોજી સાથે પણ છે. જેમકે ડેટામાંથી તારણો મેળવવા કયા ટૂલ્સ કે પ્રૉસેસિસ કે સોફ્ટવેર (ટેકનોલોજી) પ્રયોજાય છે.
  • ટ્રેડિશનલ ડેટાબેઝ-સોફ્ટવેર ટેકનિક્સ મહા જંગી કદના જટિલ બિગ ડેટામાં ‘છુપાયેલ’ અર્થપૂર્ણ પેટર્ન શોધી શકતાં નથી.
  • ટ્રેડિશનલ કમ્યુટિંગ સિસ્ટમ્સમાં મર્યાદિત સ્ટોરેજ અને સીમિત પ્રૉસેસિંગ કેપેસિટી હોવાથી તે બિગ ડેટાની ત્વરિત એનાલિસિસ કરી શકતાં નથી.
  • બિગ ડેટાના સ્ટોરેજ-એનાલિસિસ-પ્રોસેસિંગ માટે સોફિસ્ટિકેટેડ કમ્પ્યુટર સિસ્ટમ્સ અને ખાસ પ્રકારનો સોફ્ટવેર અનિવાર્ય છે.
  • ‘બિગ ડેટા’ શબ્દસમૂહ (ટર્મ) માત્ર કદાવર સાઇઝના ડેટા સેટ્સ કે પ્રચંડ કદના ડેટા માટે જ નથી વપરાતો; તે ડેટા એનાલિટિક્સની ટેકનોલોજી માટે પણ વપરાય છે.
  • આધુનિક સંદર્ભમાં ‘બિગ ડેટા’ ટર્મ એનાલિટિકલ મેથડ્સ સૂચવે છે. આવા એડવાન્સ્ડ બિગ ડેટા એનાલિટિક્સમાં આર્ટિફિશિયલ ઇન્ટેલિજન્સ (એઆઇ) અને મશીન લર્નિંગ (એમ એલ) જેવી અત્યાધુનિક ટેકનોલોજી પ્રયોજાય છે.
  • ‘બિગ ડેટા’ ટર્મનો ઉપયોગ પ્રિડિક્ટિવ એનાલિટિક્સ અને ડેટા એનાલિટિક્સ મેથડ્સ સૂચવવા પણ થાય છે.
  • જેનેટિક્સ રિસર્ચ અને જીનોમિક્સ સ્ટડીમાં જેનેટિક સાયન્ટિસ્ટ્સ અને બાયોલોજીસ્ટ્સ જીનોમના પ્રચુર પ્રમાણના ડેટાના અભ્યાસ માટે પ્રિડિક્ટિવ એનાલિટિક્સ પદ્ધતિઓ વાપરે છે.
  • કટ થ્રોટ કોમ્પિટિશનના જમાનામાં બિઝનેસને માર્કેટમાં સફળતાથી ટકાવી રાખવા બિઝનેસ ઇન્ટેલિજન્સની જરૂર પડે છે. બિગ ડેટા બિઝનેસ ઇન્ટેલિજન્સમાં મદદરૂપ છે.
  • જાયન્ટ મલ્ટિનેશનલ કંપનીઓ અને બિઝનેસ કોર્પોરેટ હાઉસિસ માટે માર્કેટ ટ્રેન્ડ્સ, કોમ્પિટિટર મુવમેન્ટ અને કન્ઝ્યુમર બિહેવિયર માટે જંગી કદના બિગ ડેટામાંથી બિઝનેસ ટ્રેન્ડ્ઝની વિવિધ પેટર્ન શોધવી આવશ્યક હોય છે. આવી બિઝનેસ કંપનીઓ ‘બિગ ડેટા’ ટર્મનો ઉપયોગ બિઝનેસ એનાલિટિક્સ કે કન્ઝ્યુમર બિહેવિયર એનાલિટિક્સ માટે કરે છે.
  • અમેરિકામાં યુનિવર્સિટી ઑફ કેલિફોર્નિયા, બર્કલી (યુસીબી) અને બ્રેક-થ્રુ લિસન પ્રૉજેક્ટમાં પ્રસિદ્ધ થનાર ગુજરાતી યુવાન એસ્ટ્રોફિઝિસિસ્ટ વિશાલ ગજ્જરના ફાસ્ટ રેડિયો બર્સ્ટ (એફ આર બી) ના સ્રોતના અભૂતપૂર્વ સંશોધન સાથે સંલગ્ન ડેટા 400 ટેરાબાઇટનો હતો. બર્કલી સેટી રિસર્ચ સેન્ટર (યુસીબી સેટી, બર્કલી, યુએસએ) ખાતે તેના પર પુન: સંશોધનમાં – એસ્ટ્રોનોમી – એસ્ટ્રોફિઝિક્સ ક્ષેત્રમાં – આર્ટિફિશિયલ ઇન્ટેલિજન્સ અને મશીન લર્નિંગ આલ્ગોરિધમનો પ્રથમ વખત ઉપયોગ થયો.
  • બિગ ડેટા એનાલિટિક્સની સફળતામાં આર્ટિફિશિયલ ઇન્ટેલિજન્સ – મશીન લર્નિંગ અલ્ગોરિધમન્યુરાલ નેટવર્ક આધારિત ટેકનોલોજીનું મોટું યોગદાન છે.

** આપ આ લેખ લોકપ્રિય ગુજરાતી બ્લૉગ ‘અનામિકા’ પર વાંચી રહ્યા છો © હરીશ દવે **

બિગ ડેટાનાં લક્ષણો: ત્રણ ‘વી’

‘બિગ ડેટા’નાં કેરેક્ટરિસ્ટિક્સ (લક્ષણો) કયાં? ‘બિગ ડેટા’ની પરખ માટેનાં મૂળભૂત લક્ષણો અંગ્રેજી આલ્ફાબેટ ‘વી’ થી શરૂ થતા ‘થ્રી વી’ છે.

બિગ ડેટાનાં આ ‘થ્રી વી’ કેરેક્ટરિસ્ટિક્સ છે: વોલ્યુમ (Volume), વેરાયટી (Variety) તથા વેલોસિટી (Velocity).

આલ્ફાબેટ ‘વી’ થી શરૂ થતા ત્રણ શબ્દો બિગ ડેટાનાં લક્ષણો સૂચવે છે. આ ત્રણ વી છે: વોલ્યુમ અર્થાત કદ, વેરાયટી અર્થાત વિવિધતા, વેલોસિટી અર્થાત ઝડપ કે ત્વરા.

બિગ ડેટાને વર્ણવવા માટેનાં લક્ષણોનાં ‘ત્રણ વી’માં પ્રથમ છે વોલ્યુમ. ડેટાનું કદ અતિ જંગી હોવું જોઈએ. બીજો ‘વી’ છે વેરાયટી. તેના ડેટામાં વૈવિધ્ય હોવું જોઈએ. જેમકે ડેટામાં ટેક્સ્ટ, ઇમેજ, વોઇસ ડેટા, વિડીયો ડેટા જેવી વિવિધતા હોવી જોઈએ. ત્રીજો ‘વી’ છે વેલોસિટી. ડેટા કેટલી ત્વરા (ઝડપ કે સ્પીડ) થી જનરેટ થાય છે કે પ્રોસેસ થઈ શકે છે તે પણ મહત્ત્વનું લક્ષણ છે.

આમ, વોલ્યુમ, વેરાયટી તથા વેલોસિટી આ ત્રણ ‘વી’ બિગ ડેટાનાં મુખ્ય કેરેક્ટરિસ્ટિક્સ છે.

** આપ આ લેખ લોકપ્રિય ગુજરાતી બ્લૉગ ‘અનામિકા’ પર વાંચી રહ્યા છો © હરીશ દવે **

બિગ ડેટાની ઉપયોગિતા – બિગ ડેટા એપ્લિકેશન્સ

બિગ ડેટા રોજિંદા માનવ વ્યવહારમાં અતિ ઉપયોગી છે.

આર્ટિફિશિયલ ઇન્ટેલિજન્સ, મશીન લર્નિંગ અને ન્યુરાલ નેટવર્ક જેવી ટેકનોલોજીના વિકાસ સાથે બિગ ડેટાની વ્યાવહારિક ઉપયોગિતા ઇન્ટરનેટ એડવર્ટાઇઝિંગ અને ઓન-લાઇન શોપિંગથી લઈને કોર્પોરેટ સેક્ટરમાં પડકારરૂપ બિઝનેસ ડિસિશન સુધી વિસ્તરી છે.

વ્યાપાર-વાણિજ્ય અને ઉદ્યોગ ક્ષેત્રે અત્યારે જ જનરેટ થતા ડેટાને રિયલ ટાઇમમાં એનાલાઇઝ કરી તાત્કાલિક નિર્ણય (રિયલ ટાઇમ ડિસિશન) લેવા માટે ‘બિગ ડેટા’ અનિવાર્ય છે.

સોશિયલ મીડિયા, રીટેઇલ બિઝનેસ, ઇ-કોમર્સ, હેલ્થ કેર, બેંકિંગ, ઇંસ્યોરન્સ,  એજ્યુકેશન જેવા સમાજવ્યાપી ક્ષેત્રોમાં  બિગ ડેટા (બિગ ડેટા એનાલિટિક્સ) મોટો રોલ ભજવે છે.

વિજ્ઞાન ક્ષેત્રે સંશોધનો અને બ્રહ્માંડને ફંફોસતા ખગોળશાસ્ત્રમાં તેની ઉપયોગિતા સિદ્ધ થઈ ચૂકી છે.

બિગ ડેટાની એપ્લિકેશન્સ સરકારી ક્ષેત્રોમાં સ્માર્ટ ફાર્મિંગ-એગ્રીકલ્ચરથી લઈ અર્બન ડેવલમેન્ટ, ટ્રાન્સપોર્ટ સિસ્ટમ્સથી લઈ કાયદો-વ્યવસ્થા સુધીનાં ક્ષેત્રોમાં ખૂબ જ ઉપયોગી છે.

સંક્ષિપ્તમાં કહીએ તો, બિગ ડેટા માનવજીવનના રોજિંદા વ્યવહારોમાં છવાઈ ગયેલ છે.

** આપ આ લેખ લોકપ્રિય ગુજરાતી બ્લૉગ ‘અનામિકા’ પર વાંચી રહ્યા છો © હરીશ દવે **

** * *** * **** ** * ** * * ** *

અનામિકા-લેખ: બિગ ડેટા
  • કમ્યુનિકેશન, ઇન્ટરનેટ અને ટ્રાન્સપોર્ટ ક્ષેત્રોમાં ક્રાંતિકારી પ્રગતિથી નજીક આવ્યા દુનિયાના દેશો
  • વિશ્વમાં વાણિજ્ય-વ્યાપાર-ઉદ્યોગ સહિતના આર્થિક ક્ષેત્રોમાં ગાઢ બન્યા વ્યવહારો
  • વિશ્વમાં રોજ જનરેટ થતો વિવિધ પ્રકારનો જંગી ડેટા
  • બિગ ડેટામાં પ્રગતિનાં પ્રેરક પરિબળો છે આર્ટિફિશિયલ ઇન્ટેલિજન્સ, મશીન લર્નિંગ, ન્યુરાલ નેટવર્ક, ક્લાઉડ કમ્પ્યુટિંગ અને વિસ્તરતી ઇન્ટરનેટ ઓફ થિંગ્સ (આઇઓટી) ટેકનોલોજી
  • એઆઇ અને મશીન લર્નિંગ અલ્ગોરિધમથી બિગ ડેટા એનાલિટિક્સ ક્ષેત્રે હરણફાળ
  • બિગ ડેટા એનાલિટિક્સનો ઉપયોગ દુનિયાના વ્યવહારોના પ્રત્યેક ક્ષેત્રમાં: ટ્રેડ-કોમર્સ-ઇન્ડસ્ટ્રી જેમકે ઇ-કોમર્સ, ઓન-લાઇન શોપિંગ, ઇંટરનેટ એડવર્ટાઇઝિંગ, એજ્યુકેશન, ફાઇનાન્સ-બેન્કિંગ, ઇન્સ્યોરન્સ, એસ્ટ્રોનોમી-એસ્ટ્રોફિઝિક્સ જેવાં વિવિધ વિજ્ઞાન ક્ષેત્રે અને સાયન્ટિફિક રિસર્ચ, હેલ્થકેર, સરકારી ગવર્નન્સ વગેરેમાં
  • એક ટેરાબાઇટ = 1000 ગીગાબાઇટ, એક પેટાબાઇટ = 1000 ટેરાબાઇટ, એક એક્ઝાબાઇટ = 1000 પેટાબાઇટ …..   વિશેષ માહિતી માટે અહીં ક્લિક કરો
  • બિગ ડેટા: Big Data
  • બિગ ડેટા એનાલિટિક્સ: Big Data Analytics
  • હડૂપ એક પ્રચલિત ઓપન સોર્સ સોફ્ટવેર ફ્રેમવર્ક: Hadoop – an Open-source software framework
  • સ્ટ્રક્ચર્ડ ડેટા તથા અનસ્ટ્રક્ચર્ડ ડેટા: Structured Data / Unstrctured Data
  • આર્ટિફિશિયલ ઇન્ટેલિજન્સ – એઆઇ: Artificial Intelligence – AI
  • ઇન્ટરનેટ ઑફ થિંગ્સ – આઇઓટી: Internet of Things – IoT
  • ગીગાબાઇટ, ટેરાબાઇટ, પેટાબાઇટ: Gigabyte, Terrabyte, Petabyte
  • વિશાલ ગજ્જર – યુનિવર્સિટી ઑફ કેલિફોર્નિયા ખાતે ફાસ્ટ રેડિયો બર્સ્ટ (એફઆરબી) પર સંશોધન: Vishal Gajjar – Research work on Fast Radio Burst (FRB) at University of California, USA
  • સેટી – સર્ચ ફોર એક્સ્ટ્રા ટેરેસ્ટ્રિયલ ઇન્ટેલિજન્સ: SETI – Search for Extraterrestrial Intelligence
  • બર્કલી સેટી રિસર્ચ સેન્ટર (યુસીબી સેટી, યુનિવર્સિટી ઑફ કેલિફોર્નિયા, બર્કલી, યુએસએ): Berkeley SETI Research Centre (UCB SETI, University of California, Berkeley, USA)
  • બિગ ડેટાનાં ‘થ્રી વી’ લક્ષણો – વોલ્યુમ, વેરાયટી, વેલોસિટી: Three characteristics – Three ‘V’ of Big Data – Volume, Variety, Velocity

*** * * ** * *** ** ** *** *** ** *** **** * * *** ** **

** આપ આ લેખ લોકપ્રિય ગુજરાતી બ્લૉગ ‘અનામિકા’ પર વાંચી રહ્યા છો © હરીશ દવે **

*** * * ** * *** ** ** *** *** ** *** **** * * *** ** **

*** * * ** * *** ** ** *** *** ** *** **** * * *** ** **