વિજ્ઞાન માનવજીવનમાં વણકલ્પ્યાં પરિવર્તનો લાવી રહ્યું છે. માનવીના જીવનના દૈનિક વ્યવહારો હોય, આનંદપ્રમોદની પ્રવૃત્તિઓ હોય કે આર્થિક-વ્યાવસાયિક પ્રવૃત્તિઓ હોય, બધે જ ભિન્ન ભિન્ન ટેકનોલોજી છવાતી જાય છે. આર્ટિફિશિયલ ઇન્ટેલિજન્સ (એઆઇ) માનવને સ્પર્શતા તમામ ક્ષેત્રોમાં પ્રવેશી ચૂકી છે. સાયન્સ અને ટેકનોલોજી જીવનના પ્રત્યેક પાસાનાં અભિન્ન અંગ બની ગયાં છે.
બિગ ડેટા, ક્લાઉડ ટેકનોલોજી અને આર્ટિફિશિયલ ઇન્ટેલિજન્સ આપણા વર્તમાનને જ નહીં, ભવિષ્યને પણ ઘડી રહ્યાં છે.
પહેલો પ્રશ્ન થાય: બિગ ડેટા શું છે?
સુવિકસિત રાષ્ટ્રીય અને આંતરરાષ્ટ્રીય પરિવહન અને સંચાર વ્યવસ્થાઓએ વૈશ્વિક આર્થિક વ્યવહારોને સરળ કર્યા છે. બહુરાષ્ટ્રીય વાણિજ્ય વ્યવસ્થામાં ઉત્પાદનો તથા સેવાઓ વિપુલ માત્રામાં ઉપલબ્ધ છે. અહીં પ્રત્યેક સ્તર પર માહિતીની આપલે થાય છે. ફળસ્વરૂપે, ઇન્ફર્મેશન ટેકનોલોજીનો અકલ્પ્ય વિકાસ થયો છે.
જાહેર – ખાનગી એકમો અને સંસ્થાઓને જંગી પ્રમાણમાં ડેટાની આવશ્યકતા રહે છે. આજના વિશ્વમાં રોજે રોજ પ્રચંડ માત્રામાં ડેટા – “બિગ ડેટા” જનરેટ થાય છે. આવા સ્ટ્રક્ચર્ડ-અનસ્ટ્રક્ચર્ડ ડેટાને ઉચિત રીતે સ્ટોર કરી તેની ત્વરિત, પરિણામલક્ષી એનાલિસિસ કરવામાં પ્રણાલિકાગત કમ્પ્યુટર સિસ્ટમ્સ અને સોફ્ટવેર્સ સક્ષમ હોતાં નથી. તેના માટે બિગ ડેટા એનાલિટિક્સની જરૂર પડે છે.
બિગ ડેટાનો સંબંધ આવા અતિ જંગી માત્રાના ડેટા સાથે તો છે જ, તે ઉપરાંત તેના પર થતી પ્રૉસેસિંગ અને એનાલિટિકલ મેથડ્સ સાથે પણ છે. બિગ ડેટા અને હડૂપ આજે ‘બઝ વર્ડ્ઝ્સ’ બન્યાં છે.
આવો, ‘અનામિકા’ના આજના લેખમાં બિગ ડેટા, બિગ ડેટા એનાલિટિક્સ તથા હડૂપ વિશે સરળ ભાષામાં જાણીએ.
[આપના સ્ક્રીન પર આ રસપ્રદ લેખ અહીંથી આગળ, નીચે ન દેખાય, તો લેખના શીર્ષક / ટાઇટલ પર ક્લિક કરશો. ત્યાં ક્લિક કરતાં જ નીચે પૂરો લેખ આવી જશે. – હરીશ દવે]
** આપ આ લેખ લોકપ્રિય ગુજરાતી બ્લૉગ ‘અનામિકા’ પર વાંચી રહ્યા છો © હરીશ દવે **
ડેટા અને ડેટાબેઝ શું છે?
તદ્દન સાદા શબ્દોમાં, ડેટા એટલે ચોક્કસ પ્રકારની માહિતીનો સહેતુક સંગ્રહ.
માહિતી કે ડેટા આપના મગજની સ્મૃતિમાં હોઈ શકે, લેખિત કે પ્રિન્ટ સ્વરૂપે પેપર પર હોઈ શકે કે બિટ્સ/ બાઇટ્સ રૂપે ઇલેક્ટ્રોનિક ડિવાઇસ (જેમકે કમ્પ્યુટર મેમરી) માં હોઈ શકે.
મગજ કે પેપરના ડેટાને ત્વરિત પ્રોસેસ કરવો સરળ નથી; કમ્પ્યુટર ડિસ્ક પર સ્ટોર થયેલ બાઇનરી ડેટાને ક્ષણાર્ધમાં પ્રોસેસ કરી નિષ્કર્ષ કાઢી શકાય છે.
ડેટાનું સાદુંસીધું ઉદાહરણ: આપના કુટુંબના સભ્યોનાં નામ, જાતિ, દરેકની ઉંમર અને વજન. બીજું ઉદાહરણ, એક સ્કૂલના અમુક ક્લાસના વિદ્યાર્થીઓનાં રોલ નંબર, નામ અને તે દરેક વિદ્યાર્થીએ વિવિધ વિષયમાં મેળવેલ માર્ક્સની માહિતી. આવી માહિતીને કોષ્ટક કે ટેબલ સ્વરૂપે મૂકી શકાય. મોટા પાયાના ઉદાહરણ પર વિચારીએ તો, સમગ્ર દેશના નાગરિકોનાં નામ, ધર્મ, તેમની ઉંમર અને શૈક્ષણિક લાયકાત વિશેની માહિતી.
આ માહિતી-સંગ્રહ ઉપયોગી તો જ બને જો તેને કોઈ અર્થપૂર્ણ ફોર્મેટમાં ગોઠવવામાં આવે. વ્યવસ્થિત ફોર્મેટમાં ગોઠવણી ન થાય ત્યાં સુધી તે ‘રૉ ડેટા’ બનીને રહે છે. આવો રૉ ડેટા વિભિન્ન સ્વરૂપનો હોઈ શકે જેમકે: ટેક્સ્ટ, ન્યુમરલ્સ, ઇમેજીસ-ચિત્રો, ફોટોગ્રાફિક ડેટા, ઑડિયો – વિડીયો ડેટા વગેરે.
ડેટાને ડેટાબેઝમાં ગોઠવવાથી તે વિશેષ ઉપયોગી બને છે. ડેટાબેઝ એ ડેટાની એવી વ્યવસ્થિત ગોઠવણી છે જેમાંથી કમ્પ્યુટર પ્રોગ્રામ જોઈતી માહિતી સહેલાઈથી આપી શકે છે કે જરૂરી તારણો મેળવી શકે છે.
આ બધી ટર્મ્સ ભારે જટિલ હોવાથી શબ્દોમાં વ્યાખ્યાયિત કરવી અને સમજાવવી મુશ્કેલ છે. આપણે ટેકનિકલ વિગતોમાં નહીં ઊતરીએ; સામાન્ય વાચકને લક્ષ્યમાં રાખી નન-ટેકનિકલ, પ્રાથમિક જાણકારી જ લઈશું તે નોંધશો.
** આપ આ લેખ લોકપ્રિય ગુજરાતી બ્લૉગ ‘અનામિકા’ પર વાંચી રહ્યા છો © હરીશ દવે **
ડેટાના પ્રકાર: સ્ટ્રક્ચર્ડ ડેટા તથા અનસ્ટ્રક્ચર્ડ ડેટા
ડેટા મુખ્યત્વે બે પ્રકારના હોઈ શકે: સ્ટ્રક્ચર્ડ ડેટા અને અનસ્ટ્રક્ચર્ડ ડેટા.
સ્ટ્રક્ચર્ડ ડેટાનાં ઘટકોને સરળતાથી અલગ અલગ રેકોર્ડ અને કેટેગરીમાં ગોઠવી શકાય છે. સ્ટ્રક્ચર્ડ ડેટાને ટેબલ બનાવી રો અને કોલમમાં સહેલાઈથી મૂકી શકાય છે. આવાં ટેબલ્સ બનાવીને તેમનો ડેટાબેઝ બનાવી શકાય છે. જેમકે: કોઈ સંસ્થાનાં કર્મચારીઓનાં નામ અને જુદાં જુદાં મહિનામાં તેમને ચૂકવાયેલ વેતન તથા ઇન્સેન્ટિવની રકમ. અથવા તો કોઈ કંપનીની પ્રોડક્ટ્સનાં નામ, તે દરેકનાં વેચાયેલ યુનિટની સંખ્યા અને તે વેચાણની કુલ રકમ.
અનસ્ટ્રક્ચર્ડ ડેટાને ભિન્ન ભિન્ન કેટેગરીમાં મૂકવો સરળ નથી. અનસ્ટ્રક્ચર્ડ ડેટા જેમકે કંપનીની પ્રૉડક્ટ્સનાં નામ, તેનાં ફોટો, વર્ણનાત્મક ટેક્સ્ટ ડૉક્યુમેન્ટ્સ, તેના કસ્ટમર રિવ્યુઝ, ઇ મેઇલ, ઑડિયો-વિડીયો ક્લિપ્સ વગેરે. આવો ડેટા ઘણો સંકુલ – કોમ્પ્લેક્સ હોવાથી વર્ગીકૃત કરવો અશક્યવત અથવા તો ખૂબ અઘરો બને છે, અથવા તેમાંથી ચોક્કસ તારણો કાઢવાં મુશ્કેલ બને છે. આવા ડેટાનો રીલેશનલ ડેટાબેઝ બનાવી શકાતો નથી.
જે સ્ટ્રક્ચર્ડ ડેટામાં પરસ્પર સંબંધ કે કોઈ પેટર્ન સ્પષ્ટ હોય છે, તેનું પૃથક્કરણ – એનાલિસિસ – સરળતાથી થઈ શકે છે. મોટા ઓર્ગેનાઇઝેશનમાં કે કોર્પોરેટ કંપનીઓમાં જે ડેટા વ્યવસ્થિત ડેટાબેઝમાં ગોઠવાય છે, તેના વિવિધ ટેબલ્સમાંથી જોઈતી માહિતી પલકારામાં પ્રાપ્ત થઈ શકે છે. સાથે સાથે તેના પરથી તારણો પણ મેળવી શકાય છે.
ડેટા ઇન્ફર્મેશન ટેકનોલોજીનો આધાર છે.
વિશ્વમાં રોજબરોજ સર્જાતો જંગી ડેટા: બિગ ડેટા?
આજની દુનિયા કમ્યુનિકેશન પર ચાલે છે. સમગ્ર વિશ્વના તમામ વ્યવહારો કમ્પ્યુટિંગ સિસ્ટમ્સ, ટેલિફોનિક સેવા અને ટ્રાન્સપોર્ટેશન પર નભતા થઈ ગયા છે. સંચાર-પરિવહન સેવાઓના વિસ્તાર સાથે આંતરરાષ્ટ્રિય વાણિજ્ય-વ્યાપારનો વ્યાપ અભૂતપૂર્વ સ્કેલ પર પહોંચ્યો છે. ક્લાઉડ ટેકનોલોજીએ તેમાં ખૂબ મદદ કરી છે. વળી દેશ-દેશ અને કંપની-કંપનીઓ વચ્ચે જેટલો સહયોગ વધ્યો છે, તેટલી જ સ્પર્ધા પણ વધી છે. સરકારી, સહકારી અને ખાનગી વ્યવસ્થાતંત્રો તેમજ બિઝનેસ એકમોના નાગરિકો અને ઉપભોક્તાઓ સાથેના વ્યવહારો અતિ જટિલ થતાં રોજેરોજ અમાપ ડેટા પેદા થાય છે. કમ્પ્યુટર સિસ્ટમ્સ ઉપરાંત સ્માર્ટ મોબાઇલ ફોન જેવાં ઉપકરણો બ્રાઉઝર્સ – વેબસાઇટ કુકિઝ અને અન્ય સોફ્ટવેરની મદદથી સર્ફર (વિઝિટર/ યુઝર) વિશે ઢગલાબંધ માહિતી એકઠી કરે છે.
વળી આર્ટિફિશિયલ ઇન્ટેલિજન્સ (એઆઇ) ના ડેવલપમેન્ટથી ઇન્ટરનેટ ઑફ થિંગ્સ – આઇઓટી – સાથે સંલગ્ન ઉપકરણો (જેવાં કે સ્માર્ટ વેરેબલ ડિવાઇસિસ, સ્માર્ટ હોમ કે સ્માર્ટ ટ્રાન્સ્પોર્ટેશન) પણ મબલખ ડેટા સર્જે છે.
આ તમામ પ્રકારના જંગી માત્રાના ડેટાને સામાન્ય રીતે ‘બિગ ડેટા’ કહેવામાં આવે છે. તેથી, માસિવ વોલ્યુમના ડેટાને બિગ ડેટા કહી શકાય, પણ યાદ રાખશો કે આધુનિક ટેકનોલોજીના મતે ‘બિગ ડેટા’ની વ્યાખ્યા આટલી મર્યાદિત નથી.
** આપ આ લેખ લોકપ્રિય ગુજરાતી બ્લૉગ ‘અનામિકા’ પર વાંચી રહ્યા છો © હરીશ દવે **
બિગ ડેટા શું છે?
‘બિગ ડેટા’ ને વ્યાખ્યાયિત કરવા લાંબી સમજૂતિ પણ ટૂંકી પડે!!! બિગ ડેટાને શબ્દોમાં ‘બાંધી’ શકાય નહીં.
બિગ ડેટાની વ્યાખ્યા સમયાંતરે બદલાય છે, ક્ષેત્રે-ક્ષેત્રે બદલાય છે. બિગ ડેટાની વ્યાખ્યા બિઝનેસના વિવિધ સેગ્મેન્ટ અનુસાર, કંપની અનુસાર, પ્રૉજેક્ટ અનુસાર પણ બદલાય છે.
સાવ સરળ ભાષામાં, ‘બિગ ડેટા’ એટલે વિવિધતાસભર, વિશાળ, જટિલ ડેટા.
બિગ ડેટા એટલે સ્ટ્રક્ચર્ડ, સેમી-સ્ટ્રક્ચર્ડ અને અનસ્ટ્રક્ચર્ડ ડેટાસેટ્સ ધરાવતો કોમ્પ્લેક્સ, માસિવ, વોલ્યુમિનસ ડેટા.
આપના લેપટોપની હાર્ડ ડિસ્ક કેપેસિટી એક ટેરાબાઇટ (1000 ગીગાબાઇટ) હોઈ શકે. સામાન્ય બિઝનેસ ઓફિસમાં ડેસ્કટોપની સ્ટોરેજ કેપેસિટી બે-પાંચ ટેરાબાઇટની હોય. આવાં કેટલાંક કમ્પ્યુટર્સનું નેટવર્ક પચ્ચીસ-પચાસ ટેરાબાઈટ ડેટા સ્ટોર કરી શકે. જ્યારે બિગ ડેટા તો સેંકડો ટેરાબાઇટ્સ કે પેટાબાઇટ્સ સાથે સંબંધિત છે.
બિગ ડેટા અતિ મોટી માત્રાનો એવો જંગી અને સંકુલ ડેટા છે જેને કોમન કમ્પ્યુટર સિસ્ટમ કે સામાન્ય સોફ્ટવેર (એપ્લિકેશન/ પ્રોગ્રામ) થી હેન્ડલ ન કરી શકાય. ટેરાબાઇટ્સ કે પેટાબાઇટ્સમાં જનરેટ થતા બિગ ડેટાના સ્ટોરેજ અને પ્રોસેસિંગ માટે અસાધારણ સ્ટોરેજ કેપેસિટી સાથે હાઇ પ્રોસેસિંગ પાવર ધરાવતી કમ્પ્યુટિંગ સિસ્ટમ્સ તેમજ અદ્યતન સોફ્ટવેર જોઈએ.
બિગ ડેટા એવો પ્રચંડ માત્રાનો ડેટા છે જેને ખાસ પ્રકારની કમ્પ્યુટર સર્વર સિસ્ટમ્સ પર ખાસ પ્રકારના સોફ્ટવેરની મદદથી જ પ્રૉસેસ-એનાલાઇઝ કરી શકાય.
હડૂપ શું છે?
બિગ ડેટાને હેન્ડલ કરવા હડૂપ નામના સોફ્ટવેર ફ્રેમવર્કનો ઉપયોગ થાય છે.
બિગ ડેટા પ્રશ્ન છે, તો તેને માટે હડૂપ એક સોલ્યુશન છે.
હડૂપ પ્રચલિત ઓપન સોર્સ સોફ્ટવેર ફ્રેમવર્ક છે, જે અનેક કમ્પ્યુટર-સર્વર્સથી બનેલ ક્લસ્ટર્ડ સિસ્ટમ્સ પર જંગી ડેટાને અતિશય ઝડપથી પ્રોસેસ કરી શકે છે. હડૂપ એક પ્રકારનું પેરેલલ પ્રોસેસિંગ પ્રોગ્રામિંગ પૂરૂં પાડે છે.
એક સાથે ઘણા ક્લસ્ટર યુનિટ્સ પર ચાલતી બિગ ડેટા એપ્લિકેશન્સને તેમજ તેમના સ્ટોરેજને હડૂપ સફળતાથી હેન્ડલ કરે છે. આમ, હડૂપ ભિન્ન ભિન્ન તમામ પ્રકારના, કોઈ પણ વોલ્યુમના ડેટાને સ્ટોરેજ આપે છે, હાઇ કેપેસિટી પ્રૉસેસિંગ પાવર આપે છે, તદુપરાંત ડેટા પર એક સાથે અસંખ્ય પ્રકારનાં મલ્ટિપલ ટાસ્ક કરવાની સગવડ આપે છે.
** આપ આ લેખ લોકપ્રિય ગુજરાતી બ્લૉગ ‘અનામિકા’ પર વાંચી રહ્યા છો © હરીશ દવે **
બિગ ડેટાનો આધુનિક અર્થ અને બિગ ડેટા એનાલિટિક્સ
- અહીં એક વાત ફલિત થાય છે કે ‘બિગ ડેટા’નો સંબંધ માત્ર ડેટાના ‘વોલ્યુમ’ સાથે જ નથી, પરંતુ ટેકનોલોજી સાથે પણ છે. જેમકે ડેટામાંથી તારણો મેળવવા કયા ટૂલ્સ કે પ્રૉસેસિસ કે સોફ્ટવેર (ટેકનોલોજી) પ્રયોજાય છે.
- ટ્રેડિશનલ ડેટાબેઝ-સોફ્ટવેર ટેકનિક્સ મહા જંગી કદના જટિલ બિગ ડેટામાં ‘છુપાયેલ’ અર્થપૂર્ણ પેટર્ન શોધી શકતાં નથી.
- ટ્રેડિશનલ કમ્યુટિંગ સિસ્ટમ્સમાં મર્યાદિત સ્ટોરેજ અને સીમિત પ્રૉસેસિંગ કેપેસિટી હોવાથી તે બિગ ડેટાની ત્વરિત એનાલિસિસ કરી શકતાં નથી.
- બિગ ડેટાના સ્ટોરેજ-એનાલિસિસ-પ્રોસેસિંગ માટે સોફિસ્ટિકેટેડ કમ્પ્યુટર સિસ્ટમ્સ અને ખાસ પ્રકારનો સોફ્ટવેર અનિવાર્ય છે.
- ‘બિગ ડેટા’ શબ્દસમૂહ (ટર્મ) માત્ર કદાવર સાઇઝના ડેટા સેટ્સ કે પ્રચંડ કદના ડેટા માટે જ નથી વપરાતો; તે ડેટા એનાલિટિક્સની ટેકનોલોજી માટે પણ વપરાય છે.
- આધુનિક સંદર્ભમાં ‘બિગ ડેટા’ ટર્મ એનાલિટિકલ મેથડ્સ સૂચવે છે. આવા એડવાન્સ્ડ બિગ ડેટા એનાલિટિક્સમાં આર્ટિફિશિયલ ઇન્ટેલિજન્સ (એઆઇ) અને મશીન લર્નિંગ (એમ એલ) જેવી અત્યાધુનિક ટેકનોલોજી પ્રયોજાય છે.
- ‘બિગ ડેટા’ ટર્મનો ઉપયોગ પ્રિડિક્ટિવ એનાલિટિક્સ અને ડેટા એનાલિટિક્સ મેથડ્સ સૂચવવા પણ થાય છે.
- જેનેટિક્સ રિસર્ચ અને જીનોમિક્સ સ્ટડીમાં જેનેટિક સાયન્ટિસ્ટ્સ અને બાયોલોજીસ્ટ્સ જીનોમના પ્રચુર પ્રમાણના ડેટાના અભ્યાસ માટે પ્રિડિક્ટિવ એનાલિટિક્સ પદ્ધતિઓ વાપરે છે.
- કટ થ્રોટ કોમ્પિટિશનના જમાનામાં બિઝનેસને માર્કેટમાં સફળતાથી ટકાવી રાખવા બિઝનેસ ઇન્ટેલિજન્સની જરૂર પડે છે. બિગ ડેટા બિઝનેસ ઇન્ટેલિજન્સમાં મદદરૂપ છે.
- જાયન્ટ મલ્ટિનેશનલ કંપનીઓ અને બિઝનેસ કોર્પોરેટ હાઉસિસ માટે માર્કેટ ટ્રેન્ડ્સ, કોમ્પિટિટર મુવમેન્ટ અને કન્ઝ્યુમર બિહેવિયર માટે જંગી કદના બિગ ડેટામાંથી બિઝનેસ ટ્રેન્ડ્ઝની વિવિધ પેટર્ન શોધવી આવશ્યક હોય છે. આવી બિઝનેસ કંપનીઓ ‘બિગ ડેટા’ ટર્મનો ઉપયોગ બિઝનેસ એનાલિટિક્સ કે કન્ઝ્યુમર બિહેવિયર એનાલિટિક્સ માટે કરે છે.
- અમેરિકામાં યુનિવર્સિટી ઑફ કેલિફોર્નિયા, બર્કલી (યુસીબી) અને બ્રેક-થ્રુ લિસન પ્રૉજેક્ટમાં પ્રસિદ્ધ થનાર ગુજરાતી યુવાન એસ્ટ્રોફિઝિસિસ્ટ વિશાલ ગજ્જરના ફાસ્ટ રેડિયો બર્સ્ટ (એફ આર બી) ના સ્રોતના અભૂતપૂર્વ સંશોધન સાથે સંલગ્ન ડેટા 400 ટેરાબાઇટનો હતો. બર્કલી સેટી રિસર્ચ સેન્ટર (યુસીબી સેટી, બર્કલી, યુએસએ) ખાતે તેના પર પુન: સંશોધનમાં – એસ્ટ્રોનોમી – એસ્ટ્રોફિઝિક્સ ક્ષેત્રમાં – આર્ટિફિશિયલ ઇન્ટેલિજન્સ અને મશીન લર્નિંગ આલ્ગોરિધમનો પ્રથમ વખત ઉપયોગ થયો.
- બિગ ડેટા એનાલિટિક્સની સફળતામાં આર્ટિફિશિયલ ઇન્ટેલિજન્સ – મશીન લર્નિંગ અલ્ગોરિધમ – ન્યુરાલ નેટવર્ક આધારિત ટેકનોલોજીનું મોટું યોગદાન છે.
** આપ આ લેખ લોકપ્રિય ગુજરાતી બ્લૉગ ‘અનામિકા’ પર વાંચી રહ્યા છો © હરીશ દવે **
બિગ ડેટાનાં લક્ષણો: ત્રણ ‘વી’
‘બિગ ડેટા’નાં કેરેક્ટરિસ્ટિક્સ (લક્ષણો) કયાં? ‘બિગ ડેટા’ની પરખ માટેનાં મૂળભૂત લક્ષણો અંગ્રેજી આલ્ફાબેટ ‘વી’ થી શરૂ થતા ‘થ્રી વી’ છે.
બિગ ડેટાનાં આ ‘થ્રી વી’ કેરેક્ટરિસ્ટિક્સ છે: વોલ્યુમ (Volume), વેરાયટી (Variety) તથા વેલોસિટી (Velocity).
આલ્ફાબેટ ‘વી’ થી શરૂ થતા ત્રણ શબ્દો બિગ ડેટાનાં લક્ષણો સૂચવે છે. આ ત્રણ વી છે: વોલ્યુમ અર્થાત કદ, વેરાયટી અર્થાત વિવિધતા, વેલોસિટી અર્થાત ઝડપ કે ત્વરા.
બિગ ડેટાને વર્ણવવા માટેનાં લક્ષણોનાં ‘ત્રણ વી’માં પ્રથમ છે વોલ્યુમ. ડેટાનું કદ અતિ જંગી હોવું જોઈએ. બીજો ‘વી’ છે વેરાયટી. તેના ડેટામાં વૈવિધ્ય હોવું જોઈએ. જેમકે ડેટામાં ટેક્સ્ટ, ઇમેજ, વોઇસ ડેટા, વિડીયો ડેટા જેવી વિવિધતા હોવી જોઈએ. ત્રીજો ‘વી’ છે વેલોસિટી. ડેટા કેટલી ત્વરા (ઝડપ કે સ્પીડ) થી જનરેટ થાય છે કે પ્રોસેસ થઈ શકે છે તે પણ મહત્ત્વનું લક્ષણ છે.
આમ, વોલ્યુમ, વેરાયટી તથા વેલોસિટી આ ત્રણ ‘વી’ બિગ ડેટાનાં મુખ્ય કેરેક્ટરિસ્ટિક્સ છે.
** આપ આ લેખ લોકપ્રિય ગુજરાતી બ્લૉગ ‘અનામિકા’ પર વાંચી રહ્યા છો © હરીશ દવે **
બિગ ડેટાની ઉપયોગિતા – બિગ ડેટા એપ્લિકેશન્સ
બિગ ડેટા રોજિંદા માનવ વ્યવહારમાં અતિ ઉપયોગી છે.
આર્ટિફિશિયલ ઇન્ટેલિજન્સ, મશીન લર્નિંગ અને ન્યુરાલ નેટવર્ક જેવી ટેકનોલોજીના વિકાસ સાથે બિગ ડેટાની વ્યાવહારિક ઉપયોગિતા ઇન્ટરનેટ એડવર્ટાઇઝિંગ અને ઓન-લાઇન શોપિંગથી લઈને કોર્પોરેટ સેક્ટરમાં પડકારરૂપ બિઝનેસ ડિસિશન સુધી વિસ્તરી છે.
વ્યાપાર-વાણિજ્ય અને ઉદ્યોગ ક્ષેત્રે અત્યારે જ જનરેટ થતા ડેટાને રિયલ ટાઇમમાં એનાલાઇઝ કરી તાત્કાલિક નિર્ણય (રિયલ ટાઇમ ડિસિશન) લેવા માટે ‘બિગ ડેટા’ અનિવાર્ય છે.
સોશિયલ મીડિયા, રીટેઇલ બિઝનેસ, ઇ-કોમર્સ, હેલ્થ કેર, બેંકિંગ, ઇંસ્યોરન્સ, એજ્યુકેશન જેવા સમાજવ્યાપી ક્ષેત્રોમાં બિગ ડેટા (બિગ ડેટા એનાલિટિક્સ) મોટો રોલ ભજવે છે.
વિજ્ઞાન ક્ષેત્રે સંશોધનો અને બ્રહ્માંડને ફંફોસતા ખગોળશાસ્ત્રમાં તેની ઉપયોગિતા સિદ્ધ થઈ ચૂકી છે.
બિગ ડેટાની એપ્લિકેશન્સ સરકારી ક્ષેત્રોમાં સ્માર્ટ ફાર્મિંગ-એગ્રીકલ્ચરથી લઈ અર્બન ડેવલમેન્ટ, ટ્રાન્સપોર્ટ સિસ્ટમ્સથી લઈ કાયદો-વ્યવસ્થા સુધીનાં ક્ષેત્રોમાં ખૂબ જ ઉપયોગી છે.
સંક્ષિપ્તમાં કહીએ તો, બિગ ડેટા માનવજીવનના રોજિંદા વ્યવહારોમાં છવાઈ ગયેલ છે.
** આપ આ લેખ લોકપ્રિય ગુજરાતી બ્લૉગ ‘અનામિકા’ પર વાંચી રહ્યા છો © હરીશ દવે **
** * *** * **** ** * ** * * ** *
અનામિકા-લેખ: બિગ ડેટા
- કમ્યુનિકેશન, ઇન્ટરનેટ અને ટ્રાન્સપોર્ટ ક્ષેત્રોમાં ક્રાંતિકારી પ્રગતિથી નજીક આવ્યા દુનિયાના દેશો
- વિશ્વમાં વાણિજ્ય-વ્યાપાર-ઉદ્યોગ સહિતના આર્થિક ક્ષેત્રોમાં ગાઢ બન્યા વ્યવહારો
- વિશ્વમાં રોજ જનરેટ થતો વિવિધ પ્રકારનો જંગી ડેટા
- બિગ ડેટામાં પ્રગતિનાં પ્રેરક પરિબળો છે આર્ટિફિશિયલ ઇન્ટેલિજન્સ, મશીન લર્નિંગ, ન્યુરાલ નેટવર્ક, ક્લાઉડ કમ્પ્યુટિંગ અને વિસ્તરતી ઇન્ટરનેટ ઓફ થિંગ્સ (આઇઓટી) ટેકનોલોજી
- એઆઇ અને મશીન લર્નિંગ અલ્ગોરિધમથી બિગ ડેટા એનાલિટિક્સ ક્ષેત્રે હરણફાળ
- બિગ ડેટા એનાલિટિક્સનો ઉપયોગ દુનિયાના વ્યવહારોના પ્રત્યેક ક્ષેત્રમાં: ટ્રેડ-કોમર્સ-ઇન્ડસ્ટ્રી જેમકે ઇ-કોમર્સ, ઓન-લાઇન શોપિંગ, ઇંટરનેટ એડવર્ટાઇઝિંગ, એજ્યુકેશન, ફાઇનાન્સ-બેન્કિંગ, ઇન્સ્યોરન્સ, એસ્ટ્રોનોમી-એસ્ટ્રોફિઝિક્સ જેવાં વિવિધ વિજ્ઞાન ક્ષેત્રે અને સાયન્ટિફિક રિસર્ચ, હેલ્થકેર, સરકારી ગવર્નન્સ વગેરેમાં
- એક ટેરાબાઇટ = 1000 ગીગાબાઇટ, એક પેટાબાઇટ = 1000 ટેરાબાઇટ, એક એક્ઝાબાઇટ = 1000 પેટાબાઇટ ….. વિશેષ માહિતી માટે અહીં ક્લિક કરો
- બિગ ડેટા: Big Data
- બિગ ડેટા એનાલિટિક્સ: Big Data Analytics
- હડૂપ એક પ્રચલિત ઓપન સોર્સ સોફ્ટવેર ફ્રેમવર્ક: Hadoop – an Open-source software framework
- સ્ટ્રક્ચર્ડ ડેટા તથા અનસ્ટ્રક્ચર્ડ ડેટા: Structured Data / Unstrctured Data
- આર્ટિફિશિયલ ઇન્ટેલિજન્સ – એઆઇ: Artificial Intelligence – AI
- ઇન્ટરનેટ ઑફ થિંગ્સ – આઇઓટી: Internet of Things – IoT
- ગીગાબાઇટ, ટેરાબાઇટ, પેટાબાઇટ: Gigabyte, Terrabyte, Petabyte
- વિશાલ ગજ્જર – યુનિવર્સિટી ઑફ કેલિફોર્નિયા ખાતે ફાસ્ટ રેડિયો બર્સ્ટ (એફઆરબી) પર સંશોધન: Vishal Gajjar – Research work on Fast Radio Burst (FRB) at University of California, USA
- સેટી – સર્ચ ફોર એક્સ્ટ્રા ટેરેસ્ટ્રિયલ ઇન્ટેલિજન્સ: SETI – Search for Extraterrestrial Intelligence
- બર્કલી સેટી રિસર્ચ સેન્ટર (યુસીબી સેટી, યુનિવર્સિટી ઑફ કેલિફોર્નિયા, બર્કલી, યુએસએ): Berkeley SETI Research Centre (UCB SETI, University of California, Berkeley, USA)
- બિગ ડેટાનાં ‘થ્રી વી’ લક્ષણો – વોલ્યુમ, વેરાયટી, વેલોસિટી: Three characteristics – Three ‘V’ of Big Data – Volume, Variety, Velocity
*** * * ** * *** ** ** *** *** ** *** **** * * *** ** **
** આપ આ લેખ લોકપ્રિય ગુજરાતી બ્લૉગ ‘અનામિકા’ પર વાંચી રહ્યા છો © હરીશ દવે **
*** * * ** * *** ** ** *** *** ** *** **** * * *** ** **
*** * * ** * *** ** ** *** *** ** *** **** * * *** ** **
6 thoughts on “બિગ ડેટા”