Skip to main content

Big data

Big data informazioaren eta komunikazioaren teknologien sektorean erabiltzen den terminoa da, aniztasun handia eta edukietan konplexutasun handia duten eta oso azkar prozesatu behar diren datu kopuru izugarriaren multzoa deskribatzeko. Horrek egiten du ohiko informatika-sistemen gaitasunak gainditzea.

Big data kontzeptuak ere erreferentzia egiten dio Interneteko erabiltzaileen jardueraren ondorioz sortzen diren datu-kopuru handiak bildu, maneiatu, aztertu eta kudeatzeaz arduratzen den teknologia-multzoari. Big data teknologien helburua “landu gabe” sortu diren datu masiboak bildu eta prozesatzea da, sektore edo erakunde batzuei informazio esanguratsua lortzea ahalbidetzen dieten patroiak edo jokaerak hautemateko.

Biga data datuen eta teknologien ereduetako batzuk dira; merkataritza elektronikoaren transakzioen azterketa, Twitterreko argitalpenen prozesaketa edo finantza-merkatuen jarraipena.

Makrodatuak eta datuen inteligentzia dira ingeleseko biga data terminoaren alternatibak. Datu masibo gisa ere ezagutzen da.

Big datak etorkizuneko gertakariak aurreikusten lagun dezake, mundu-mailako joerak aztertuta, baina gaitasun hori ez dago polemikatik salbuetsita. Kritikoek adierazi dute kontzeptu horrek pribatutasuna urratzen duela eta tresna boteretsua izan daitekeela gobernuek eta enpresek pertsonak zelatatzeko edo iritzi-korronteak manipulatu ahal izateko.

Big data kontzeptuak indarra hartu zuen 2000ko hamarkada hasieran. Doug Laney analistak sortu zuen, “hiru Vak” gisa ezagutzen dena kontuan hartuta:

  • Bolumena: erakundeek iturri askotatik biltzen dituzte datuak. Iraganean, ezinezkoak izango zen horiek gordetzea.
  • Abiadura: Gauzen Internetaren (IoT) sorrerak ekarri du datuak oso azkar mugitzea, eta horrek agerian utzi du informazioa denbora errealean erabiltzeko beharra.
  • Aniztasuna: egun, mota askotako datuak erabiltzen dira: zenbakidunak, testuzkoak, mezu elektronikoak, bideoak, ahots-mezuak. transakzioak...

Hasierako 3 “V” horiei beste batzuk erantsi zaizkie:

  • Egiazkotasuna: bildutako informazioaren fidagarritasuna da, kalitatezko datuak eta analisia lortzeko alderdi garrantzitsua.
  • Bistaratzea: informazio-orriak grafiko bakar batean bihurtzeak argi erakusten ditu ondorioak modu errazean.
  • Balioa: datuak modu eraginkorrean biltzea, baliozko informazio txikiak lortzeko.
  • Aldakortasuna: ingurune aldakorrera uneoro egokitzeko beharrak dakar aldizka ereduen eta aplikatzen diren tratamenduen kontrola eramatea.

Big data sistemek 3 datu-mota aztertzen dituzte:

  1. Egituratutako datuak: tauletan gorde daitezke eta formatu eta luzera argia dute. Esaterako, zenbakiak, karaktere-kateak, datak, etab.
  2. Egituratu gabeko datuak: jatorrian bildu ziren moduan daude eta ez daukate formatu zehatzik, beraz, ezin dira modu tradizionalean gorde. Esaterako, posta elektronikoak edo formatu desberdinak dituzten artxibo ofimatikoak, esaterako, pptx edo pdf luzapenak dituztenak, besteak beste.
  3. Erdiegituratutako datuak: egitura bat dute, baina ez da datu egituratutzat hartzeko bezain erregularra. Kategoria honetan sartuko lirateke, besteak beste, XML edo HTML moduko etiketetan oinarritzen diren programazio-lengoaiak.

Big dataren azterketari esker, patroiak eta portaeren joerak hauteman daitezke, eta baita erabakiak hartzeko eta negozio-ekintza estrategikoak garatzeko gakoak edo adierazleak ere. Horregatik, oso aktibo baliotsua da edozein enpresarentzat. Beste modu batera esanda, big datak jarduteko edo erabakitzeko erreferentzia-puntu bat ematen du. Hain informazio kopuru handiak erabiltzerakoan, datuak aldatu edo probatu egin daitezke, jabetza duen erakundeari egokia iruditzen zaion modura. Horrela, erakundeak gai dira arazoak modu ulergarriagoan eta eraginkorragoan hautemateko. Gainera, irabaziak, bezeroak, kostuen murrizketak eta produktu eta zerbitzu berriak sortzen dituzten aukera berriak hauteman ditzakete.

Big datak eta zibersegurtasunak elkarren beharra dute. Alde batetik, funtsezkoa da informazio kopuru handi horren pribatutasuna mantentzea. Ziberasotzaileek asko desio duten helburua da eta oso ondo babestuta egon behar dute. Era berean, big datak zeregin garrantzitsua du zibersegurtasunean , datuak prozesatu eta aztertzeko duen gaitasunarengatik. Horri esker, datu horien osotasuna arriskuan jartzen duten erabiltzaileak hauteman daitezke, esaterako.

Egun, datuak prozesatzeko gaitasuna ezinbesteko tresna da zibersegurtasuneko edozein estrategiatan eta baldintza erabakigarria zibermehatxuak hautemateko eta klasifikatzerako garaian. Izan ere, denbora errealean zer gertatzen ari den jakitea ahalbidetzen du eta baita denboran zehar ereduak diseinatzea ere. Beraz, big datak, ikasketa automatikoa edo machine learning gisako teknologiekin batera, oso zehatzak diren aurreikuspen-ereduak sortzen ditu, zibererasoa zein egoeratan eman litekeen edo zibererasorik gertagarriena zein izango litzatekeen asmatzeko.