Skip to main content

Ikasketa automatikoa

Machine learning (ML) gisa ere ezagutzen da. Ikasketa automatikoa adimen artifizialaren adarra da, eta jarraibide espliziturik gabe ikasi eta zereginak egiteko gai diren sistema informatikoak sortzen ditu. Datu berriak jasotzerakoan portaera alda dezaketen programak dira. Datu horiekin ereduak sortu eta ekintzak birdoitzen dituzte, erantzuna hobetu edo pertsonalizatzeko. Modu errazean azalduta, ikasketa automatikoak datuak erabiltzen ditu galderei erantzuteko.

Pausoz pauso eta kasuz kasu zerbait nola egin esan beharrean, ML sistemek “entrenamendurako datuak” etengabe prozesatuz “ikasten” dute (laginaren informazioa adierazten duten multzoak). Prozesaketaren emaitzak nahi den emaitzaren hurbiltasunaren arabera kalifikatzen dira. Prozesu hori errepikatu egiten da eta puntuaziorik onena duten algoritmoak eta parametroak berrientzako oinarri gisa erabiltzen dira.

Ikasketa automatikoko sistemen ezaugarri nagusia da esperientziarekin eta datuekin jarduera hobetzen dutela, hau da: ikasi egiten dute.

ML erabilgarria da, esaterako, sarrera-datuen multzoa masiboa edo gizaki batek idatzitako algoritmo batekin prozesa ezina denean.

Sistema edo makina batek hainbat modutara ikas dezake. Ikasketa automatikoaren askotariko ikuspegiak konponduko dituzten arazo-motaren arabera aldatzen dira, baita programak duen atzeraelikadura motaren eta kopuruaren arabera ere. Ikasketa automatikoa hainbat algoritmoren (edo ikasketa-motaren) bitartez egiten da:

  • Gainbegiratutako algoritmoak / Gainbegiratutako ikasketa: Iraganean ikasitakoa datu berriei aplika diezaiekete. Entrenamendurako datu bakoitzak sarrera eta “etiketa” bana ditu (irteera edo aurrez definitutako erantzun egokia). Sistemak helburu-funtzioa exekutatzen du, sarrera horrekin lotutako irteerara heltzeko. Jarraian, funtzio horren gainean iteratzen du, parametroak aldatuz, funtzioak entrenamendu multzoaren barruan ez dauden datuak arrakastaz prozesatu ahal izan arte.
  • Gainbegiratu gabeko algoritmoak / Gainbegiratu gabeko ikasketa: Datuen multzoetatik inferentziak atera ditzakete. Entrenamendu-datuak “etiketarik gabe” daude, hau da, algoritmoari ez zaio nahi den irteera ematen. Algoritmo horiek datuetan ereduak eta egiturak aurkitzean oinarritzen dira.
  • Erdigainbegiratutako algoritmoak / Erdigainbegiratutako ikasketa: Entrenamendu-datu batzuek etiketa dute eta beste batzuek ez. Zientzialariak ohartu dira, kasu batzuetan, algoritmo horiek errendimendu hobea dutela gainbegiratu gabeko ikasketak baino eta gainbegiratutako ikasketa baino eraginkorragoak direla.
  • Ikasketa aktiboko algoritmoak: Algoritmoa gainbegiraketaren oreka hobetzen ahalegintzen da (irteerak ezagutzen). Sarrera-datu adierazgarriak hautatzen ditu eta gizakiari eskatzen dio interaktiboki sarrera horientzako irteera egokiena emateko. Adibide bat da Interneteko webgune batean irudiak identifikatzeko eskatzen digutenean, “robota ez zarela frogatzeko” (CAPTCHA gisa ezagutzen dena). “Aukeratu aparkalekuak ageri diren irudiak” gisako zereginen erantzunak ikasketa aktiboko algoritmoetan sartzen dira, baita ibilgailu autonomoen ordenagailu bidezko ikusmena hobetzeko erabiltzen direnak ere.
  • Ikaskuntza indartuan, algoritmoek sari kuantifikagarri bat metatzeko aukerak nola handitu dute ardatz. Sari metagarri mota honen adibidea da xake partida bateko aurkariari pieza bat hartzea. Xakean, peoi batek 1 balio du, zaldiek eta alfilek 3 (hiru peoien baliokidea gutxi gorabehera), erreginak 9, etab. Partidak aurrera egin ahala abantaila materiala handitzen duten algoritmoek partida irabazteko aukerak handitzen dituzte. Ikasketa indartua jokoen teorian, erlekumeen inteligentzian eta algoritmo genetikoetan aplikatzen da.

Gainbegiratua, gainbegiratu gabea, indartua... Ekosistema konplexua dirudi, baina errealitatean ez da hala. Garrantzitsuena da jakitea hainbat ikasketa-mota daudela eta hainbat arazok ikaskuntza automatikoko ikuspegi desberdinak behar dituztela.

Zientzia fikzioko kontzeptua dirudien arren, ikasketa automatikoa gure bizitzen parte da eta egunerokoan erabiltzen ditugun hainbat produktu eta zerbitzuren parte, esaterako:

  • Streaming zerbitzuak, hala nola Netflix edo Spotify.
  • GPS bidezko nabigaziorako softwareak, esaterako, Google Maps.
  • Bilatzaileak, esaterako, Google Search.
  • Facebook edo LinkedIn bezalako sare sozialek erakusten dizkiguten feedek edo edukiek (albisteak, argitalpenak) ikasketa automatikoa erabiltzen dute erabiltzaile bakoitzaren edukia pertsonalizatzeko, irakurtzen duen edo “gustuko dut” ematen dion aztertuz. Horrela, eredu bat eraikitzen du eta feeda horren arabera pertsonalizatzen du.

Ikasketa automatikoa sektore guztietan aplikatzen da, osasunetik merkataritzara, baita gidaririk gabeko ibilgailuen garapenean ere.

“Ikasketa automatikoa” espresioa IBMko ingeniari eta adimen artifizialaren aitzindari izan zen Arthur Samuelek sortu zuen 1959an. Dama-jokoan aritzeko, aurreko partidak aztertzeko eta etorkizuneko jokoaren erabakiak hobetzeko diseinatu zuen ordenagailu bat deskribatzeko otu zitzaion termino hori. Ikerketa zientifikoaren esparruan, adimen artifizialaren adarra bilakatu zen ML 70eko eta 80ko hamarkadetan. Garai hartan, zientzialariek adimen artifizialaren hainbat teknikarekin egiten zituzten esperimentuak, hala nola sare neuronalekin eta programazio logiko-induktiboarekin, ordenagailuei datuak modu adimentsuan prozesatzen laguntzeko. 90eko hamarkadan, ikasketa automatikoak utzi egin zion datu konplexu eta masiboen analisirako ikuspegi praktikoak aurkitzeko adimenaren simulazioan oinarritzeari.