Problemi s podacima otežavaju uspješno mašinsko učenje i AI
Prema ispitivanju 277 stručnjaka koji se bave podacima i vještačkom inteligencijom u velikim kompanijama iz gotovo 20 industrija, AI je još u ranim danima i brojni su izazovi koji sprečavaju njegovu uspješnu primjenu.
Gotovo sve kompanije koje rade na AI projektima nailaze na probleme s kvalitetom i označavanjem podataka. Četiri od pet stručnjaka koji rade na tome kažu da je “obučavanje” vještačke inteligencije podacima teže nego što su mislili, stoji u istraživanju koje je proveo Dimensional Research. Kao najveće izazove navode greške u podacima, nedovoljno podataka, neupotrebljivi podaci te nedovoljno ljudi i alata za označavanje podataka.
Količina podataka potrebnih za “obučavanje” AI algoritma je ogromna. 72% ispitanika je izjavilo da će u okviru projekta na kojem trenutno rade biti potrebno više od 100.000 označenih podataka, a 10% je navelo da im treba više od deset miliona.
“Označavanje i anotacija podataka potrebnih za obuku za projekte mašinskog učenja je ozbiljan problem za timove za naučno istraživanje podataka i značajna prepreka u realizaciji tih projekata”, kaže se u istraživanju “Šta nam naučnici kažu o AI modelu obuke”, koji je za Alegion proveo Dimensional Research.
Pitanja ljudskih resursa
Gotovo dvije trećine ispitanika kažu da su njihovi projekti za mašinsko učenje (ML) napredovali od početnog dokazivanja nacrtnih ideja (POC), što je lakmus-test za ideju, kao što je, naprimjer, prepoznavanje i zrelost nekog voća.
Niz izazova predstavlja i sljedeća faza “hranjenja” algoritma s dovoljno podataka “da bude spreman za validaciju”, navodi se u izvještaju.
Ljudski resursi su također problem. 80% vremena stručnjaci utroše na pripremu i upravljanje podacima. Ovo je problematično za kompanije zato što su stručnjaci koji prikupljaju podatke skupi, a i oni su nezadovoljni jer očekuju posao koji je “zanimljiv, izazovan i strateški”, a rade nešto sasvim suprotno. Kao rezultat toga, ne preostaje im mnogo vremena da urade ono za što su plaćeni – koriste mašinsko učenje da unaprijede poslovanje“, navodi se u izvještaju.