Vsi smo bili priča očitnemu izboljšanju tekstovnih in slikovnih outputov popularnih AI orodij v zadnjem letu, zakon eksponentnega napredka pa narekuje, da se bodo sposobnosti umetne inteligence izboljševale vse hitreje. Tako hitro, da je samo še vprašanje časa, kdaj bomo dosegli umetno splošno inteligenco (AGI, artificial general intelligence), ki bo presegala tudi najpametnejše med nami in se naprej razvijala sama. Pa se bo to res zgodilo? Nedavna poročila nakazujejo na to, da se bo morda razvoj upočasnil prej, kot smo mislili.
Podatki: osnova umetne inteligence
Orodja umetne inteligence temeljijo na podatkih, ki jih je ustvaril človek. Na ta način se računalnik uči o našem slogu komuniciranja in ustvarjanja ter pozna podatke, na podlagi katerih lahko poda faktološko ustrezne odgovore, ki delujejo tako, kot da bi jih ustvaril človek. Da umetno inteligenco ustrezno natreniramo, potrebujemo kakovostne podatke – najboljše je strokovno gradivo, ki so ga s trudom ustvarili kompetentni ljudje.
Leta 2026 naj bi kakovostnega gradiva zmanjkalo
Težava je, da naj bi kakovostnega tekstovnega gradiva za treniranje umetne inteligence v kratkem zmanjkalo. Že čez dve leti, natančno, naj bi se pojavila t. i. podatkovna suša – točka, na kateri bo AI predelal veliko večino kakovostnega gradiva, ki je na voljo na spletu. Poudarek na kakovostnega – sicer je podatkov, ki se shranjujejo na splet, vedno več, a objave na socialnih omrežjih in forumih niso gradivo, ki je optimalno za razvoj AI jezikovnih modelov. Na t. i. nizkokakovostnih podatkih se AI lahko uči, a to večinoma ne bo izboljšalo sposobnosti modela. Prej obratno – vsi vemo, kako je Chat v svojih prvih iteracijah, preden so ga ukrotili" s strogimi etičnimi pravili, ponavljal nestrpne in moralno sporne vsebine, ki se jih je naučil iz svojih nizkokakovostnih podatkov za trening.
Kaj to pomeni za razvoj?
Kakovostnih podatkov pa ne bo zmanjkalo le za trening tekstovnih modelov; napovedi kažejo na to, da bo med 2030 in 2050 zmanjkalo tudi kakovostnega slikovnega gradiva. Celo nizkokakovostnega pisnega gradiva – objav na socialnih omrežjih in forumih – bi lahko zmanjkalo do leta 2050. Vse to pod vprašaj postavlja napovedi o neskončni eksponentni rasti orodij umetne inteligence. Pravzaprav je vprašljivo tudi, ali bomo res že v nekaj letih dosegli raven umetne splošne inteligence, ki prekaša tudi najpametnejše med nami, ali pa bo prej zmanjkalo kakovostnih podatkov. Upočasnitve razvoja umetne inteligence se mnogi, ki jih skrbijo socialni nemiri in brezposelnost, veselijo. Druge pa skrbi, da bo napovedan gospodarski izkupiček – po optimističnih ocenah več kot 15 bilijonov do leta 2030 – neprimerljivo manjši.
Potencialne rešitve
Čeprav je pomanjkanje kakovostnih podatkov zelo realen problem, obstajajo možne rešitve. Večina orodij je natreniranih na podatkih, ki so prosto dostopni na spletu. Ko bo teh zmanjkalo, se bodo AI podjetja morda zatekla k drugim virom – založbam, knjižnicam, univerzam – ki bodo omogočili nadaljnji trening. Četudi pa bodo podjetja našla alternativne vire, so nas odprta vprašanja v zvezi s podatkovno sušo opomnila, da neomejen eksponentni razvoj ni samoumeven in da smo – vsaj za zdaj – ljudje in naši izdelki še vedno tisti, ki narekujemo razvoj.
KOMENTARJI (0)
Opozorilo: 297. členu Kazenskega zakonika je posameznik kazensko odgovoren za javno spodbujanje sovraštva, nasilja ali nestrpnosti.
PRAVILA ZA OBJAVO KOMENTARJEV