
‘Tko nas bre zavadi’: Znanstvenici došli do frapantnog otkrića, analizirali DNK Srba i Hrvata
Pionirska studija britanskog znanstvenika Alana Turinga (1912.-1954.) iz 1950. godine postavila je pitanje može li računalna tehnologija razmišljati kao ljudi? Predložio je da ako čovjek ne može razlikovati razgovor s umjetnom inteligencijom (UI) i stvarnim čovjekom nakon pet minuta pitanja, to bi dokazalo da UI posjeduje inteligenciju sličnu ljudskoj.
Unatoč napretku u razvoju sustava umjetne inteligencije, više od 70 godina nakon Turingova prijedloga, nijedan AI nije uspješno prošao test prema uvjetima koje je postavio. Međutim, nekoliko sustava približilo se tom cilju.
Nedavni eksperiment testirao je tri velika modela pri obradi prirodnog jezika, uključujući GPT-4 (UI tehnologiju po kojoj radi ChatGPT-a).
Ispitanici su provodili dvije minute razgovarajući s osobom ili UI sustavom. Umjetna je inteligencija bila programirana da napravi manje pravopisnih pogrešaka i prekine interakciju ako ispitanik postane agresivan.
Ovo je dosad najjači potres na nekom drugom planetu: Evo što je NASA detektirala u našem susjedstvu
Pod tim uvjetima, UI se dobro nosio s varanjem ispitanika.
Kada su razgovarali s UI sustavom, ispitanici su u samo 60% vremena točno prepoznali da komuniciraju sa sustavom umjetne inteligencije.
Unatoč tom napretku, profesori filozofije Simon Goldstein s Australskog katoličkog sveučilišta i Cameron Domenico Kirk-Giannini sa Sveučilišta Rutgers (New Jersey, SAD) postavljaju pitanje je li oponašanje ljudi zaista učinkovit test za mjerenje inteligencije i koje alternative možemo koristiti.
“Iako je uspješan prolazak Turingova testa nekakav pokazatelj inteligencije, nije konačan. Problem je što može dati lažne negativne rezultate. Današnji veliki modeli često su programirani da odmah otkriju da nisu ljudi. To može umanjiti mogućnost da UI sustavi prođu Turingov test, iako bi to zapravo mogli učiniti”, objašnjavaju profesori.
Turingov test također može stvoriti i lažne pozitivne rezultate. Sustav bi mogao proći test jednostavno programirajući odgovor na svaki mogući unos.
Osim toga, taj se test također usredotočuje na ljudsku kogniciju. Ako se razmišljanje umjetne inteligencije razlikuje od ljudskog, stručnjak za ispitivanje može pronaći zadatke na kojima se UI i ljudi razlikuju u performansama.
Umjesto usredotočivanja na Turingov test, bolje je procjenjivati napredak umjetne inteligencije u razvoju različitih sposobnosti. Postoji niz mjera u strojnom učenju koje to omogućuju.
Primjerice, GPT-4 mogao je točno odgovoriti na 86% pitanja u ogromnom testu razumijevanja višejezičnosti – testu koji mjeri performanse na multiple-choice testovima iz različitih akademskih predmeta na sveučilišnoj razini.
Isto tako, postigao je dobre rezultate na AgentBenchu, alatu koji može mjeriti sposobnost velikog modela za ponašanje kao agent, na primjer, pregledavanje interneta, kupovinu proizvoda online i sudjelovanje u igrama.
“Iako su veliki jezični modeli stručni u oponašanju ljudi, to ne znači da su nužno inteligentni. Postoji mnogo vrsta inteligencije i načina na koje je možemo mjeriti. Važno je pratiti napredak u razvoju različitih sposobnosti umjetne inteligencije kako bismo bolje razumjeli njezinu stvarnu inteligenciju”, zaključuju Goldstein i Kirk-Giannini.
‘Tko nas bre zavadi’: Znanstvenici došli do frapantnog otkrića, analizirali DNK Srba i Hrvata
Posebnom hrvatskom blagu smrt kuca na vrata: Ostalo je još samo nekoliko desetaka…
Astronauti otkrili kako točno miriše svemir: ‘Drugačiji je od svega ostalog, a evo kako nastaje’
Stravičan i bizaran incident: Iz WC školjke izbila jaka vatra dok je muškarac obavljao nuždu