Upoznajte Najteži AI Test na Svijetu: Posljednji Ispit Čhumanosti
Nedavno je pokrenut jedan od najizazovnijih AI ispita na svijetu, poznat kao Posljednji Ispit Čhumanosti, koji je već u prvih nekoliko tjedana pokazao značajan napredak u točnosti rezultata. OpenAI-ov Deep Reasoning i nova verzija ChatGPT o3-mini trenutno vode na ljestvici, pokazujući nevjerojatne rezultate u rješavanju najtežih dostupnih logičkih problema.
Što je Posljednji Ispit Čhumanosti?
Ovaj AI test stvorili su stručnjaci iz cijelog svijeta i sadrži neka od najkompleksnijih pitanja koja poznajemo. Samo prije nekoliko tjedana, kada sam pisao o ovom ispitu, rezultat vrhunskog modela DeepSeek R1 bio je 9.4% točnosti prilikom evaluacije isključivo na tekstu. S obzirom na to koliko je teško razumjeti neka od pitanja, to je bio značajan rezultat.
Napredak AI Modela
- Nova verzija ChatGPT o3-mini ostvarila je 10.5% točnosti u standardnom režimu, dok je na visokom režimu postigla 13% točnosti.
- OpenAI-ov novi AI agent, Deep Research, postigao je nevjerojatnih 26.6%, što je povećanje točnosti od čak 183% u manje od 10 dana.
Međutim, važno je napomenuti da Deep Research ima mogućnosti pretraživanja interneta, što njegovo uspješno rješavanje ispita čini donekle nepravednim u odnosu na druge modele koji nemaju ovu funkcionalnost. Pristup informacijama pomaže u rješavanju općepoznatih pitanja, što dodatno objašnjava njegov visok rezultat.
Hoće li AI ikada nadmašiti 50%?
Premda bi bilo nerealno očekivati da će AI modeli uskoro ostvariti visoke rezultate, napredak koji smo već primijetili izaziva zanimanje. Pitanje ostaje: koliko ćemo još čekati da neki model prvi puta prijeđe granicu od 50%? Može se pretpostaviti da će modeli poput Deep Research biti posebno uspješni u područjima poput medicine, prava i klasične filozofije.
Zaključak
Posljednji Ispit Čhumanosti predstavlja pravi izazov za AI modele i omogućava nam da pratim njihovu evoluciju. Na temelju trenutnih rezultata, uzbudljivo je razmišljati o budućim dostignućima u umjetnoj inteligenciji. S obzirom na brzinu napretka, svakako vrijedi pratiti kako će se situacija razvijati. A kada će AI konačno postići dostići rezultat veći od 50%? Ostaje nam samo da čekamo i gledamo!
Prijavite se za najnovije vijesti, recenzije i vrhunske tehnološke ponude kako biste bili u toku sa svim zbivanjima u svijetu umjetne inteligencije.