Tehnologija

2 minute read

ChatGPT i Google Gemini su užasni u sažimanju vijesti, prema novoj studiji

11 veljače, 2025

Nedavna studija pokazuje nedostatke u AI sustavima za sažimanje vijesti

Nova studija koju je proveo BBC otkrila je da četverica najpopularnijih AI chatbota, uključujući ChatGPT, netočno sažimaju vijesti. U ovoj fascinantnoj analizi, BBC je zatražio od ChatGPT-a, Copilota, Geminija i Perplexityja da sažmu 100 vijesti i zatim su ocijenili svaki odgovor kako bi utvrdili koliko su AI odgovori bili točni.

Rezultati studije

Studija je pokazala da je “51% svih AI odgovora na pitanja o vijestima ocijenjeno kao problematično u nekom obliku,” dok je “19% AI odgovora koji su citirali sadržaj BBC-a sadržavalo činjenice koje su bile netočne, poput netočnih izjava, brojeva i datuma.” Ovi nalazi otkrivaju brojne primjere netočnosti, uključujući tvrdnje poput “Geminija koji je netočno rekao da NHS ne preporučuje pušenje e-cigareta kao pomoć u prestanku,” te “ChatGPT i Copilot koji su tvrdili da su Rishi Sunak i Nicola Sturgeon još uvijek na dužnosti, iako su već napustili svoje pozicije.”

Problemi s razlikovanjem između činjenica i mišljenja

Osim netočnosti, još jedno važno otkriće odnosi se na borbu AI sustava u razlikovanju između mišljenja i činjenica. Studija je pokazala da su AI alati “uređivali sadržaj” i često nisu uključivali ključni kontekst. S obzirom na to koliko često svjedočimo problemima s alatima za sažimanje vijesti, uključujući zbrke s Apple Intelligenceom koje su natjerale Apple da privremeno ukloni ovu funkciju iz iOS 18.3, jasno je da ne bismo trebali vjerovati svemu što prečimo putem AI-a.

Zaključak: Oprez u korištenju AI alata za vijesti

BBC zaključuje da su “Microsoftov Copilot i Googleov Gemini imali značajnije probleme od OpenAI-ovog ChatGPT-a i Perplexityja.” Dok ova istraživanja ne donose puno novih informacija, ona potvrđuju skepticizam prema alatima za sažimanje putem AI-a i naglašavaju važnost opreza prilikom uzimanja informacija iz AI chatbota sa dozom sumnje. AI se rapidno razvija, a veliki jezični modeli (LLMs) izlaze gotovo tjedno, pa su pogreške koje se događaju očekivane. No, iz mojih osobnih testiranja, primijetio sam da su netočnosti i “halucinacije” sada rjeđe u softveru poput ChatGPT-a nego što su bile prije nekoliko mjeseci.

Sam Altman je u svom jučerašnjem blogu izjavio da AI napreduje brže od Mooreovog zakona, što znači da ćemo i dalje svjedočiti stalnim poboljšanjima softvera i njegovoj interakciji s okolinom. Za sada, međutim, najbolje je ne oslanjati se na AI za dnevne vijesti, a ako se radi o tehnologiji, bolje je držati se provjerenih izvora poput TechRadara.

Odgovori Otkaži odgovor

Tehnologija

Marvelovi rivali rangirani po redu i objašnjeni natjecateljski način

11 veljače, 2025

2 minute read

Pametni telefoni

iOS 18.4 bi mogao biti najveće nadogradnja iPhonea ikada – evo zašto

11 veljače, 2025

3 minute read

Izabrano samo za vas Najčitanije vijesti

Ako Apple preradi aplikaciju Telefon u iOS-u 26, možda ću jednostavno prekinuti vezu

FBI upozorava da je opasan malware BADBOX 2.0 zaražen više od milijun uređaja – evo kako ostati siguran

Cloud usluga Infomaniak pojačava borbu s Protonom zbog kontroverznog švicarskog zakona o nadzoru

ChatGPT i Google Gemini su užasni u sažimanju vijesti, prema novoj studiji

Nedavna studija pokazuje nedostatke u AI sustavima za sažimanje vijesti

Rezultati studije

Problemi s razlikovanjem između činjenica i mišljenja

Zaključak: Oprez u korištenju AI alata za vijesti

Odgovori Otkaži odgovor

Previous Post

Marvelovi rivali rangirani po redu i objašnjeni natjecateljski način

Next Post

iOS 18.4 bi mogao biti najveće nadogradnja iPhonea ikada – evo zašto

Ako Apple preradi aplikaciju Telefon u iOS-u 26, možda ću jednostavno prekinuti vezu

FBI upozorava da je opasan malware BADBOX 2.0 zaražen više od milijun uređaja – evo kako ostati siguran

Cloud usluga Infomaniak pojačava borbu s Protonom zbog kontroverznog švicarskog zakona o nadzoru

86 milijuna AT&T zapisa procurilo je na internetu – a ovaj put su dekriptirani, stoga budite na oprezu

Svjetlosne eksplozije, mrtvačka mora svitci i zašto je tako teško odrediti spol dinosauru

HMS Endeavour, brod kojim je kapetan Cook plovio u Australiju 1770. godine, otkriven je u SAD-u

Evo kako koristiti Gemini na Androidu

Spotify obožavatelji su dobili još jedno besplatno nadogradnju tijekom leta, zahvaljujući ovoj suradnji Starlinka i United Airlinesa

ChatGPT i Google Gemini su užasni u sažimanju vijesti, prema novoj studiji

Nedavna studija pokazuje nedostatke u AI sustavima za sažimanje vijesti

Rezultati studije

Problemi s razlikovanjem između činjenica i mišljenja

Zaključak: Oprez u korištenju AI alata za vijesti

Odgovori Otkaži odgovor

Previous Post

Next Post

Related Posts