Novosti

2 minute read

Microsoftova studija tvrdi da se AI još uvijek muči s otklanjanjem grešaka u softveru

11 travnja, 2025

Generativna AI i Izazovi U Debuggingu: Istraživanje Microsofta

Generativna umjetna inteligencija (AI) sve više se integrira u programerske tokove rada. Međutim, nova istraživanja Microsofta otkrivaju da veliki jezični modeli i dalje nisu dovoljno učinkoviti kada je u pitanju debugging. Ovo istraživanje naglašava važnost ljudskih programera, čak i kada se suočavaju s jednostavnim zadacima koje iskusni developeri lako rješavaju.

Problem Debugiranja s AI

U istraživanju se navodi da čak i napredni modeli imaju poteškoća s debugging zadacima koji su relativno jednostavni za iskusne developere. Iako AI pokazuje potencijal, postoje izazovi koje treba prevladati:

Google izvještava da oko 25% novog koda generira AI.
Meta također primjećuje široku primjenu AI u kodiranju.

Izvještaj se fokusira na testiranje devet AI modela od strane 11 istraživača iz Microsofta, koristeći SWE-bench Lite, popularnu metodu za testiranje eficijentnosti debugiranja. Rezultati su pokazali da je model Claude 3.7 Sonnet imao najvišu stopu uspjeha od 48.4%, dok su modeli OpenAI o1 i o3-mini prikazali niže stope od 30.2% i 22.1%.

Izazovi i Mogućnosti u Razvoju AI za Debugging

Istraživači ističu: “Čak i uz alate za debugiranje, naš jednostavni agent temeljen na upitima rijetko rješava više od polovice SWE-bench Lite problema.” Problem leži u nedostatku podataka koji predstavljaju ponašanje donošenja odluka u sekvencama. Međutim, istraživači su optimistični: “Vjerujemo da bi obuka ili fino podešavanje LLM-a mogli poboljšati njihove interaktivne sposobnosti debugginga.”

Istraživači planiraju razviti model koji će se fokusirati na prikupljanje potrebnih informacija za rješavanje grešaka.
Obećavaju otvoreno dijeljenje alata debug-gym kako bi olakšali slična istraživanja drugim znanstvenicima.

Zaključak: Vrijednost AI za Razvojne Programere

Unatoč očekivanjima, umjetna inteligencija možda trenutno ne nudi toliko koristi u svakodnevnom radu programerima koliko to AI kompanije sugeriraju. “Većina programera provodi većinu svog vremena rješavajući greške u kodu,” naglašavaju istraživači, sugerirajući da, iako uživaju u generaciji koda, ne ostvaruju veliki uštedu vremena.

Kako se tehnologija razvija, tako se i AI modeli mogu usavršavati, a budućnost bi mogla donijeti efikasnije alate koji će programerima pomoći u svakodnevnim izazovima.

Odgovori Otkaži odgovor

Tehnologija

Nikad nisam bio više uzbuđen da dobijem novi prijenosni uređaj: Intelov novi grafički upravljač navodno pruža bolju izvedbu MSI Claw 8 AI+

11 travnja, 2025

2 minute read

Pametni telefoni

Samsung Galaxy Fold 7 se približava – 5 novih stvari koje smo saznali prema najnovijim glasinama

11 travnja, 2025

3 minute read

Izabrano samo za vas Najčitanije vijesti

Genki lansira novu kolekciju gaming dodataka dizajniranih za Nintendo Switch 2 i ‘da eliminira uobičajena ograničenja handheld igre’

Qualcomm konačno ispravlja zero-day ranjivosti Adreno GPU-a korištene u napadima na Android

Meta Quest 4 odgođen do 2027., ali bismo mogli vidjeti potpuno novu vrstu Meta VR slušalica umjesto toga

Microsoftova studija tvrdi da se AI još uvijek muči s otklanjanjem grešaka u softveru

Generativna AI i Izazovi U Debuggingu: Istraživanje Microsofta

Problem Debugiranja s AI

Izazovi i Mogućnosti u Razvoju AI za Debugging

Zaključak: Vrijednost AI za Razvojne Programere

Odgovori Otkaži odgovor

Previous Post

Nikad nisam bio više uzbuđen da dobijem novi prijenosni uređaj: Intelov novi grafički upravljač navodno pruža bolju izvedbu MSI Claw 8 AI+

Next Post

Samsung Galaxy Fold 7 se približava – 5 novih stvari koje smo saznali prema najnovijim glasinama

Genki lansira novu kolekciju gaming dodataka dizajniranih za Nintendo Switch 2 i ‘da eliminira uobičajena ograničenja handheld igre’

Qualcomm konačno ispravlja zero-day ranjivosti Adreno GPU-a korištene u napadima na Android

Meta Quest 4 odgođen do 2027., ali bismo mogli vidjeti potpuno novu vrstu Meta VR slušalica umjesto toga

Zubi stari 2 milijuna godina otkrivaju spol pretpovijesnog čovjekolikog majmuna po prvi put

Video prikazuje fizičare kako postižu “nemoguće” dostignuće puzanja lopte okomito

Cijene i boje Nothing Phone 3 procurile, a točno je onoliko skupi koliko smo očekivali

Garmin Index Monitor za Spavanje: sve što znamo o Garminovoj traci bez ekrana usmjerenoj na oporavak u stilu Whoop

Nintendo Switch 2 još nije ni objavljen, ali Nintendo već šalje oznake ‘Nema na skladištu’ trgovcima.

Microsoftova studija tvrdi da se AI još uvijek muči s otklanjanjem grešaka u softveru

Generativna AI i Izazovi U Debuggingu: Istraživanje Microsofta

Problem Debugiranja s AI

Izazovi i Mogućnosti u Razvoju AI za Debugging

Zaključak: Vrijednost AI za Razvojne Programere

Odgovori Otkaži odgovor

Previous Post

Next Post

Related Posts