Microsoftova studija tvrdi da se AI još uvijek muči s otklanjanjem grešaka u softveru

Generativna AI i Izazovi U Debuggingu: Istraživanje Microsofta

Generativna umjetna inteligencija (AI) sve više se integrira u programerske tokove rada. Međutim, nova istraživanja Microsofta otkrivaju da veliki jezični modeli i dalje nisu dovoljno učinkoviti kada je u pitanju debugging. Ovo istraživanje naglašava važnost ljudskih programera, čak i kada se suočavaju s jednostavnim zadacima koje iskusni developeri lako rješavaju.

Problem Debugiranja s AI

U istraživanju se navodi da čak i napredni modeli imaju poteškoća s debugging zadacima koji su relativno jednostavni za iskusne developere. Iako AI pokazuje potencijal, postoje izazovi koje treba prevladati:

  • Google izvještava da oko 25% novog koda generira AI.
  • Meta također primjećuje široku primjenu AI u kodiranju.

Izvještaj se fokusira na testiranje devet AI modela od strane 11 istraživača iz Microsofta, koristeći SWE-bench Lite, popularnu metodu za testiranje eficijentnosti debugiranja. Rezultati su pokazali da je model Claude 3.7 Sonnet imao najvišu stopu uspjeha od 48.4%, dok su modeli OpenAI o1 i o3-mini prikazali niže stope od 30.2% i 22.1%.

Izazovi i Mogućnosti u Razvoju AI za Debugging

Istraživači ističu: “Čak i uz alate za debugiranje, naš jednostavni agent temeljen na upitima rijetko rješava više od polovice SWE-bench Lite problema.” Problem leži u nedostatku podataka koji predstavljaju ponašanje donošenja odluka u sekvencama. Međutim, istraživači su optimistični: “Vjerujemo da bi obuka ili fino podešavanje LLM-a mogli poboljšati njihove interaktivne sposobnosti debugginga.”

  • Istraživači planiraju razviti model koji će se fokusirati na prikupljanje potrebnih informacija za rješavanje grešaka.
  • Obećavaju otvoreno dijeljenje alata debug-gym kako bi olakšali slična istraživanja drugim znanstvenicima.

Zaključak: Vrijednost AI za Razvojne Programere

Unatoč očekivanjima, umjetna inteligencija možda trenutno ne nudi toliko koristi u svakodnevnom radu programerima koliko to AI kompanije sugeriraju. “Većina programera provodi većinu svog vremena rješavajući greške u kodu,” naglašavaju istraživači, sugerirajući da, iako uživaju u generaciji koda, ne ostvaruju veliki uštedu vremena.

Kako se tehnologija razvija, tako se i AI modeli mogu usavršavati, a budućnost bi mogla donijeti efikasnije alate koji će programerima pomoći u svakodnevnim izazovima.

Total
0
Shares
Odgovori

Vaša adresa e-pošte neće biti objavljena. Obavezna polja su označena sa * (obavezno)

Previous Post

Nikad nisam bio više uzbuđen da dobijem novi prijenosni uređaj: Intelov novi grafički upravljač navodno pruža bolju izvedbu MSI Claw 8 AI+

Next Post

Samsung Galaxy Fold 7 se približava – 5 novih stvari koje smo saznali prema najnovijim glasinama

Related Posts