Kako je ljudski igrač pobijedio napredni Go AI
U svijetu društvenih igara, dominira fascinantna priča o tome kako je napredni algoritam strojnog učenja, poznat kao AlphaGo Zero, savladao igru Go. Samouki algoritam, razvijen od strane Googlea, uspio je postati svjetski prvak u ovoj kompleksnoj igri za samo tri dana, što je dodatno uzdrmalo profesionalne ljudske igrače koji su godine provodili usavršavajući svoje vještine, samo da bi ih ‘robot’ pobijedio.
Pobjede i izazovi protiv AI-a
AlphaGo Zero nije bio samo brz, već je nadmašio čak i svoju prethodnu verziju koja je već bila u stanju pobijediti svjetske prvake. “Pobijedio je verziju AlphaGo koja je pobijedila svjetskog prvaka Lee Sedola, i to rezultatom od sto pobjeda prema nuli”, objasnio je vođa istraživačkog tima u videu iz 2017. godine.
No, ljudske vještine nisu izašle iz igre. Jedan igrač Go-a, koji se nalazi na razini ispod najvišeg amaterskog ranga prema Financial Timesu, uspio je pobijediti AI igrača KataGo u 14 od 15 mečeva. Kako je to ljudima uspjelo? Uz malo pomoći od… strojnog učenja.
Stvoreni “protivnici” za istraživanje slabosti
Tim istraživača, koji je objavio preliminarne rezultate svog rada, trenirao je vlastite AI “protivnike” kako bi istraživali slabosti u sustavu KataGo. “Naša vještina ne leži u tome da pobijedimo igrajući bolje od KataGo – naši protivnici lako gube od amaterskih igrača,” napisali su u svom radu. “Umjesto toga, naši protivnici pobjeđuju zavaravanjem KataGo-a da napravi ozbiljne greške.”
- Princip strategije koju su razvili uključivao je stvaranje velikih petlji oko kamenčića AI-a dok su u isto vrijeme ‘odvraćali’ pažnju AI-a postavljanjem poteza na drugih dijelovima ploče.
- Rezultati su pokazali da AI gubi 97-99% vremena, ovisno o verziji KataGo-a koja je korištena.
Kellin Pelrine, jedan od autora rada, uspješno je iskoristio ovu strategiju da bi dosljedno pobijedio računalnu protivnicu. Nakon što je naučio strategiju, više nije bilo potrebno dodatno oslanjanje na AI.
Važne implikacije za sigurnost
Iako je pobijediti AI fascinantno, istraživači ističu kako rezultati imaju ozbiljnije implikacije. “Naši rezultati naglašavaju da poboljšanja u sposobnostima ne moraju nužno značiti i adekvatnu robusnost,” zaključila je ekipa. “Iako su neuspjesi u Go AI sustavima zabavni, slični neuspjesi u sustavima kritičnim za sigurnost, poput automatiziranog financijskog trgovanja ili autonomnih vozila, mogu imati katastrofalne posljedice.”
Preprint studije objavljen je na web stranici istraživača, pružajući dodatne uvide u ono što izaziva slabosti čak i najnaprednijih AI sustava.
Zaključak
Ova priča o ljudskoj pobjedi protiv stroja nije samo o igri, već i o važnosti razumijevanja sigurnosnih aspekata tehnologije koja nas okružuje. Uvijek je od vitalnog značaja kladiti se na ljudsku intuiciju, kroz inovaciju i istraživanje, kako bismo razumjeli i poboljšali naše sustave u budućnosti.