Pojava proteina i inovacije u znanosti
Proteini su se prvi put pojavili na Zemlji prije otprilike 3,7 milijardi godina, a od tada je priroda oblikovala te molekule u ono što danas poznajemo. No, što ako postoji način da taj proces umjetno oponašamo – samo mnogo brže?
Revolucija uz pomoć umjetne inteligencije
Grupa istraživača iz tvrtke EvolutionaryScale tvrdi da je upravo to učinila koristeći moć umjetne inteligencije (AI). U svom radu razvili su kod za potpuno nov fluorescentni protein. Proteini se sastoje od dugih lanaca aminokiselina, a stručni naziv za to je sekvenca. Razlike u ovim sekvencama određuju konačnu strukturu i funkciju proteina.
Istraživači navode kako “[a] konsenzus se razvija da podloga ovim sekvencama predstavlja temeljni jezik biologije proteina koji se može razumjeti pomoću jezičnih modela.” Ako je to točno, moglo bi biti moguće generirati sekvence potpuno novih proteina, potencijalno vrlo različitih u strukturi i funkciji od onih koje već postoje.
Što je ESM3?
Njihov pristup razumijevanju ovog jezika zove se ESM3, multimodalni generativni jezični model. U jednostavnim terminima, to je vrsta generativne AI – poput raznih GPT modela OpenAI-a – ali umjesto da ga tražite da napiše vašu zadaću poput ChatGPT-a, ovaj model generira kod za protein. Trenirali su ga na 771 milijardi jedinstvenih tokena – što je AI termin za jedinicu podataka – uzetih iz baza podataka prirodnih sekvenci i struktura proteina, kao i nekih generiranih sintetičkih sekvenci.
Podaci su sadržavali ukupno 3,15 milijardi sekvenci proteina, 236 milijuna struktura proteina i 539 milijuna proteina s anotacijama funkcija.
Prvo uspješno generiranje nove sekvence proteina
Nakon toga, sljedeći korak bio je provjeriti može li generirati potpuno novu sekvencu proteina. Tim je zatražio od modela da generira nove fluorescentne proteine, pružajući mu nepotpun recept i zadaću da popuni praznine. I uspjeli su – model je stvorio sekvencu i strukturu za prethodno nepoznatu varijantu zelenog fluorescentnog proteina (GFP), koja se često koristi u istraživanjima stanične i molekularne biologije, nazvanu esmGFP.
Izvanredno otkriće
Prema podacima iz EvolutionaryScale, ovaj novi protein “predstavlja ogroman evolucijski korak od prirodnih fluorescentnih proteina,” dijeleći samo 53% sličnosti u sekvenci u usporedbi s najbližim prirodno postojećim proteinom, eqFP578, pronađenim u anemonama. Istraživački tim tvrdi da je ova divergencija “do određene mjere ekvivalentna simulaciji evolucije od preko 500 milijuna godina.”
Međutim, ne slažu se svi s tim. Profesorica mikrobiološke ekologije i evolucije na Sveučilištu Bath, Tiffany Taylor, koja nije bila uključena u studiju, napisala je u Live Scienceu 2024. godine (kada je studija još bila u fazi preprinta) da “je inženjering proteina vođen AI-jem zanimljiv, no ne mogu se oteti osjećaju da bismo mogli biti previše samouvjereni u pretpostavci da možemo nadmašiti složene procese oblikovane milijunima godina prirodne selekcije.”
Što budućnost donosi?
Ipak, kako kaže Taylor, ovo je zanimljiva koncepcija – ali čemu bi konkretno bila korisna? Na web stranici EvolutionaryScale piše da je njihov model “alat za znanstvenike kako bi zamislili proteine za hvatanje ugljika, enzime koji razgrađuju plastiku i nova liječenja.” Međutim, još uvijek nema jamstva da će se ovo na kraju pretvoriti u stvarnost. Za sada, novo otkriveni protein ostaje “generiran” samo u smislu AI-ja.
Ova značajna otkrića i njihova potencijalna primjena otvaraju vrata novim mogućnostima koje bi mogle revolucionirati znanstvena istraživanja i medicinske tretmane u budućnosti. Studija je objavljena u časopisu Science.