Nova Era Memorijskih Tehnologija u Svijetu Umjetne Inteligencije
Ubrzan napredak snage procesiranja umjetne inteligencije (AI) označava skretanje prema novom poglavlju u razvoju memorijske tehnologije. Međutim, prema upozorenjima stručnjaka, ovaj napredak dolazi s određenim troškovima koji uključuju praktične i ekološke brige. Nedavna istraživanja Korea Advanced Institute of Science & Technology (KAIST) i Terabyte Interconnection and Package Laboratory (TERA) sugeriraju da bi do 2035. godine AI GPU akceleratori s 6TB HBM-a mogli postati stvarnost.
Novi Standardi Snage i Složenosti
Ove tehnički impresivne inovacije ističu visoke energetske zahtjeve i sve veću složenost u održavanju infrastrukture umjetne inteligencije. Plan razvoja pokazuje evoluciju od HBM4 do HBM8, koja će rezultirati značajnim poboljšanjima u propusnosti, stavljanju memorije i tehnikama hlađenja.
– **HBM4**: Počinje 2026. godine, Nvidia-ina Rubin i AMD-ove Instinct MI400 platforme uključivat će do 432GB memorije s propusnostima blizu 20TB/s. Ova vrsta memorije koristi direktno hlađenje tekućinom i prilagođene pakete kako bi podnijela gustoću snage od 75 do 80W po stogu.
– **HBM5**: Očekuje se 2029. godine i udvostručuje kanale ulaza/izlaza, a prelazi na hlađenje uranjanjem, s do 80GB po stogu koje troši 100W.
– **HBM6**: Predviđa se za 2032. godinu, povećava propusnost na 8TB/s i kapacitet stoga na 120GB, svaki zahtijevajući do 120W.
Ovi brojke brzo se povećavaju kada se uzmu u obzir cijeli GPU paketi koji bi mogli trošiti do 5,920W po čipu, u slučaju da se koristi 16 HBM6 stogova u sustavu.
Prijelomni Trenuci s HBM7 i HBM8
Kada dođe HBM7 i HBM8, brojke će doseći dotad nezamislive razmjere. HBM7, kojem se očekuje dolazak oko 2035. godine, trostruko povećava propusnost na 24TB/s i omogućava do 192GB po stogu. Ova arhitektura podržava 32 stoga memorije, dovodeći ukupni kapacitet preko 6TB, dok energetski zahtjev raste na 15,360W po paketu.
Srž problema leži u dramatičnom povećanju potrošnje energije, koja predstavlja sedmerostruki rast u samo devet godina. Na primjer, brojka od 15,36GW za milijun ovih uređaja u podatkovnom centru jednaka je cijeloj kapacitetu vjetroelektrana Ujedinjenog Kraljevstva za 2024. godinu.
HBM8, koji se predviđa za 2038. godinu, dodatno povećava kapacitet i propusnost na 64TB/s po stogu te kapacitet do 240GB, koristeći 16,384 I/O i brzine do 32Gbps.
Potražnja za Inovacijama u AI
Rastući zahtjevi AI i inferencija velikih jezičnih modela (LLM) potakli su istraživače na uvođenje pojava kao što su HBF (High-Bandwidth Flash) i HBM-centric računalstvo. Ovi dizajni predlažu integraciju NAND flash i LPDDR memorije u HBM stog, oslanjajući se na nove metode hlađenja i međusobne veze. Međutim, njihova izvedivost i učinkovitost u stvarnim uvjetima još uvijek trebaju biti potvrđeni.
Zaključak
Kako tehnologija pametnog procesiranja nastavlja napredovati, izazovi s potrošnjom energije i ekološkim stopama postaju sve važniji. Balansiranje inovacija i održivosti bit će ključno za budućnost memorijske tehnologije u svijetu umjetne inteligencije. U narednim godinama, vidjet ćemo kako se ovi izazovi mogu prevladati, što će definirati nove standarde za industriju.