Pogled na nevjerojatnu Nvidia GPU koja pokreće globalnu ambiciju DeepSeekove AI.

Šokantni Uspon Kineskog AI Giga Igrača: DeepSeek

U svijetu tehnologije, često se pretpostavljalo da će Sjedinjene Američke Države ostati nesporno globalno vodstvo u oblasti umjetne inteligencije (AI), posebno nakon nedavne najave predsjednika Donalda Trumpa o Projektu Stargate – inicijativi vrijednoj 500 milijardi dolara za jačanje AI infrastrukture unutar SAD-a. Međutim, ovotjedno predstavljanje kineskog DeepSeek-a zabilježilo je dramatičnu promjenu koja može preokrenuti ravnotežu u ovom sektoru.

Udarac na Tržištu

DeepSeek, razvijen po znatno nižim troškovima od svojih američkih konkurenata, iznenadio je tehnologijske analitičare svojom pojavom na tržištu. Njegov utjecaj bio je tako značajan da je uzrokovao gubitak od 1 trilijuna dolara na tržištu američkih tehnoloških dionica, pri čemu je Nvidia bila najveća žrtva.

Tajna Istraživanja i Razvoj

Iako je očito da sve što dolazi iz Kine nosi element tajnosti, nedavno objavljeni tehnički rad pruža uvid u tehnologiju koja pokreće kinesku verziju ChatGPT-a. Godine 2022., SAD je blokirao uvoz naprednih Nvidia GPU-a u Kinu kako bi stegnuo kontrolu nad kritičnom AI tehnologijom. Nažalost, ovaj potez nije sprječio razvoj DeepSeek-a.

Tehnološke Specifikacije DeepSeek-a

Prema spomenutom radu, DeepSeek je obučavao svoj model V3 na klasteru od 2,048 Nvidia H800 GPU-a, koji su oslabljene verzije H100. H800 je pušten u promet u ožujku 2023. kako bi se prilagodio američkim izvozničkim restrikcijama prema Kini, a nudi 80 GB HBM3 memorije i propusnost od 2 TB/s. Iako zaostaje iza novijeg H200, koji omogućava 141 GB HBM3e memorije i 4.8 TB/s propusnosti, te AMD-ovog Instinct MI325X, koji nadmašuje oba s 256 GB HBM3e memorije i 6 TB/s propusnosti, H800 i dalje nudi solidne performanse.

  • U klasteru na kojem je DeepSeek treniran, svaki čvor sadrži 8 GPU-a povezanih putem NVLink-a i NVSwitch-a za međunodalnu komunikaciju.
  • InfiniBand konekcije omogućavaju komunikaciju između čvorova.
  • Međutim, H800 ima nižu NVLink propusnost u usporedbi s H100, što utječe na performanse višestrukih GPU-a.

Troškovi i Učinkovitost

Za obuku modela DeekSeek-V3 bilo je potrebno ukupno 2.79 milijuna GPU-sati uz korištenje naprednih tehnika poput cjevovodne i podatkovne paralelizacije, optimizacije memorije i inovativnih kvantizacijskih tehnika. Prema The Next Platform, trošak obuke modela V3 iznosio je samo 5.58 milijuna dolara, ukoliko se uzme u obzir cijena od 2 dolara po GPU satu. No, ostaje nejasno radi li se o tržišnoj cijeni u Kini.

Zaključak: Budućnost Umjetne Inteligencije

Kako se tržište umjetne inteligencije nastavlja razvijati, a konkurencija između Sjedinjenih Američkih Država i Kine postaje sve intenzivnija, ostaje da se vidi kako će novi igrači poput DeepSeek-a oblikovati budućnost ove dinamične industrije. Jedno je sigurno: uspon kineskih tehnologija donosi zanimljive promjene i izazove u svijetu umjetne inteligencije.

Total
0
Shares
Odgovori

Vaša adresa e-pošte neće biti objavljena. Obavezna polja su označena sa * (obavezno)

Previous Post

Nova prijetnja preuzimanjem Chrome preglednika mogla bi utjecati na milijarde korisnika – evo kako se boriti protiv toga

Next Post

Zeekr-ov novi električni automobil ima ‘zlatnu bateriju’ koja se puni od 10-80% za samo devet minuta – što ga čini najbržim na svijetu

Related Posts