Tehnologija

2 minute read

Virtualni DPU unutar GPU-a: Može li pametan hardverski trik biti iza probojne učinkovitosti AI-a DeepSeeka?

30 siječnja, 2025

Revolucija u AI svijetu: DeepSeek V3 Chatbot iz Kine

Chatbot DeepSeek V3 iz Kine šokirao je tehnološku industriju kao vjerodostojna alternativa OpenAI-ovom ChatGPT-u, i to po značajno nižoj cijeni. Nedavna istraživanja otkrila su da je DeepSeek V3 treniran na klasteru od 2.048 Nvidia H800 GPU-a, koji su oslabljene verzije H100 modela. Možemo samo zamisliti koliko bi bio moćniji da se koristila AMD Instinct akceleracijska oprema!

Fantastična učinkovitost po niskoj cijeni

Prema izvještaju The Next Platform, DeepSeek je zahtijevao 2,79 milijuna GPU-sati za pretreniranje i fino podešavanje na impresivnih 14,8 trilijuna tokena, a trošak za cijeli taj proces iznosio je samo 5,58 milijuna dolara. Kako su developeri DeepSeek-a uspjeli ostvariti ovaj nevjerojatan rezultat? Odgovor leži u pametnom pristupu i inovacijama.

Inovativna arhitektura: Mixture-of-Experts (MoE)

DeepSeek koristi napredni model Mixture-of-Experts (MoE) koji optimizira performanse selektivnim aktiviranjem samo najrelevantnijih dijelova svoje arhitekture za svaki zadatak. Treća verzija modela, DeepSeek V3, sadrži ukupno 671 milijardu parametara, ali aktivira samo 37 milijardi za predikciju pojedinog tokena. Ova selektivna aktivacija drastično smanjuje računarske troškove, a pritom zadržava visoku razinu performansi i točnosti – što ćete osjetiti kada ga isprobate.

Kako DeepSeek optimizira korištenje resursa

Iako je lako biti skeptičan prema DeepSeek-u i tvrdnjama vezanima uz njegov trening, istraživanje otkriva neke od inovacija koje su developeri uvrstili kako bi maksimizirali potencijal slabijih hardverskih resursa. Jedna od ključnih inovacija je algoritam DualPipe koji omogućava učinkovitu paralelnost u procesiranju podataka.

DualPipe preklapa unaprijed i unatrag izračun, smanjuje latenciju i optimizira prijenos podataka između GPU-a.
Ovaj sustav upravlja komunikacijom na učinkovit način, minimizirajući besposleno vrijeme i dinamički balansirajući GPU jezgre između izračuna i komunikacije.
Osigurava da prijenos podataka ne postane usko grlo prilikom skaliranja modela.

Jedan komentar na The Next Platform opisuje DualPipe kao “u suštini kreiranje virtualnog DPU-a na samom GPU-u za upravljanje komunikacijom među svim komponentama”, ističući njegovu ključnu ulogu u optimizaciji učinkovitosti prijenosa podataka.

Zaključak

DeepSeek V3 predstavlja značajan iskorak u razvoju chatbot tehnologija, nudeći visoke performanse uz minimalne troškove. S inovativnim algoritmima poput DualPipe i inteligentnom arhitekturom Mixture-of-Experts, ovaj chatbot može promijeniti igru u svijetu umjetne inteligencije. U vremenima kada su troškovi modela ključni, DeepSeek pokazuje put naprijed.

Odgovori Otkaži odgovor

Pametni telefoni

Kada je u pitanju video s pametnih telefona, iPhoneovi bi i dalje mogli biti kraljevi snimanja.

30 siječnja, 2025

2 minute read

Tehnologija

Gdje kupiti Nvidia RTX 5090: dan lansiranja je danas, a ovo su trgovci koje bih provjerio

30 siječnja, 2025

2 minute read

Izabrano samo za vas Najčitanije vijesti

Ova mala nadogradnja mogla bi biti izvrsna za Samsung Galaxy Z Fold 7

Lažni pozivni IT podrške dovode do cyber iznude i ukradene tvrtkine podatke

Google Pixel 10 serija boja je upravo procurila; koje nijanse su vam zapadle za oko?

Virtualni DPU unutar GPU-a: Može li pametan hardverski trik biti iza probojne učinkovitosti AI-a DeepSeeka?

Revolucija u AI svijetu: DeepSeek V3 Chatbot iz Kine

Fantastična učinkovitost po niskoj cijeni

Inovativna arhitektura: Mixture-of-Experts (MoE)

Kako DeepSeek optimizira korištenje resursa

Zaključak

Odgovori Otkaži odgovor

Previous Post

Kada je u pitanju video s pametnih telefona, iPhoneovi bi i dalje mogli biti kraljevi snimanja.

Next Post

Gdje kupiti Nvidia RTX 5090: dan lansiranja je danas, a ovo su trgovci koje bih provjerio

Ova mala nadogradnja mogla bi biti izvrsna za Samsung Galaxy Z Fold 7

Lažni pozivni IT podrške dovode do cyber iznude i ukradene tvrtkine podatke

Google Pixel 10 serija boja je upravo procurila; koje nijanse su vam zapadle za oko?

Microsoft pokreće besplatnu zaštitu od cyber prijetnji za europske vlade protiv AI prijetnji i drugih

Veliki bijeli morski pas umire nakon samo TRI dana u zatočeništvu

Google planira da njegova AI piše vaše e-mailove umjesto vas

Shell širi poslovanje u infrastrukturu podataka lansiranjem tekućine dizajnirane za hlađenje visokodensnih čipova korištenih u AI računanju

Magnetne zavjese široke kao grad viđen na suncu u nepredviđenim otkrićima

Virtualni DPU unutar GPU-a: Može li pametan hardverski trik biti iza probojne učinkovitosti AI-a DeepSeeka?

Revolucija u AI svijetu: DeepSeek V3 Chatbot iz Kine

Fantastična učinkovitost po niskoj cijeni

Inovativna arhitektura: Mixture-of-Experts (MoE)

Kako DeepSeek optimizira korištenje resursa

Zaključak

Odgovori Otkaži odgovor

Previous Post

Next Post

Related Posts