Revolucija u AI: DeepSeek i SambaNova postavljaju nove standarde
U 2025. godini, kineski AI startup DeepSeek brzo je stekao reputaciju s svojim R1 modelom otvorenog koda, koji se ističe usporedivim performansama s vrhunskim industrijskim modelima, ali uz znatno niže troškove. Ovaj veliki jezični model sposoban je za napredne zadatke razmišljanja i pokazuje izvanredne rezultate u području umjetne inteligencije.
SambaNova donosi najbržu implementaciju AI tehnologije
SambaNova Systems, AI startup osnovan 2017. godine od strane stručnjaka iz Sun/Oracle i Stanford univerziteta, nedavno je objavio da je ostvario najbržu dozvolu za primjenu DeepSeek-R1 671B LLM do sada. Prema tvrdnjama kompanije, njihova platforma je postigla brzinu od 198 tokena po sekundi po korisniku koristeći samo 16 prilagođenih čipova, umjesto 40 stalaka s 320 Nvidia GPU-a koji bi obično bili potrebni.
Rodrigo Liang, izvršni direktor i suosnivač SambaNove, izjavio je: “Pokretani SN40L RDU čipom, SambaNova je najbrža platforma koja pokreće DeepSeek. Ova će brzina porasti do pet puta brže od posljednje GPU brzine na jednom staku – a do kraja godine, nuditi ćemo 100 puta veću kapacitet za DeepSeek-R1.”
Efikasnost umjesto uobičajenih GPU-ova
Iako su Nvidia GPU-ovi tradicija za velike AI poslove, SambaNova smatra da njihova reconfigurable dataflow arhitektura nudi učinkovitije rješenje. Kompanija tvrdi da njihovo hardversko rješenje isporučuje tri puta veću brzinu i pet puta veću efikasnost od vodećih GPU-a, a pri tome zadržava punu moć razmišljanja DeepSeek-R1.
Liang je istaknuo: “DeepSeek-R1 je jedan od najnaprednijih modela umjetne inteligencije, ali njegov puni potencijal bio je ograničen neučinkovitošću GPU-a. To se danas mijenja. Donosimo sljedeći veliki proboj – smanjenje troškova inferencije i smanjenje zahtjeva hardvera s 40 stalaka na samo jedan – kako bismo ponudili DeepSeek-R1 pri najbržim brzinama, učinkovito.”
Brzina u razmišljanju – ključno za AI modele
George Cameron, suosnivač firme za evaluaciju AI-a, Artificial Analysis, izjavio je da je njihova kompanija “neovisno mjerila cloud dozvolu SambaNove za puni model DeepSeek-R1 s 671 milijardom parametara na više od 195 output tokena/s, što je najveća brzina izlaza koju smo ikada izmjerili za DeepSeek-R1. Visoke brzine izlaza su posebno važne za modele razmišljanja, jer ovi modeli koriste output tokene za poboljšanje kvalitete svojih odgovora.”
DeepSeek-R1 671B sada je dostupan na SambaNova Cloud-u, s API pristupom za odabrane korisnike. Kompanija brzo povećava kapacitet i nada se da će uskoro doći do 20,000 tokena po sekundi ukupnog staklenog propusnog kapaciteta.
Zaključak
DeepSeek i SambaNova omogućavaju revoluciju u području umjetne inteligencije, postavljajući nove standarde performansi, efikasnosti i brzine. Ova inovacija ne samo da će unaprijediti tehnologiju razmišljanja, već i otvoriti vrata novim mogućnostima primjene AI modela. U očekivanju budućih unapređenja, sigurno smo da će ovaj napredni pristup oblikovati AI industriju u godinama koje dolaze.