Treba li se Nvidia brinuti? Hrabri konkurent za inferenciju zamjenjuje 320 Nvidia GPU-a s 16 rekonfigurabilnih jedinica podatkovnog toka

Revolucija u AI: DeepSeek i SambaNova postavljaju nove standarde

U 2025. godini, kineski AI startup DeepSeek brzo je stekao reputaciju s svojim R1 modelom otvorenog koda, koji se ističe usporedivim performansama s vrhunskim industrijskim modelima, ali uz znatno niže troškove. Ovaj veliki jezični model sposoban je za napredne zadatke razmišljanja i pokazuje izvanredne rezultate u području umjetne inteligencije.

SambaNova donosi najbržu implementaciju AI tehnologije

SambaNova Systems, AI startup osnovan 2017. godine od strane stručnjaka iz Sun/Oracle i Stanford univerziteta, nedavno je objavio da je ostvario najbržu dozvolu za primjenu DeepSeek-R1 671B LLM do sada. Prema tvrdnjama kompanije, njihova platforma je postigla brzinu od 198 tokena po sekundi po korisniku koristeći samo 16 prilagođenih čipova, umjesto 40 stalaka s 320 Nvidia GPU-a koji bi obično bili potrebni.

Rodrigo Liang, izvršni direktor i suosnivač SambaNove, izjavio je: “Pokretani SN40L RDU čipom, SambaNova je najbrža platforma koja pokreće DeepSeek. Ova će brzina porasti do pet puta brže od posljednje GPU brzine na jednom staku – a do kraja godine, nuditi ćemo 100 puta veću kapacitet za DeepSeek-R1.”

Efikasnost umjesto uobičajenih GPU-ova

Iako su Nvidia GPU-ovi tradicija za velike AI poslove, SambaNova smatra da njihova reconfigurable dataflow arhitektura nudi učinkovitije rješenje. Kompanija tvrdi da njihovo hardversko rješenje isporučuje tri puta veću brzinu i pet puta veću efikasnost od vodećih GPU-a, a pri tome zadržava punu moć razmišljanja DeepSeek-R1.

Liang je istaknuo: “DeepSeek-R1 je jedan od najnaprednijih modela umjetne inteligencije, ali njegov puni potencijal bio je ograničen neučinkovitošću GPU-a. To se danas mijenja. Donosimo sljedeći veliki proboj – smanjenje troškova inferencije i smanjenje zahtjeva hardvera s 40 stalaka na samo jedan – kako bismo ponudili DeepSeek-R1 pri najbržim brzinama, učinkovito.”

Brzina u razmišljanju – ključno za AI modele

George Cameron, suosnivač firme za evaluaciju AI-a, Artificial Analysis, izjavio je da je njihova kompanija “neovisno mjerila cloud dozvolu SambaNove za puni model DeepSeek-R1 s 671 milijardom parametara na više od 195 output tokena/s, što je najveća brzina izlaza koju smo ikada izmjerili za DeepSeek-R1. Visoke brzine izlaza su posebno važne za modele razmišljanja, jer ovi modeli koriste output tokene za poboljšanje kvalitete svojih odgovora.”

DeepSeek-R1 671B sada je dostupan na SambaNova Cloud-u, s API pristupom za odabrane korisnike. Kompanija brzo povećava kapacitet i nada se da će uskoro doći do 20,000 tokena po sekundi ukupnog staklenog propusnog kapaciteta.

Zaključak

DeepSeek i SambaNova omogućavaju revoluciju u području umjetne inteligencije, postavljajući nove standarde performansi, efikasnosti i brzine. Ova inovacija ne samo da će unaprijediti tehnologiju razmišljanja, već i otvoriti vrata novim mogućnostima primjene AI modela. U očekivanju budućih unapređenja, sigurno smo da će ovaj napredni pristup oblikovati AI industriju u godinama koje dolaze.

Total
0
Shares
Odgovori

Vaša adresa e-pošte neće biti objavljena. Obavezna polja su označena sa * (obavezno)

Previous Post

Ove nove jeftine ANC slušalice iz pouzdane marke izgledaju kao nevjerojatna vrijednost – 90 sati trajanja baterije, Hi-Res Audio, prostorni zvuk… sve za 50 dolara

Next Post

GoPro predstavlja mnogo jeftiniju 360-stupanjsku kameru, ali to nije potpuno nova Max 2 koju smo čekali

Related Posts