Sveprisutni prevoditelji su na dohvat ruke dok Facebookov Meta otkriva svoju tehnologiju koja može prevoditi između 101 jezika

Revolucionarna Metaova AI prevoditeljica SeamlessM4T

U kolovozu 2023. godine, Meta je predstavila svoju najnoviju inovaciju – AI model za prevođenje koji može razumjeti gotovo 100 različitih jezika. Ovaj model, poznat kao SeamlessM4T (Massively Multilingual and Multimodal Machine Translation), predstavlja Metaovu ambiciju da stvori ‘univerzalnog prevoditelja’, sličnog Babel Fish-u iz klasika Douglas Adamsa, Vodič kroz galaksiju za autostopere.

Što je SeamlessM4T?

SeamlessM4T je sveobuhvatni alat koji omogućuje:

  • prevođenje teksta u tekst
  • prevođenje govora u tekst
  • prevođenje govora u govor
  • prevođenje teksta u govor

Ova napredna tehnologija pokriva impresivan, i dalje rastući, spektar jezika išilazi iz okvira tradicionalnih sustava prevođenja.

Prednosti SeamlessM4T

Jedna od ključnih prednosti SeamlessM4T-a je njegovo jedinstveno rješenje koje prevladava ograničenja klasičnih kaskadnih sustava, koji često zahtijevaju zasebne pod sustave za prepoznavanje govora, prevođenje i sintezu teksta u govor. Meta navodi kako ovaj alat nadmašuje postojeće modele, postižući čak do 23% više BLEU (Bilingual Evaluation Understudy) rezultata u točnosti prevođenja.

Tehnologija iza SeamlessM4T

Da bi razvili SeamlessM4T, tim je analizirao 4 milijuna sati multijezičnog sirovog audio sadržaja dobivenog iz javno dostupne baze podataka. Izradili su SeamlessAlign, multimodalni korpus koji sadrži više od 470,000 sati usklađenog govora i kombinirali ga s najsuvremenijim tehnikama strojnog učenja. Ova kombinacija uključuje SONAR (Sentence-level Multimodal and Language-Agnostic Representations) embeding, koji omogućuje multijezično i modalno agnosticno kodiranje za tekst i govor.

Etika i društveni izazovi

Važno je napomenuti da Meta nastoji riješiti i društvene te etičke izazove korištenjem zaštitnih mehanizama unutar SeamlessM4T-a. Ove zaštite smanjuju rodnu pristranost – greške u određivanju gramatičkog roda – i ublažavaju problem dodane toksičnosti, gdje uvredljive riječi mogu biti prisutne u prijevodima, ali ne i u izvornoj verziji teksta.

Zaključak

SeamlessM4T predstavlja značajan korak naprijed u svijetu prevođenja i komunikacije. Uz njegovu sposobnost podržavanja različitih jezika i oblika prijevoda, Meta stvara temelj za globalnu interakciju koja je pristupačnija i kvalitetnija. Ovaj alat bi mogao revolucionirati način na koji komuniciramo preko jezičnih barijera, čineći svijet malo manjim mjestom.

Total
0
Shares
Odgovori

Vaša adresa e-pošte neće biti objavljena. Obavezna polja su označena sa * (obavezno)

Previous Post

Pompejeve najgore dane, zajedničko mokrenje i najbolji dinosaur film?

Next Post

FBI tvrdi da radnici iz Sjeverne Koreje hakiraju američke tvrtke koje su ih angažirale

Related Posts