Razumijevanje Zipfova Zakona: Tajna Unutar Jezika
Ljudi vole misliti da smo nepredvidivo biće, do određene mjere vođeni slobodnom voljom koja proizađe iz fizičkih procesa. No, postoji jedna pomalo neobična činjenica koja bi vas mogla gurnuti u lingvističku egzistencijalnu krizu: većina jezika izgleda slijedi jednadžbu poznatu kao Zipfov zakon, a nitko ne zna zašto.
Što je Zipfov Zakon?
Riječima koje koristimo, očekivali bismo da će neke imati veću učestalost od drugih. Na primjer, riječ “the” koristi se mnogo češće od riječi “ekumenski” ili “phubbing”. Međutim, analiza učestalosti korištenja riječi u velikim tekstovima pokazuje da ona pomno prati određeni statistički zakon. Prije otprilike 80 godina, George Kingsley Zipf primijetio je da učestalost riječi izgleda kao funkcija zakona snage, formulirana kao f(r) ∝ 𝑟𝛼, gdje je f učestalost riječi, r je rang učestalosti, a 𝛼 eksponent. Jednostavno rečeno, najčešće korištena riječ u jeziku – u engleskom, “the” – korištena je dvostruko češće od sljedeće najčešće riječi, tri puta češće od one treće, i tako dalje, slijedeći ovaj zakon snage iznenađujuće dugo vremena.
Primjena na Različite Jezike
Možda mislite da je ovo neobična karakteristika engleskog jezika, no to nije tako. Zipfov zakon se čini da vrijedi za gotovo sve jezike koji su istraženi. Bez obzira pričate li engleski, hindi, francuski, mandarinski ili španjolski, učestalost riječi opada s obzirom na njezin popularnost. Što je još čudnije, ovaj zakon odnosi se čak i na jezike koje još nismo dešifrirali. Čak i riječi iz tajanstvenog Voynich Manuskripta čine se da slijede ovaj zakon.
Utjecaj na Velike Tekstove
Jedinični tekstovi, ako su dovoljno veliki, također će otprilike slijediti ove zakone, s najčešće korištenom riječi koja se pojavljuje dvostruko više od sljedeće, itd. Čak je i Charles Darwin teško umakao ovom fenomenu; analiza njegovog djela O podrijetlu vrsta pokazuje da se i tu zakon prilično lijepo uklapa. Ovaj zakon se pojavljuje svuda.
Zašto Je Ovaj Zakon Važan?
Dakle, to je prilično čudno, zar ne? “Vrijedno je razmišljati o neobičnosti ovog zakona,” objašnjava jedna recenzija ovog fenomena. “Sigurno je to ne trivijalna osobina ljudskog jezika da riječi variraju u učestalosti; moglo bi se smatrati razumnim očekivati da bi sve riječi trebale biti otprilike jednake učestalosti. No, s obzirom na to da riječi doista variraju, nije jasno zašto bi trebale slijediti tako precizan matematički zakon – osobito onaj koji ne uzima u obzir nijedan aspekt značenja svake riječi.”
Moguća Objašnjenja
- Statistički problemi
- Ograničenja koja nameće ljudsko pamćenje i vokabular
- Proporcija napora: govornici teže minimalizirati trud koristeći češće riječi, dok slušatelji traže jasnoću u manje korištenim riječima
- Razvoj jezika kroz vrijeme može stvoriti efekt snježne grudve gdje se popularne riječi dodatno populariziraju
Međutim, nijedno od ovih objašnjenja nije sveobuhvatno prihvaćeno, a uzrok ostaje pomalo misterij. Ako želite uroniti dublje u ovu lingvističku misteriju, možete unijeti vlastiti (dugi) tekst u kalkulator distribucije i provjeriti slijedi li Zipfov zakon. Možda vam se neće svidjeti koliko predvidiv vaš jezik može izgledati, ali ne brinite, čak i Shakespeareov Hamlet se čini da ga slijedi.
Zaključak
Zipfov zakon otvara vrata fascinantnim pitanjima o prirodi jezika i načinu na koji komuniciramo. Bez obzira na to jeste li lingvist ili samo znatiželjna osoba, razumijevanje ovog zakona može vam pružiti dublji uvid u strukturu jezika i naš svakodnevni govor.