​Naukowcy z MIT stworzyli nowy system, który wykorzystuje uczenie maszynowe, do pomocy rozszyfrowania języków, które nie przetrwały próby czasu.

Zdjęcie Naukowcy z MIT poznają zapomniane języki /123RF/PICSEL

Liczne badania sugerują, że większość języków istniejących na świecie nie jest dzisiaj używana, a dziesiątki martwych języków pozostają nierozpoznane. Lingwiści nie wiedzą wystarczająco dużo o gramatyce, słownictwie i składni tych języków.

Reklama

Badanie zapomnianych języków jest trudne, gdyż większości z nich nie ma do czego porównać. Niektórym z nich brakuje również opracowanych zasad gramatyki czy interpunkcji. Laboratorium Informatyki i Sztucznej Inteligencji MIT dokonało przełomu w rozszyfrowywaniu zapomnianych języków.



Uczeni opracowali nowy system, który był w stanie automatycznie rozszyfrować zapomniany język bez konieczności posiadania zaawansowanej wiedzy na temat jego relacji z innymi językami. System może określać związki między językami. Ostatnie rewelacje wskazują, że język iberyjski nie jest spokrewniony z baskijskim, jak do tej pory twierdzono.



- System opiera się na siedmiu zasadach opartych na historycznych spostrzeżeniach lingwistycznych. Zgodnie z tymi zasadami języki na ogół rozwijają się tylko w sposób przewidywalny - powiedziała Regina Barzilay, szefowa projektu z MIT.



W ewolucji języków rzadko dochodzi do dodania lub usunięcia całego dźwięku, a raczej następuje ich zastępowanie. Na przykład słowo z literą "P" w języku macierzystym może zmienić się na "B" w języku potomnym, ale jest mało prawdopodobne, by zmieniło się na "K".



Zdjęcie Zdjęcie ilustracyjne / 123RF/PICSEL

Wykorzystując te ograniczenia językowe, naukowcy z MIT opracowali algorytm odszyfrowujący, który jest w stanie poradzić sobie z ogromną przestrzenią możliwych transformacji.

Algorytm ten uczy się osadzać dźwięki językowe w wielowymiarowej przestrzeni, w której różnice w wymowie są odzwierciedlone pomiędzy odpowiadającymi im wektorami. System ma na celu segmentację słów w starożytnym języku i mapowanie ich do odpowiedników w powiązanym języku.