Ученые разработали алгоритм, который позволяет на основе лексических данных автоматически реконструировать слова из протоязыков. Работа опубликована в журнале Proceedings of the National Academy of Sciences, а ее краткое содержание приводит NatureNews.
На первом этапе программа автоматически распознает однокоренные слова, а затем пытается восстановить их в той форме, в какой они присутствовали в протоязыке. При этом она основывается на некоторых правилах, управляющих сохранением и изменением отдельных звуков в словах. Модель эволюции, создаваемая программой, имеет вероятностный характер и разные ее элементы могут иметь большую или меньшую статистическую значимость.
В качестве теста нового алгоритма ученые построили древо происхождения австронезийских языков. Эти языки преимущественно распространены на территории Тихого океана, но к западу встречаются вплоть до Мадагаскара. Около 300 миллионов человек говорят на этих языках
Программа проанализировала более 140 тысяч слов в 637 языках этой семьи, построило дерево их происхождения и восстановило лексику нескольких протоязыков в основании этого дерева. По словам авторов, при сравнении полученных результатов с данными лингвистов их точность составила около 85 процентов.
Специалисты, опрошенные NatureNews, считают такую точность хорошей для облегчения работы лингвистов, однако все равно рассматривают модели, составляемые программой, только в качестве приблизительных.