Исследователи из Альбертского университета (Канада) заявили, что при помощи нейросети смогли определить язык, на котором написан загадочный манускрипт Войнича, над расшифровкой которого специалисты со всего мира бьются уже несколько десятилетий. Статья канадских ученых была опубликована в журнале Transactions of the Association of Computational Linguistics .
Рукопись Войнича представляет собой иллюстрированный манускрипт, написанный в XV веке в Центральной Европе неизвестным автором. Свое название книга получила в честь коллекционера Уилфрида Войнича, который купил ее в 1912 году у иезуитов. Текст 240-страничной книги написан с помощью неизвестного алфавита и разбит на шесть разделов. Книга хранится в библиотеке Йельского университета.
По словам Гжегожа Кондрака, одного из соавторов исследования, созданный командой алгоритм для определения языка прошел тренировку на переведенной на 380 языков Всеобщей декларации прав человека, показав точность распознавания языка в 97%. После этого ученые применили алгоритм для анализа текста рукописи Войнича, и нейросеть сочла, что древняя книга была написана на иврите, однако автор не использовал гласные буквы и изменил порядок букв в каждом слове, сообщает CBCNews.
Исходя из этой гипотезы, исследователи попытались перевести первое предложение рукописи Войнича и получили следующий текст: "Она дала рекомендации священнику, хозяину дома, и мне, и людям". Кроме того, создатели нейросети утверждают, что среди первых 72 слов книги встречаются слова "крестьянин", "свет", "воздух" и "огонь". Это говорит в пользу гипотезы, что манускрипт Войнича мог служить фармакопеей, то есть сводом правил, которыми руководствуются при изготовлении, хранении и назначении лекарственных препаратов, пишет N+1.
Как отметил Кондрак, дальнейшая расшифровка текста книги потребует участия лингвистов - специалистов по ивриту, а если попытка увенчается успехом, то нейросеть можно будет использовать и для других подобных задач, например для расшифровки критских иероглифов.