https://frosthead.com

Искусственный интеллект терпит неудачу при расшифровке загадочной рукописи Войнича

Рукопись Войнича ставила в тупик криптографов с тех пор, как в начале 15-го века документ был вновь открыт польским книготорговцем в 1912 году. Рукописная 240-страничная страница, теперь размещенная в Библиотеке редких книг и рукописей Бейнеке Йельского университета, написана слева направо. на неизвестном языке. Кроме того, сам текст, вероятно, был зашифрован неизвестным кодом. Несмотря на многочисленные попытки взломать код некоторых из лучших в мире криптографов, включая Алана Тьюринга и команду Блетчли Парк, содержание загадочной книги долгое время оставалось загадкой. Но это не остановило людей от попыток. Последний, чтобы нанести удар? Лаборатория искусственного интеллекта в университете Альберты.

Боб Вебер из канадской прессы сообщает, что эксперт по обработке естественного языка Грег Кондрак и аспирант Брэдли Хауэр пытались определить язык, на котором рукопись была написана с использованием ИИ. Согласно пресс-релизу, команда первоначально считала, что рукопись была написана на арабском языке. Но после подачи ИИ, обученного распознавать 380 языков с точностью 97%, анализ частоты букв показал, что текст, скорее всего, был написан на иврите.

«Это было удивительно, - говорит Кондрак. Затем они выдвинули гипотезу, что слова были алфавитами, в которых буквы перемешаны, а гласные опущены. Когда они расшифровали первую строку текста, используя этот метод, они обнаружили, что 80 процентов созданных слов были найдены в ивритском словаре. Исследование появляется в журнале « Труды» Ассоциации компьютерной лингвистики .

Никто из исследователей не обучается древнему ивриту, поэтому Джордж Дворски из Gizmodo сообщает, что они взяли свою расшифрованную первую строку ученому-информатику Моше Коппелю, коллеге и носителю иврита. Он сказал, что это не сформировало связное предложение. После того, как команда исправила некоторые странные орфографические ошибки и провела их через Google Translate, они придумали что-то читаемое, даже если это не имеет особого смысла: «Она дала рекомендации священнику, мужу дома, мне и людям».

Вебер сообщает, что перевод другого раздела из 72 слов включал в себя слова «фермер», «свет», «воздух» и «огонь».

«Кто-то с очень хорошим знанием иврита и кто в то же время историк мог бы взять это свидетельство и следовать этой подсказке», - говорит Кондрак Веберу.

Но ученые Войнича настроены скептически. Средневековый Дамиан Флеминг из Университета Индианы и Университета Пердью в Форт-Уэйне был среди тех, кто ответил на новости о работе в социальной сети, особенно критикуя решение использовать Google Translate для расшифровки рукописи, а не для консультации с ивритским ученым.

* вой на войничном языке * pic.twitter.com/ObNXNpVTVy

- Дамиан ᚠ ל ε ᛗ ιn @ (@FW_Medieval) 30 января 2018 года

Эксперты, знакомые с рукописью Войнича и ее историей, имеют веские основания для выражения сомнений; на протяжении многих лет многие люди заявляли о том, что расшифровали рукопись, только чтобы доказать, что они ошибочны. Один из последних случаев произошел в прошлом году, когда любитель взлома кода Николас Гиббс заявил, что понял, что книга написана в основном на латинском языке. После заявления Гибба средневековые специалисты вышли из работы по дереву, чтобы оспорить его выводы, заявив, что теория аббревиатур не сводится к грамматически правильной латыни и не имеет смысла. Также кажется, что Гиббс выдвинул теорию, чтобы попытаться продать шоу о рукописи кабельной сети.

Хотя мы до сих пор не знаем, о чем говорится в книге, у исследователей есть несколько гипотез о том, о чем эта рукопись. Основываясь на книжных иллюстрациях о растениях и купающихся женщинах, многие ученые считают, что это медицинский учебник о здоровье женщин - предмет настолько загадочный, что его нужно было спрятать в одной из самых запутанных рукописей в мире.

Искусственный интеллект терпит неудачу при расшифровке загадочной рукописи Войнича