Ученые из Ланкастерского университета (Великобритания) получили грант в размере 914 тысяч фунтов стерлингов на разработку трехуровнего программного обеспечения, которое сможет извлекать из художественных текстов элементы для геолокации и на их основе строить анимированные 3D-изображения соответствующих мест. В частности, при помощи такой системы планируется создать анимированную карту Средиземья на основе книг Дж. Р. Р. Толкина.
Как пишет N+1, работа над системой будет включать три этапа. Первый год уйдет на обработку массива текстов - на этом этапе программа будет учиться находить вербальные элементы, которые подходят для визуализации, и переводить их в формат XML. В течение второго года программа будет учиться ужимать каждый литературный текст до XML-описания определенных местностей и с помощью алгоритмов 3D-моделирования создавать для него визуальный географический справочник. На третий год программа займется визуализацией конкретных сцен в соответствии с сюжетом произведения с использованием программного обеспечения для игровых движков.
Результатом реализации проекта станет сайт, который будет содержать большую картографическую базу. Она, как считает руководитель проекта Салли Бушелл, окажет важное влияние на процесс образования. Авторы проекта полагают, что их разработка не заменит процесс чтения визуализацией, но поможет сопоставлять прочитанный текст с его 3D-проекцией.
Отметим, что визуализацией художественных текстов при помощи машинного обучения занимаются и другие исследователи. Так, ранее литературоведы из Университета Честера и Ланкастерского университета уже совмещали цифровую обработку текстов с данными геоинформационных систем. В ходе работы они анализировали путевые дневники англичан, путешествовавших по Озерному краю в XVIII веке, чтобы выяснить, насколько эмоциональное описание тех или иных участков местности зависит от реального маршрута путешественника.