Искусственный интеллект удалось адаптировать для литературного анализа текстов

6 апреля 2023 года

Исследователи из России разработали подход, позволяющий применять искусственный интеллект для автоматического анализа литературных произведений. Система может определить тип персонажей по репликам и описанию, а также раскрыть характер их взаимоотношений. Метод можно использовать для обучения цифровых помощников и решения других задач, сообщила в среду пресс-служба Института искусственного интеллекта AIRI.

"Содержащийся в исследовании набор шагов можно использовать для извлечения именованных сущностей и их взаимосвязей из других текстов. С помощью описанных методов можно выполнять ряд практических задач. Например, проводить анализ нормативной документации и суммаризацию юридических текстов, чтобы переписывать сложные документы простым и понятным обычному человеку языком", - говорится в сообщении.

Группа исследователей под руководством старшего научного сотрудника Института искусственного интеллекта AIRI (Москва) Ильи Макарова приспособила уже существующие нейросетевые алгоритмы для литературного анализа текстов, а также распознавания персонажей и определения характера их взаимоотношений. Для этого ученые применили теорию графов и так называемые NER-алгоритмы, одну из форм компьютерной обработки естественного языка.

Исследователи проверили работу подхода на "Властелине колец" и других произведениях Джона Рональда Руэла Толкина. После обучения система ИИ успешно распознала то, в каких отношениях находились свыше 880 наименованных сущностей в книгах британского писателя, а также научилась узнавать их по репликам.

Аналогичным образом, как отмечают Макаров и его коллеги, можно анализировать любые другие сложные и объемные литературные произведения, а также другие типы текстов, в том числе имеющие важное историческое или юридическое значение. Это позволит использовать системы ИИ для подготовки кратких и удобочитаемых изложений подобных документов, а также глубокого анализа правовых норм, подытожили ученые.

Источник: ТАСС