Разработка и реализация алгоритма автоматизированного распознавания поэтических образов

Семинар: Информационные технологии в задачах филологии и компьютерной лингвистики
Начало заседания: 17:30

Дата выступления: 10 Октябрь 2018

Организация: ИВТ СО РАН

Авторы: Лучко Лилия Георгиевна

Проблема автоматизированного анализа семантического уровня поэтических текстов включает в себя, в частности, задачу выявления использованных автором поэтических образов. Ввиду сложности и слабой формализуемости этой задачи необходимо построить программное приложение для распознавания поэтических образов, обладающее возможностью самообучаться и самосовершенствоваться. При решении поставленной задачи целесообразно использовать нейросеть, которая должна обладать базой знаний, необходимой и достаточной для реализации процесса обучения. К данной базе знаний относятся следующие базы данных: поэтических образов, синонимов и словоформ. Эти базы данных учитывают структуру словарей, то есть отражают отношение симметричности для поэтических образов, а также симметричности и транзитивности для синонимов.

В процессе исследования был разработан алгоритм распознавания поэтических образов, основанный на построении правила распознавания, которое формируется исходя из обучающей выборки, с учётом ошибки при распознавании данной выборки, что позволяет найти оптимальное правило распознавания. Кроме того, словарь синонимов и словоформ применяется для выявления синонимических последовательностей поэтических образов, находящихся в различных формах.

Актуальность и новизна данной работы состоит в создании модели словарей поэтических образов и синонимов, которые лежат в основе соответствующих баз данных, разработке и реализации алгоритма распознавания поэтических образов с использованием вышеперечисленных баз данных, а также интеграции данного набора программ в систему автоматизации анализа русских поэтических текстов.