Разработка и реализация алгоритмов компьютерного анализа метроритмических характеристик русских поэтических текстов

Семинар: Информационные технологии в задачах филологии и компьютерной лингвистики
Начало заседания: 17:30

Дата выступления: 10 Апрель 2019

Организация: НГУ

Авторы: Кузнецова Ирина Владимировна

В литературоведении существует необходимость автоматизации анализа различных уровней структуры стиха, а также автоматизированного составления на основе такого анализа метрических справочников к корпусам стихов, словарей рифм и конкордансов.

В докладе описаны алгоритмы и реализация программного модуля, отвечающего за анализ структурного уровня стихотворения: метра, стопности и рифмы.
Алгоритм определения метра и стопности учитывает проблему неоднозначности расстановки ударений в омографах, возможные пропуски схемных ударений (пиррихии), наложение сверхсхемных ударений (спондеи), которые решаются методом “по аналогии”.

Также описан алгоритм выявления переноса ударения с одной части речи на другую (проклитик). Для выполнения задачи составлена база данных проклитик на основе словаря академика А.А. Зализняка.

Алгоритм поиска рифм реализован из соображений возможности образования рифмы: строки рифмуются, если у последних слов в строке одинаковая позиция ударного слога и фонетически совпадают окончания. Результатом работы алгоритма определения рифмы является установление строфики стихотворения. Алгоритм реализован на языке Python и протестирован на корпусе стихотворений А.С. Пушкина (период творчества 1818-1825).