Разработка программного средства для автоматического анализа поэтических текстов

Семинар: Информационно-вычислительные технологии в задачах поддержки принятия решений
Начало заседания: 11:00

Дата выступления: 22 Октябрь 2013

Организация: НГУ

Авторы: Алексей Забайкин

При исследовании естественного языка часто прибегают к многоуровневой модели информации, включающей в себя статистику, синтаксис, семантику, прагматику и апобетику. При этом наличие в некотором сообщении информации высокого уровня, в том числе и фактографической, влечет за собой наличие информации всех низших высоких уровней. Но в обратную сторону данная зависимость далеко не всегда верна. Так, для сообщения научного жанра практически не наблюдается зависимости понимания значения, действия и результата действия сообщения от языка, на котором написано сообщение. Однако для некоторых типов сообщения такая зависимость весьма велика. Это относится, например, к сообщениям (текстам) художественного жанра, прежде всего, – к поэтическим текстам. Особенность анализа поэтических стихов является предметом исследования в докладе. Для выявления фактографической информации последовательно рассматриваются синтаксический уровень, семантический уровень, семантический и прагматический уровни и соответствующая корреляция с ритмом, фонетикой, лексикой, грамматикой и тематикой сообщения. Характерной особенностью анализа является высокая трудоёмкость, предполагающая использование корпусов поэтических текстов большого объёма, что влечёт за собой широкое использование техник data-mining для выявления закономерностей и построения новых правил. В результате работы предложено программное средство для автоматического анализа поэтических текстов, которое позволяет существенно расширить возможности филологов, в том числе уменьшить зависимость качества сравнительного анализа от личной эрудиции исследователя, а также применять различные методы интеллектуального анализа данных.