Информационная энтропия поэтических текстов в задачах стилеметрии

Семинар: Информационные технологии в задачах филологии и компьютерной лингвистики
Начало заседания: 17:30

Дата выступления: 21 Февраль 2023

Организация: ФИЦ ИВТ (Новосибирск)

Авторы: Кожемякина Ольга Юрьевна

Одним из методов количественного анализа текста является его представление в виде временного ряда с последующим исследованием информационной энтропии текста. Исследование авторского стиля на основании энтропийных характеристик представляется перспективным направлением в области анализа информации поэтического текста. В рамках работы: проведены расчеты значений энтропии первого, второго и третьего порядка для корпусов стихотворений А.С. Пушкина и других поэтов пушкинской эпохи; получены математическое ожидание и дисперсия подсчитываемого в каждой серии вида энтропии; начаты расчеты, имеющие целью выяснить значимость описанных выше энтропийных характеристик для определения авторского стиля; реализовано программное приложение, автоматически извлекающее статистическую информацию, потенциально применимую в задачах выявления особенностей авторского стиля, из русскоязычных поэтических текстов и их транскрипций; извлечены статистические данные из стихотворений А.С. Пушкина и других авторов, которые могут стать основой стилеметрической классификации авторов по энтропийным признакам.