Алгоритм переноса схемы теории риторических структур в базу данных и алгоритм, обратный к нему

Семинар: Информационные технологии в задачах филологии и компьютерной лингвистики
Начало заседания: 17:30

Дата выступления: 21 Апрель 2021

Организация: НГУ

Авторы: Шашок Наталья Александровна

Теория риторических структур активно используется для широкого круга задач, в частности, для генерации текстов, резюмирования, вопросно-ответного поиска и корпусной лингвистики. Однако применение этой теории в задачах анализа поэтических текстов достаточно редко, поэтому, несмотря на существование открытых корпусов схем для русскоязычных документов, подобные корпуса для стихотворных произведений отсутствуют. Таким образом, возникает задача создания программного обеспечения, которое бы позволяло осуществлять работу с наборами схем риторических структур поэтических текстов как с корпусом.
В данном докладе обсуждается алгоритм переноса схем риторических структур, представленных XML-документами, в базу данных, созданную с целью осуществления поиска подсхем, а также обратный алгоритм построения схемы в виде XML-документа.