Алгоритм пакетной выгрузки данных и метаданных системы комплексного анализа поэтических текстов

Семинар: Информационные технологии в задачах филологии и компьютерной лингвистики
Начало заседания: 17:30

Дата выступления: 1 Апрель 2020

Организация: НГУ

Авторы: Шашок Наталья Александровна

Актуальным направлением развития гуманитарных исследований являются задачи, связанные с автоматизацией анализа поэтических текстов, в частности,  с обработкой больших корпусов стихотворений. Возникает как проблема выбора достоверных внешних источников, так и проблема адаптации взятых из них материалов, связанная с отсутствием программных интерфейсов (API) для пакетной выгрузки материалов с ресурса. В докладе обсуждается проектирование и реализации алгоритма пакетной выгрузки метаданных с сайта Фундаментальной электронной библиотеки “Русская литература и фольклор” для их дальнейшего использования в рамках системы комплексного анализа поэтических текстов.