Определение читабельности предложений на основе синтаксических деревьев

Семинар: Информационные технологии в задачах филологии и компьютерной лингвистики
Начало заседания: 17:30

Дата выступления: 24 Май 2022

Организация: Новосибирский государственный университет (Новосибирск)

Авторы: Смаль Иван Андреевич

Проблема оценки читабельности - сложности понимания текстов - актуальна в наше время, поскольку результаты могут применяться во множестве областей: здравоохранение, образование, маркетинг и др.

Решением данной проблемы занимаются с начала 20-го века, и несмотря на то, что в наше время инструменты для анализа текста, а также построения различных классификаторов и регрессоров, достаточно развиты, самыми популярными решениями остаются классические формулы, разработанные в конце 90-х годов.

В докладе представлены результаты построения моделей для оценки читабельности предложений на основе машинного обучения, а также анализ значимости различных свойств синтаксических деревьев в построенных моделях.