Анализ применимости синтаксических характеристик при оценке сложности текстов методами машинного обучения

Семинар: Информационно-вычислительные технологии в задачах поддержки принятия решений
Начало заседания: 11:00

Дата выступления: 28 Февраль 2023

Организация: НГУ

Авторы: Смаль Иван Андреевич

В последние годы сфера обработки естественного языка очень быстро развивается. Однако, когда речь идет про оценку сложности текстов, до сих пор самыми распространенными являются формулы, разработанные еще в 20-м веке.

В докладе представлены результаты анализа того, насколько точно можно предсказывать сложность текста методами градиентного бустинга и случайного леса при использовании исключительно синтаксических характеристик текста. Работа проводилась на двух корпусах текстов – корпусе учебников, и корпусе художественной литературы.

 

Семинар будет проведен в смешанном формате. Очное заседание пройдет в  конференц-зале ФИЦ ИВТ (к.513), дистанционно к семинару можно будет подключиться по ссылке https://vcs-6.ict.nsc.ru/b/grz-ayy-7ne

Для студентов и аспирантов, находящихся в Новосибирске и не имеющих причин для дистанционного подключения, очное присутствие обязательно.

Запись семинара: https://vcs-6.ict.nsc.ru/playback/presentation/2.3/caeaa151fe7743faa3d160ccb904deddc5b7d1cb-1677556242955