Методы машинного обучения в анализе интернет-комментариев, содержащих оценку высших учебных заведений

Семинар: Информационные технологии в задачах филологии и компьютерной лингвистики
Начало заседания: 17:30

Дата выступления: 2 Май 2023

Организация: НГУ (Новосибирск)

Авторы: Перетолчин Глеб Дмитриевич

В рамках работы рассмотрены методы представления комментариев в сети, алгоритмы их предобработки и модели машинного обучения, используемые для классификации текстов. Основной задачей  является классификация комментариев по тональности, источник анализируемого материала — интернет-ресурс https://tabiturient.ru/ .

Разработана  методика анализа интернет-комментариев, содержащих оценку высших учебных заведений. Оценка точности методики позволяет сделать вывод: наивный байесовский классификатор дает достаточно хорошие результаты, однако лучшие результаты получены с использованием LSTM-модели.