Разработка словаря и инструмента анализа тональности текстов на узбекском языке с помощью именованных сущностей

Семинар: Информационно-вычислительные технологии в задачах поддержки принятия решений
Начало заседания: 11:00

Дата выступления: 28 Октябрь 2025

Организация: НГУ (Новосибирск)

Авторы: Саидов Бобур Рашидович

В данной работе рассматривается проблема автоматического анализа тональности текстов на узбекском языке с применением именованных сущностей (NER). Цель исследования — разработать лексический словарь эмоционально окрашенных слов и построить инструмент, способный определять тональность текстов с учётом контекста и упомянутых сущностей (личностей, организаций, локаций, продуктов и др.).

В ходе работы создана расширенная база данных эмоциональных слов, включающая положительные, отрицательные и нейтральные категории, а также таблица именованных сущностей, позволяющая моделировать взаимосвязи между объектами и выражаемыми эмоциями. Для анализа использованы современные методы машинного обучения и обработки естественного языка, включая модели SVM, LSTM и BERT.

Результатом исследования стал программный инструмент, который классифицирует тексты по тональности и связывает эмоции с соответствующими именованными сущностями. Разработанный подход обеспечивает более глубокое понимание эмоциональной структуры текстов на узбекском языке и может быть использован для мониторинга общественных настроений, анализа отзывов и социальных медиа.

Семинар будет проведен в смешанном формате. Очное заседание пройдет в конференц-зале ФИЦ ИВТ (к.513), дистанционно к семинару можно будет подключиться по ссылке https://vcs-6.ict.nsc.ru/rooms/grz-ayy-7ne/join

Для студентов и аспирантов, находящихся в Новосибирске и не имеющих причин для дистанционного подключения, очное присутствие обязательно.