Разработка словаря и инструмента анализа тональности текстов на узбекском языке с помощью именованных сущностей
Семинар: Информационно-вычислительные технологии в задачах поддержки принятия решений
Начало заседания: 11:00
Дата выступления: 28 Октябрь 2025
Организация: НГУ (Новосибирск)
Авторы: Саидов Бобур Рашидович
В данной работе рассматривается проблема автоматического анализа тональности текстов на узбекском языке с применением именованных сущностей (NER). Цель исследования — разработать лексический словарь эмоционально окрашенных слов и построить инструмент, способный определять тональность текстов с учётом контекста и упомянутых сущностей (личностей, организаций, локаций, продуктов и др.).
В ходе работы создана расширенная база данных эмоциональных слов, включающая положительные, отрицательные и нейтральные категории, а также таблица именованных сущностей, позволяющая моделировать взаимосвязи между объектами и выражаемыми эмоциями. Для анализа использованы современные методы машинного обучения и обработки естественного языка, включая модели SVM, LSTM и BERT.
Результатом исследования стал программный инструмент, который классифицирует тексты по тональности и связывает эмоции с соответствующими именованными сущностями. Разработанный подход обеспечивает более глубокое понимание эмоциональной структуры текстов на узбекском языке и может быть использован для мониторинга общественных настроений, анализа отзывов и социальных медиа.
Семинар будет проведен в смешанном формате. Очное заседание пройдет в конференц-зале ФИЦ ИВТ (к.513), дистанционно к семинару можно будет подключиться по ссылке https://vcs-6.ict.nsc.ru/rooms/grz-ayy-7ne/join
Для студентов и аспирантов, находящихся в Новосибирске и не имеющих причин для дистанционного подключения, очное присутствие обязательно.


