Разработка алгоритма нормализации диалектных форм узбекского языка (на материале Бухары и Самарканда)

Семинар: Информационно-вычислительные технологии в задачах поддержки принятия решений
Начало заседания: 11:00

Дата выступления: 24 Март 2026

Организация: НГУ (Новосибирск)

Авторы: Шодиев Отабек Туражон угли

Проект направлен на разработку алгоритма нормализации диалектных форм узбекского языка для говоров Бухары и Самарканда. Актуальность исследования обусловлена ограниченностью лингвистических ресурсов для узбекского языка и отсутствием стандартизированных решений для обработки его диалектного разнообразия, что затрудняет развитие систем машинного перевода и автоматического анализа текстов. На текущем этапе сформулированы проблема, цели и задачи исследования, включающие анализ диалектных особенностей, сбор корпуса данных и выбор подходов к нормализации.

Проект предполагает создание алгоритма, сочетающего словарные методы и лингвистические правила для приведения диалектных форм к литературной норме. Планируется формирование  словаря соответствий и экспериментальная проверка точности разработанного алгоритма. Ожидаемым результатом является воспроизводимая методика нормализации и её программная реализация.

Семинар будет проведен в смешанном формате. Очное заседание пройдет в конференц-зале ФИЦ ИВТ (к.513), дистанционно к семинару можно будет подключиться по ссылке https://vcs-6.ict.nsc.ru/rooms/grz-ayy-7ne/join

Для студентов и аспирантов, находящихся в Новосибирске и не имеющих причин для дистанционного подключения, очное присутствие обязательно.