Разработка алгоритма нормализации диалектных форм узбекского языка (на материале Бухары и Самарканда)
Семинар: Информационно-вычислительные технологии в задачах поддержки принятия решений
Начало заседания: 11:00
Дата выступления: 24 Март 2026
Организация: НГУ (Новосибирск)
Авторы: Шодиев Отабек Туражон угли
Проект направлен на разработку алгоритма нормализации диалектных форм узбекского языка для говоров Бухары и Самарканда. Актуальность исследования обусловлена ограниченностью лингвистических ресурсов для узбекского языка и отсутствием стандартизированных решений для обработки его диалектного разнообразия, что затрудняет развитие систем машинного перевода и автоматического анализа текстов. На текущем этапе сформулированы проблема, цели и задачи исследования, включающие анализ диалектных особенностей, сбор корпуса данных и выбор подходов к нормализации.
Проект предполагает создание алгоритма, сочетающего словарные методы и лингвистические правила для приведения диалектных форм к литературной норме. Планируется формирование словаря соответствий и экспериментальная проверка точности разработанного алгоритма. Ожидаемым результатом является воспроизводимая методика нормализации и её программная реализация.
Семинар будет проведен в смешанном формате. Очное заседание пройдет в конференц-зале ФИЦ ИВТ (к.513), дистанционно к семинару можно будет подключиться по ссылке https://vcs-6.ict.nsc.ru/rooms/grz-ayy-7ne/join
Для студентов и аспирантов, находящихся в Новосибирске и не имеющих причин для дистанционного подключения, очное присутствие обязательно.


