Разработка алгоритмов генерации словоформ узбекского языка

Семинар: Информационные технологии в задачах филологии и компьютерной лингвистики
Начало заседания: 17:30

Дата выступления: 25 Ноябрь 2020

Организация: НГУ

Авторы: Менглиев Давлатёр Бахтиярович

В настоящее время наблюдается активное развитие узбекского сектора интернета. В нем, как и в других национальных секторах, самой распространенной формой представления текстовой информации являются слабоструктурированные документы, работа с которыми предполагает наличие надежных алгоритмов анализа текста, в том числе его лексических характеристик. В докладе представлен один из алгоритмов стемминга, изученный автором доклада для решения поставленной задачи, озвучены недостатки этого алгоритма и возможные пути решения для минимизации ошибок в работе.