Алгоритмы генерации словоформ узбекского языка

Семинар: Информационные технологии в задачах филологии и компьютерной лингвистики
Начало заседания: 17:30

Дата выступления: 1 Апрель 2020

Организация: НГУ

Авторы: Менглиев Давлатёр Бахтиярович

В настоящее время наблюдается активное развитие узбекского сектора интернета. В нем, как и в других национальных секторах, самой распространенной формой представления текстовой информации являются слабоструктурированные документы, работа с которыми предполагает наличие надежных алгоритмов анализа текста, в том числе его лексических характеристик. В докладе будет представлен один из алгоритмов усечения окончаний (алгоритм Портера), который был изучен автором для решения поставленной задачи. Вместе с тем, в докладе будут также озвучены недостатки этого алгоритма и возможные пути решения для минимизации ошибок в работе.