Определение авторства текстов на каракалпакском языке: вычисление TF-IDF метрики

Семинар: Информационные технологии в задачах филологии и компьютерной лингвистики
Начало заседания: 17:30

Дата выступления: 9 Апрель 2024

Организация: НГУ (Новосибирск)

Авторы: Абдуллаев Руслан Махсетбай улы

Авторство текста определяется не только по уникальному выбору слов автором, но и через стилистические и лингвистические особенности, такие как использование определенных лексических конструкций, предпочтительные грамматические структуры, а также морфологические и синтаксические характеристики.

В рамках начальной стадии исследования был разработан алгоритм определения TF-IDF метрики для текстов каракалпакского языка. Проведено тестирование алгоритма.

(аннотация представлена в авторской редакции)

---

Онлайн-подключение на семинар будет осуществляться по ссылке:

https://vcs-6.ict.nsc.ru/rooms/be6-uui-gvg-ced/join