Способы решения проблемы миноритарных классов в задачах классификации текстов

Семинар: Информационные технологии
Начало заседания: 14:35

Дата выступления: 27 Февраль 2018

Организация: ИВТ СО РАН (Новосибирск)

Авторы: Пастушков И.С.

В задачах классификации текстов часто возникает ситуация, когда количество представителей одного или нескольких классов не позволяет обучить модель на распознавание данного класса. В докладе будет представлен обзор таких способов решения проблемы миноритарных классов, как SMOTE, ADASYN, OneVsRest, OneVsOne, генерация примеров с помощью цепей Маркова и др., а также их адаптация для задач классификации текстов.