Онтология-ориентированное распознавание именованных сущностей в юридических текстах Узбекистана с последующей нормализацией

Семинар: Информационно-вычислительные технологии в задачах поддержки принятия решений
Начало заседания: 11:00

Дата выступления: 24 Март 2026

Организация: НГУ (Новосибирск)

Авторы: Турсунов Улугбек Акмолжон угли

В работе предложен онтология-ориентированный подход к распознаванию и нормализации именованных сущностей в юридических текстах Республики Узбекистан. Актуальность исследования обусловлена необходимостью автоматизированной обработки больших массивов неструктурированной правовой информации и преодоления проблемы вариативности представления сущностей .

Метод основывается на гибридной архитектуре, объединяющей правила, словарные методы и модели машинного обучения, включая дообученные трансформеры. Важной составляющей является разработка онтологии предметной области, обеспечивающей приведение различных текстовых вариантов к каноническим формам. Предложен алгоритм нормализации, включающий этапы предобработки, точного и нечёткого сопоставления, а также разрешения аббревиатур.

Полученные результаты демонстрируют перспективность использования онтологического подхода для повышения точности извлечения и консолидации данных, что способствует развитию интеллектуальных систем поиска и анализа юридической информации.

Семинар будет проведен в смешанном формате. Очное заседание пройдет в конференц-зале ФИЦ ИВТ (к.513), дистанционно к семинару можно будет подключиться по ссылке https://vcs-6.ict.nsc.ru/rooms/grz-ayy-7ne/join

Для студентов и аспирантов, находящихся в Новосибирске и не имеющих причин для дистанционного подключения, очное присутствие обязательно.