Выделение словосочетаний из текста на естественном языке

Семинар: Информационные технологии в задачах филологии и компьютерной лингвистики
Начало заседания: 17:30

Дата выступления: 24 Октябрь 2018

Организация: ИВТ СО РАН

Авторы: Содбоев Матвей Константинович

В работе представлены технологии автоматического извлечения словосочетаний из текстов, среди которых выделен наиболее перспективный — “Tomita Parser”. В дальнейшем он будет интегрироваться с системой комплексного анализа русских поэтических текстов. Процесс анализа состоит из трех основных модулей: структурный, семантический и прагматический. Извлечение словосочетаний относится к семантическому анализу.

Предлагаемый метод использует контекстно свободные грамматики для описания правил, на основе которых извлекаются словосочетания. Сами правила составляются на формальном языке.

Также приведены примеры работы алгоритма и его недостатки.