Информация о проекте

Локальный номер: 16
Номер гос. регистрации: 01201261902
Дата гос. регистрации: 2012-05-24
Тип проекта: Российский фонд фундаментальных исследований
Инициативные проекты
Шифр проекта: 12-07-00125-а
Название: Теоретико-информационные методы анализа текстовой информации и их применение к задачам прогнозирования и защиты информации
Руководитель: Рябко Б.Я.
Коды ГРНТИ: 28.23.24; 81.93.29; 81.96.00;
Коды УДК: 004.89; 004.93;
Аннотация: Методы анализа текстовой информации находят самое широкое применение в лингвистике, компьютерных науках, при решении таких задач, как "автоматическое определение смысла" (data mining, text mining), автоматическое обучение, биоинформатика и др. Несмотря на многочисленные достижения, полученные исследователями как у нас в стране, так и за рубежом, многие важные задачи в области анализа текстовых данных еще далеки от своего окончательного решения. Одна из таких задач - построение доверительных множеств при фильтрации текстов и методически связанная с ней проблема прогнозирования, или предсказания, символьных последовательностей. Другой класс задач, важных для практики и теории - определение "степени близости" различных текстов (или степени их однородности) и тесно связанная с ними задача классификации, являющаяся ключевой при построении филогенетических деревьев в биоинформатике. Обнаружена тесная связь одного из важнейших направлений теории защиты информации - стегоанализа с задачей анализа символьных последовательностей. В частности, получены первые результаты в области построения доказуемо невскрываемых стегосистем и выяснения условий их существования. В последних работах руководителя проекта предложен новый подход к решению названных проблем. Этот подход базируется на идеях и методах теории информации (универсальное кодирование, Колмогоровская сложность), а также теории сложности алгоритмов и новых подходах статистического анализа. В рамках предлагаемого проекта планируется разработка эффективных методов решения вышеуказанных задач с использованием последних достижений и новейших подходов, разрабатываемых участниками проекта.