Интеграция данных, формальное описание и визуальное моделирование биологических и других сложных систем

Семинар: Информационные технологии
Начало заседания: 14:35

Дата выступления: 14 Март 2005

Организация: Конструкторско-технологический институт вычислительной техники

Авторы: Колпаков Федор Анатольевич

Разработан подход для формализованного комплексного описания, графического представления и моделирования широкого круга биологических и других сложных систем. Особенностью данного подхода является то, что он практически не зависит от предметной области и обеспечивает абстрактное описание структуры сложных систем на трех взаимосвязанных уровнях. Чтобы принять во внимание особенности конкретной предметной вводится концепция типа диаграммы, которая определяет какие объекты и связи могут быть размещены на диаграмме, особенности их графического представления, а так же правила, которые обеспечивают семантическую целостность и правильность диаграммы в процессе ее редактирования. Определены (в виде библиотеки классов) типы данных и типы диаграммы для описания молекулярно-биологических систем на различных семантических и иерархических уровнях. Разработана компьютерная система GeneNet, обеспечивающая пользовательский интерфейс для формализованного описания и графического представления генных сетей через Internet. Разработаны методы и библиотека классов для доступа базам данных в различных форматах (текстовые файлы, реляционные базы данных, данные в формате XML, удаленные базы данных, доступные через Internet и другие) и представления, содержащейся в них информации в объектно-ориентированном виде. Разработана интегрированная расширяемая программа (BioUML), которая обеспечивающая всю цепочку построения и анализа биологических моделей, начиная от поиска информации в биологических базах данных и заканчивая моделированием и графическим представлением результатов моделирования. Предложена архитектура, которая обеспечивает расширяемость программы в различных направлениях: 1. типы диаграмм – позволяют пользователю создавать новые типы диаграмм, специфичные для его данных. Стоит подчеркнуть, что это позволяет использовать программу BioUML для визуального моделирования не только биологических систем, но и других сложных систем; 2. модули баз данных – разработанная концепция модулей баз данных позволяет интегрировать различные базы данных в программу BioUML, обеспечивает поиск, редактирование и интеграцию информации из этих базах данных; 3. программные модули - модульная архитектура на базе технологии Eclipse обеспечивает возможность встраивания в программу BioUML новых методов анализа, моделирования и других программных модулей (plug-ins). Учитывая громадный массив экспериментальных данных по различным компонентам биологических систем, BioUML обеспечивает эффективную интеграцию с различными биологическими базами данных и широкие возможности поиска необходимой информации. Для этого используется концепция модуля базы данных, которая обеспечивает интеграцию базы данных в систему BioUML. Созданы модули для следующих баз данных и форматов: KEGG, TRANSPATH, GeneNet, SBML, CellML, BioPAX и др. ...