Иерархия сервисов хранения и обмена научными данными для учреждений ФАНО России

В ИВТ СО РАН ведутся работы по созданию для ученых и исследователей инструментов по работе с цифровыми данными. В частности, на базе новой системы хранения данных (СХД) формируется иерархия ИТ-сервисов хранения, обмена и совместной работы с научными данными и документами.

Базовым сервисом комплекса является выделение дискового пространства на отказоустойчивой СХД (BSS – Basic Storage Service). Выделенное дисковое пространство может быть подключено к любой компьютерной системе в поддерживаемом ИВТ СО РАН сибирском сегменте академической корпоративной компьютерной сети организаций ФАНО России с использованием специальных блочных и файловых протоколов.

Сервисы второго уровня связаны с запуском виртуальных машин в отказоустойчивом распределенном кластере ИВТ СО РАН (BVS – Basic Virtualization Service) и могут быть использованы, в частности, для организации доступа и использования выделяемых на СХД дисковых пространств или обработки научных данных.

Третьим уровнем сервисов являются платформы для хранения, обмена и совместной работы с научными данными и документами.

Первый из них – сервис автоматизации совместной деятельности рабочих групп (SGCS – Scientific Groups Collaboration Service) на базе платформы с открытым исходным кодом Zimbra. Сервис позволяет обмениваться электронными сообщениями (электронная почта), управлять списками контактов, вести ежедневник (календарь), управлять задачами как для отдельных пользователей, так и для групп пользователей с возможностью открытия (sharing) доступа другим пользователям системы к папкам и документам, почтовым папкам, событиям календаря и задачам. У сервиса современный веб-интерфейс и есть возможность работы с большинством почтовых клиентов стационарных и мобильных платформ через стандартные протоколы.

Доступны два варианта использования сервиса: для организации-пользователя может быть выделена отдельная виртуальная машина с развернутой платформой, либо предоставлена возможность регистрации пользователей в общей системе. В первом случае администрирование платформы осуществляют специалисты организации-пользователя, во-втором регистрация и управление пользователями выполняется службой ИВТ СО РАН.

Другой сервис третьего уровня построен на платформе с открытым исходным кодом NextCloud и предназначен для совместной работы с файлами и документами, а также среднесрочного и долговременного хранения общих данных (CDSS – Cloud Data Store&share Service). Сервис является расширенным аналогом Dropbox и позволяет загружать и хранить файлы и папки, предоставлять к ним доступ другим пользователям системы, совместно редактировать документы (с помощью интегрированного сервиса на основе открытой системы LibreOffice) с поддержкой версионности, публиковать файлы, папки и документы, подключать хранилище к компьютерным системам в виде внешних дисков, использовать его для резервного копирования и автоматической синхронизации данных с помощью клиентских приложений для стационарных компьютеров и мобильных устройств. Возможна интеграция и использование на базе интерфейса платформы различных внешних хранилищ данных. Также как и для SGCS использование сервиса возможно в двух формах: в качестве развернутой на отдельной виртуальной машине и управляемой специалистами организации-пользователя платформы, либо на общей центральной платформе, управляемой службой ИВТ СО РАН.

И SGCS, и CDSS позволяют настроить идентификацию и авторизацию пользователей на основе различных служб каталогов: Active Directory, LDAP и др. CDSS при этом поддерживает создание федераций, позволяющих организовать обмен данными и совместную работу пользователей других инсталляций этого сервиса.

ИВТ СО РАН продолжает работы по расширению списков ИТ-сервисов поддержки научных исследований для подведомственных ФАНО России организаций. Миссия этой деятельности – предоставить ученым и исследователям удобные инструменты для работы с их цифровыми данными, организовать среду для совместной работы с такими данными, возможности для их публикации в рамках концепции OpenScience. Цель – построить цифровую платформу поддержки междисциплинарных и мультидисциплинарных научных исследований, основанных на интенсивном использовании цифровых данных.