Перейти к содержимому

Научная библиотека БНТУ

Принципы управления данными

Развитие цифровых технологий и увеличение объемов данных привели к тому, что возникла необходимость поиска решений для преодоления различных препятствий при поиске и обработке данных в Интернете как для человека, так и для машины. Например, машина может быть способна определить тип данных обнаруженного цифрового объекта, но не способна его анализировать из-за того, что он находится в неизвестном формате; или может обрабатывать содержащиеся данные, но не может определять лицензионные требования, связанные с поиском и/или использованием этих данных. Оптимальное состояние, когда машины полностью «понимают» и могут автономно и правильно работать с цифровым объектом, достигается редко. Тем не менее, шаги на пути к более продуктивному процессу были сделаны.

В 2016 году в журнале Scientific Data были опубликованы «Руководящие принципы FAIR (Findability, Accessibility, Interoperability and Reuse) по управлению научными данными». Авторы стремились предоставить рекомендации по улучшению видимости, доступности, функциональной совместимости и повторного использования научных данных. Эти принципы подчеркивают возможность использования компьютерных технологий (т. е. способность вычислительных систем находить, получать доступ, взаимодействовать и повторно использовать данные без вмешательства человека или с минимальным вмешательством), так как люди все больше полагаются на вычислительную поддержку для работы с данными в результате увеличения объема, сложности и скорости создания данных.

Согласно этим принципам, данные должны быть:

Доступными для поиска (Findable)

Первый шаг в использовании данных — их поиск. Метаданные и данные должны быть легко доступны как людям, так и компьютерам. Машиночитаемые метаданные необходимы для автоматического обнаружения наборов данных и сервисов, поэтому они являются важным компонентом процесса.

F1. (Мета)данным присваивается глобально уникальный и постоянный идентификатор.

F2. Данные описываются расширенными метаданными (определены R1 ниже).

F3. Метаданные четко и явно включают идентификатор данных, которые они описывают.

F4. (Мета)данные регистрируются или индексируются в доступном для поиска ресурсе.

Доступными (Accessible)

Как только пользователь находит необходимые данные, ему необходимо знать, как к ним можно получить доступ, возможно, включая аутентификацию и авторизацию.

А1. (Мета)данные можно получить по их идентификатору с использованием стандартизированного протокола связи.

A1.1. Протокол является открытым, бесплатным и универсальным.

A1.2. Протокол допускает процедуру аутентификации и авторизации там, где это необходимо. А2. Метаданные доступны, даже если данные больше не доступны.

Совместимыми (Interoperable)

Данные обычно необходимо интегрировать с другими данными. Кроме того, данные должны взаимодействовать с приложениями или рабочими процессами для анализа, хранения и обработки.

I1. (Мета)данные используют формальный, доступный, общий и широко применимый язык для представления знаний.

I2. (Мета)данные используют словари, соответствующие принципам FAIR.

I3. (Мета)данные включают квалифицированные ссылки на другие (мета)данные.

Пригодными для повторного использования (Reusable)

Конечной целью данных, соответствующих принципам FAIR, является оптимизация повторного использования данных. Для этого метаданные и данные должны быть хорошо описаны, чтобы их можно было воспроизводить и/или комбинировать в различных условиях.

R1. (Мета)данные подробно описаны с множеством точных и релевантных атрибутов.

R 1.1. (Мета)данные выпускаются с четкой и доступной лицензией на использование данных

R 1.2. (Мета)данные связаны с подробным описанием происхождения

R 1.3. (Мета)данные соответствуют стандартам сообщества, относящимся к данной предметной области

Принципы относятся к трем типам объектов: данные (или любой цифровой объект), метаданные (информация об этом цифровом объекте) и инфраструктура. Например, принцип F4 определяет, что и метаданные, и данные регистрируются или индексируются в доступном для поиска ресурсе (компонент инфраструктуры).

Подробнее о принципах FAIR можно прочитать на сайте инициативы GO FAIR.