Перейти к содержимому

Научная библиотека БНТУ

План управления данными

План управления данными (Data Management Plan, DMP) — это формальный документ, в котором описываются данные, полученные в ходе исследовательского проекта, и излагаются стратегии управления данными, которые будут реализованы во время и после активной фазы исследовательского проекта.  Он также подробно описывает все аспекты управления данными, которые будут иметь место в течение всего жизненного цикла данных исследования, когда данные собираются, систематизируются, документируются, совместно используются и сохраняются.

Составление плана поможет вам сэкономить время и силы, а также упростит процесс исследования. Планирование также позволяет принимать обоснованные решения с учетом более широкого контекста и различных вариантов.

Примерное содержание плана управления данными

(Адаптировано из Руководства по передовой практике для планов управления данными (DMP), основанного на общих элементах/Best practice guidance for DMPs based on common themes)

ЭлементОписание
ОПИСАНИЕ ДАННЫХ• Дайте краткий обзор данных, которые вы будете собирать или создавать, отмечая содержание, охват и тип данных, например, табличные данные, данные опроса, экспериментальные измерения, модели, программное обеспечение, аудиовизуальные данные, физические образцы и т. д.
• Подумайте, как ваши данные могут быть дополнены и интегрированы с существующими данными, или есть ли какие-либо существующие данные или методы, которые вы могли бы использовать повторно.
• Укажите, какие данные имеют долгосрочную ценность и должны быть переданы и/или сохранены.
• При повторном использовании существующих данных объясните, как решаются такие вопросы, как авторское право и интеллектуальная собственность.
ФОРМАТ ДАННЫХ• Четко отметьте, в каком формате будут ваши данные.
• Объясните, почему вы выбрали определенные форматы. Решения могут основываться на опыте сотрудников, предпочтениях открытых форматов, стандартах, принятых центрами обработки данных, или широком использовании в данном сообществе.
• Использование стандартизированных, взаимозаменяемых или открытых форматов обеспечивает долгосрочное использование данных; они рекомендуются для совместного использования и архивирования.
• См. руководство UK Data Service по рекомендуемым форматам или рекомендации DataONE Best Practices для форматов файлов

ОБЪЕМ ДАННЫХ• Обратите внимание, какой объем данных вы создадите в МБ/ГБ/ТБ. Укажите пропорции необработанных данных, обработанных данных и других вторичных выходных данных (например, отчетов).
• Рассмотрите последствия объемов данных с точки зрения хранения и доступа. Нужны ли дополнительные расходы?
• Подумайте, не вызовет ли масштаб данных проблем при совместном использовании или передаче данных между сайтами; если да, то как вы будете решать эти проблемы?
СБОР ДАННЫХ• Объясните, как данные будут собираться и обрабатываться. Это должно охватывать соответствующие стандарты или методы, обеспечение качества и организацию данных.
• Укажите, как данные будут организованы в ходе проекта, упомянув, например, контроль версий и структуру папок. Последовательные, хорошо упорядоченные исследовательские данные будет легче найти, понять и повторно использовать.
• Объясните, как будет контролироваться и документироваться согласованность и качество сбора данных. Сюда могут входить такие процессы, как калибровка, повторные выборки или измерения, сбор стандартизированных данных, проверка ввода данных, экспертная оценка данных или представление с использованием контролируемых словарей.
МЕТАДАННЫЕ И ДОКУМЕНТАЦИЯ• Определитесь, какие метаданные будут предоставлены, чтобы помочь другим идентифицировать и обнаружить данные.
• Исследователям настоятельно рекомендуется использовать стандарты метаданных научных сообществ, если они существуют. Research Data Alliance (Альянс по исследовательским данным) предлагает открытый Каталог стандартов метаданных, применимых к исследовательским данным. Хранилища данных также могут предоставлять рекомендации по соответствующим стандартам метаданных.
• Подумайте, какая еще документация необходима для повторного использования. Она может включать информацию о методологии, используемой для сбора данных, аналитическую и процедурную информацию, определения переменных, единиц измерения, формат и тип файлов данных, а также программное обеспечение, используемое для сбора и/или обработки данных.
• Подумайте, как вы будете собирать эту информацию и где она будет записана, например, в базе данных со ссылками на каждый элемент, в текстовом файле «readme», в заголовках файлов и т. д.
ЭТИКА И КОНФИДЕНЦИАЛЬНОСТЬ• Исследователи, проводящие исследования с участием людей, должны запрашивать согласие на сохранение и обмен данными.
• Подумайте, как вы будете защищать личность участников, например, с помощью анонимизации или использования процедур управляемого доступа.
• Этические вопросы могут повлиять на то, как вы храните и передаете данные, кто может их просматривать/ использовать и как долго они хранятся. Вы должны продемонстрировать, что вы знаете об этом и планируете соответственно.
• См. подход ICPSR к конфиденциальности.
ПРАВА ИНТЕЛЛЕКТУАЛЬНОЙ СОБСТВЕННОСТИ• Укажите, кому будут принадлежать авторские права и права интеллектуальной собственности на любые существующие данные, а также на новые данные, которые вы создадите. Для проектов с участием нескольких партнеров право на интеллектуальную собственность должно быть предусмотрено в соглашении.
• Опишите любые ограничения, необходимые для совместного использования данных, например, для защиты конфиденциальных или патентоспособных данных.
• Объясните, как данные будут лицензироваться для повторного использования.
• См. руководство DCC о том, как лицензировать исследовательские данные, а также мастер лицензирования данных и программного обеспечения EUDAT .
ХРАНЕНИЕ И БЕЗОПАСНОСТЬ• Опишите, где данные будут храниться и резервироваться в ходе исследовательской деятельности.
• Определите, кто будет отвечать за резервное копирование и как часто это будет выполняться.
• Предпочтительно использовать надежное хранилище с автоматическим резервным копированием, например, предоставляемое университетскими ИТ-специалистами. Хранение данных только на ноутбуках, жестких дисках компьютеров или внешних запоминающих устройствах очень рискованно.
• См. руководство UK Data Service по хранению данных.
• Также подумайте о безопасности данных, особенно если ваши данные являются конфиденциальными, например, подробные личные данные или коммерческая тайна. Обратите внимание на основные риски и то, как они будут учитываться. Также обратите внимание, существуют ли какие-либо институциональные политики безопасности данных.
• Определите формальные стандарты, которым вы будете соответствовать, например, ISO 27001. См. информационный документ DCC по управлению информационной безопасностью — ISO 27000 и руководство UK Data Service по безопасности данных.
ОБМЕН ДАННЫМИ• Зафиксируйте, как вы будете делиться данными, например, хранить их в хранилище данных, использовать безопасный сервис данных, обрабатывать запросы данных напрямую или использовать другой механизм. Используемые методы будут зависеть от ряда факторов, таких как тип, размер, сложность и конфиденциальность данных.
• Определитесь, когда вы сделаете данные доступными. Грантодатели могут ожидать своевременного обнародования этой информации.
• Подумайте о том, кто сможет использовать ваши данные. Если вам нужно ограничить доступ или применить соглашения об обмене данными, объясните, почему.
• Рассмотрите стратегии минимизации ограничений на совместное использование. Они могут включать анонимизацию или агрегирование данных, получение согласия участников на обмен данными, получение разрешений на авторские права и согласование ограниченного периода эмбарго.
• Подумайте, как ваши данные могут быть повторно использованы в других контекстах. Там, где есть возможность повторного использования, вы должны использовать стандарты и форматы, которые облегчают это, и убедитесь, что соответствующие метаданные доступны в Интернете, чтобы ваши данные могли быть обнаружены.
• Следует применять постоянные идентификаторы, чтобы люди могли надежно и эффективно находить ваши данные. Они также помогают отслеживать цитирование и повторное использование.
ХРАНИЛИЩЕ ДАННЫХ• Определитесь с хранением данных. Если вы не предполагаете использовать конкретный репозиторий, план управления данными должен продемонстрировать, что данные можно эффективно курировать после завершения проекта.
• Изучите политики и процедуры репозитория, включая стандарты метаданных и связанные с этим действия.
• Международный список репозиториев данных доступен через re3data, а некоторые университеты или издатели предоставляют списки рекомендаций, например рекомендуемые репозитории PLOS ONE.
ДОЛГОСРОЧНОЕ ИСПОЛЬЗОВАНИЕ• Обрисуйте планы по совместному использованию и сохранению данных — как долго данные будут храниться и где они будут архивироваться.
• Потребуются ли дополнительные ресурсы для подготовки данных к депонированию или оплаты каких-либо сборов из хранилищ данных?
• См. руководство DCC: Как оценивать и выбирать исследовательские данные для курирования.
РОЛИ И ОБЯЗАННОСТИ• Опишите роли и обязанности для всех видов деятельности, например, сбора данных, производства метаданных, качества данных, хранения и резервного копирования, архивирования данных и совместного использования данных. Там, где это возможно, должны быть указаны имена лиц.
• Для совместных проектов вы должны объяснить координацию обязанностей по управлению данными между партнерами.
• См. рекомендации DataONE: Определение ролей и распределение обязанностей по управлению данными.
БЮДЖЕТ• Внимательно рассмотрите и обоснуйте ресурсы, необходимые для выполнения плана. Они могут включать затраты на хранение, оборудование, рабочее время персонала, затраты на подготовку данных для депозита и сборы за хранение.
• Опишите любые соответствующие технические знания, поддержку и обучение, которые, вероятно, потребуются, и то, как они будут приобретены.
• Если вы не размещаете данные в репозитории, убедитесь, что у вас есть соответствующие ресурсы и системы для совместного использования и сохранения данных.
СВЯЗАННЫЕ ПОЛИТИКИ• Подумайте, существуют ли какие-либо процедуры, на которых вы можете основывать свой подход. Если в вашей группе/отделе есть свои правила, по которым вы работаете, укажите их.
• Перечислите любые другие соответствующие спонсорские, институциональные, ведомственные или групповые политики в отношении управления данными, обмена данными и безопасности данных.

Планы управления данными – это не жестко фиксированные документы, они могут улучшаться и изменяться по необходимости в ходе работы. План, который вы разрабатываете для заявки на грант, — это всего лишь первоначальная идея. Получив финансирование, вам нужно будет расширить этот план, разработав политики и процедуры или внедрив руководящие принципы от вашей исследовательской группы, отдела или учреждения. Процессы часто изменяются с течением времени, поэтому важно реагировать на новые возможности, внося соответствующие корректировки.

Если вы не обладаете навыками, необходимыми для управления данными на протяжении всего их жизненного цикла, можно обратиться за советом к коллегам, имеющим такой опыт или использовать в качестве примера публично доступные планы или чек-листы. Стоит также обратить внимание на Guidelines on FAIR Data Management in Horizon 2020 — официальные рекомендации по разработке планов управления данными, а также подробное руководство по открытому доступу и управлению научными данными Open access & Data management, опубликованные в рамках соответствующей программы Европейского Союза.