- Главная
- /
- Лаборатория научных коммуникаций
- /
- Работа с научными данными
- /
- План управления данными
План управления данными
План управления данными (Data Management Plan, DMP) — это формальный документ, в котором описываются данные, полученные в ходе исследовательского проекта, и излагаются стратегии управления данными, которые будут реализованы во время и после активной фазы исследовательского проекта. Он также подробно описывает все аспекты управления данными, которые будут иметь место в течение всего жизненного цикла данных исследования, когда данные собираются, систематизируются, документируются, совместно используются и сохраняются.
Составление плана поможет вам сэкономить время и силы, а также упростит процесс исследования. Планирование также позволяет принимать обоснованные решения с учетом более широкого контекста и различных вариантов.
Примерное содержание плана управления данными
Элемент | Описание |
---|---|
ОПИСАНИЕ ДАННЫХ | • Дайте краткий обзор данных, которые вы будете собирать или создавать, отмечая содержание, охват и тип данных, например, табличные данные, данные опроса, экспериментальные измерения, модели, программное обеспечение, аудиовизуальные данные, физические образцы и т. д. • Подумайте, как ваши данные могут быть дополнены и интегрированы с существующими данными, или есть ли какие-либо существующие данные или методы, которые вы могли бы использовать повторно. • Укажите, какие данные имеют долгосрочную ценность и должны быть переданы и/или сохранены. • При повторном использовании существующих данных объясните, как решаются такие вопросы, как авторское право и интеллектуальная собственность. |
ФОРМАТ ДАННЫХ | • Четко отметьте, в каком формате будут ваши данные. • Объясните, почему вы выбрали определенные форматы. Решения могут основываться на опыте сотрудников, предпочтениях открытых форматов, стандартах, принятых центрами обработки данных, или широком использовании в данном сообществе. • Использование стандартизированных, взаимозаменяемых или открытых форматов обеспечивает долгосрочное использование данных; они рекомендуются для совместного использования и архивирования. • См. руководство UK Data Service по рекомендуемым форматам или рекомендации DataONE Best Practices для форматов файлов |
ОБЪЕМ ДАННЫХ | • Обратите внимание, какой объем данных вы создадите в МБ/ГБ/ТБ. Укажите пропорции необработанных данных, обработанных данных и других вторичных выходных данных (например, отчетов). • Рассмотрите последствия объемов данных с точки зрения хранения и доступа. Нужны ли дополнительные расходы? • Подумайте, не вызовет ли масштаб данных проблем при совместном использовании или передаче данных между сайтами; если да, то как вы будете решать эти проблемы? |
СБОР ДАННЫХ | • Объясните, как данные будут собираться и обрабатываться. Это должно охватывать соответствующие стандарты или методы, обеспечение качества и организацию данных. • Укажите, как данные будут организованы в ходе проекта, упомянув, например, контроль версий и структуру папок. Последовательные, хорошо упорядоченные исследовательские данные будет легче найти, понять и повторно использовать. • Объясните, как будет контролироваться и документироваться согласованность и качество сбора данных. Сюда могут входить такие процессы, как калибровка, повторные выборки или измерения, сбор стандартизированных данных, проверка ввода данных, экспертная оценка данных или представление с использованием контролируемых словарей. |
МЕТАДАННЫЕ И ДОКУМЕНТАЦИЯ | • Определитесь, какие метаданные будут предоставлены, чтобы помочь другим идентифицировать и обнаружить данные. • Исследователям настоятельно рекомендуется использовать стандарты метаданных научных сообществ, если они существуют. Research Data Alliance (Альянс по исследовательским данным) предлагает открытый Каталог стандартов метаданных, применимых к исследовательским данным. Хранилища данных также могут предоставлять рекомендации по соответствующим стандартам метаданных. • Подумайте, какая еще документация необходима для повторного использования. Она может включать информацию о методологии, используемой для сбора данных, аналитическую и процедурную информацию, определения переменных, единиц измерения, формат и тип файлов данных, а также программное обеспечение, используемое для сбора и/или обработки данных. • Подумайте, как вы будете собирать эту информацию и где она будет записана, например, в базе данных со ссылками на каждый элемент, в текстовом файле «readme», в заголовках файлов и т. д. |
ЭТИКА И КОНФИДЕНЦИАЛЬНОСТЬ | • Исследователи, проводящие исследования с участием людей, должны запрашивать согласие на сохранение и обмен данными. • Подумайте, как вы будете защищать личность участников, например, с помощью анонимизации или использования процедур управляемого доступа. • Этические вопросы могут повлиять на то, как вы храните и передаете данные, кто может их просматривать/ использовать и как долго они хранятся. Вы должны продемонстрировать, что вы знаете об этом и планируете соответственно. • См. подход ICPSR к конфиденциальности. |
ПРАВА ИНТЕЛЛЕКТУАЛЬНОЙ СОБСТВЕННОСТИ | • Укажите, кому будут принадлежать авторские права и права интеллектуальной собственности на любые существующие данные, а также на новые данные, которые вы создадите. Для проектов с участием нескольких партнеров право на интеллектуальную собственность должно быть предусмотрено в соглашении. • Опишите любые ограничения, необходимые для совместного использования данных, например, для защиты конфиденциальных или патентоспособных данных. • Объясните, как данные будут лицензироваться для повторного использования. • См. руководство DCC о том, как лицензировать исследовательские данные, а также мастер лицензирования данных и программного обеспечения EUDAT . |
ХРАНЕНИЕ И БЕЗОПАСНОСТЬ | • Опишите, где данные будут храниться и резервироваться в ходе исследовательской деятельности. • Определите, кто будет отвечать за резервное копирование и как часто это будет выполняться. • Предпочтительно использовать надежное хранилище с автоматическим резервным копированием, например, предоставляемое университетскими ИТ-специалистами. Хранение данных только на ноутбуках, жестких дисках компьютеров или внешних запоминающих устройствах очень рискованно. • См. руководство UK Data Service по хранению данных. • Также подумайте о безопасности данных, особенно если ваши данные являются конфиденциальными, например, подробные личные данные или коммерческая тайна. Обратите внимание на основные риски и то, как они будут учитываться. Также обратите внимание, существуют ли какие-либо институциональные политики безопасности данных. • Определите формальные стандарты, которым вы будете соответствовать, например, ISO 27001. См. информационный документ DCC по управлению информационной безопасностью — ISO 27000 и руководство UK Data Service по безопасности данных. |
ОБМЕН ДАННЫМИ | • Зафиксируйте, как вы будете делиться данными, например, хранить их в хранилище данных, использовать безопасный сервис данных, обрабатывать запросы данных напрямую или использовать другой механизм. Используемые методы будут зависеть от ряда факторов, таких как тип, размер, сложность и конфиденциальность данных. • Определитесь, когда вы сделаете данные доступными. Грантодатели могут ожидать своевременного обнародования этой информации. • Подумайте о том, кто сможет использовать ваши данные. Если вам нужно ограничить доступ или применить соглашения об обмене данными, объясните, почему. • Рассмотрите стратегии минимизации ограничений на совместное использование. Они могут включать анонимизацию или агрегирование данных, получение согласия участников на обмен данными, получение разрешений на авторские права и согласование ограниченного периода эмбарго. • Подумайте, как ваши данные могут быть повторно использованы в других контекстах. Там, где есть возможность повторного использования, вы должны использовать стандарты и форматы, которые облегчают это, и убедитесь, что соответствующие метаданные доступны в Интернете, чтобы ваши данные могли быть обнаружены. • Следует применять постоянные идентификаторы, чтобы люди могли надежно и эффективно находить ваши данные. Они также помогают отслеживать цитирование и повторное использование. |
ХРАНИЛИЩЕ ДАННЫХ | • Определитесь с хранением данных. Если вы не предполагаете использовать конкретный репозиторий, план управления данными должен продемонстрировать, что данные можно эффективно курировать после завершения проекта. • Изучите политики и процедуры репозитория, включая стандарты метаданных и связанные с этим действия. • Международный список репозиториев данных доступен через re3data, а некоторые университеты или издатели предоставляют списки рекомендаций, например рекомендуемые репозитории PLOS ONE. |
ДОЛГОСРОЧНОЕ ИСПОЛЬЗОВАНИЕ | • Обрисуйте планы по совместному использованию и сохранению данных — как долго данные будут храниться и где они будут архивироваться. • Потребуются ли дополнительные ресурсы для подготовки данных к депонированию или оплаты каких-либо сборов из хранилищ данных? • См. руководство DCC: Как оценивать и выбирать исследовательские данные для курирования. |
РОЛИ И ОБЯЗАННОСТИ | • Опишите роли и обязанности для всех видов деятельности, например, сбора данных, производства метаданных, качества данных, хранения и резервного копирования, архивирования данных и совместного использования данных. Там, где это возможно, должны быть указаны имена лиц. • Для совместных проектов вы должны объяснить координацию обязанностей по управлению данными между партнерами. • См. рекомендации DataONE: Определение ролей и распределение обязанностей по управлению данными. |
БЮДЖЕТ | • Внимательно рассмотрите и обоснуйте ресурсы, необходимые для выполнения плана. Они могут включать затраты на хранение, оборудование, рабочее время персонала, затраты на подготовку данных для депозита и сборы за хранение. • Опишите любые соответствующие технические знания, поддержку и обучение, которые, вероятно, потребуются, и то, как они будут приобретены. • Если вы не размещаете данные в репозитории, убедитесь, что у вас есть соответствующие ресурсы и системы для совместного использования и сохранения данных. |
СВЯЗАННЫЕ ПОЛИТИКИ | • Подумайте, существуют ли какие-либо процедуры, на которых вы можете основывать свой подход. Если в вашей группе/отделе есть свои правила, по которым вы работаете, укажите их. • Перечислите любые другие соответствующие спонсорские, институциональные, ведомственные или групповые политики в отношении управления данными, обмена данными и безопасности данных. |
Планы управления данными – это не жестко фиксированные документы, они могут улучшаться и изменяться по необходимости в ходе работы. План, который вы разрабатываете для заявки на грант, — это всего лишь первоначальная идея. Получив финансирование, вам нужно будет расширить этот план, разработав политики и процедуры или внедрив руководящие принципы от вашей исследовательской группы, отдела или учреждения. Процессы часто изменяются с течением времени, поэтому важно реагировать на новые возможности, внося соответствующие корректировки.
Если вы не обладаете навыками, необходимыми для управления данными на протяжении всего их жизненного цикла, можно обратиться за советом к коллегам, имеющим такой опыт или использовать в качестве примера публично доступные планы или чек-листы. Стоит также обратить внимание на Guidelines on FAIR Data Management in Horizon 2020 — официальные рекомендации по разработке планов управления данными, а также подробное руководство по открытому доступу и управлению научными данными Open access & Data management, опубликованные в рамках соответствующей программы Европейского Союза.