Перейти к содержимому

Научная библиотека БНТУ

Управление научными данными

Управление научными данными относится к рабочему процессу с исследовательскими данными в активной фазе проекта, а также к методам, поддерживающим долгосрочное сохранение, доступ и использование после завершения проекта.

Хорошие практики по управлению данными:

  • повышают прозрачность исследований;
  • облегчают долгосрочное сохранение и доступ к данным;
  • экономят ваше время при написании работ;
  • снижают риск потери данных;
  • облегчают будущее повторное использование и совместное использование;
  • позволяют предоставлять необходимую информацию в финансирующие и научные организации, издателям журналов
  • улучшают цитируемость.

К заинтересованным сторонам управления данными часто относятся:

  • Исследователь: создает и использует данные
  • Учреждение: устанавливает внутреннюю политику управления данными
  • Хранилище данных: курирует и предоставляет доступ к данным
  • Пользователь: использует сторонние данные
  • Спонсор: предоставляет ресурсы для поддержки исследовательского проекта.
  • Издатель: распространяет результаты и поддерживает научные публикации.

Управление данными в жизненном цикле исследования

Жизненный цикл научных данных дает возможность продумать различные этапы, которые проходят данные в ходе исследовательского проекта.

Ключевые этапы жизненного цикла научных данных включают: планирование, первоначальный сбор данных, обработку и анализ данных, публикацию и распространение, а также хранение и повторное использование.

Поиск и планирование:

На этом этапе устанавливается, нужно ли в ходе проекта создавать новый набор данных, объединять или анализировать существующие наборы данных; определяется конфиденциальность и другие этические вопросы; рассматривается формат и содержание документации, а также стандарты метаданных, которые следует использовать для описания данных; выявляются потенциальные пользователи данных; выбирается подходящий репозиторий данных для архивирования; определяются затраты на управление данными. Эти детали должны быть включены в план управления данными.

Сбор исходных данных

Это этап, на котором определяются рабочие процессы и процедуры для организации файлов, резервного копирования и хранения, выполнения протоколов обеспечения качества и установки соответствующих средств контроля доступа и мер безопасности.

Подготовка и анализ данных

Исследователям может потребоваться очистить, интерпретировать или обработать необработанные данные. На этом этапе важно задокументировать изменения в необработанных данных и создать основную версию для анализа и последующего архивирования. Также важно документировать процедуры анализа, такие как дополнительные модификации данных, используемая модель, код, используемый для запуска анализа, а также спецификации аппаратного и программного обеспечения.

Публикация и распространение

Это этап взаимодействия с хранилищем данных или репозиторием для определения форматов файлов, очистки и дальнейшего документирования данных. Вся сопроводительная документация должна быть проверена и содержать достаточно информации для повторного использования данных.

Долгосрочное управление

Это этап, на котором исследователи делятся своими данными и выводами посредством публикаций, представляют отчеты и помещают данные и дополнительные материалы в архив или репозиторий.

Понимание жизненного цикла научных данных поможет вам:

  • эффективно планировать;
  • быть в курсе существующих данных и того, как ваши данные их дополняют;
  • тщательно продумать, как ваши данные будут собираться и обрабатываться;
  • решить, когда и где хранить ваши данные для повторного использования.