- Главная
- /
- Лаборатория научных коммуникаций
- /
- Работа с научными данными
- /
- Управление научными данными
Управление научными данными
Управление научными данными относится к рабочему процессу с исследовательскими данными в активной фазе проекта, а также к методам, поддерживающим долгосрочное сохранение, доступ и использование после завершения проекта.
Хорошие практики по управлению данными:
- повышают прозрачность исследований;
- облегчают долгосрочное сохранение и доступ к данным;
- экономят ваше время при написании работ;
- снижают риск потери данных;
- облегчают будущее повторное использование и совместное использование;
- позволяют предоставлять необходимую информацию в финансирующие и научные организации, издателям журналов
- улучшают цитируемость.
К заинтересованным сторонам управления данными часто относятся:
- Исследователь: создает и использует данные
- Учреждение: устанавливает внутреннюю политику управления данными
- Хранилище данных: курирует и предоставляет доступ к данным
- Пользователь: использует сторонние данные
- Спонсор: предоставляет ресурсы для поддержки исследовательского проекта.
- Издатель: распространяет результаты и поддерживает научные публикации.
Управление данными в жизненном цикле исследования
Жизненный цикл научных данных дает возможность продумать различные этапы, которые проходят данные в ходе исследовательского проекта.
Ключевые этапы жизненного цикла научных данных включают: планирование, первоначальный сбор данных, обработку и анализ данных, публикацию и распространение, а также хранение и повторное использование.
Поиск и планирование:
На этом этапе устанавливается, нужно ли в ходе проекта создавать новый набор данных, объединять или анализировать существующие наборы данных; определяется конфиденциальность и другие этические вопросы; рассматривается формат и содержание документации, а также стандарты метаданных, которые следует использовать для описания данных; выявляются потенциальные пользователи данных; выбирается подходящий репозиторий данных для архивирования; определяются затраты на управление данными. Эти детали должны быть включены в план управления данными.
Сбор исходных данных
Это этап, на котором определяются рабочие процессы и процедуры для организации файлов, резервного копирования и хранения, выполнения протоколов обеспечения качества и установки соответствующих средств контроля доступа и мер безопасности.
Подготовка и анализ данных
Исследователям может потребоваться очистить, интерпретировать или обработать необработанные данные. На этом этапе важно задокументировать изменения в необработанных данных и создать основную версию для анализа и последующего архивирования. Также важно документировать процедуры анализа, такие как дополнительные модификации данных, используемая модель, код, используемый для запуска анализа, а также спецификации аппаратного и программного обеспечения.
Публикация и распространение
Это этап взаимодействия с хранилищем данных или репозиторием для определения форматов файлов, очистки и дальнейшего документирования данных. Вся сопроводительная документация должна быть проверена и содержать достаточно информации для повторного использования данных.
Долгосрочное управление
Это этап, на котором исследователи делятся своими данными и выводами посредством публикаций, представляют отчеты и помещают данные и дополнительные материалы в архив или репозиторий.
Понимание жизненного цикла научных данных поможет вам:
- эффективно планировать;
- быть в курсе существующих данных и того, как ваши данные их дополняют;
- тщательно продумать, как ваши данные будут собираться и обрабатываться;
- решить, когда и где хранить ваши данные для повторного использования.