В течение многих десятилетий было принято считать, что обнародование исходных данных не является необходимостью, если методология и выводы исследования ясны. Тем не менее подходы с течением времени меняются. С одной стороны, невозможность проверять результаты и повторять эксперименты в силу искажения и/или нехватки данных привела научное сообщество к так называемому кризису воспроизводимости в науке. С другой стороны, была создана и активно развивается цифровая инфраструктура, которая обеспечивает условия для хранения данных, онлайн-доступ, поиск, просмотр и отбор данных, что стимулирует и облегчает обмен данными между всеми заинтересованными сторонами. Для исследователей очень важно разобраться в современных практиках работы с научными данными, чтобы эффективно организовывать этот процесс и получать наилучшие результаты.
Что мы имеем в виду, когда говорим о данных научных исследований? Зачем нужно публиковать научные данные? Как организовать процесс подготовки данных перед публикацией? Где можно опубликовать данные научных исследований? Как сориентироваться в современных подходах к работе с научными данными? На эти вопросы постараемся ответить в нашей статье.
Что можно считать научными данными?
На самом деле, нет единого мнения относительно определения. Проще говоря, научные данные — это вся информация, которую исследователь собирает и изучает в процессе работы над конкретной темой. Когда мы говорим о научных данных, мы можем иметь в виду как необработанные данные, так и данные, которые были обработаны и проанализированы или даже опубликованы. Они могут иметь форму аудиовизуальных материалов, программного обеспечения, кода, протоколов, методов, расшифровок интервью, моделей и т. д., в зависимости от области исследований.
Как правило, авторы научных публикаций фокусируются на основных выводах и выделяют наиболее значимые результаты, не включая большинство собранных данных по ряду причин. Во-первых, исследователи обычно собирают гораздо больше данных, чем возможно уместить в формат научной статьи. Во-вторых, общая цель научных статей состоит в том, чтобы представить данные в контексте выводов исследователя. В-третьих, необработанные или даже частично обработанные данные часто громоздки и неудобны для сортировки. Но все же публикация более развернутых наборов данных может иметь неоспоримые преимущества.
Зачем нужно публиковать научные данные?
Есть целый ряд причин, по которым исследователю стоит рассмотреть возможность публикации своих данных:
- Публикация данных может быть включена в требования издателей международных научных журналов и организаций-грантодателей, поддерживающих исследовательский проект.
- Доступность данных может увеличить цитирование научных работ. Публикуя свои данные, исследователь может предоставить другим возможность корректно цитировать их и получать заслуженное признание своих результатов.
- Публикация данных может увеличить видимость, повысить наглядность научных проектов и влияние исследования. Это позволит ученым более подробно рассмотреть полученные данные, методы и анализ, что может привести к прогрессу в текущем изучении проблемы и к новым направлениям исследований.
- Публикация данных также может способствовать сотрудничеству и повысить репутацию исследователя в научном сообществе.
- В условиях кризиса воспроизводимости доступ к наборам данных может помочь повторить проведенные эксперименты и подтвердить достоверность полученных результатов.
- Обмен данными полезен не только для науки, но и для общества в целом. Если данные имеют социальную значимость, их можно использовать для более широкого освещения (например, в СМИ) и принятия решений на разных уровнях.
- Публикация данных может иметь также экономический эффект, поскольку позволяет оптимизировать расходы на проведение дальнейших исследований, если использование данных разрешено.
Как подготовить данные для публикации?
Для исследователей крайне важно грамотно организовать работу с данными, чтобы эффективно использовать свои ресурсы; быть в курсе существующих данных и того, какие данные ещё необходимы; тщательно продумать, как данные будут собираться, обрабатываться и храниться.
Целенаправленный процесс работы с данными в активной фазе исследовательского проекта и после его завершения в мировой практике называется «управлением научными данными». Он включает различные этапы: планирование и сбор данных, подготовку и анализ данных, публикацию и распространение, а также долгосрочное хранение. Рационально организовывать этот процесс помогает план управления данными — документ, в котором содержится информация о данных, полученных в ходе исследования, и излагаются стратегии управления данными. Наряду с другими элементами, как правило, он включает определение форматов данных, отбор наиболее значимых данных для архивирования и публикации, выбор хранилища для размещения данных, что является важной подготовкой перед публикацией данных.
На этапе подготовки данных к публикации важно убедиться, что на них не распространяются правовые ограничения, такие, например, как защита конфиденциальности.
Где можно опубликовать данные научных исследований?
Если данных незначительное количество, ряд журналов может принять их в качестве дополнительной информации к публикации. Как правило, информация о требованиях определенного журнала к предоставлению данных содержится на сайте издания. Однако такой способ не идеален, поскольку такие наборы данных может быть трудно обнаружить при поиске.
Кроме традиционного способа прилагать данные к научной статье в настоящее время существует два основных пути для публикации наборов данных как самостоятельных интеллектуальных продуктов. Если вы предполагаете разместить относительно большой объем данных, то можно воспользоваться довольно развитой системой разнообразных хранилищ и репозиториев данных. Это может быть реализовано как на институциональном уровне, если такая возможность предоставляется учреждением, так и при помощи специализированных международных общедоступных платформ. Они обеспечивают долгосрочную сохранность данных, помогают в поиске данных, продвигают передовые методы цитирования и идентификации, а также соответствуют требованиям издателей и грантодателей к предоставлению доступа к данным. Одним из примеров таких хранилищ является Zenodo — репозиторий общего назначения с открытым доступом, разработанный в рамках европейской программы OpenAIRE и управляемый CERN. При размещении в хранилище данных важно определить ограничения доступа для каждого элемента данных и выбрать необходимую лицензию, определяющую условия использования и воспроизведения.
Другой путь – это размещение в специализированных «журналах данных», предназначенных для публикации наборов данных и кратких описаний к ним. Такие публикации называются статьями об элементах исследований. Они обязательно проходят процесс рецензирования и дополняют основные научные работы. Среди самых известных журналов такого типа можно упомянуть Data in Brief (Elsevier), Open Health Data (Ubiquity Press), Genomics Data (Elsevier), Scientific Data (Nature) и GigaScience (BMC). Подобные издания приобретают все большую популярность и их количество постоянно увеличивается. Журналы данных призваны упростить поиск наборов данных и улучшить их распространение и цитирование. В большинстве журналов есть стандартная форма, которую авторам легко заполнить, чтобы представить свои результаты.
Данные научных исследований могут быть опубликованы как до, так и после основной научной статьи. Опубликованные наборы данных могут быть процитированы или иным образом связаны с основной публикацией.
Как сориентироваться в современных подходах к работе с научными данными?
Он подробно освещает вопросы управления данными, их хранения, анализа и визуализации, публикации и цитирования.
Рекомендуем воспользоваться опытом и технологиями, наработанными международным научным сообществом для того, чтобы ваши исследования были не только актуальными и инновационными, но также хорошо организованными и более эффективными.
Текст: Алина Шкутова, отдел развития научных коммуникаций. Источник фото