Мы опубликовали три открытых научных набора данных, разработанных исследователем в области искусственного интеллекта и Data Science Борисом Крюком.
Это датасеты про вечную мерзлоту, природные пожары и сейсмические события. У них разная предметная область, но общая логика: большой охват, открытые форматы, подробные метаданные и возможность использовать данные повторно — для новых моделей, проверок, инженерных расчётов и прикладных исследований.
В ИНИД размещены:
Pan-Arctic Permafrost Dataset — 2,9 млн наблюдений по 171 605 локациям за 2005–2021 годы. Набор данных охватывает Арктическую зону России и предназначен для исследований вечной мерзлоты, климатических рисков, инженерного и территориального планирования.
Eurasia Wildfire Open Dataset — открытый набор данных о пожарах на территории России и Евразии с привязкой к метеорологическим наблюдениям. Он закрывает важный дефицит открытых данных по пожарной динамике и может использоваться для анализа природных и климатических рисков, разработки систем мониторинга и прогнозирования, исследования экосистемных и антропогенных факторов.
POSEIDON Global Seismic Dataset — глобальный каталог сейсмических событий, включающий 2,8 млн записей за 30 лет наблюдений. Датасет может применяться в фундаментальных исследованиях по сейсмологии, оценке сейсмических и цунами-рисков, а также при разработке и валидации физико-информированных моделей.
По словам Бориса Крюка, открытая публикация таких данных важна не только для отдельного исследования, но и для развития научной среды в целом:
"Россия — огромная страна с целым рядом недоизученных направлений: вечная мерзлота, природные пожары, сейсмика. Данных и моделей здесь объективно не хватает, а потребность в них велика. Для меня открытая публикация — это способ сделать так, чтобы собранное один раз приносило пользу десяткам коллективов по всей стране, а не лежало в одном архиве. Наука сильнее, когда она общая."
По оценке автора, эти наборы данных имеют долгосрочную научную ценность и могут использоваться как референсные датасеты в своих областях. Для ИНИД такая публикация важна ещё и как пример того, как исследовательские данные становятся не приложением к статье, а самостоятельным открытым ресурсом.
Публикация таких материалов в ИНИД делает научные данные доступнее для повторного использования: исследователи могут не только ознакомиться с результатами работ, но и использовать сами данные для новых моделей, проверок, расчётов и прикладных исследований.