07.12.2025

От центральных хранилищ к сетям: федеративные системы как будущее открытых данных

С 13 по 16 октября 2025 года в Брисбене (Австралия) прошла biennial конференция International Data Week — событие, на которое съезжаются лучшие специалисты по управлению научными данными со всего мира. Число участников впечатляет: 807 человек из 75 стран, включая 704 очных участников и 103 онлайн-участников. На конференции было проведено 107 сессий, 130 постеров и 63 lightning talks. Эта масштабная встреча стала не только форумом для обсуждения достижений, но и площадкой для формирования новой парадигмы управления научными данными.

День первый: Индигенные данные и их суверенитет

Конференция открылась пленарной сессией, посвященной CARE-принципам индигенного управления данными (Collective Benefit, Authority to Control, Responsibility, Ethics). Этот фокус неслучаен: одной из ключевых проблем 2025 года стало право сообществ (в том числе коренных народов) контролировать и решать, как используются их данные.
      

 «Индигенные сообщества имеют право на владение и контроль над своими знаниями и данными. Это не просто этика — это основа будущей системы»

— Розалин Хикс, модератор пленарной сессии

Спикеры рассказали о конкретных примерах: как народы Тайваня, Саамов и австралийских коренных жителей строят инструменты для управления своими данными, сохраняя не только доступ, но и культурную целостность информации.

День второй: FAIR, ИИ и ответственная наука

На второй день конференции центральной темой стала «Строгая, ответственная и воспроизводимая наука в эпоху FAIR и ИИ». Модератор сессии — президент CODATA Мерсе Кросас — собрала экспертов из разных дисциплин:

  • Агнес Кирагга рассказала о практическом применении инструментов науки о данных в контексте развивающихся стран
  • Ана Арджона выступила с критическим взглядом: нужна более глубокая валидация данных в социальных науках
  • Джульет Геррард отразила сложности на пересечении науки и государственной политики

Главный вывод: FAIR-принципы (Findable, Accessible, Interoperable, Reusable) уже не просто идеальный стандарт — они становятся практической необходимостью, особенно в условиях, когда системы ИИ нуждаются в чистых, хорошо описанных данных.

День третий: Открытая наука и федеративные системы

Центральная пленарная сессия «Open Research and Federated Systems: Disciplinary, Regional, and International Perspectives» дала название новому тренду. Спикеры обсудили архитектурный сдвиг: Что такое федеративные системы?

Классический централизованный репозиторий работает так: исследователь загружает данные в один большой сервер (например, Zenodo или Figshare), откуда их может скачать любой.

Федеративная система работает иначе:
Данные остаются там, где они созданы — в лабораториях, университетах, региональных архивах. Но благодаря единым стандартам метаданных (FAIR, DataCite) и протоколам обмена, все эти локальные хранилища видны друг другу. Исследователь выполняет один поиск через федеративный каталог и получает результаты из десятков репозиториев одновременно.

Главное преимущество: суверенитет данных. Организация полностью контролирует, кто может получить доступ к данным, как их использовать и сохраняет полную техническую и юридическую ответственность.

Спикеры подчеркнули три ключевых преимущества этого подхода:

  1. Геополитическая устойчивость
В условиях цифровых санкций и глобальной напряженности страны и организации получают возможность сохранить свои данные дома, не отправляя их в американские облака.
  2. Локальная оптимизация
Каждое учреждение может настроить свой репозиторий под специфику своих данных — будь то медицинские записи с дополнительной защитой, промышленные данные, или открытые датасеты.
  3. Масштабируемость
Вместо того чтобы строить один гигантский сервер, можно создать сеть специализированных узлов.

Региональные примеры

Фиона Брэдли (Великобритания) подчеркнула важность справедливого доступа к знаниям — федеративные системы позволяют исследователям из развивающихся стран оставаться включенными, не становясь зависимыми от глобальных гигантов.

Марсель Гарсия де Суза описал, как эти принципы реализуются в Бразилии, где создается региональная инфраструктура открытых данных с учетом местных потребностей и регуляций.
Берни Поп рассказал о применении в геномике — как федеративные системы позволяют университетам и больницам обмениваться генетическими данными в этических рамках, без создания единого глобального генобанка.

Значение для России

Этот тренд имеет прямое значение для российских исследователей и проектов, подобных нашему. Вместо того чтобы все данные стекались в одну американскую платформу, мы можем создавать локальную инфраструктуру, которая останется под полным контролем. При этом через протоколы интеграции (OAI-PMH, JSON-LD, DOI) эти данные будут видны глобальному сообществу.

Это не замыкание, а суверенное открытие.

Финальный день: Данные для позитивных перемен

На закрывающей сессии «Data for Positive Change: Where to Next?» спикеры размышляли о будущем:

  • Девика Мадалли говорила о роли данных в решении проблем в развивающихся странах
  • Нокутула Мчуну поднял вопрос социальной справедливости в доступе к данным
  • Сандра Коллинз и Родриго Роа обсудили, как данные могут служить инструментом экологической политики и климатических действий 

«Данные сами по себе нейтральны. Но как мы их организуем, кому даем доступ и для каких целей — это политический выбор»

— Финальный вывод IDW 2025

Практические следствия для ИНИД

  1. Мы на правильном пути. Если ваш проект работает как специализированный узел в сети, он ценен именно в качестве такого узла.
  2. Интеграция важнее масштаба. Вместо того чтобы пытаться собрать ВСЕ данные, фокусируйтесь на глубокой интеграции с другими репозиториями через стандарты.
  3. Суверенитет данных — это фича, а не баг. Исследователи хотят знать, что их данные в безопасности и под их контролем.

 

Источники
World Data System: «Data Without Borders: Highlights from International Data Week 2025» (4 ноября 2025)
Research Data Alliance (RDA), CODATA, Australian Research Data Commons (ARDC)

Читайте также

Загрузить еще