В чём заключается концепция «третьей волны открытых данных» и как удержаться на её гребне.
⠀
Развитие цифровых технологий привело к значительному увеличению объёма данных, которые можно анализировать. Изменения затронули все элементы работы с информацией: сбор, обработку, анализ, дальнейшее распространение и практическое применение полученных результатов. Как следствие, всё больше растёт и обмен данными, в том числе через специальные инфраструктуры, например проекты, предоставляющие доступ к научным данным. Они облегчают работу с информацией на одном или нескольких этапах и решают дополнительные задачи:
⠀
Таким образом, одним из залогов активного и продуктивного обмена данными является их открытость. По убеждению сторонников открытых данных, сведения, полученные от общества, должны быть в общественном распоряжении или по крайней мере доступны для желающих ознакомиться с этими данными. За многие годы активистам в этой области удалось достичь большого прогресса: уже стало привычно, что государства по всему миру публикуют свои данные на специальных порталах в режиме свободного доступа.
⠀
Как считают представители Open Data Policy Lab, проекта исследовательского центра The Governance Lab, несмотря на достигнутые успехи в области открытости данных, сохраняются и проблемы. Во-первых, большое количество, возможно, бóльшую часть, данных собирают частные компании. Доступ к таким потенциально полезным сведениям, их перевод в статус открытых данных — непростая задача. Во-вторых, в прошлом приоритетом сторонников открытости были государственные сведения на национальном и международном уровнях, это привело к отставанию и недостатку внимания к информации, которую собирают на региональном и локальном уровнях. В-третьих, нарушение информационных прав граждан, например скандалы, связанные с утечкой личных данных, значительно подорвали доверие к идее открытых данных.
Исследователи полагают, что комплекс инновационных мер позволил бы решить эти проблемы и перевести принципы работы с данными на новый этап развития — в «третью волну открытых данных». Концепция «третьей волны открытых данных» была выдвинута почти год назад, в октябре 2020 года, в статье «Появление третьей волны открытых данных» (The Emergence of a Third Wave of Open Data). За прошедшее время исследователи Open Data Policy Lab представили развитие этой концепции в статье «Набор инструментов для третьей волны открытых данных» (The Third Wave of Open Data Toolkit), опубликованной в марте этого года, а также в августовской публикации «Многоуровневый подход к документированию того, как третья волна открытых данных может принести пользу обществу» (A Layered Approach to Documenting How the Third Wave of Open Data Can Provide Societal Value).
⠀
Что такое «волны открытых данных»?
⠀
В период пандемии COVID-19 понятие «волна» приобрело негативное значение, ассоциирующееся с новым всплеском заболеваний. Однако в случае открытых данных это понятие несёт, скорее, позитивный смысл. «Волна» — это парадигма, в которой работают специалисты в области открытых данных.
⠀
Ключевым элементом «первой волны» было законодательство о свободе информации. Журналисты, юристы и активисты НКО получили возможность направлять прямые запросы государственным органам власти и тем самым раскрывать засекреченные данные, представляющие интерес для общества. Прежде всего они работали с информацией национального значения.
⠀
«Вторая волна» началась, когда должностные лица отдельных стран мира приняли решение раскрыть часть информации и предоставить к ней доступ с помощью специальных порталов открытых данных. Государства стремились повысить уровень открытости: с помощью данных ведомства, крупные корпорации и небольшие компании могли найти решения общественных проблем. Пример такого решения — разработка приложений для транспортной системы Лондона.
⠀
Как считают представители Open Data Policy Lab, «третья волна» связана с появлением новых подходов к обработке информации. По их мнению, главное отличие от предыдущих лет заключается в целевом раскрытии данных. В новых условиях фокус сместится с «открытости ради открытости» на формирование наиболее полезных и запрашиваемых датасетов. Спрос на данные будет иметь столь же большое значение, сколь и их доступность, а роль контекста, в котором организации собирают и применяют данные, будет лишь возрастать.
⠀
В чём заключаются особенности «третьей волны»?
⠀
По мнению исследователей, у нового периода будет четыре отличительных черты, которые позволят развить достижения прошлых лет и дополнить уже сложившиеся структуры работы с данными.
⠀
Целевое раскрытие
⠀
Для работы с данными необходимо затратить финансовые, технические и человеческие ресурсы. Объём этих ресурсов ограничивает возможности не только тех, кто предоставляет данные, но и тех, кто нуждается в информации. Понимание того, что в условиях ограниченности ресурсов экспертам необходимо расставлять приоритеты, лежит в основе «третьей волны». Как считают в Open Data Policy Lab, вместо того чтобы производить данные и выкладывать их, надеясь, что их кто-то найдет, необходимо установить связь с пользовательским сообществом и узнать их запросы.
⠀
Эксперты Центра перспективных управленческих решений (ЦПУР), а также платформы «Инфраструктура научно-исследовательских данных» (ИНИД) проводят подобные исследования, в частности, изучают то, насколько открытые данные ведомств соответствуют запросам общества. К примеру, в аналитической записке «Открытые данные в дипломатии: Россия в контексте международного опыта», в котором в числе прочего рассматриваются открытые данные МИД России, делается вывод: «МИД России также следует более активно способствовать использованию своих открытых данных другими стейкхолдерами, прежде всего исследователями, СМИ, общественными организациями».
⠀
Сотрудничество в области данных
⠀
В ходе «третьей волны» расширится круг сторон, работающих с данными, а сотрудничество между ними будет укрепляться. Изучению данных будут всё больше уделять внимание общественные и некоммерческие организации, малый бизнес, местные власти и другие стороны, которые могут применять полученные сведения на локальном уровне. Исследователи считают, что в этом им могут помочь специалисты в области данных, которые будут играть более значимую роль во время принятия решений.
⠀
Совместные проекты в области данных, которые объединяют силы государственного и частного секторов, будут иметь большое значение во время «третьей волны». Как считают исследователи, новые модели сотрудничества на их основе позволят идентифицировать и продуктивно работать с данными коммерческих компаний, обладающими большим общественным значением.
⠀
Открытость региональных данных
⠀
В прошлом эксперты по открытости основное внимание уделяли данным национального и международного масштаба. В условиях «третьей волны» всё большее значение получат данные регионального масштаба. Сведения, которые собирают на уровне городов и регионов, обладают более высоким уровнем детализации и практическим значением, а значит, с их помощью можно прямо повлиять на жизнь граждан.
⠀
Ответственная работа с данными и защита информационных прав
⠀
Если в период первых двух «волн» специалисты отмечали угрозу нарушения права граждан на приватность информации, то во время «третьей волны» им придется разбираться с бóльшим числом проблем. К примеру, с последствиями предвзятого подхода при анализе данных или с негативным эффектом от применения датасетов.
⠀
Исследователи считают, что в этой ситуации защита приватности не должна приводить к негативным последствиям. Некоторые организации и страны предпочитают не раскрывать данные, аргументируя это защитой приватности и безопасностью, что приводит к дополнительным сложностям при работе с информацией и замедляет появление инноваций. В период «третьей волны» сообществу исследователей открытых данных предстоит сформировать правила, чтобы они учитывали такие риски.
⠀
В сентябре этого года ЦПУР в рамках проекта ИНИД представил аналитический обзор международного опыта институционализации доступа исследователей к разным типам микроданных, которыми обладают органы государственной власти. Из-за рисков раскрытия чувствительной информации такие данные, как правило, не публикуются и требуют использования специальных организационных и инфраструктурных механизмов для установления доступа к ним. В обзоре предложена типология, включающая в себя три основных модели доступа к таким данным, а также модель институционализации доступа, оптимальная для современной России.
⠀
Как вызвать «третью волну»: тенденции и набор инструментов
⠀
Чтобы «поймать» «третью волну», исследователям открытых данных нужно понять, из каких тенденций она состоит, и применить определённые инструменты для усиления этих тенденций и соответствия им. Представители Open Data Policy Lab провели интервью с экспертами из государственных ведомств, частного сектора и общественных организаций и выявили восемь тенденций, определяющих новый подход к обеспечению открытости информации, а также подобрали инструменты, применение которых поможет «оседлать» каждую из них.
⠀
Создание и развитие информационных ресурсов для распределения объёмов ведомственных данных
⠀
Организации, работающие с открытыми данными, как правило, делегируют эту задачу отдельным командам, в чьих руках консолидируются навыки и ресурсы с информацией. Изоляция от других команд не предоставляет им возможности достаточно влиять на повседневную деятельность организации.
⠀
В качестве одного из решений исследователи предлагают распределять специалистов, обладающих навыками работы с открытыми данными, по различным отделам, это может помочь преодолеть институциональные барьеры. Целенаправленные усилия по инвестированию, развитию и распространению навыков работы с данными могут помочь организации основываться на фактических данных и систематизировать все свои операции.
⠀
Осознание ценности и влияния открытых данных и создание базы с информацией о доказанном влиянии
⠀
Первые две «волны» во многом опирались на абстрактные аргументы о ценности права на доступ к общественной информации и его важности. Сила этих аргументов слабеет, когда в бюджете не хватает средств на открытость. Отраслевым руководителям, правительственным чиновникам и общественности бывает просто необходимо понимать, какую ощутимую пользу принесут им инвестиции в открытые данные. Иначе открытые данные не будут восприниматься как важная потребность, а будут выглядеть ещё одним «полезным дополнением». Часто лучше обратиться непосредственно к интересам организаций или отдельных личностей, чтобы дать простые объяснения того, как открытые данные поддержат достижение их целей.
⠀
Также важно показать, как раскрытие данных приводит к положительным результатам на практике, например через экономический рост. В связи с этим Open Data Policy Lab предлагает собирать информацию о примерах успешного решения проблем с помощью данных. Примеры таких решений из разных стран собирает команда ЦПУР в рамках проекта Доказательная политика.
⠀
Новые посредники данных и их поддержка
⠀
Как считают исследователи, важную роль будут играть посредники, которые могут оптимизировать затраты на работу с данными. Посредники данных могут расширять возможности организаций и поддерживать работу с открытыми данными, предоставляя необходимые ресурсы, будь то безопасные платформы для совместной работы и обмена данными или поддержка в составлении соглашений о совместном использовании данных.
⠀
По мнению исследователей, посредники данных могут наладить связь между сторонами, которые обладают данными и которые нуждаются в них, а также предоставить техническую поддержку всем акторам. Одним из примеров таких посредников выступает платформа ИНИД, целью которой является обеспечение продуктивного взаимодействия между владельцами данных о государстве и обществе и исследователями для принятия управленческих решений на основе данных и для совершенствования государственной политики.
⠀
Создание структуры управления данными: регуляция и чёткие правила
⠀
Организации часто не понимают, как управлять данными в разных ситуациях, и поэтому действуют в условиях неопредёленности, в том числе и правовой. В государственном секторе такие проблемы выражаются на всех уровнях: национальном, международном и особенно на региональном. Компаниям из коммерческого сектора тоже не всегда понятно, с какими данными и партнёрами можно работать без нарушения юридических норм. Определение этих норм — приоритет в период «третьей волны».
⠀
На протяжении всего жизненного цикла данных, включая этапы сбора, хранения, подготовки, обмена, анализа и использования, акторы могут оценивать риски и стремиться к их предотвращению. Эта концепция называется сквозной ответственностью за данные, и она важна для обеспечения доверия и пресечения возможности нанесения вреда. Организации могут поощрять обеспечение мер безопасности в отношении данных правительственными, межправительственными и международными органами или создавать порталы для облегчения повторного использования данных. Так, специалисты ИНИД уже занимаются разработкой стандартов деперсонификации данных для юридической и методологической поддержки госорганов при работе с данными.
⠀
Создание технической инфраструктуры для повторного использования данных
⠀
Наиболее популярными методами обмена информацией в «первую волну» были веб-формы и электронные письма, а во «вторую волну» — порталы открытых данных. Хотя формат портала открытых данных, вероятно, останется общим местом технической инфраструктуры, приоритетом «третьей волны» будет оптимизация уже сложившейся инфраструктуры, повышение её технологического уровня и введение общих стандартов данных.
⠀
Межотраслевые, междисциплинарные исследования и разработки будут способствовать такому усовершенствованному технологическому развитию. Новые и сложные технические разработки могут сподвигать к более ответственному повторному использованию данных и более тесному сотрудничеству. Такие разработки могут включать улучшенные вычислительные мощности для анализа больших наборов данных и новые и безопасные способы передачи данных.
⠀
Содействие формированию и развитию компетенций в работе с публичными данными
⠀
При работе с данными нельзя забывать об интересах общества: люди не только пользуются открытой информацией, но и раскрывают сведения о себе. Чем больше людей будут знать основы науки о данных, тем больше они смогут влиять на политику обработки информации.
⠀
Чтобы гарантировать ответственное использование данных и технологий, важно, чтобы как выгоды, так и связанные с ними риски оценивались заинтересованными сторонами. Организации могут поддержать усилия по повышению компетентности в работе с публичными данными, не только делая доступными данные, но и создавая сопроводительную документацию на понятном языке без использования жаргонизмов.
⠀
Контроль, мониторинг и разъяснение принятых решений и предоставленных данных
⠀
История принятия решений и подробная информация о них являются ключом к снижению рисков и наиболее эффективному повторному использованию данных. Недостаточная прозрачность того, каким образом стороны собирают данные и как принимают решения на их основе, сокращает возможность узнать, какие меры могли бы снизить риски.
⠀
С помощью прозрачности можно в большей степени избегать негативных последствий от работы с данными. Организации могут установить информацию обо всех решениях, которые влияют на сбор, обработку, анализ, совместное использование и повторное использование данных, а также обо всех сторонах, которые влияют на принятия этих решений. Через это организации могут понять, почему системы существуют именно в таком виде, и соответственно реагировать, когда эти системы не дают желаемых результатов.
⠀
Создание проводников данных
⠀
Проекты «третьей волны» будут нуждаться в институциональной поддержке. Как считают в Open Data Policy Lab, главным структурным сдвигом станет появление новых ролей и зон ответственности. Проводники данных (data stewards) и старшие проводники данных (chief data stewards) могут стать лидерами, которые будут распознавать возможности в области сотрудничества и распространения информации.
⠀
Некоторые государства организуют межведомственные команды по работе с открытыми данными или нанимают экспертов по развитию этого направления. Организации могут продвигать эффективные методы работы с данными, назначив отдельную команду или отдельного человека для управления совместной работой с данными.
⠀
Многоуровневый подход к документированию того, как «третья волна открытых данных» может принести пользу обществу
⠀
Структура открытых данных (Open Data Framework), разделённая на слои, похожие на репчатый лук в разрезе, показывает все процессы, которые используются для извлечения пользы из данных в ходе «третьей волны». Эта «луковая модель» демонстрирует, как организации могут создавать пользу для общества, делая свои данные доступными для повторного использования другими сторонами.
⠀
Первый слой — жизненный цикл данных — описывает процессы сбора, обработки, распространения, анализа и использования данных. Второй слой описывает расширение доступа к данным за счет совместной работы. Третий слой фокусируется на глубоком понимании процессов через обработку данных. Четвёртый слой описывает благоприятные условия для работы с данными. Пятый слой даёт определение ценности данных для общества. Последний, шестой слой, описывает приоритетные действия, которые будут работать на развитие концепции «третьей волны открытых данных», они же и есть те восемь инструментов, которые описаны выше.