28.12.2020

Колонка эксперта. Гайд по J-PAL: электронное руководство по использованию административных данных

Данные – неотъемлемая часть доказательной политики. Наиболее ценными в этом контексте являются микроданные, имеющие минимальный уровень агрегации, в частности – первичные статистические данные и административные данные.

В ноябре этого года Лаборатория борьбы с бедностью (J-PAL) при Массачусетском технологическом институте (МТИ)[1] выпустила электронное руководство, посвященное использованию административных данных в целях реализации доказательной политики[2]. Руководство разработано авторским коллективом при участии профессорского состава МТИ и экономистов Всемирного банка.

В современных условиях административные данные – это совокупность активов государства, которые должны быть направлены на максимизацию пользы для общества. Не смотря на высокую степень репрезентативности при проведении исследований, использование анализа административных данных в процессе принятия стратегических и операционных управленческих решений в государственном управлении все еще является редкостью в силу ряда ограничений, которые во многом характерны для России:

  • Данные непригодные для анализа. Организация и систематизация данных, включая их предобработку, гармонизацию, обеспечение связности (в том числе с другими источниками), описание и документирование, часто требуют значительных ресурсов (прежде всего, организационных): на уровне органов исполнительной власти не всегда имеются такие возможности. Как следствие – данные представляются в устаревших форматах, затрудняющих их систематический анализ.
  • Риск идентификации персональных данных. Уникальная особенность и одновременно одно из главных ограничений административных данных – высокий уровень детализации (до конкретного индивида, как например, данные о диагнозах и истории болезни пациента): такая информация является сенситивной и конфиденциальной. Деперсонализация и анонимизация административных данных – ключевой приоритет.  Это не только требование законодательства многих стран (в том числе России), но и вопрос этики. Однако обеспечение безопасности персональных данных – многосложный процесс: как с технологической, так и с юридической точки зрения. Для органов государственной власти, не имеющих соответствующей практики и компетенций, это ограничение – определяющее при отказе от анализа административных данных.
  • Недостаточные стимулы органов власти. Выгоды от предоставления исследователям доступа к административным данным не всегда очевидны для ФОИВ: организация такого доступа может занимать длительное время и быть дорогостоящим для поставщиков данных, в то же время органы власти не всегда понимают конечную ценность анализа административных данных в целях улучшения процесса принятия решений, а иногда видят в нем репутационные риски.

Руководство J-PAL с акцентом на практические кейсы показывает, как можно работать с указанными ограничениями, превращая административные данные в доказательства эффективности / неэффективности проводимой государственной политики.

Первая часть руководства посвящена механизмам организации доступа к административным данным: поиску взаимовыгодных (как для исследователей, так и для органов власти) решений по деперсонализации данных, их предобработке и формированию связных датасетов, управлению инфраструктурой данных, составлению соглашений об использовании данных, сотрудничеству между исследователями и органами власти.

Второй раздел полностью состоит из практических кейсов и структурированных тематических исследований, рассказывающих о практиках внедрения различных механизмов доступа к административным данным в государственном управлении: от разработки единой облачной платформы для обмена данными в Кейптауне (ЮАР) и ее использования в борьбе с засухой и COVID-19 до создания крупных дата-центров развитых стран таких, как, например, Институт исследований рынка труда и занятости в Германии[3], или формирования коллабораций между международным исследовательским сообществом и ФОИВ конкретного государства для решения задач социального развития, как это происходит в Индонезии.

Кому и зачем может быть полезно руководство:

  1. Руководителям органов исполнительной власти – для расширения возможностей использования административных данных в принятии управленческих решений и формировании государственной политики.
  2. Исследовательским сообществам и высшим учебным заведениям – для продвижения и позиционирования возможных выгод как для ФОИВ в частности, так и для общества в целом от результатов исследований; а также для понимания механизмов организации доступа к административным данным.
  3. Службам государственной статистики – в целях формирования оперативной статистики.

Витовт Копыток, руководитель проекта «Данные для исследований»:

 

«Мы использовали руководство J-PAL при подготовке наборов данных к хакатону Pandemic Data Hack, который проводили совместно с Рострудом. Основное решение, которое приходится принимать, когда работаешь с микроданными: как сохранить конфиденциальность, при этом не сильно снижая их детализацию? Это сложный выбор – во многих случаях повышение агрегации приводит к тому, что получится проверить меньше исследовательских гипотез. Нужно быть аккуратным, чтобы применение методов обезличивания не привело к снижению точности оценок, которые будут получены при анализе данных. Если дизайн исследования известен заранее, можно разработать процедуру обезличивания таким образом, чтобы она не влияла на качество получаемых оценок. А вот если данные готовятся не под конкретное исследование, учесть все нюансы сложнее. Пятая глава руководства J-PAL содержит хорошее введение в методы обезличивания: ссылки на литературу и практические инструменты, включая репозитории со скриптами, в которых реализованы различные процедуры обезличивания и проверки рисков деидентификации.

Вторая часть руководства интересна с точки зрения той экосистемы вокруг данных для исследователей, которую пытается развивать ИНИД. Если посмотреть на практические кейсы из разных стран, то видно, что форматов институциализации механизмов передачи данных от государственных органов исследователям довольно много. В качестве посредников между органами власти и учеными могут выступать структурные подразделения министерств, подведомственные организации, отраслевые университеты, некоммерческие организации. Последняя форма используется довольно часто. С одной стороны, она позволяет избавиться от излишнего формализма, присущего государственным институциям. С другой, помогает преодолеть конфликт интересов, который неизбежно возникает, когда, например, крупный университет получает доступ к эксклюзивный данным, на которых он проводит собственные исследования. Форма «nonprofit institution» позволяет обеспечить равный доступ к данным государственных органов, как крупных исследовательских центров, так и небольших исследовательских коллективов».

 

[1] The Abdul Latif Jameel Poverty Action Lab (J-PAL) - Лаборатория борьбы с бедностью им. Абдул-Латифа Джамиля, созданная экономистами - нобелевскими лауреатами 2019 года Абхиджит Винаяк Банерджи (США) и Эстер Дюфло (Франция).

Читайте также

Загрузить еще