27.08.2021

Объединяй и властвуй: как интеграция данных позволит нам жить лучше

Витовт Копыток, руководитель проектного направления «Данные для исследований» Центра перспективных управленческих решений

Где построить больницу? Как победить молодёжную преступность? Уменьшить бедность? Или снизить смертность? Интеграция административных данных из нескольких источников позволяет отвечать на эти и многие другие вопросы. Но для прорыва в исследованиях нужно дать учёным и аналитикам доступ к этим ценным сведениям.

Государство не первый год собирает в информационных системах сведения о жизни в стране: размеры социальных отчислений, рождаемость и смертность, получение пособий, истории болезней и многое другое. Пандемия коронавируса подтолкнула ведомства к интеграции данных, хранящихся в разрозненных источниках, а это открывает практически безграничные возможности для оценки результатов государственной политики. Комбинируя данные, исследователи получают возможность проверять гипотезы, о которых раньше могли только экспертно рассуждать.

Прозрачные и понятные правила доступа к данным для академических исследователей способствовали бы появлению прорывных работ в области оценки государственных программ и проектов. Однако пока нет чётко описанных правил, кому и на каких условиях могут быть предоставлены обезличенные, но детальные данные государства. Так, например, весной Правительство утвердило новый пакет документов по «Единой информационной платформе национальной системы управления данными» (НСУД), которая систематизирует данные из множества государственных систем для повышения качества оказания госуслуг. Но смогут ли получить доступ к данным из НСУД академические исследователи — вопрос открытый. В рамках НСУД планируется запуск «Цифровой аналитической платформы предоставления статистических данных», но также пока нет уверенности, что там будут доступны не только статистические показатели, но и микроданные.

Административные данные собираются не ради формирования статистики. Основная задача государственных органов — выдавать пособия, регистрировать организации, разрешать ввоз товара и выполнять другие функции, а микроданные являются побочным продуктом этой деятельности. При этом собранные данные, как правило, отличаются детальностью и широким охватом. К примеру, Пенсионный фонд России каждый месяц получает от работодателей информацию о страховых взносах и доходах, на которые начислены эти взносы. В традиционных обследованиях, которые проводит Росстат, опрашивается только небольшая часть домохозяйств, граждан или организаций, так как охватить всех — очень дорого.

Собранные данные могут послужить прекрасным материалом для исследований, особенно если объединить сведения из нескольких ведомств. Примером может послужить Швеция, ставшая одним из лидеров раскрытия административных данных. Эта небольшая скандинавская страна создала инфраструктуру, позволяющую объединять данные из разных источников и делиться ими с аналитиками. В результате не только шведские, но и другие зарубежные исследователи опубликовали в лучших журналах большое количество научных работ, посвящённых оценке разных аспектов государственной политики. Власти страны могут пользоваться этими работами для улучшения своей результативности.

Другие страны развивают похожую инфраструктуру. Один из последних примеров — создание Administrative Data Research UK в Великобритании в 2018 году. Организация собирает и связывает данные различных министерств и региональных ведомств и проводит исследования на их основе. Например, совместный проект с Лондонской школой экономики должен ответить на вопрос о том, как образовательная политика влияет на молодежную преступность. Для этого данные о посещаемости, успеваемости и участии школьников в образовательных программах связывают с данными о преступности.

К интеграции данных иногда прибегают и в России. Например, в проекте «Мониторинг трудоустройства выпускников» участвует несколько государственных органов. Они агрегируют информацию об образовании, полученном выпускниками, и их дальнейшей судьбе на рынке труда. Отдельные крупные научные центры используют эти данные для проведения исследований, однако потенциал этих данных недоиспользуется: как и в случае с НСУД отсутствуют прозрачные правила доступа к данным.

Новые возможности

Можно предложить и другие проекты по связыванию данных, которые могли бы послужить прекрасной базой для исследований и повышения эффективности мер государственной политики.

Перечень кейсов можно продолжать. Чтобы раскрыть потенциал использования этих данных, нужно чётко и ясно определить, каким образом академические исследователи могут получить доступ к содержимому государственных информационных систем. Это нетривиальная задача, так как одновременно нужно обеспечить конфиденциальность, но и не потерять в полезности данных для исследований. Однако возможная польза перевешивает издержки. 

Подробнее узнать об использовании результатов исследований, проведённых на административных данных для совершенствования государственной политики, можно в разделе «Доказательная политика» на сайте Центра перспективных управленческих решений. Пилотные наборы обезличенных административных данных опубликованы в каталоге проекта «Инфраструктура научно-исследовательских данных» и доступны для исследователей.

Читайте также

Загрузить еще