Дата-сет Росстата о демографии в России теперь можно скачать в новой, дополненной версии, доступной в форматах CSV и SQL. В отличие от предыдущей версии, опубликованной в начале марта, эта версия дата-сета содержит 11 дополнительных показателей: сведения о миграции по районам Крайнего Севера и местностям, приравненным к ним; данные о миграции по видам и срокам регистрации; коэффициент миграционного прироста по субъектам РФ. Всего в наборе представлены 101 показатель.
Один из важных элементов для полноценного анализа набора данных – это использованная методика его сбора или расчета. В репозитории Github доступен для скачивания инструмент Identifier Explorer, с помощью которого можно декодировать метки методик сбора данных по большинству показателей дата-сета. Кроме того, с помощью выложенного в репозиторий ноутбука можно оперативно визуализировать временные ряды по статистическим показателям и сделать быстрый EDA – exploratory data analysis.
Как и в случае предыдущей версии, для удобства исследователей данные Росстата выстроены в однородный максимально длинный и полный временной ряд (1990–2020 гг.).