02.12.2021

Пятьдесят миллионов записей: резюме, вакансии и другие сведения

В новом наборе — данные с федерального единого цифрового портала «Работа в России» о вакансиях, резюме, откликах и приглашениях с января 2018 года по октябрь 2021 года. Датасет состоит из семи основных и шести дополнительных плоских CSV-таблиц. Взаимосвязь атрибутов разных таблиц отражена в описании набора на официальной вики ИНИД

Портал «Работа в России» — проект Роструда, где собраны вакансии от центров занятости населения со всей России, проверенных работодателей, а также от крупнейших коммерческих job-порталов.

Большой объём данных, собранных в датасете (в одних только основных таблицах более 50 миллионов уникальных записей), позволяет исследовать рынок труда со многих сторон: анализировать работу федеральных и региональных ведомств, выявлять тенденции, меняющие поведение работодателей и соискателей и не только. 

В основных таблицах собрана информация о резюме в целом (сurriculum_vitae.csv), а также об указываемых соискателями в резюме опыте работы (workexp.csv), основном образовании (edu.csv) и дополнительном образовании (addedu.csv), вакансиях по регионам (vacancies.csv), откликах соискателей (responses.csv) и приглашениях на собеседования (invitations.csv). 

В дополнительных таблицах собрана информация об организациях работодателей (organizations.csv), о субъектах РФ (regions.csv), а также справочники по сферам деятельности (industries.csv) и специальностям (professions.csv). Кроме того, есть дополнительные аналитические данные о гражданах (stat_citizens.csv) и работодателях (stat_company.csv) на портале.

Скачать датасет вы можете в каталоге ИНИД.