24.12.2020

Первый в России турнир на kaggle на государственных данных и топ победителей хакатона PandemicDataHack

Онлайн-хакатон проекта ИНИД, посвященный влиянию пандемии COVID-19 на сферу труда и занятости в России, завершился победой 17 команд: в ходе защит организаторы приняли решение увеличить призовой фонд до 1 160 000 рублей и наградить дополнительными специальными призами на пять команд больше. 

В течение трех дней, с 18 по 20 декабря, дата-аналитики, IT-разработчики, специалисты по машинному обучению, визуализации, а также продуктовые дизайнеры работали с актуальными государственными данными и оценивали влияние пандемии COVID-19 на сферу труда и занятости в России. Специально для хакатона Роструд расширил свои наборы данных по рынку труда на портале «Работа в России» и предоставил доступ к обезличенным сведениям об отдельных характеристиках получателей государственной услуги по содействию гражданам в поиске подходящей работы. 

«Мы получили гораздо больше заявок, чем предполагали, а сами команды продемонстрировали высокий уровень компетентности. Организуя хакатон, мы хотели показать, что работать с государственными данными может быть интересно, а главное ― что в ходе хакатона появляются идеи, которые могут впоследствии стать основой новых решений и проектов в сфере труда и занятости», ― отметила генеральный директор Центра перспективных управленческих решений (ЦПУР) Мария Шклярук.

Соревнование PandemicDataHack проходило между 61 командами из 43 городов по 4 направлениям и включало решение исследовательских и практических задач. Анализируя ранее неопубликованные данные, участники искали ответы на вопросы: как можно улучшить положение людей, получивших статус "безработный", какие показатели рынка труда позволяют выявить регионы с повышенным риском роста безработицы в кризис, как скорректировать меры поддержки по содействию трудоустройству с учетом стартовых навыков кандидата и что позволит оказывать более адресную поддержку населению со стороны центров занятости.

Кроме того, в рамках хакатона состоялось первое в России соревнование на kaggle на государственных данных.

Этот трек был посвящен созданию моделей машинного обучения для оценки стоимости навыков кандидатов. ML-модели должны помогать соискателю оценить, на какую заработную плату он может рассчитывать, что полезно для тех, кто впервые выходит на рынок труда или хочет начать развиваться в новой сфере. Кроме того, они должны позволять создавать индивидуальную траекторию обучения и развития необходимых компетенций у соискателя.

В финал соревнования прошло 40 команд. В каждом направлении были определены команды, занявшие первые три места. Приз за первое место составил 125,000 рублей, за второе – 75,000 рублей, а за третье – 50,000 рублей. Также была создана отдельная номинация «За понятный язык».

Публикуем список победителей каждого трека и ссылки на их работы. Все 40 решений финалистов можно найти на странице хакатона: https://pandemicdatahack.ru/

Трек 1 – Анализ тенденций на рынке труда в условиях пандемии.

1 место: Команда DS29 (Анастасия Кишкун, Александр Сарачаков, Алиса Аленичева, Егор Юсупов, Евгений Васичкин)

Проект команды не только визуализирует сами изменения на рынке труда, но и демонстрирует как они повлияли на собирательный портрет безработного. Используя данные об имеющихся доступных вакансиях и возможностях получить образование, авторы смогли показать, какие шаги может предпринять условный безработный для того, чтобы найти работу.

2 место: Команда Strategy Viz (Артем Ганин, Илона Волкова, Евгений Козырев)

Собранный командой дашборд демонстрирует тенденции на рынке труда в региональном разрезе. Это позволяет узнать, какие категории лиц оказались наиболее уязвимы в том или ином регионе и какие причины наиболее часто приводили к потере работы в каждом из этих регионов.

3 место: Команда Margaritis_Monile (Анна Калинина, Маргарита Полищук, Дмитрий Рачков, Ксения Чернышова, Юлия Коноплева)

Проведенное командой исследование было направлено на то, чтобы изучить влияние кризиса на категории наиболее уязвимых групп граждан: людей предпенсионного возраста; многодетных родителей и родителей-одиночек; малоимущих граждан, заключивших социальный контракт. Для этой цели авторы собрали дашборд, в котором визуализированы не только общие тенденции на рынке труда, но и социально-экономические портреты безработных.

Специальный приз - “За понятный язык”

Команда Культурный код (Юрий Петров, Александр Соболев, Максим Сергеев)

Авторы совместили данные о безработице с данными о числе заболевших и продемонстрировали путь к трудоустройству некоторых из граждан на примере персонажей.

Команда NOVA (Илья Макаренко, Андрей Семенушкин, Максим Пешехонов, Даниил Фалин)

В ходе исследования команда установила, что наличие детей, образование и готовность к переобучению положительно связаны с вероятностью трудоустройства. В то же время фактором, снижающим вероятность трудоустройства, являются дополнительные выплаты на детей. 

Трек 2 – Уволить нельзя нанять. Оценка влияния пандемии на рынок труда.

1 место: Команда Not LATE yet (Анна Ставнийчук, Ольга Сучкова, Константин Векерле, Александра Осаволюк, Георгий Калашнов)

Авторы исследования изучили степень влияния отдельных факторов, которые привели к росту безработицы России. Согласно полученным выводам, всплеск регистрируемой безработицы связан не с увеличением размеров пособий и упрощением процедуры подачи заявок, а с введением региональных ограничительных мер. Кроме того, работа позволяет установить отрасли экономики, которые больше других. были затронуты кризисом.

2 место: Команда А1А (Михаил Орлов, Александр Шелудков, Екатерина Кожара, Евгений Антонов, Константин Куликов)

Ключевой вопрос исследования – какую устойчивость демонстрировали рынки труда российских регионов во время текущего кризиса. Выводы исследования подтвердили отраслевую природу кризиса и влияние на него со стороны региональных властей. Кроме того, авторы сформировали шесть собирательных портреты профессионалов, сумевших найти работу в это непростое время.

3 место: Команда ЗКЛ (Катя Бонч-Осмоловская, Артём Щенников, Арнольд Хачатуров, Андрей Серебрянский)

Фокус проекта «Миллионики против неформалов» был направлен на изучение изменений рынка труда в зависимости от региональной специфики. Исследователи установили два пика регистрируемой безработицы, один из которых был зафиксирован в крупных городах, а другой – в регионах с высоким уровнем неформальной занятости.

Специальный приз “За понятный язык”

Команда Hen-party (Мария Кривошеева, Ольга Мамедова, Арина Ишметова)

Авторы исследования провели кросс-секционный анализ безработицы, в ходе которого была подтверждена гипотеза о том, что в кризис граждане без высшего образования оказались в более уязвимом положении по сравнению с теми, кто им владеет.

Трек 3 – Создание моделей машинного обучения, участникам предлагалось написать код, который предсказывает размер зарплаты для людей, ищущих работу на портале «Работа в России».

Соревнование проходила на платформе честный результат и отражает реальное качество моделей Kaggle, которая предоставляет систему проверки качества моделей машинного обучения и позволяет участникам узнать текущее качество своей модели. Сегодня эта платформа является “золотым стандартом” в проверке ML-решений.

Для третьего трека была подготовлена обучающая выборка, на которой участники хакатона должны были построить наилучшую статистическую модель, предсказывающую потенциальную зарплату для будущих резюме. При этом данные были собраны так, чтобы построенные участниками модели были устойчивыми к сезонным трендам и форс-мажорным ситуациям.

В результате места распределились следующим образом:

1 место: Команда GoodFit (Глеб Ерофеев, Екатерина Гладкова, Иван Стразов, Артемий Саранцев);

2 место: Команда Работа не волк, работа - это work (Александр Сидоренко, Дмитрий Борисов, Ян Будакян);

3 место: Команда НеИИ (Майя Бикметова, Марина Семенова, Екатерина Сафиуллина).

Специальный приз “За понятный язык”:

Команда Лишний носок (Влада Крайникова, Глеб Балчиди, Азиз Ташпулатов).

Трек 4 – UX/UI дизайн мобильного приложения портала «Работа в России».

В четвертом треке, команды разрабатывали логику и макеты для мобильного приложения с учетом оценки реальной целевой аудитории портала и ее ожиданий.

Места распределились следующим образом:

1 место: Команда Pandemic Lifestyle Team (Лада Хромых, Юлия Ковальчук, Иван Персидский)

2 место: Команда Пиком (Алексей Варанкин, Алиса Галямова, Михаил Бускин, Евгений Тенсин)

3 место: Команда BreakingCode (Геогрий Шавшуков, Анна Кравченко, Александр Бугаев).

Специальный приз “За понятный язык”

Команда UXBOX (Гульнара Шаяхметова, Розалия Максутова, Людмила Слепова, Рустем Файдрахманов)

Мероприятие было организовано совместно с Российской службой труда и занятости (Рострудом) и Центром перспективных управленческих решений. Компании GeekBrains, Superjob, Yandex DataLens и Avito Работа поддержали проект и выступили в качестве партнеров мероприятия.

Данные подготовленные для хакатона также в будущем будут доступны в каталоге ИНИД.

Посмотреть видео с открытия и закрытия хакатона можно на нашем youtube-канале.