28.12.2021

Совпадение? Не думаю. Мы собрали все тексты ИНИД про поиск закономерностей

Те закономерности и связи между разными фактами, которые мы находим в данных, на самом деле не всегда означают то, чем кажутся. Чтобы найти неочевидные причинно-следственные связи и избежать ложных закономерностей, используют научные методы выявления причинности (causal inference), которые помогают выделить интересующий эффект и определить именно те факторы, которые стали его настоящей причиной.

Об экспериментальном анализе в четырёх лекциях осенью этого года в МГУ рассказывал Дмитрий Архангельский (Ph.D. Stanford, Associate professor at CEMFI): https://data-in.ru/publications/news/120/ . Посмотреть курс в открытом доступе вы можете на Youtube-канале ИНИД:  https://www.youtube.com/channel/UCwgt10ff7qPZWrDUgb2SVpA 

Методы анализа причинно-следственных связей широко применяются во многих сферах. В этом году Нобелевскую премию по экономике труда вручили именно за них.

Нобелевскую премию 2021 года за экономику труда и causal inference Георгий Калашнов, МГУ, и Витовт Копыток, ЦПУР, подробно разбирали в октябре: https://www.data-in.ru/publications/news/119/ 

Для анализа эффективности госполитики и господдержки особенно важно понимать, какая именно принятая мера сработала и точно ли сработала именно она. Но как это сделать? Как выявить, что конкретно повлияло на ситуацию и дало наблюдаемые явления, ведь, как правило, объяснить происходящее можно сразу несколькими причинами.

О применении методов аналитики в современной России рассказывал Максим Цыганков: (https://data-in.ru/publications/news/92/)

Например, программа материнского капитала, которая действует больше 10 лет. Её изначальный дизайн выплаты семьям за рождение второго ребёнка довольно большой суммы, 400 000 рублей, которые семья может потратить на ряд целей. Вопрос: а помогла ли эта программа? Когда правительство её принимало, основной целью было повысить рождаемость в государстве. Критики этой реформы говорят, что видимый рост рождаемости это не результат введения программы, а изменение демографических тенденций. Исследователь Евгений Яковлев, профессор Российской экономической школы (РЭШ), вместе с коллегами в своей работе постарался отделить влияние программы от демографических трендов и получил доказанный вывод.

Подробнее об исследовании можно прочитать на сайте РЭШ: https://news.nes.ru/news/kommentarij-evgeniya-yakovleva-o-programme-materinskogo-kapitala/, а мы беседовали с Евгением Яковлевым в декабре о том, зачем исследователям административные данные:  https://www.data-in.ru/publications/news/137/ 

Для чего ещё используют методы causal inference? Например, для анализа эффективности программ профессиональной подготовки. Может показаться, что зарплаты у тех, кто проходил переобучение, выше благодаря самим образовательным программам. Но вполне возможно, что на эти программы приходят изначально более мотивированные люди, у которых больше способностей, которые хотят развиваться. У них и без прохождения этой программы зарплата была выше. Чтобы разобраться, необходимо применять causal inference. 

Больше про causal inference рассказывают эксперты из МГУ в четырёх курсах на русском языке: https://data-in.ru/publications/news/93/ 

Чтобы получить правильные результаты для принятия решений, аналитик должен уметь критически смотреть как на свои выводы, так и на изначальные данные. Смотря на любое явление, он должен задавать себе вопросы: «‎А есть ли здесь альтернативное объяснение? Означает ли наблюдаемая связь между переменными то, что одна переменная реально влияет на другую? Или на самом деле мы видим влияние какого-то другого фактора, который мы не учли?»

Надеемся, что материалы, собранные в этом тексте, помогут всем чаще задаваться этими вопросами и чаще привлекать методы анализа причинно-следственных связей не только в экономике и госуправлении, но и в любых ситуациях выбора и принятия решений.

Читайте также: в чём заключается концепция «третьей волны открытых данных» и как удержаться на её гребне: https://data-in.ru/publications/news/108/