Те закономерности и связи между разными фактами, которые мы находим в данных, на самом деле не всегда означают то, чем кажутся. Чтобы найти неочевидные причинно-следственные связи и избежать ложных закономерностей, используют научные методы выявления причинности (causal inference), которые помогают выделить интересующий эффект и определить именно те факторы, которые стали его настоящей причиной.
Об экспериментальном анализе в четырёх лекциях осенью этого года в МГУ рассказывал Дмитрий Архангельский (Ph.D. Stanford, Associate professor at CEMFI): https://data-in.ru/publications/news/120/ . Посмотреть курс в открытом доступе вы можете на Youtube-канале ИНИД: https://www.youtube.com/channel/UCwgt10ff7qPZWrDUgb2SVpA
Методы анализа причинно-следственных связей широко применяются во многих сферах. В этом году Нобелевскую премию по экономике труда вручили именно за них.
Нобелевскую премию 2021 года за экономику труда и causal inference Георгий Калашнов, МГУ, и Витовт Копыток, ЦПУР, подробно разбирали в октябре: https://www.data-in.ru/publications/news/119/
Для анализа эффективности госполитики и господдержки особенно важно понимать, какая именно принятая мера сработала и точно ли сработала именно она. Но как это сделать? Как выявить, что конкретно повлияло на ситуацию и дало наблюдаемые явления, ведь, как правило, объяснить происходящее можно сразу несколькими причинами.
О применении методов аналитики в современной России рассказывал Максим Цыганков: (https://data-in.ru/publications/news/92/)
Например, программа материнского капитала, которая действует больше 10 лет. Её изначальный дизайн — выплаты семьям за рождение второго ребёнка довольно большой суммы, 400 000 рублей, которые семья может потратить на ряд целей. Вопрос: а помогла ли эта программа? Когда правительство её принимало, основной целью было повысить рождаемость в государстве. Критики этой реформы говорят, что видимый рост рождаемости — это не результат введения программы, а изменение демографических тенденций. Исследователь Евгений Яковлев, профессор Российской экономической школы (РЭШ), вместе с коллегами в своей работе постарался отделить влияние программы от демографических трендов и получил доказанный вывод.
Подробнее об исследовании можно прочитать на сайте РЭШ: https://news.nes.ru/news/kommentarij-evgeniya-yakovleva-o-programme-materinskogo-kapitala/, а мы беседовали с Евгением Яковлевым в декабре о том, зачем исследователям административные данные: https://www.data-in.ru/publications/news/137/
Для чего ещё используют методы causal inference? Например, для анализа эффективности программ профессиональной подготовки. Может показаться, что зарплаты у тех, кто проходил переобучение, выше благодаря самим образовательным программам. Но вполне возможно, что на эти программы приходят изначально более мотивированные люди, у которых больше способностей, которые хотят развиваться. У них и без прохождения этой программы зарплата была выше. Чтобы разобраться, необходимо применять causal inference.
Больше про causal inference рассказывают эксперты из МГУ в четырёх курсах на русском языке: https://data-in.ru/publications/news/93/
Чтобы получить правильные результаты для принятия решений, аналитик должен уметь критически смотреть как на свои выводы, так и на изначальные данные. Смотря на любое явление, он должен задавать себе вопросы: «А есть ли здесь альтернативное объяснение? Означает ли наблюдаемая связь между переменными то, что одна переменная реально влияет на другую? Или на самом деле мы видим влияние какого-то другого фактора, который мы не учли?»
Надеемся, что материалы, собранные в этом тексте, помогут всем чаще задаваться этими вопросами и чаще привлекать методы анализа причинно-следственных связей не только в экономике и госуправлении, но и в любых ситуациях выбора и принятия решений.
Читайте также: в чём заключается концепция «третьей волны открытых данных» и как удержаться на её гребне: https://data-in.ru/publications/news/108/