Чому? Нова наука про причинно-наслідковий зв'язок

Концепції

The Book of Why: The New Science of Cause and Effect

Послухайте огляд

00:00

-00:00

8 жовтня 2019

Зміст

Рекомендовано KMBS

Основна ідея

Причинний умовивід

Статистика та причинність

Сходи причинності

Великі дані та каузальні моделі

Основна ідея

Ми часто чуємо фразу «Кореляція – це не причинно-наслідковий зв’язок». Але табу, колись накладене статистикою на розмови про каузальність, поступово зникає, і не в останню чергу завдяки революції причинності. У чому ж полягає сутність нової науки? Чому великі дані не можуть відповісти на всі запитання і як навчитися шукати на них відповіді?

Причинний умовивід

Книга розповідає про нову науку, яка змінила спосіб, у який ми відрізняємо факти від вигадки. Ця наука впливає не тільки на повсякденне життя людей, а також на різні сфери, починаючи від створення нових ліків і закінчуючи економічними питаннями або глобальним потеплінням. Незважаючи на те, що спектр проблемних зон достатньо широкий, ця наука дозволяє розглядати їх уніфіковано, що здавалося неможливим ще 20 років тому. Автори називають цю науку «причинний умовивід» (causal inference).

Десятки тисяч років тому люди почали розуміти, що деякі речі стають причиною інших подій, і якщо вплинути на причину, то зміниться й наслідок. Завдяки цьому відкриттю виникли організовані спільноти, міста, а також цивілізація, яка спирається на науку і технології. Сталося це завдяки запитанню: «Чому?»

Причинний умовивід ґрунтується на тому ж запитанні. Ця наука cпирається на тезу: людський мозок – найдосконаліший інструмент для управління причинами та наслідками. Він зберігає неймовірний обсяг каузального знання, яке за умови наявності підтверджених даних здатне допомогти нам знайти відповіді на найскладніші питання сучасності.

До того ж, автори вважають, що якщо ми зрозуміємо логіку каузального мислення, то зможемо відтворити її на комп’ютері та винайти штучного вченого. Цей робот відкриватиме невідомі досі феномени, шукатиме пояснення поточним науковим дилемам, розроблятиме нові експерименти та постійно витягатиме нові каузальні знання з навколишнього середовища.

Однак це станеться ще не сьогодні, у той час як нова наука вже зараз змінює мислення вчених і впливає на наші життя. Зокрема, вона допомагає шукати відповіді на такі запитання:

– Наскільки ефективним є певний засіб у профілактиці захворювання?

– Що стало причиною зростання продажу: новий закон або наша рекламна кампанія?

– Чи варто мені змінювати роботу?

В усіх цих пунктах є дещо спільне: причинно-наслідкові зв’язки. Наш світ сповнений подібних запитань і потребує відповідей, але до виділення причинного умовиводу в окремий напрямок процес пошуку рішень був дуже складним.

Чому автори називають причинний умовивід новою наукою, якщо Вергілій у 29 році до н.е. казав: «Щасливий той, хто зміг зрозуміти причини речей?». Найскладнішою перешкодою вони вважають величезний розрив між словником, яким ми користуємося, ставлячи каузальні запитання, і традиційним науковим словником, за допомогою якого формулюються теорії.

Простий приклад: показання барометра B = kp, де k – коефіцієнт пропорційності, а Р – атмосферний тиск. Правила алгебри дозволяють переписати це рівняння так: P = B/k, k = B/p, B – kp = 0. Жодна з літер B, k або P не має пріоритету перед іншими. Тоді як ми можемо бути впевнені, що цей тиск впливає на показання барометра, а не навпаки? І як ми можемо описати науковою мовою всі ті причинно-наслідкові зв’язки, які спостерігаємо навколо?

Статистика та причинність

Наукові інструменти були від самого початку розроблені для задоволення потреб учених. До певного моменту цього було достатньо. Але наукова допитливість штовхала вчених уперед у пошуках відповідей на каузальні запитання в різних сферах, наприклад у законодавстві, бізнесі, медицині, формуванні політик. І виявилося, що для цього інструментів уже недостатньо.

Таке неодноразово траплялося в історії людства. Наприклад, ще 400 років тому люди не страждали через те, що не вміють управляти невизначеністю. Але після винаходу нових азартних ігор наука зацікавилася напрямком, який пізніше отримав назву теорії ймовірності. І лише коли страховим компаніям потрібні були точні оцінки тривалості життя, математики стали розраховувати очікувану величину цього показника.

Потреба в теорії причинності виникла приблизно тоді ж, коли з’явилася статистика. Насправді сучасна статистика народилася з каузальних запитань про спадковість, які ставили Карл Пірсон і Френсіс Гальтон, та їхніх спроб знайти відповідь, досліджуючи дані різних поколінь. На жаль, вони зазнали невдачі, але замість того щоб зупинитися і запитати: «Чому?», вони стали розвивати статистику, вільну від причинності.

Цей момент став критичним в історії науки. З’явилася можливість забезпечити каузальні запитання правильним словником, однак вона була втрачена. Зрештою, створення «мови причинності» було відкладено більш ніж на 50 років. А разом із тим було накладено заборону на розробку інструментів, методів і принципів, які мають відношення до причинно-наслідкових зв’язків.

Із цією забороною знайомі всі, хто вивчав основи статистики. Кожен студент повинен запам’ятати раз і назавжди: кореляція не означає причинності. Звичайно, для цього є розумна підстава, адже якщо півень кукурікає перед світанком, це не означає, що без його кукурікання сонце не зійде.

Однак проблема полягає в тому, що, хоча статистика й говорить, що причинність не дорівнює кореляції, вона не пояснює, що ж таке причинність. Часто студентам взагалі забороняють казати про те, що Х – причина Y, а тільки про те, що Х и Y пов’язані між собою. Внаслідок цього статистика сфокусувалася переважно на зборі даних, але не на їх інтерпретації. Вважалося, що всі відповіді можна знайти в даних, і більшого шукати не слід.

Відгомін такого підходу чутен донині. Ми живемо в епоху, коли вважається: великі дані – ключ до вирішення всіх проблем людства. Курси з data science (наука про дані) користуються величезною популярністю в університетах, а кар’єра аналітика даних стає дедалі прибутковішою. І тут криється небезпека. Автори пишуть: самі по собі дані надзвичайно дурні. Зібрана інформація може розповісти вам, що люди, які вживають ліки, одужують швидше за тих, хто цього не робив, однак дані не розкажуть, чому так відбулося. Але ж причина може виявитися будь-якою, у тому числі такою, яка взагалі виключить ліки з рівняння.

Ми живемо в епоху, коли вважається: великі дані – ключ до вирішення всіх проблем людства

З кожним днем ми дедалі частіше стикаємося із прикладами з науки або бізнесу, які доводять: лише даних недостатньо. Тому останні 30 років теорія причинності стала розвиватися швидкими темпами. Століття тому питання про те, чи можуть сигарети стати причиною проблем зі здоров’ям, уважалося б ненауковим. 20 років тому запитати фахівця зі статистики, чи аспірин допоміг упоратися з головним болем, означало те саме, що поцікавитися, чи вірить він у вуду. Однак сьогодні соціологи, IT-фахівці та навіть деякі економісти регулярно ставлять подібні запитання. Автори називають таку трансформацію каузальною революцією.

Сходи причинності

Люди досить давно зрозуміли, що світ не складається із сухих фактів (того, що сьогодні ми називаємо даними). Найімовірніше, ці факти склеюються між собою причинно-наслідковими зв’язками. Каузальні. Жодна машина не може генерувати пояснення із сирих даних. Їй необхідний поштовх.

Автори виділяють три когнітивні рівні, які повинна опанувати людина (або алгоритм) на шляху до розуміння каузальності: спостерігати, робити та представляти. Кожному з них відповідає свій щабель на сходах причинності.

Асоціація. Відповідає рівню спостереження. Цим рівнем володіють навіть тварини. Він полягає в здатності помічати повторення в тому, що ми бачимо. Наприклад, сова спостерігає, як рухається миша, і розуміє, де гризун опиниться у наступний момент. Так само діє комп’ютерна програма, яка грає у Го: вона досліджує базу даних, яка складається з мільйонів партій, щоб розібратися, які кроки найчастіше ведуть до перемоги.

Інакше кажучи, перший щабель сходів причинності – це прогнозування на підставі попередніх спостережень. Його можна описати запитанням: «Що, як я побачу щось?» Наприклад, маркетинг-директор магазину може розмірковувати: «Наскільки імовірно, що клієнт, який придбав зубну пасту, також придбає зубну нитку?» Ми кажемо, що одна подія асоційована з іншою, якщо той факт, що ви побачили першу, підвищує ймовірність побачити другу.

Каузальні пояснення, а не сухі факти, складають основний обсяг знань,і саме вони в майбутньому повинні стати фундаментом штучного інтелекту

Запитання, подібні до тих, над яким міркує маркетинг-директор, є хлібом статистики. Найчастіше відповідають на них, збираючи та аналізуючи дані (наприклад, про купівельну поведінку). Фахівці зі статистики розробили чимало інструментів, які дозволяють знаходити асоціації між змінними. Кореляція є типовим виміром асоціації.

Деякі асоціації можуть мати очевидні каузальні інтерпретації, інші – ні. Однак статистика не дає відповіді на запитання, що є причиною, а що наслідком, зубна паста або зубна нитка. А з точки зору маркетинг-директора це взагалі не має значення. Якісні прогнози не обов’язково включають хороші пояснення. Зрештою, сова може бути відмінним мисливцем, не розуміючи, чому миша рухається в тому або іншому напрямку.

Автор припускає, що читачів здиву теза про те, що системи машинного навчання знаходяться на тому самому щаблі сходів причинності, що й тварини,–найнижчому. Адже, здавалося б, вони є вершиною технічного прогресу. Однак насправді нинішній ШІ ще дуже далекий від людського мислення, і його поява навряд чи є справою найближчих років.

Програми машинного навчання, як і 30 років тому, оперують практично повністю на асоціативному рівні. Їх приводить у рух потік даних, і вони намагаються вичленувати в ньому закономірність приблизно так само, як статистик намагається провести пряму лінію серед безлічі крапок. Алгоритми продовжують удосконалюватися в точності та швидкості обчислень, але це не забезпечує еволюційного стрибка. І якщо, наприклад, програмісти автономного автомобіля захочуть, щоб він реагував інакше у нових ситуаціях, їм доведеться самим задати такі реакції. Не варто очікувати, що ШІ сам визначить, що пішохід із пляшкою віскі в руці здатний жбурнути нею в машину, якщо та просигналить. Недолік гнучкості й адаптивності є невід’ємною властивістю систем, які перебувають на нижньому щаблі сходів причинності.

Втручання (інтервенція). На цей рівень ми переходимо, коли починаємо змінювати світ навколо нас. Приклад типового для цього щабля запитання: «Що трапиться із продажем зубної нитки, якщо ми подвоїмо ціну на зубну пасту?». Щоб знайти відповідь, недостатньо мати багато даних – потрібний новий тип знання.

Інтервенція відповідає рівню «робити» і тому перебуває вище за асоціацію на сходах причинності. Багато вчених з болем виявляють, що жоден зі статистичних методів не достатній для відповіді на просте запитання на кшталт наведеного вище.

Чому не можна пошукати дані про період, коли зубна паста коштувала вдвічі дорожче, і спрогнозувати результат? Тому що підвищення ціни в той момент могло бути викликане різними причинами (наприклад, скороченням поставок у конкурентів), а зараз ви плануєте свідомий крок. А це означає, що, найімовірніше, результат буде іншим.

Один зі способів передбачити результат інтервенції – провести експеримент у контрольованих умовах. Великі компанії, такі як Facebook, часто так і діють, щоб перевірити свої гіпотези. Однак цікаво те, що іноді успішно передбачити ефект від втручання можна і без експерименту. Наприклад, менеджер з продажу може створити модель купівельної поведінки, яка враховуватиме ринкову ситуацію. Точна каузальна модель зможе дати відповідь на запитання, що відбудеться, якщо змінити ціну.

Отже, другий щабель сходів причинності відповідає на запитання «Що, як ми зробимо щось?» або на запитання «Як?». Наприклад, якщо на складі залишилося багато зубної пасти, менеджера цікавить: як можна її продати? За якою ціною її варто пропонувати? І знову відповідь на ці запитання вимагає моделювання інтервенції перед початком дій.

Ми постійно втручаємося у повсякденне життя, наприклад, коли приймаємо таблетку від головного болю. Ми впливаємо на одну змінну (кількість аспірину в нашому тілі), щоб це відбилося на іншій (статус головного болю). Якщо каузальна гіпотеза про аспірин була правильною, то значення другої змінної стане не «є головний біль», а- «немає головного болю».

Контрфакти. Інтервенція не дає відповідей на всі запитання, хоч і є важливим щаблем сходів причинності. Якщо головний біль минув, нас як і раніше може цікавити, чому це трапилося. Чи став причиною аспірин? А може, з’їдена їжа або почуті гарні новини? Для пошуку відповідей на ці запитання недостатньо даних або експериментів – потрібно, по суті, повернутися назад у часі та довідатися: що було б, якби я не прийняв аспірин? Тому рівень контрфактів пов’язаний зі здатністю уявити те, що могло піти інакше.

У контрфактів складні стосунки з даними, тому що дані – це факти. Вони не можуть розповісти, що сталося б в уявному світі. Однак людський мозок на це здатний, і це відрізняє його від тварин і систем машинного навчання.

Якщо повернутися до прикладу із зубною пастою, то запитання верхнього рівня може звучати так: «Яка ймовірність того, що клієнт, який купив зубну пасту, придбав би її, якби ціна була вдвічі вищою?» У пошуках відповіді ми порівнюватимемо реальний світ (де людина придбала товар за поточною ціною) з уявним (де ціна удвічі вища). Наявність каузальної моделі дозволяє відповідати на подібні запитання. А уявити наочно модель причинності допомагає інструмент під назвою «каузальна діаграма», де у вигляді графа представлені змінні та причинно-наслідкові зв’язки між ними (приклад такої діаграми – на мал.1).

Великі дані та каузальні моделі

У науці, бізнесі, державному управлінні та навіть у спорті кількість сирих даних в останні роки росте із приголомшливим темпом. Особливо помітно це активним користувачам соціальних мереж. Наприклад, у 2014 році Facebook зберігав 300 петабайт даних (петабайт дорівнює 1024 терабайт) 2 млрд активних користувачів, що складає 150 Мб на людину. Наукові бази даних також стрімко ростуть. Наприклад, проект «1000 геномів» зібрав 200 терабайт інформації, склавши найбільший у світі публічний каталог даних про генотип.

Однак великі дані впливають не лише на прогрес у передових галузях науки, але й на життя рядових учених. Наприклад, 20 років тому морський біолог міг витратити місяці, описуючи різні види. Зараз же він має миттєвий доступ до онлайн-даних про всіх риб та інших тварин. І замість виконання рутинних завдань біолог може займатися більш творчою роботою.

Постає питання: що ж далі? Як витягти зміст із набору цифр, біт і пікселів? Хтось як і раніше вважає, що відповідь на всі наші запитання (наприклад: чи існує ген, відповідальний за рак легенів? у яких сонячних системах є планети, схожі на Землю? тощо) можна знайти в самих даних, потрібно лише опанувати аналіз. Однак значна частина наших запитань носить причинний характер, і це означає, що на них не можна відповісти лише за допомогою даних. Вони вимагають від нас сформувати модель процесу, який генерує дані, або хоча б окремих його аспектів. Якщо ви бачите дослідження, яке аналізує дані без побудови моделі, то можете бути впевнені: воно тільки резюмує дані, але не інтерпретує їх.

Звичайно, дані також є корисними. Вони можуть бути необхідним першим кроком до пошуку цікавих шаблонів асоціацій і формулювання запитань. Однак не варто зупинятися на ньому, потрібно йти далі – до інтерпретації даних.

Чи зможемо ми створити ШІ, який допоможе нам у цьому, буде здатен думати? Найімовірніше, так, якщо машини опанують усі три рівні сходів причинності. Алгоритми, здатні відповідати на каузальні та контрфактуальні запитання, вже існують. Якщо дослідники у сфері ШІ впровадять їх, ми станемо набагато ближчими до появи розумних роботів.