Нововведение в редакторе. Вставка постов из Telegram

Иллюзия причинно-следственной связи, или снова об ошибках статистики

25 4835

Сегодня мы поговорим об очередных логических ошибках, возникающих при манипуляциях со статистикой, подобные тем, что мы уже рассматривали в прошлые разы. Как и раньше, поводом послужит очередное глубокомысленное заявление:

Согласно официальной статистике, четверо из пяти человек, умерших от СПИДа, умерли во время приёма антиретровирусных препаратов.

По мнению автора комментария, это говорит о том, что якобы, именно терапия привела к смерти. То есть из высокого процента они делают выводы о наличии причинно-следственной связи. Разумеется, это рассуждение - одна большая вопиющая ошибка. Почему? Давайте разбираться.

Post hoc non propter hoc

"После - не значит вследствие". Мысль, выраженную в этой крылатой латинской фразе, важно помнить при интерпретации любых фактов!

Одной из весьма характерных ошибок, которые люди допускают при интерпретации статистических показателей (как, впрочем, и любых данных), является непонимание разницы между корреляцией и причинно-следственной связью.

Например, в стране вырос процент разрушенных зданий. И вскоре в стране вырастает процент людей, берущих декретный отпуск. Значит ли это, что разрушение зданий вызывает декретные отпуска? Нет, конечно. Эти показатели коррелируют, и даже связь между ними есть, но опосредованная. Просто случилась война, в результате которой увеличилось число разрушенных зданий, а попутно процент мужчин в структуре населения упал. Соответственно, более высокий процент декретников отражает всего лишь более высокий процент женщин среди населения (но жаль, конечно, детей, которые будут теперь расти без отца).

А в другом примере мы можем обнаружить, что разрушенные здания никак не отражаются на числе декретников. Почему? Потому что здания разрушены землетрясением, а не войной, тут число погибших мужчин и женщин примерно одинаково, оно не отражается на доле женщин и, соответственно, не изменяет число декретников.

Вот так, есть два показателя, но в одном случае они коррелируют, а в другом - нет.

Многие статистические исследования выдают такие вот противоречивые результаты. В одном случае вроде бы и есть корреляция, а в другом её совсем нет. Мета-обзор социологических исследований в местах природных катастроф (землетрясения, цунами) и войн позволил бы увидеть разницу. Важно выяснить, чем вызвана эта разница, и тогда можно найти настоящую причинно-следственную связь.

И тогда мы сможем извлекать действительно ценную информацию из непонятных цифр.

Высокий процент и иллюзия корреляции

Фраза, которую я приводил в начале, показывает не просто типовое приравнивание корреляции к наличию причинно-следственной связи, но и иллюзию корреляции, которой на самом деле там нет! Мы читаем, что 80% умерших принимали АРВТ (антиретровирусная терапия - комплекс мероприятий и лекарств для предотвращения репликации ВИЧ в организме), и нам психологически кажется, что 80% принимавших АРВТ умерли. Но это неверно!

Как же так? Потому что есть большое количество пациентов, принимающих АРВТ, но не умерших. Мы рассматривали не всю выборку, а только её часть. И это на фоне умерших может быть 80%, но на фоне живых потребителей АРВТ этот процент намного меньше.

Насколько меньше? Попробуем прикинуть. В примерных цифрах по нашей стране это выглядит так: в год регистрируется около 100 тыс. новых случаев заражения, примерно 30 тыс. человек умирает. При этом охват АРВТ составляет примерно половину от числа инфицированных. Сейчас примерно миллион ВИЧ-инфицированных и ещё 300 тыс. уже умерло (с середины 90-х, когда в нашей стране начал распространяться ВИЧ). То есть у нас получается, что АРВТ получает 50% живых и 80% умерших, или 500 тыс. (68%) против 240 тыс. (32%). Расчёт, конечно, весьма приблизительный, но суть должна быть понятна.

Вот так легко 80% оказываются пшиком. Загадочно? Ничуть.

На самом деле и показатель 80% тоже нужно понимать правильно. Это только кажется, что он говорит о смерти от АРВТ. На самом деле смерть всё равно наступает от СПИД, а высокий показатель по приёму АРВТ говорит совсем о другом. Не забываем, что среди этих умерших только 80% принимали АРВТ, а умерли-то все 100%, в том числе никакую АРВТ не принимавшие!

Кто-то думает, что человек долго и счастливо живёт, а потом - бац! - внезапно умер от СПИД. Нет, конечно, всё совсем не так. Человек, который прохладно относится к своей болезни, чаще всего делает так только до наступления по-настоящему серьёзных проявлений. Когда уже больно, тяжело дышать, плохо работает зрение, появляются опухоли и болячки - больной задумывается о лечении.

Как в известной шутке: "Все админы делятся на тех, кто ещё не делает резервные копии данных, и на тех, кто уже делает". Когда становится совсем плохо - человек спешит лечиться. А другого сколько-нибудь нормально работающего лечения, кроме АРВТ, против активности вируса пока что нет. Вот и получается, что высокий процент смертности при наличии АРВТ говорит всего лишь о том, что 80% уже обречённых людей пытаются спасти свою жизнь хоть как-нибудь. Даже если до этого они от АРВТ отказывались, пока им было "всёхорошо". Вот тут и есть настоящая корреляция. И ничего более таинственного.

Низкий процент и иллюзия корреляции

Чем больше самоубийц, тем меньше самоубийц (ц) Народная мудрость

Однако всё это не очень-то объясняет, почему кажется, что не принимающие АРВТ умирают меньше? Ведь там же вроде как низкий процент получается?

А всё очень просто. В России пока всё ещё заражается больше, чем умирает. Приток новых людей обеспечивает увеличение числа ещё не принимающих АРВТ, но пока ещё не умерших. Вот когда рост числа инфицированных по сравнению с умирающими остановится, тогда ситуация начнёт резко меняться: не принимающие АРВТ начнут вымирать намного активнее тех, кто принимает.

Те, кто не принимают АРВТ и не умерли, это не те, кто в принципе не умрёт (как может показаться сначала). Это на самом деле те, кто заболели относительно не так давно, но всё ещё не умерли либо всё ещё не начали принимать АРВТ. Не забываем, что число заболевших долгие годы росло практически в геометрической прогрессии, а умирают от СПИД далеко не сразу - спустя годы! И нынешние умершие - это те, кто заболел лет 10 назад.

Так вот, выцеплять эти 80% является ошибкой, они ничего не говорят о влиянии АРВТ на смертность. Смотреть надо на реальный возраст дожития после заражения. А он составляет порядка 10 лет для тех, кто не принимает АРВТ, и порядка 60 лет для тех, кто принимает. Разница огромна! По сути, АРВТ в наше время позволяет ВИЧ-инфицированному прожить столько же, сколько живут здоровые люди. А при отсутствии АРВТ жизнь будет не очень долгой. И это настоящий статистически значимый показатель, в отличие от невнятных 80%, которые говорят примерно ни о чём.

Итого: низкий процент умерших среди совсем не применявших АРВТ, говорит всего лишь о том, что число вновь заболевающих всё ещё слишком велико.

Аргентинские таблетки

Напоследок - забавный пример того, как на статистические результаты влияют самые неожиданные факторы.

В Аргентине проводились исследования нового успокоительного лекарства, и в числе испытуемых было некоторое количество мужчин и женщин. Оказалось, что эффективность препарата на женщинах намного выше, чем на мужчинах. Почему? Всё дело заключалось в форме выпуска. Лекарство представляло из себя таблетки бело-голубой окраски. А в это время сборная Аргентины по футболу играла на чемпионате мира, и ассоциации с цветами формы игроков сборной заметно влияли на результат действия препарата именно на мужчин. Интересная корреляция? Да, подобные казусы возможны. Главное, не следует делать из них ошибочных выводов.

Задержан нелегальный мигрант Азербайджана Шахин Аббасов убивший русского парня Кирилла Ковалёва в Москве

Кстати, азербайджанского убийцу задержали в Ростовской области. Говорят что бежал к границе. Скоро суд отправит его в СИЗО. Следственный комитет публикует фото двоих соучастников убийства Ки...

Обсудить
  • :flushed:
  • Успокоительное во время ЧМ будет неэффективно для болельщиков. При любой окраске)
  • Согласно официальной статистике, четверо из пяти человек, умерших от СПИДа, умерли во время приёма антиретровирусных препаратов. Логика здесь такая же как и "Человек умер потому что родился" или "Умер потому-что дышал кислородосодержащей атмосферой, а кислород это окислитель который вызывает старение органов" ))) Причем версию про вредность дыхания кислородом я, когда то, встречал в одной из "официальных" статей :smile:
  • Если учесть, что среди больных очень много педерастов и наркоманов, то короткий срок жизни как бы не должен удивлять... Регулярный прием наркотиков не способствует долголетию )))