Как обозреватель по вопросам числовой грамотности я нечасто сталкивалась с подобными злоупотреблениями – когда числа просто выдумывают. Но некоторым хватает дерзости оперировать цифрами «с потолка» и – что еще серьезнее – утверждениями, которые всегда обладают большей убедительностью, если кажутся научными. Тут-то и пригождаются числа.
Это можно увидеть в разговоре Трампа с Джонатаном Суоном. Очевидно, кто-то в Белом доме распечатал пачку графиков статистической платформы Our World in Data[2 - «Наш мир в данных» (англ.).] при Оксфордском университете, известной своими превосходными данными, и положил их на стол рядом с креслом Трампа. И даже Дональд Трамп, олицетворение «альтернативных фактов», подкрепляет свою позицию числами – реальными числами.
Числа помогают нам убеждать других в том, что мы правы. С ними наши суждения обретают впечатление научной обоснованности. Числа же не лгут, не правда ли? Измерить – значит познать. Слова подвержены предвзятости, а числа, как нам кажется, отражают реальность как она есть. Но какими бы важными ни оказались те или иные числа, моя книга показывает, что они никогда не бывают объективными. Число утрачивает свою объективность уже в момент измерения. Решения о том, что и как вы измеряете, субъективны по определению.
Взять, к примеру, действия нидерландского правительства по борьбе с коронавирусом. 19 мая 2020 года министр здравоохранения Уго де Йонг объявил о создании сводной панели численных данных по коронавирусу, которая должна была служить «основой для принятия решений». Регистрировать следовало все – положительные результаты тестирования, факты госпитализации, случаи заражения в домах престарелых… Исходя из такой медицинской статистики, принимались новые меры – закрывались магазины, торгующие товарами не первой необходимости, рестораны и школы. И борьба с коронавирусом приводила к тому, что жители Нидерландов начинали больше курить, теряли работу и впадали в депрессию.
В сводной панели не отражались цифры, описывающие образ жизни, уровень занятости или психическое здоровье. Предпочтение отдавалось другим числам, чтобы избежать перегрузки системы здравоохранения и обеспечить защиту наиболее уязвимых. Выбор понятен – но все же это лишь выбор. И речь здесь не только о статистике, но и об этике.
Это не значит, что числа – лишь чье-то мнение. Они подобны законам: это субъективные соглашения, которые можно подвергнуть тщательным испытаниям. Если договориться о том, что прогресс, интеллект или здоровье можно измерить, и о том, как это следует делать, то мы можем рассматривать изменения этих измерений с течением времени, факторы, которые на них влияют, и результаты, которых достигает наша страна по сравнению с другими.
Если числа используются правильно, они помогают нам познавать мир и изменять его. Но что означает «правильно используются»? Здесь в дело вступает статистика – методы стандартизации, сбора и анализа численных данных.
В этой книге я надеюсь убедить вас в том, что случайная выборка лучше, чем опрос пользователей твиттера; что корреляция – это не причинно-следственная связь; что погрешности необходимо учитывать и что утверждение Трампа о смертности от коронавируса в США было абсолютно неверным.
– Почему так нельзя? – спросил президента Суон.
– Нужно смотреть по… Вот, глядите. – Трамп протянул журналисту другую страницу. На ней была диаграмма с ярко раскрашенными столбцами. – Вот Соединенные Штаты. Нужно смотреть по случаям заболевания. Вот эти случаи.
Трамп продолжал говорить, но Суон попытался спросить еще раз:
– А почему не в пропорции к численности населения?
Утверждение Трампа не было чистой выдумкой, как полтора миллиона присутствовавших на его инаугурации. Он смотрел на коэффициент летальности (Case Fatality Rate, CFR), то есть на процентную долю умерших от болезни среди всех тех, кто получил положительные результаты тестирования. Это хорошо известный эпидемиологический параметр, позволяющий приблизительно оценить смертность от того или иного заболевания. К концу июля 2020 года, когда состоялось это интервью, значение CFR для Европы составляло 7,0 процента, а для всего мира – 3,9 процента. А для Соединенных Штатов? 3,5 процента – действительно «ниже», как и утверждал Трамп.
И все же что-то в его рассуждениях было не так. К счастью, Суону хватило проницательности сразу же это заметить. Низкое значение CFR не означало, что в США все в порядке. Даже если эта доля мала, количество умерших будет большим, если большим будет количество инфицированных. Поэтому Суон хотел увидеть, как соотносится число умерших с численностью всего населения. В конце июля смертность в Европе находилась на уровне 264 случая на миллион жителей, а в среднем по миру – 84. В США смертность составляла 453 случая на миллион человек. Она превышала европейскую более чем в полтора раза, а общемировую – более чем в пять раз. Если вкратце, то ситуация была прямо противоположной тому, что подразумевает слово «ниже».
Эта книга разоблачает злоупотребления именно такого рода. Если лучшая ложь содержит крупицу истины, то и числовой обман точно так же труднее всего раскрыть, если он связан с реальными цифрами. Такая фальшь бывает достаточно тонкой, чтобы остаться незамеченной, и достаточно убедительной, чтобы ее можно было распространять.
В своей книге я предложу вам средства, позволяющие распознать такой обман. Для этого вам не понадобится ученая степень по статистике – хватит и толики любопытства и здравого смысла. Не помешает и готовность признать свои недостатки.
– А некоторые говорят, что слишком много тестировать вредно. Вы ведь знаете об этом? – сказал Трамп Суону несколько раньше в том же интервью.
– Кто так говорит?
– Да почитайте книги, почитайте учебники.
– Учебники?
Через несколько минут Трамп сформулировал ту мысль, которую хотел высказать:
– Дело в том, что мы тестируем гораздо лучше, чем любая другая страна. Поэтому у нас больше случаев заболевания.
Здесь Трамп сделал с темой тестирования на коронавирус то же, что и с темой смертности: он начал подбирать доводы, которые подтверждали его точку зрения. Числа связаны не только со статистикой, но и с психологией. И этим грешит не один Трамп. Все мы так делаем.
Возможно, вы с надеждой ловите каждую новость о количестве вакцинированных, мечтая, чтобы все это наконец закончилось; может быть, вас раздражает исследование эффективности масок, потому что вам кажется, что это ограничение вашей свободы; или же вас печалит статистика смертности от коронавируса в вашей стране, потому что вы привыкли гордиться своим отечеством.
Все мы встречаем и такие факты, которые радостно принимаем на веру, и такие, которые мы предпочли бы немедленно отвергнуть.
Даже если уловки Трампа в этом интервью вас не обманули, вполне вероятно, что в каком-нибудь другом случае вы на них попадетесь. В марте 2020 года в Нидерландах получила широкое распространение статистическая таблица, в которой смертность от коронавируса в Италии, сильно пострадавшей в то время, сравнивалась с аналогичными данными по Нидерландам. Вывод ужасал: мы идем тем же путем, что и Италия!
Однако при анализе данных оказалось, что они отобраны и подогнаны именно к такому выводу. Каждый из двух наборов чисел начинался с некой произвольной даты, выбранной так, что при экстраполяции итальянских данных и их сравнении с положением в Нидерландах картина действительно получалась тревожной. Но стоило взять данные с другими, более логичными начальными датами, как траектория развития пандемии в Нидерландах оказывалась совершенно отличной от итальянской и менее пугающей. Именно такой тенденциозный подбор данных и использовал Трамп в своем интервью.
А как же довод о том, что число выявленных заболеваний увеличивается из-за более интенсивного тестирования? Он был широко распространен в Нидерландах летом 2020 года, когда пришла вторая волна пандемии коронавируса. Этот довод был не уловкой, а вполне обоснованным аргументом: то, как проводится тестирование, действительно влияет на статистику. Однако это не причина не принимать вторую волну всерьез; просто нужно быть еще осторожнее в истолковании данных. Я сама писала об этом в своих статьях. Но, услышав подобное из уст Трампа, я просто рассмеялась и не стала разбираться в его доводах. Ох уж этот мне чудак со своими учебниками! Мне тоже нужно держать себя в руках.
Пандемия показала нам числа как с лучшей, так и с худшей стороны, еще раз продемонстрировав и то, насколько они важны, и то, как ими можно злоупотреблять ради личной выгоды. Я привожу ряд примеров в этом дополненном издании.
Числа дают нам опору и уверенность в собственных силах. Это подбадривает, особенно в такие неопределенные времена. Но у чисел есть и границы: они не могут ни точно предсказывать будущее, ни говорить нам, какие принимать решения. Надеюсь, эта книга поможет вам увидеть цифры в истинном свете, поскольку они играют важную роль в нашей жизни сегодня и будут играть ее завтра и еще долго после окончания пандемии.
Утрехт, декабрь 2020 года
Вступление
Плененные числами
Она зашла в пыльный кабинет сквозь раздвижные двери и пожала мне руку:
– Хуанита[3 - Я уже писала о встрече с Хуанитой в своем блоге Out of the Blauw и в блоге организации Oikocredit Nederland. Поскольку я не сумела связаться с ней и показать ей это изложение, ее имя изменено. Глава 1. Числа могут спасать].
Полинявший свитер был ей велик, отчего она, и без того невысокая, казалась еще меньше. Когда Хуанита села на складной стул напротив меня, я объяснила по-испански, что приехала в Боливию по заданию нидерландского университета, провожу исследование уровня счастья и имущественного расслоения и хочу задать ей несколько вопросов о ее собственной жизни и стране, в которой она живет.
Я произносила эту заученную речь уже не в первый раз. Десять дней я беседовала с жителями боливийского города Тарихи, расположенного недалеко от аргентинской границы. Я разговаривала с рыночными торговками, пила пиво с фермерами, выращивающими клубнику, ходила на семейные барбекю – лишь бы собрать как можно больше данных. Теперь я добралась со своей пачкой анкет до офиса женской организации, руководство которой предложило связать меня с empleadas domеsticas – домработницами. Женщинами вроде Хуаниты.
– Начнем, – сказала я. – Сколько вам лет?
– Пятьдесят восемь.
– К какой этнической группе вы принадлежите?
– Аймара.
«Ага, – подумала я, – значит, она из одного из индейских племен». С такими людьми я раньше не встречалась.
– Семейное положение?
– Не замужем.
– Вы умеете читать?
– Нет.
– А писать?
– Нет.
Я продолжила задавать вопросы в том же духе – профессия, образование, есть ли у нее мобильный телефон, холодильник или телевизор.
– Я зарабатываю двести боливиано в месяц, – ответила она, когда я спросила о ее зарплате. Это было гораздо меньше минимальной заработной платы – 815 боливиано, которую установил незадолго до того президент Эво Моралес.