Видео с голосовым переводом на Телеграм-канале @carni_ru
Я много говорю о статистике, науке в целом, эпистемологии и даже немного о философии. Но именно статистика лежит в основе большей части науки, поскольку это математика, это числа, это способ передать результаты экспериментов с доверительными интервалами, стандартными отклонениями, средними значениями, медианами и медианными абсолютными отклонениями и прочими вещами. Это крайне важно при оценке науки о питании человека, которая, к слову, составляет значительную часть научных исследований.
Чтобы правильно воспринимать и расшифровывать результаты, необходимо понимать хотя бы основы статистики, статистической значимости, нулевых и альтернативных гипотез и так далее.
Поэтому я решил, что будет полезно разобрать эти концепции более подробно и прикладным образом, а не просто говорить об абстрактном, превращая абстрактное в практическое. Сегодня мы займемся этим, анализируя статью, выпущенную в 2024 году, хотя и немного запоздало, но пора уже погрузиться в эту тему. Статья называется «Кофе может быть не просто утренним напитком, согласно новому исследованию». Это классическая научно-популярная статья о здоровье, типичный заголовок для новостей в области здравоохранения.
Проблема в том, что в большинстве случаев исследование на самом деле не подтверждает то, что заявлено в заголовке. Заголовок создан, чтобы быть эффектным и сенсационным. Поэтому нам следует анализировать само исследование, а не заголовок. Но поскольку мы все же обращаемся к заголовку и будем читать статью, давайте начнем с его разбора. Итак, «Кофе *может быть* не просто утренним напитком, согласно новому исследованию». Первое слово, которое бросается в глаза, это «может».
Как только речь заходит о статистике, необходимо понимать логику. Я представляю это как иерархию знаний или иерархию истины. В самом ее основании лежит философия. Над ней — эпистемология. Эпистемология отвечает на вопрос: как мы вообще что-то знаем? Как мы узнаем, что что-то истинно? Что такое истина в первую очередь? А уже над ней находится логика. Здесь мы изучаем логические ошибки, формальные и неформальные. И, на мой взгляд, над всем этим находится статистика. Статистика, если говорить об иерархии науки, а не истины, является ее фундаментом.
Она лежит в основе практически всей науки, потому что, будь то экспериментальное или наблюдательное исследование, ее скелетом является статистика. Именно так я это воспринимаю. Причина, по которой я это упомянул, заключается в том, что если вы изучаете статистику, первое, что вам нужно освоить, это логика, хотя бы ее основы.
Почему важно понимать принцип «ассоциация не равно причинно-следственная связь»?
Этот принцип, «ассоциация не равно причинно-следственная связь», является одним из самых распространенных и первых, которые преподают в статистике. Ирония заключается в том, что это самый злоупотребляемый принцип во всей науке. Почему? Потому что часто исследователи продолжают использовать слова, которые обязательно подразумевают причинно-следственную связь между двумя переменными, например, «повышает риск того-то на столько-то процентов». Слово «риск» — это утверждение о причине и следствии. Вы не можете так говорить.
Кроме того, это пример экологической ошибки (ecological fallacy), которая гласит, что даже если бы вы могли информировать о риске, риск всей группы не отражает риск каждого отдельного человека. Это также известно как ошибка композиции (composition fallacy): что верно для частей, то верно для целого.
На самом деле, это ошибка деления (division fallacy): что верно для целого, то верно для частей. Здесь задействовано множество логических ошибок. Возвращаясь к заголовку, почему использовано слово «может»? Причина в том, что оно также означает «может и не быть». Это всего лишь ассоциация. Как только вы начинаете говорить об ассоциациях, это ставит под вопрос силу этой ассоциации. Если вы сравниваете экспериментальную и контрольную группы, это ставит под вопрос увеличение частоты заболеваемости как в процентном, так и в абсолютном выражении. Это ставит под сомнение многое.
Так что слово «может» также означает «может и не быть». И нам предстоит выяснить, значимы ли эти доказательства или нет, что, в конечном итоге, само по себе является мнением, если только речь не идет о статистической значимости, которая все равно является произвольным порогом. Давайте продолжим. Статья CNN: «Утренняя чашка кофе *может* (опять это слово) делать больше, чем просто бодрить, согласно новому исследованию».
Слово «может» здесь означает то же самое, что и «может не делать». Это хороший мыслительный эксперимент: каждый раз, когда вы видите фразу «может сделать что-то», просто замените ее на «может не сделать».
Что подразумевается под «умеренными количествами» кофе в исследовании?
Далее говорится: «Умеренные количества... ». Важно определить, что такое «умеренные», поскольку это относительный термин. Нам нужны абсолютные значения, которые, как я полагаю, будут в самом исследовании. «Умеренное потребление кофеина» (который поступает не только из кофе) определяется как «около трех чашек кофе в день». Я предполагаю, что это метрические чашки, но не знаю, как они это определяют. Данные получены от респондентов, а люди, как известно, лгут, забывают, а опросники частоты потребления пищи — это спорный метод. «...
были *ассоциированы* (опять это слово) с более низким риском... ». Это немедленно ставит под вопрос силу и тип ассоциации.
Была ли она криволинейной или линейной? Значения R-квадрат и R-значения измеряют только силу линейной связи, а не ассоциаций в целом.
Почему термин «сниженный риск» неприменим в данном контексте?
Утверждение «ассоциированы с более низким риском» некорректно. Это не связано с более низким риском чего-либо, потому что «риск» — это утверждение о причинно-следственной связи. Не существует исследований, которые могли бы информировать о риске любого серьезного исхода для здоровья или заболевания в контексте питания человека за любой заданный период времени на протяжении всей истории науки о питании человека. Таких исследований никогда не было и никогда не будет.
Чтобы получить такую информацию, нужно взять двух генетически идентичных близнецов, как фенотипически, так и генотипически идентичных, разлучить их при рождении, поместить в две метаболические камеры и наблюдать за ними всю их жизнь, пытаясь вывести долгосрочные результаты для здоровья (например, 40 лет для 40-летних результатов). При этом необходимо контролировать каждую переменную, включая время их пробуждения, время отхода ко сну, уровень стресса, гормональный фон, какую ногу они сначала обувают.
Это неправдоподобно, невозможно, не прошло бы этический комитет (что правильно) и, кроме того, было бы чрезвычайно дорого. Такие исследования не проводятся. Это называется экспериментальной наукой.
Чем отличается наблюдательная наука от экспериментальной, и почему это важно для оценки исследований питания?
То, что мы имеем, это наблюдательная наука, которая фактически является теологией, потому что наука действительно углубляется в определения.
Экспериментальная наука требует контроля. Наблюдательная наука вообще не требует контроля, но если это будет определением наблюдательной науки, то это действительно теология. Это теоретизирование. Это относится к различию между наукой и сайентизмом. Чем мы на самом деле занимаемся в обществе? Мы занимаемся наукой или сайентизмом? Мы в основном занимаемся последним, осознаем мы это или нет, даже люди с лучшими намерениями. Итак, речь не идет о «сниженном риске» чего-либо. Мы отлично начали, не правда ли? Обожаю это слово — «риск».
«Риск развития кардиометаболической мультиморбидности». На самом деле это не так уж важно. Мы рассматриваем ассоциацию. Вместо «риска» им следовало сказать «снижение частоты» (incidence rate) того или иного значения, которое нам пока неизвестно, в конкретной изученной популяции. Это еще один важный момент.
Результаты исследования могут быть ответственно экстраполированы только на изученную группу, потому что каждый человек генотипически и фенотипически отличается от другого. Это факт, независимо от того, нравится вам это или нет. Будь то дескриптивная или инференциальная статистика. Инференциальная статистика совершенно неприменима к науке о питании человека.
Почему применение инференциальной статистики к питанию человека считается некорректным?
Инференциальная статистика — это идея, что вы с помощью стандартных ошибок, центральных предельных теорем, выборочных распределений можете получить информацию обо всей популяции, что является полностью гипотетическим. Это вводящее в заблуждение, двусмысленное утверждение. Оно заставляет думать, что речь идет буквально о популяции людей. О популяции, которая меняется каждую секунду из-за рождений и смертей с точки зрения демографического состава и параметров изучаемой случайной переменной.
Нет, под «популяцией» они подразумевают гипотетическую популяцию, которая обладает теми же характеристиками, что и все случаи, фактически включенные в ваше исследование, которые вы наблюдали, и которые подвержены тем же смешивающим и/или ложным переменным, причем эти переменные являются постоянными в своем поведении. Те же кривые случайного распределения, функции плотности вероятности, если они непрерывны. Это глупо. Это ошибочно. Ученые сообщают о том, что они наблюдали, а не о том, что они, по их мнению, наблюдали бы, если бы могли провести исследование так, как им хотелось бы.
Это имеет ценность в инженерии. Это не имеет ценности в науке о питании человека, когда ваши случаи настолько принципиально отличаются друг от друга. Это фундаментальный факт. Итак, в этом исследовании популяции было выявлено, что это *ассоциировано* с более низкой частотой заболеваемости, согласно заявленному потреблению кофеина. Люди лгут. Люди забывают.
Это основано на данных респондентов, согласно исследователям и их оговоркам, согласно частоте, с которой они на самом деле проводили эти опросники.
Почему нельзя экстраполировать результаты исследования за его временные рамки?
Изучение проводилось в течение определенного времени. Это еще один ключевой момент. Вы не можете экстраполировать результаты исследования за пределы его срока, который включает продолжительность исследования. Если исследование длилось два года, вы не можете экстраполировать эти результаты на период более двух лет. Вы понятия не имеете, что принесет будущее. Это ошибка индуктивной достоверности. Опять же, логика.
Какова истинная природа принципа «ассоциация не равно причинно-следственная связь»?
Далее в статье говорится, что ведущий автор исследования является доцентом эпидемиологии.
Эпидемиология изучает ассоциации, генерирует гипотезы, но сама по себе не является наукой в строгом смысле, если только не рассматривать наблюдательную науку как таковую. Это также, кстати, не говоря о том, что когда мы говорим об ассоциациях, часто учат, что «ассоциация не равно причинно-следственная связь», что является грубым упрощением. На самом деле это означает, что «ассоциация не обязательно указывает на причинно-следственную связь между зависимыми и независимыми переменными». Это происходит из-за смешивающих и ложных переменных.
Но это также означает, возвращаясь к логике, что контрапозитив и обратное утверждение также верны. Если нет ассоциации, это не означает отсутствия причинно-следственной связи. Часто учат обратному: «Ассоциация не равно причинно-следственная связь, но если нет ассоциации, то нет и причинно-следственной связи». Это ложно.
Контрапозитив утверждения «ассоциация равно причинно-следственная связь» (если предположить, что оно истинно) логически эквивалентен исходному, а именно: «отсутствие причинно-следственной связи равно отсутствию ассоциации». Итак, если мы знаем, что ассоциация не равна причинно-следственной связи, то мы также знаем, что отсутствие причинно-следственной связи не означает отсутствие ассоциации. И мы также знаем, что обратное утверждение верно: если нет ассоциации, это не равно отсутствию причинно-следственной связи. Это факт. Это может немного запутать.
Но всегда существует возможность того, что даже одна смешивающая переменная может разорвать причинно-следственную связь между X и Y. У нас есть примеры этого во всей Вселенной.
Что такое кардиометаболическая мультиморбидность?
Кардиометаболическая мультиморбидность, или CM, — это сосуществование по крайней мере двух кардиометаболических заболеваний, таких как ишемическая болезнь сердца, инсульт, диабет 2 типа и высокое кровяное давление. Это определение. «Потребление кофе и кофеина *может* играть, да, *может*, именно так, *может* играть важную защитную роль». Защитную роль. Хорошо, что они сказали «может», потому что если бы они просто сказали «защитную», это было бы еще одним утверждением о причинно-следственной связи, не так ли? Да, это риторический вопрос. Да, это так.
«Роль почти на всех фазах развития CM». Отлично.
Насколько надежны данные самоотчетов в исследованиях питания?
«Исследователи анализировали данные примерно 180 000 человек из Британского биобанка». Это достаточно большая выборка, не так ли? «Крупная биомедицинская база данных и исследовательский ресурс, который отслеживает людей в долгосрочной перспективе».
Что ж, определите «долгосрочную перспективу», потому что «долгосрочная» — это относительный термин, не так ли? То, что для одного человека кажется долгим сроком, для другого может быть коротким. Какова была продолжительность исследования? Какова была абсолютная продолжительность исследования, чтобы мы могли оценить его срок и понять, насколько ответственно экстраполировать эти результаты на какой период времени? «Участники не имели кардиометаболических заболеваний на момент начала исследования». Это хорошо, но что еще у них было на момент начала? Что еще делали эти люди?
Чего не делали эти люди? Что эти люди уже успели сделать к тому моменту? Опять же, генотип и фенотип. Генотип относится к генам, с которыми вы родились. Это ваш набор инструментов. Фенотип — это то, как эти гены проявляются в зависимости от того, что вы делаете, в зависимости от окружающей среды, в которой они находятся. Сюда входит то, что вы едите, сколько вы едите, что вы делаете.
Если вы возьмете двух генетически идентичных близнецов и поместите их в две разные среды, у них будет одинаковый генотип, но они не будут выглядеть одинаково. Внешний вид, проявление зависит от фенотипа, от того, как эти гены на самом деле проявляются. Что они делают? Итак, все эти люди совершенно генотипически и фенотипически разные. Ваши случаи совершенно отличаются друг от друга. Так что не говорите мне про 95% доверительные интервалы, основанные на t-распределениях и односторонних и двусторонних тестах на степени свободы. Это безответственно. Абсолютно безответственно.
Почему использование самоотчетных данных о потреблении кофеина является проблемой?
«Информация включала самоотчеты участников о потреблении кофеина». Вот оно. Самоотчеты о потреблении кофеина. Вы когда-нибудь видели опросник частоты потребления пищи? Вы когда-нибудь видели, как они это делают? Сами вопросы часто зависят от исследователей, от того, что они решат включить.
Это множественный выбор? «Сколько кофеина вы выпили за последние две недели?» А потом варианты от А до D, каждый из которых представляет собой интервальный диапазон. Откуда люди на самом деле это знают? Вот еще: «Сколько красного мяса вы съели за последний год с момента нашего последнего наблюдения?» Обычно это годы наблюдений в год. Они следят за вами. Да, да. Меняется ли ваше поведение каждый год? Или, скорее, ваше поведение такое же, как в прошлом году? Ваше поведение такое же, как месяц назад? Это стоит учитывать.
Не говоря уже о том, что, черт возьми, вы помните, что вы делали две недели назад? Вы помните, что вы ели две недели назад? Нет. Это качество науки о здоровье, эпидемиологии здоровья. Это нутриционная эпидемиология. Это наука. Вам это нравится? Невероятно. Итак, самоотчетное потребление кофеина. Хорошо, я рад, что мы это выяснили. Спасибо, что признали это.
«Через кофе, черный или зеленый чай и кардиометаболические заболевания, которые они развили, согласно данным первичной медико-санитарной помощи, больничным записям и свидетельствам о смерти, согласно исследованию, опубликованному во вторник в Журнале клинической эндокринологии и метаболизма Эндокринного общества».
Какова проблема сопоставления самоотчетных данных с развитием заболеваний?
Вы это уловили? Они измеряли этих людей. Нет, нет. Они собирали данные согласно тому, как эти люди отвечали о количестве потребляемого кофеина (напитков). Шум вокруг этого сигнала уже огромен, огромен из-за данных респондентов. Не говоря уже о том, что они сравнивают это с *ассоциированным* развитием кардиометаболических заболеваний и выводят причинно-следственную корреляцию. Вы можете сказать: «Ну, нет, они этого не делают, потому что они постоянно говорят,,может" и,,мог бы"». Да, но они говорят «риск». Риск. Да, это утверждение о причине и следствии. Нет.
Очень, очень легко пренебрежительно отвергнуть это как неправду из-за того, насколько популярно и повсеместно это выражение. Слово «риск» настолько вездесуще, оно используется каждый день, неустанно. Это не имеет значения, это все равно неправильно. Апелляция к популярности — это ошибка, безответственно. Не риск. Итак, отлично. Это то, что они сделали.
В чем разница между относительными и абсолютными показателями результатов в исследованиях?
«Умеренные потребители кофеина» — опять же, вероятно, они разделили людей на квинтили, это часто делается. «О, эти люди в этом квинтиле, что соответствует этому интервальному диапазону потребления того-то». А затем они сравнивают частоту заболеваемости через процентное увеличение или уменьшение, что является относительной статистикой исхода и не передает абсолютные эквиваленты. Почему я это поднимаю? 17% может означать, теоретически, двух человек. Это зависит от того, о чем вы говорите. Итак, отлично, мы хорошо начали.
«Умеренные потребители кофеина имели *сниженный риск*». Нет, не риск. Я буду повторять это, пока не посинею, не риск. Сниженный риск? Нет, в этой группе была более низкая частота заболеваемости. Что еще делали эти люди? Чего еще не делали эти люди? Я знаю, что это, вероятно, прозвучит обескураживающе и разочаровывающе. «Ну, это слишком хаотично, я не понимаю». Мы хотим порядка как люди, и знание того, что эта наука не может ничего сообщить, обескураживает. Что ж, это то, что происходит, когда вы живете в постпросвещенческую эпоху, где вы думаете, что можете играть в Бога.
«Человек предполагает, а Бог располагает», как говорят. Это просто глупо.


Я много говорю о статистике, науке в целом, эпистемологии и даже немного о философии. Но именно статистика лежит в основе большей части науки, поскольку это математика, это числа, это способ передать результаты экспериментов с доверительными интервалами, стандартными отклонениями, средними значениями, медианами и медианными абсолютными отклонениями и прочими вещами. Это крайне важно при оценке науки о питании человека, которая, к слову, составляет значительную часть научных исследований.
Чтобы правильно воспринимать и расшифровывать результаты, необходимо понимать хотя бы основы статистики, статистической значимости, нулевых и альтернативных гипотез и так далее.
Поэтому я решил, что будет полезно разобрать эти концепции более подробно и прикладным образом, а не просто говорить об абстрактном, превращая абстрактное в практическое. Сегодня мы займемся этим, анализируя статью, выпущенную в 2024 году, хотя и немного запоздало, но пора уже погрузиться в эту тему. Статья называется «Кофе может быть не просто утренним напитком, согласно новому исследованию». Это классическая научно-популярная статья о здоровье, типичный заголовок для новостей в области здравоохранения.
Проблема в том, что в большинстве случаев исследование на самом деле не подтверждает то, что заявлено в заголовке. Заголовок создан, чтобы быть эффектным и сенсационным. Поэтому нам следует анализировать само исследование, а не заголовок. Но поскольку мы все же обращаемся к заголовку и будем читать статью, давайте начнем с его разбора. Итак, «Кофе *может быть* не просто утренним напитком, согласно новому исследованию». Первое слово, которое бросается в глаза, это «может».
Как только речь заходит о статистике, необходимо понимать логику. Я представляю это как иерархию знаний или иерархию истины. В самом ее основании лежит философия. Над ней — эпистемология. Эпистемология отвечает на вопрос: как мы вообще что-то знаем? Как мы узнаем, что что-то истинно? Что такое истина в первую очередь? А уже над ней находится логика. Здесь мы изучаем логические ошибки, формальные и неформальные. И, на мой взгляд, над всем этим находится статистика. Статистика, если говорить об иерархии науки, а не истины, является ее фундаментом.
Она лежит в основе практически всей науки, потому что, будь то экспериментальное или наблюдательное исследование, ее скелетом является статистика. Именно так я это воспринимаю. Причина, по которой я это упомянул, заключается в том, что если вы изучаете статистику, первое, что вам нужно освоить, это логика, хотя бы ее основы.
Почему важно понимать принцип «ассоциация не равно причинно-следственная связь»?
Этот принцип, «ассоциация не равно причинно-следственная связь», является одним из самых распространенных и первых, которые преподают в статистике. Ирония заключается в том, что это самый злоупотребляемый принцип во всей науке. Почему? Потому что часто исследователи продолжают использовать слова, которые обязательно подразумевают причинно-следственную связь между двумя переменными, например, «повышает риск того-то на столько-то процентов». Слово «риск» — это утверждение о причине и следствии. Вы не можете так говорить.
Кроме того, это пример экологической ошибки (ecological fallacy), которая гласит, что даже если бы вы могли информировать о риске, риск всей группы не отражает риск каждого отдельного человека. Это также известно как ошибка композиции (composition fallacy): что верно для частей, то верно для целого.
На самом деле, это ошибка деления (division fallacy): что верно для целого, то верно для частей. Здесь задействовано множество логических ошибок. Возвращаясь к заголовку, почему использовано слово «может»? Причина в том, что оно также означает «может и не быть». Это всего лишь ассоциация. Как только вы начинаете говорить об ассоциациях, это ставит под вопрос силу этой ассоциации. Если вы сравниваете экспериментальную и контрольную группы, это ставит под вопрос увеличение частоты заболеваемости как в процентном, так и в абсолютном выражении. Это ставит под сомнение многое.
Так что слово «может» также означает «может и не быть». И нам предстоит выяснить, значимы ли эти доказательства или нет, что, в конечном итоге, само по себе является мнением, если только речь не идет о статистической значимости, которая все равно является произвольным порогом. Давайте продолжим. Статья CNN: «Утренняя чашка кофе *может* (опять это слово) делать больше, чем просто бодрить, согласно новому исследованию».
Слово «может» здесь означает то же самое, что и «может не делать». Это хороший мыслительный эксперимент: каждый раз, когда вы видите фразу «может сделать что-то», просто замените ее на «может не сделать».
Что подразумевается под «умеренными количествами» кофе в исследовании?
Далее говорится: «Умеренные количества... ». Важно определить, что такое «умеренные», поскольку это относительный термин. Нам нужны абсолютные значения, которые, как я полагаю, будут в самом исследовании. «Умеренное потребление кофеина» (который поступает не только из кофе) определяется как «около трех чашек кофе в день». Я предполагаю, что это метрические чашки, но не знаю, как они это определяют. Данные получены от респондентов, а люди, как известно, лгут, забывают, а опросники частоты потребления пищи — это спорный метод. «...
были *ассоциированы* (опять это слово) с более низким риском... ». Это немедленно ставит под вопрос силу и тип ассоциации.
Была ли она криволинейной или линейной? Значения R-квадрат и R-значения измеряют только силу линейной связи, а не ассоциаций в целом.
Почему термин «сниженный риск» неприменим в данном контексте?
Утверждение «ассоциированы с более низким риском» некорректно. Это не связано с более низким риском чего-либо, потому что «риск» — это утверждение о причинно-следственной связи. Не существует исследований, которые могли бы информировать о риске любого серьезного исхода для здоровья или заболевания в контексте питания человека за любой заданный период времени на протяжении всей истории науки о питании человека. Таких исследований никогда не было и никогда не будет.
Чтобы получить такую информацию, нужно взять двух генетически идентичных близнецов, как фенотипически, так и генотипически идентичных, разлучить их при рождении, поместить в две метаболические камеры и наблюдать за ними всю их жизнь, пытаясь вывести долгосрочные результаты для здоровья (например, 40 лет для 40-летних результатов). При этом необходимо контролировать каждую переменную, включая время их пробуждения, время отхода ко сну, уровень стресса, гормональный фон, какую ногу они сначала обувают.
Это неправдоподобно, невозможно, не прошло бы этический комитет (что правильно) и, кроме того, было бы чрезвычайно дорого. Такие исследования не проводятся. Это называется экспериментальной наукой.
Чем отличается наблюдательная наука от экспериментальной, и почему это важно для оценки исследований питания?
То, что мы имеем, это наблюдательная наука, которая фактически является теологией, потому что наука действительно углубляется в определения.
Экспериментальная наука требует контроля. Наблюдательная наука вообще не требует контроля, но если это будет определением наблюдательной науки, то это действительно теология. Это теоретизирование. Это относится к различию между наукой и сайентизмом. Чем мы на самом деле занимаемся в обществе? Мы занимаемся наукой или сайентизмом? Мы в основном занимаемся последним, осознаем мы это или нет, даже люди с лучшими намерениями. Итак, речь не идет о «сниженном риске» чего-либо. Мы отлично начали, не правда ли? Обожаю это слово — «риск».
«Риск развития кардиометаболической мультиморбидности». На самом деле это не так уж важно. Мы рассматриваем ассоциацию. Вместо «риска» им следовало сказать «снижение частоты» (incidence rate) того или иного значения, которое нам пока неизвестно, в конкретной изученной популяции. Это еще один важный момент.
Результаты исследования могут быть ответственно экстраполированы только на изученную группу, потому что каждый человек генотипически и фенотипически отличается от другого. Это факт, независимо от того, нравится вам это или нет. Будь то дескриптивная или инференциальная статистика. Инференциальная статистика совершенно неприменима к науке о питании человека.
Почему применение инференциальной статистики к питанию человека считается некорректным?
Инференциальная статистика — это идея, что вы с помощью стандартных ошибок, центральных предельных теорем, выборочных распределений можете получить информацию обо всей популяции, что является полностью гипотетическим. Это вводящее в заблуждение, двусмысленное утверждение. Оно заставляет думать, что речь идет буквально о популяции людей. О популяции, которая меняется каждую секунду из-за рождений и смертей с точки зрения демографического состава и параметров изучаемой случайной переменной.
Нет, под «популяцией» они подразумевают гипотетическую популяцию, которая обладает теми же характеристиками, что и все случаи, фактически включенные в ваше исследование, которые вы наблюдали, и которые подвержены тем же смешивающим и/или ложным переменным, причем эти переменные являются постоянными в своем поведении. Те же кривые случайного распределения, функции плотности вероятности, если они непрерывны. Это глупо. Это ошибочно. Ученые сообщают о том, что они наблюдали, а не о том, что они, по их мнению, наблюдали бы, если бы могли провести исследование так, как им хотелось бы.
Это имеет ценность в инженерии. Это не имеет ценности в науке о питании человека, когда ваши случаи настолько принципиально отличаются друг от друга. Это фундаментальный факт. Итак, в этом исследовании популяции было выявлено, что это *ассоциировано* с более низкой частотой заболеваемости, согласно заявленному потреблению кофеина. Люди лгут. Люди забывают.
Это основано на данных респондентов, согласно исследователям и их оговоркам, согласно частоте, с которой они на самом деле проводили эти опросники.

Почему нельзя экстраполировать результаты исследования за его временные рамки?
Изучение проводилось в течение определенного времени. Это еще один ключевой момент. Вы не можете экстраполировать результаты исследования за пределы его срока, который включает продолжительность исследования. Если исследование длилось два года, вы не можете экстраполировать эти результаты на период более двух лет. Вы понятия не имеете, что принесет будущее. Это ошибка индуктивной достоверности. Опять же, логика.
Какова истинная природа принципа «ассоциация не равно причинно-следственная связь»?
Далее в статье говорится, что ведущий автор исследования является доцентом эпидемиологии.
Эпидемиология изучает ассоциации, генерирует гипотезы, но сама по себе не является наукой в строгом смысле, если только не рассматривать наблюдательную науку как таковую. Это также, кстати, не говоря о том, что когда мы говорим об ассоциациях, часто учат, что «ассоциация не равно причинно-следственная связь», что является грубым упрощением. На самом деле это означает, что «ассоциация не обязательно указывает на причинно-следственную связь между зависимыми и независимыми переменными». Это происходит из-за смешивающих и ложных переменных.
Но это также означает, возвращаясь к логике, что контрапозитив и обратное утверждение также верны. Если нет ассоциации, это не означает отсутствия причинно-следственной связи. Часто учат обратному: «Ассоциация не равно причинно-следственная связь, но если нет ассоциации, то нет и причинно-следственной связи». Это ложно.
Контрапозитив утверждения «ассоциация равно причинно-следственная связь» (если предположить, что оно истинно) логически эквивалентен исходному, а именно: «отсутствие причинно-следственной связи равно отсутствию ассоциации». Итак, если мы знаем, что ассоциация не равна причинно-следственной связи, то мы также знаем, что отсутствие причинно-следственной связи не означает отсутствие ассоциации. И мы также знаем, что обратное утверждение верно: если нет ассоциации, это не равно отсутствию причинно-следственной связи. Это факт. Это может немного запутать.
Но всегда существует возможность того, что даже одна смешивающая переменная может разорвать причинно-следственную связь между X и Y. У нас есть примеры этого во всей Вселенной.
Что такое кардиометаболическая мультиморбидность?
Кардиометаболическая мультиморбидность, или CM, — это сосуществование по крайней мере двух кардиометаболических заболеваний, таких как ишемическая болезнь сердца, инсульт, диабет 2 типа и высокое кровяное давление. Это определение. «Потребление кофе и кофеина *может* играть, да, *может*, именно так, *может* играть важную защитную роль». Защитную роль. Хорошо, что они сказали «может», потому что если бы они просто сказали «защитную», это было бы еще одним утверждением о причинно-следственной связи, не так ли? Да, это риторический вопрос. Да, это так.
«Роль почти на всех фазах развития CM». Отлично.
Насколько надежны данные самоотчетов в исследованиях питания?
«Исследователи анализировали данные примерно 180 000 человек из Британского биобанка». Это достаточно большая выборка, не так ли? «Крупная биомедицинская база данных и исследовательский ресурс, который отслеживает людей в долгосрочной перспективе».
Что ж, определите «долгосрочную перспективу», потому что «долгосрочная» — это относительный термин, не так ли? То, что для одного человека кажется долгим сроком, для другого может быть коротким. Какова была продолжительность исследования? Какова была абсолютная продолжительность исследования, чтобы мы могли оценить его срок и понять, насколько ответственно экстраполировать эти результаты на какой период времени? «Участники не имели кардиометаболических заболеваний на момент начала исследования». Это хорошо, но что еще у них было на момент начала? Что еще делали эти люди?
Чего не делали эти люди? Что эти люди уже успели сделать к тому моменту? Опять же, генотип и фенотип. Генотип относится к генам, с которыми вы родились. Это ваш набор инструментов. Фенотип — это то, как эти гены проявляются в зависимости от того, что вы делаете, в зависимости от окружающей среды, в которой они находятся. Сюда входит то, что вы едите, сколько вы едите, что вы делаете.
Если вы возьмете двух генетически идентичных близнецов и поместите их в две разные среды, у них будет одинаковый генотип, но они не будут выглядеть одинаково. Внешний вид, проявление зависит от фенотипа, от того, как эти гены на самом деле проявляются. Что они делают? Итак, все эти люди совершенно генотипически и фенотипически разные. Ваши случаи совершенно отличаются друг от друга. Так что не говорите мне про 95% доверительные интервалы, основанные на t-распределениях и односторонних и двусторонних тестах на степени свободы. Это безответственно. Абсолютно безответственно.
Почему использование самоотчетных данных о потреблении кофеина является проблемой?
«Информация включала самоотчеты участников о потреблении кофеина». Вот оно. Самоотчеты о потреблении кофеина. Вы когда-нибудь видели опросник частоты потребления пищи? Вы когда-нибудь видели, как они это делают? Сами вопросы часто зависят от исследователей, от того, что они решат включить.
Это множественный выбор? «Сколько кофеина вы выпили за последние две недели?» А потом варианты от А до D, каждый из которых представляет собой интервальный диапазон. Откуда люди на самом деле это знают? Вот еще: «Сколько красного мяса вы съели за последний год с момента нашего последнего наблюдения?» Обычно это годы наблюдений в год. Они следят за вами. Да, да. Меняется ли ваше поведение каждый год? Или, скорее, ваше поведение такое же, как в прошлом году? Ваше поведение такое же, как месяц назад? Это стоит учитывать.
Не говоря уже о том, что, черт возьми, вы помните, что вы делали две недели назад? Вы помните, что вы ели две недели назад? Нет. Это качество науки о здоровье, эпидемиологии здоровья. Это нутриционная эпидемиология. Это наука. Вам это нравится? Невероятно. Итак, самоотчетное потребление кофеина. Хорошо, я рад, что мы это выяснили. Спасибо, что признали это.
«Через кофе, черный или зеленый чай и кардиометаболические заболевания, которые они развили, согласно данным первичной медико-санитарной помощи, больничным записям и свидетельствам о смерти, согласно исследованию, опубликованному во вторник в Журнале клинической эндокринологии и метаболизма Эндокринного общества».
Какова проблема сопоставления самоотчетных данных с развитием заболеваний?
Вы это уловили? Они измеряли этих людей. Нет, нет. Они собирали данные согласно тому, как эти люди отвечали о количестве потребляемого кофеина (напитков). Шум вокруг этого сигнала уже огромен, огромен из-за данных респондентов. Не говоря уже о том, что они сравнивают это с *ассоциированным* развитием кардиометаболических заболеваний и выводят причинно-следственную корреляцию. Вы можете сказать: «Ну, нет, они этого не делают, потому что они постоянно говорят,,может" и,,мог бы"». Да, но они говорят «риск». Риск. Да, это утверждение о причине и следствии. Нет.
Очень, очень легко пренебрежительно отвергнуть это как неправду из-за того, насколько популярно и повсеместно это выражение. Слово «риск» настолько вездесуще, оно используется каждый день, неустанно. Это не имеет значения, это все равно неправильно. Апелляция к популярности — это ошибка, безответственно. Не риск. Итак, отлично. Это то, что они сделали.
В чем разница между относительными и абсолютными показателями результатов в исследованиях?
«Умеренные потребители кофеина» — опять же, вероятно, они разделили людей на квинтили, это часто делается. «О, эти люди в этом квинтиле, что соответствует этому интервальному диапазону потребления того-то». А затем они сравнивают частоту заболеваемости через процентное увеличение или уменьшение, что является относительной статистикой исхода и не передает абсолютные эквиваленты. Почему я это поднимаю? 17% может означать, теоретически, двух человек. Это зависит от того, о чем вы говорите. Итак, отлично, мы хорошо начали.
«Умеренные потребители кофеина имели *сниженный риск*». Нет, не риск. Я буду повторять это, пока не посинею, не риск. Сниженный риск? Нет, в этой группе была более низкая частота заболеваемости. Что еще делали эти люди? Чего еще не делали эти люди? Я знаю, что это, вероятно, прозвучит обескураживающе и разочаровывающе. «Ну, это слишком хаотично, я не понимаю». Мы хотим порядка как люди, и знание того, что эта наука не может ничего сообщить, обескураживает. Что ж, это то, что происходит, когда вы живете в постпросвещенческую эпоху, где вы думаете, что можете играть в Бога.
«Человек предполагает, а Бог располагает», как говорят. Это просто глупо.