Статистика в клинических исследованиях: ключевые понятия

Введение

Статистические методы обеспечивают формальный учет факторов, вызывающих различные реакции пациентов на лечение. Использование статистики позволяет специалистам, проводящим клинические исследования, формировать рациональные и точные выводы на основе полученной информации и обосновывать решения в неоднозначных случаях. Статистика лежит в основе предотвращения ошибок и погрешностей при проведении медицинских исследований. В этой статье рассматриваются некоторые ключевые понятия статистики и их применение в клинических исследованиях.

Проверка гипотезы

Гипотеза является предположением или рядом предположений, которые либо а) утверждают что-либо условно с целью проведения дальнейших научных исследований, либо б) подтверждают что-либо высоковероятное с учетом установленных фактов.

С учетом наших целей мы заинтересованы в гипотезе, которая утверждает что-либо , например, что новый метод лечения болезни лучше, чем существующий стандарт оказания медицинской помощи. Если новый метод лечения обозначить как «В», а стандарт оказания медицинской помощи как «А», тогда гипотеза утверждает, что метод «В» лучше, чем метод «А».

Может показаться очевидным, что ученые предпримут попытку доказать эту гипотезу, однако в данном случае это не так. На самом деле эта задача решается опосредованно. Вместо того, чтобы пытаться доказать гипотезу относительно метода В, научный подход подразумевает, что на самом деле истинным утверждением является утверждение о методе А, то есть разницы между стандартом оказания медицинской помощи и новым методом нет. Это называется «нулевой» гипотезой. Затем ученые пытаются опровергнуть утверждение относительно метода А. Это также называется опровержением нулевой гипотезы. Если ученым удается доказать, что гипотеза о методе А является неверной, и что стандарт оказания медицинской помощи не превосходит новый метод лечения, это означает, что гипотеза о методе В верна, и что новый метод лечения лучше, чем стандарт.

Для чего это делается?

Простого ответа на этот вопрос нет, данный метод широко распространен в современной науке, но можно попробовать провести аналогию с юридической сферой. Нулевая гипотеза отражает нашу текущую ситуацию или знание (например, по аналогии с ситуацией в суде, «подсудимый является невиновным»), которым мы доверяем, если только не располагаем существенными доказательствами обратному. Но если мы попытаемся доказать «альтернативную гипотезу» (так именуется гипотеза, обратная нулевой гипотезе), тогда «подсудимый является виновным».

Для того, чтобы лучше понять суть проблемы, следует процитировать Альберта Эйнштейна:

«Никаким количеством экспериментов нельзя доказать теорию; но достаточно одного эксперимента, чтобы ее опровергнуть».

Данная цитата позволяет предположить, что попытка доказать несостоятельность нулевой гипотезы или опровергнуть ее — это более четкая и достижимая задача, чем попытки подтвердить правильность альтернативной гипотезы. Обратите внимание, что это НЕ объясняет в полной мере, почему в науке применяется данный подход. Скорее, это объяснение помогает нам легче понять и воспринять довольно непростое понятие.

Ошибки 1-го и 2-го типа

В нижеприведенной таблице можно увидеть разницу между ошибками 1-го типа (ложноположительный результат) и 2-го типа (ложноотрицательный результат).


	Нулевая гипотеза верна	Нулевая гипотеза неверна
Опровержение нулевой гипотезы	Ошибка 1-го типа «Ложноотрицательный результат»	Правильный вывод «Верный положительный результат»
Невозможность опровергнуть нулевую гипотезу	Правильный вывод «Верный отрицательный результат»	Ошибка 2-го типа «Ложноотрицательный результат»

Запутаться по-прежнему легко, поэтому предлагаем рассмотреть эти тезисы в упрощенном варианте на следующем ярком примере:

Ошибки 1-го типа могут привести к смерти пациента: представьте себе исследование, в ходе которого сделан неверный вывод о том, что стандарт оказания медицинской помощи не имеет преимуществ перед новым методом, а применение нового метода лечения привело к катастрофическим результатам. Совершение ошибок 1-го типа приводит к неправильному выводу о наличии эффекта, которого на самом деле нет.
Ошибки 2-го типа означают, что потенциально ценное исследование ничем не заканчивается. Возможно, данное исследование могло бы быть действительно полезным, но, так как оно более не проводится, пациентам не будет причинен вред. Совершение ошибок 2-го типа приводит к невозможности обнаружить эффект, который присутствует.

В этой связи очевидно, что ошибки 1-го типа имеют гораздо более серьезные последствия для здоровья пациентов, чем ошибки 2-го типа.

Уровень значимости

Уровень значимости отражает вероятность совершения ошибки 1-го типа. Он зависит от масштаба выборки и «статистической мощности» исследования.

Статистическая мощность

«Мощность» статистического исследования отражает вероятность того, что оно может привести к опровержению нулевой гипотезы, или, иными словами, вероятность исследования обнаружить эффект, если эффект действительно существует. Это можно описать и иначе, например, сказать, что «мощность» исследования — это вероятность НЕ совершить ошибки 2-го типа.

P-величины

P-величины, или величины вероятности, отражают степень убедительности доказательств по шкале от 0 до 1. Небольшая р-величина (как правило, не превышающая 0,05, т.е. 5%) указывает на наличие убедительных доказательств против нулевой гипотезы, что может привести к ее опровержению, в то время как более высокая р-величина (больше, чем 0,05) указывает на обратное.

Корреляция в сравнении с каузацией

При анализе результатов исследования важно помнить, что корреляция и каузация не являются тождественными понятиями. Корреляция — статистическая взаимосвязь двух или более случайных величин; однако эта взаимосвязь не означает, что одна из этих случайных величин является причиной для возникновения другой (между обеими величинами есть что-то общее). В качестве примера можно привести гормонозаместительную терапию (ГЗТ) и ишемическую болезнь сердца (ИБС): известно, что женщины, которые использовали гормонозаместительную терапию, были менее подвержены риску возникновения ишемической болезни сердца. Однако это объяснялось не фактом применения гормонозаместительной терапии, а скорее тем, что группа людей, которые пользовались этим методом лечения, принадлежали к более высокой социально-экономической группе с улучшенными режимами питания и физической активности.

О каузации говорят в том случае, когда какой-либо фактор вызывает результат. Каузальный фактор частично является причиной результата. Для того чтобы различать корреляцию и каузацию, необходимо зафиксировать как можно больше информации об участниках исследования. Кроме того, необходимо с осторожностью относиться к использованию научной методологии при разработке дизайна клинических исследований и оценке возможных погрешностей в ходе исследования.

Манипуляция данными

Манипуляция данными — это практика выборочной некорректной подачи отчетных данных или создания ложных результатов. Примером манипуляции данными является случай, когда данные, которые противоречат ожидаемому результату, намеренно изымаются с целью увеличить пропорцию результатов, которые подтвердят проверяемую гипотезу. Кода исследователь удаляет из результатов статистические выбросы (значения, которые намного больше или меньше, чем следующее значение в ряду), необходимо проверить, действительно ли это статистические выбросы, а не результаты, которые отличаются от ожидаемых или желаемых. Еще одним примером манипуляции данных является случай, когда весь набор данных собран исследователем методом случайной выборки данных, основанных на наблюдении лишь одного пациента.

Трансформация данных

Трансформация данных — это применение математической формулы к некоторым данным, полученным при проведении исследования. Нередко это необходимо для того, чтобы приводимые данные было проще и легче воспринять. Например, измерять эффективность использования автомобильного топлива логичнее всего как «километр на литр». Однако, если необходимо оценить, сколько дополнительного топлива понадобится, чтобы увеличить проходимое расстояние, эти данные отражаются как «литр на километр». Применение некорректной формулы для отражения данных в данном случае повлияет на общий результат исследования.

Слияние данных

Слияние данных — это комбинирование данных нескольких исследований для того, чтобы получить более ясное представление о ситуации. Одна из самых распространенных форм слияния данных — это метаанализ, когда данные нескольких опубликованных исследований объединяются для их обобщения и сравнения. При проведении метаанализа важно убедиться, что при проведении исследований использовались одинаковые или сравнимые методы. Любые различия в дизайне исследования необходимо учитывать для того, чтобы исключить вероятность использования различных факторов в основе исследования (искажающих факторов). Примером некорректного слияния данных может быть обобщение данных нескольких исследований с использованием разных видов мышей в единое исследование на животных.

A2-4.33.3-V1.1