Четверть психологических исследований назвали статистически недоcтоверными

Томас Байес (1701-1761), на работах которого основан байесовский подход к оценке достоверности
Томас Байес (1701-1761), на работах которого основан байесовский подход к оценке достоверности

Специалист по статистике из США нашел способ единообразно оценивать достоверность научных исследований. Это позволило ему сделать вывод о том, что один из наиболее часто применяемых критериев правильности результатов на самом деле не является столь уж корректным. По оценкам профессора Валена Джонсона, до четверти работ по психологии, использовавших самый распространенный критерий достоверности, могут содержать ложные выводы. Подробности приведены в журнале Proceedings of the National Academy of Sciences, а кратко о выкладках исследователя пишет Nature News.

Работа Джонсона посвящена сравнению двух способов оценить достоверность выводов в научном исследовании. Профессор Техасского университета A&M (TAMU) обратил внимание на то, что обычно ученые используют либо вероятностный, либо байесовский подходы, но стандартного способа сопоставить их между собой до сих пор не было. Причем отсутствие такого сопоставления было обусловлено тем, что вероятностные и байесовские оценки представляют собой ответы на два разных вопроса.

В случае с вероятностным подходом ученый, получивший в своих наблюдениях численные данные, задается вопросом о вероятности получить точно такие же данные в случае, когда результат на самом деле случаен (то есть искомой закономерности в данных нет). Достоверными в области биологии, психологии и ряда иных дисциплин считаются результаты, характеризуемые вероятностью p<0,05: эта запись означает, что вероятность случайного результата составляет не более пяти процентов.

Байесовский подход основан на ином вопросе. Исследователи, которые используют его в своих работах, оценивают вероятность получить те данные, которые они получили, в случае когда их модель верна. Затем эту вероятность сравнивают с шансами получить такие же данные в случае, когда верна альтернативная модель. Отношение указанных вероятностей (обозначаемое символом K) в таком случае получается критерием достоверности. Если K меньше трех, то о достоверности говорить не приходится, а вот K>100 говорит об очень высокой достоверности.Причем, что подчеркивается статистиками, альтернативная модель вовсе не обязана быть гипотезой о случайности результатов. Корректность выбора альтернативной модели в каждом случае следует оговаривать особо. Напрямую сравнивать достоверности, полученные вероятностным и байесовским подходом (то есть «p<0,05» и «K=5,25») было нельзя.

Джонсон предложил специальный статистический тест, который во многих случаях позволяет сравнить обе оценки друг с другом. Кроме того, ученый обратился к материалам 855 предыдущих исследований, опубликованных психологами в 2007 году в двух разных журналах: Psychonomic Bulletin & Review и Journal of Experimental Psychology: Learning, Memory and Cognition. Расчеты показали, что в большинстве случаев наиболее распространенная «достаточная» достоверность на уровне p<0,05 соответствует лишь байесовской оценке на уровне около 5, а это считается достаточно маленьким значением. По оценкам Джонсона подобные просчеты могут примерно в 17-25 процентах случаев (из числа работ, основанных на пятипроцентном вероятностном критерии) приводить к неверным выводам: ученые сообщат о наличии закономерности там, где ее на самом деле нет. Исследователь подчеркивает, что плохая статистика может быть одной из главных причин невоспроизводимости научных работ: опережая подлоги и ошибки в ходе самого эксперимента.

Чтобы защитить добросовестных ученых от подобных ложных выводов, специалист по статистике предлагает пересмотреть общепринятую договоренность о том, какие же результаты считать значимыми. По мнению Джонсона, даваемое вероятностным подходом значение 0,05 надо снизить до 0,005: его анализ показывает, что работы с p<0,005 почти наверняка выдержат дополнительные проверки. За рост точности, по словам ученого, придется платить увеличением количества измерений и удорожанием опытов, но приложенные к его статье расчеты говорят об окупаемости подобных расходов. Объем опытной работы вырастет меньше, чем вдвое, а доля ошибочных выводов упадет примерно с 20 до 4 процентов, то есть в пять раз.

За последние несколько лет из публикации отзывались статьи даже нобелевских лауреатов, причем такие случаи обусловлены несколькими причинами: от небрежности при проведении опытов или мошенничества до ошибок, подобных тем, что разобраны Джонсоном. Именно в психологии кризис воспроизводимости приобрел наибольшие масштабы (подробнее об этом можно прочитать в обзорной заметке Nature или в материале New Yorker).

подписатьсяОбсудить
00:01 Сегодня

Башку с плеч!

Раскрыты подробности первой успешной операции по пересадке головы
00:02 24 сентября 2016

Потрачено!

Как пираты переводили компьютерные игры
00:01 19 сентября 2016
Готовящаяся к вспышке звезда Эта Киля в центре туманности Гомункул

Яркая смерть

Когда вспышка сверхновой уничтожит жизнь на Земле
Олег Знарок (на втором плане) и Николай Кулёмин, Евгений Кузнецов и Евгений Дадонов (слева направо на первом плане) Похороните меня за кленом
Как Россия проиграла в принципиальном матче Канаде и вылетела из Кубка мира
Виталий МуткоДетали туалета
Мутко переизбран президентом РФС на фоне задержания главы ВОБ Шпрыгина
«Если "Спартак" сдаст позиции, Хабаровск Каррере припомнят»
Бывший форвард сборной России — о промежуточных итогах розыгрыша Кубка страны
«Корейцы пьют даже больше русских»
История жителя Владивостока, поселившегося в Сеуле
Мамин жим лежа
10 звезд Instagram, которые вернулись в форму после беременности
Не ЗОЖ, но хорош
В Instagram полюбили ироничный аккаунт противницы правильного питания
Разводка и девичья фамилия
Топ-15 лженовостей о звездах, которые СМИ повторяют из года в год
Джимхана и тиранозавр
Самое крутое автомобильное видео сентября
Ядовитый гараж
Собираем гербарий уникальных и тайных творений BMW Motorsport
С мотором в багажнике
Вспоминаем заднемоторные седаны в честь юбилея Skoda 105/120/125
Джентльмены, покупайте ваши моторы!
Непростой Тест: чьи двигатели стоят на спорт- и суперкарах?
Стенка на стенку
Джоконда, покемон и Корлеоне с Чебурашкой — лучшее от уличных художников Москвы
«За годы ожидания мы выдохлись. Живем сейчас где попало»
История покупателей жилья, заселенных в недостроенные дома в Подмосковье
«Мне угрожали, обещали закатать в асфальт»
История валютной ипотечницы, которая прошла оба кризиса и ни о чем не пожалела
Что-то пошло не так
Как выглядят населенные насекомыми города, жизнь без неба и море над головой
Кто купил Америку
Десять человек, которым на самом деле принадлежат земли США