Ежегодный опрос Гэллапа о том, какие профессии являются наиболее заслуживающими доверия, не задает вопросов об ученых, но можно с уверенностью сказать, что, по крайней мере, они будут намного выше, чем продавцы подержанных автомобилей и члены Конгресса внизу.
В то же время, среди тысяч людей во всем мире, которые практикуют науку и публикуют свои результаты, некоторые меньшинства, вероятно, уступают искушению массировать данные для достижения результатов, привлекающих внимание (и благоприятных для финансирования). В последние годы для некоторых стало политически полезным воспользоваться этой возможностью и заявить о намеренном научном мошенничестве. (Обвинения в том, что искусственное изменение климата является широко распространенным научным заговором, стали более распространенными после так называемого скандала с изменением климата в 2009 году, несмотря на то, что в ходе ряда расследований не было обнаружено каких-либо доказательств мошенничества или научных нарушений.)
Но как часто ученые на самом деле лгут о своих данных? Другими словами, насколько мы должны доверять им?
Ответ, по крайней мере, согласно исследованию, опубликованному сегодня в « Известиях Национальной академии наук», заключается в том , что в целом ученые - довольно честная группа. В этой статье медицинские исследователи из Университета Вашингтона и других стран обнаружили, что из более чем 25 миллионов статей, связанных с биомедицинскими исследованиями, опубликованных в базе данных Национального института здравоохранения PubMed, которые датируются 1940-ми годами, 2047 были отозваны в какой-то момент с момента их издание. Это менее 0, 01 процента всех бумаг в базе данных.
Исследователи сломали свои результаты далее, пытаясь приписать каждое сокращение к типу причины. По их данным, 21, 3 процента были вызваны честной ошибкой, такой как непреднамеренное неправильное толкование данных. Между тем, 67, 4 процента отказов могут быть отнесены на счет какого-либо проступка, включая мошенничество или фальсификацию (43, 4 процента), плагиат (9, 8 процента) и дублирование публикации (14, 2 процента). По сравнению со статьями, отозванными до 1975 года, те, которые были отозваны впоследствии, имели в десять раз больше шансов на мошенничество, чем на честную ошибку.
Общий скромный уровень мошенничества может объяснить, почему авторы блога Retraction Watch, в которых документы отозваны, столкнулись с оппозицией. Некоторые говорят, что направление внимания на отдельные случаи нечестности непропорционально увеличивает общественное недоверие к науке в целом. «Аргумент звучит примерно так», - написали они в мае в Lab Times . «Научное мошенничество встречается редко, поэтому сосредоточение внимания на проступках дает искаженную картину исследований, которые дадут боеприпасы только критикам, которые хотят поставить под сомнение такие темы, как изменение климата и безопасность вакцин».
Одним из ответов может быть то, что мы на самом деле не знаем, насколько редки случаи мошенничества, несмотря на то, что показатель ретракции в 0, 01 процента показывает это новое исследование PNAS. Как отмечают авторы исследования, во многих случаях статья может быть подозрительной, но в журнале недостаточно доказательств, чтобы от нее отказаться. Например, в 2005 году The Lancet «выразил обеспокоенность» результатами исследования, в котором была обнаружена корреляция между средиземноморской диетой и сниженным риском сердечно-сосудистых заболеваний, но в конечном итоге они не отозвали документ.
Более того, у нас нет возможности узнать, сколько подозрительных наборов данных никогда не обнаруживается. Фальсифицированный набор данных не может быть воспроизведен другими исследователями, но во многих случаях сомнительно, что это побудит их утверждать о нечестности. Исторически многие случаи научного мошенничества раскрываются только внутренними разоблачителями.
Недавние события, тем не менее, указывают на то, что мы можем вступать в эпоху, когда научные открытия действительно помогают нам обнаружить мошенничество или, по крайней мере, некоторые его виды. В июле этого года социальный психолог Ури Симонсон из Университета Пенсильвании получил заголовки, используя инновационный статистический анализ для обнаружения сфабрикованных данных в работе социального психолога Дирка Смистерса, который написал статью, в которой обнаружил положительное влияние цвета на поведение потребителей.
Техника Симонсона сложна, но опирается на тот факт, что люди, как известно, плохо умеют подделывать наборы данных, характеризующиеся той же случайностью, что и в реальных событиях. Саймонсон сказал Nature : «Основная идея состоит в том, чтобы увидеть, слишком ли близки данные к теоретическому прогнозу или множественные оценки слишком похожи друг на друга».
Вскоре после отставки Смистерса Саймонсон обнародовал свой алгоритм, поощряя исследователей публиковать свои необработанные данные, а другие проверять их. Он надеется, что реальная возможность того, что любые исследователи, соблазненные манипулировать своими данными, могут стать мощным сдерживающим фактором. Теоретически это не только уменьшит количество мошенничества, но и повысит доверие, которое мы можем оказать продуктам науки в целом.