https://frosthead.com

Подавляющее большинство необработанных данных старых научных исследований теперь может отсутствовать

Одной из основ научного метода является воспроизводимость результатов. В лаборатории по всему миру исследователь должен иметь возможность изучать тот же предмет, что и другой ученый, и воспроизводить те же данные, либо анализировать те же данные и замечать те же закономерности.

Вот почему результаты исследования, опубликованного сегодня в Current Biology, так волнуют. Когда группа исследователей попыталась отправить по электронной почте авторам 516 биологических исследований, опубликованных в период с 1991 по 2011 годы, и попросить предоставить необработанные данные, они с ужасом обнаружили, что более 90 процентов самых старых данных (из статей, написанных более 20 лет назад) были недоступны. В целом, даже с учетом статей, опубликованных совсем недавно в 2011 году, им удалось отследить данные только на 23 процента.

«Все знают, что если вы спросите исследователя о данных из старых исследований, они получат рубец и ушиб, потому что они не знают, где это», - говорит Тимоти Вайнс, зоолог из Университета Британской Колумбии, который возглавлял усилие. «Но на самом деле никогда не было систематических оценок того, как быстро данные, хранимые авторами, на самом деле исчезают».

Чтобы сделать их оценку, его группа выбрала тип данных, который был относительно непротиворечивым с течением времени - анатомические измерения растений и животных - и выкопала от 25 до 40 работ для каждого нечетного года в течение периода, который использовал данные такого рода, чтобы увидеть если бы они могли выследить необработанные цифры.

Удивительное количество их запросов было остановлено на самом первом этапе: в 25 процентах исследований активные адреса электронной почты не могли быть найдены, так как несуществующие адреса были указаны на самой бумаге, а поисковые запросы в Интернете не вызывали никаких текущих. Еще для 38 процентов исследований их запросы не дали ответа. Еще 7 процентов наборов данных были потеряны или недоступны.

«Некоторое время, например, оно сохранялось на гибких дисках размером три с половиной дюйма, поэтому никто не мог получить к нему доступ, потому что у них больше не было подходящих дисков», - говорит Вайнс. Поскольку основная идея хранения данных такова, что они могут быть использованы другими в будущих исследованиях, этот вид морального износа по существу делает данные бесполезными.

Это может показаться обыденным препятствием, но ученые похожи на нас: они меняют адреса электронной почты, получают новые компьютеры с разными дисками, теряют свои резервные копии файлов - поэтому эти тенденции отражают серьезные системные проблемы в науке.

А сохранение данных настолько важно, что стоит помнить, потому что невозможно предсказать, в каком направлении будут двигаться исследования в будущем. Вайнс, например, проводил собственное исследование пары видов жаб, обитающих в Восточной Европе, которые, по-видимому, находятся в процессе гибридизации. По его словам, в 1980-х годах отдельная группа исследователей работала над той же темой и наткнулась на старую статью, в которой документировалось распределение этих жаб в 1930-х годах. Знание того, что их распределение относительно мало изменилось за прошедшие десятилетия, позволило ученым сделать все виды вычислений, которые иначе были бы невозможны. «Эти оригинальные данные, полученные из очень небольшого старого исследования, написанного на польском языке, были невероятно полезны для исследователей, появившихся 70 лет спустя», - говорит он.

Существует также тот факт, что большая часть этого исследования оплачивается за счет государственного финансирования, большая часть которого идет через гранты, которые предусматривают, что полученные данные должны быть свободно доступны для общественности. Кроме того, на полевые данные влияют обстоятельства окружающей среды, в которой они собираются, поэтому невозможно точно воспроизвести их позже, когда условия изменились.

Какое решение? В некоторых журналах, в том числе в « Молекулярной экологии», управляющим редактором которой является Vines, приняты политики, требующие от авторов представлять необработанные данные вместе со своими работами, что позволяет самому журналу архивировать данные на постоянной основе. Хотя журналы, как и люди, подвержены изменению адресов электронной почты и технологическому устареванию, с этими проблемами гораздо легче справиться в институциональном масштабе.

Подавляющее большинство необработанных данных старых научных исследований теперь может отсутствовать