https://frosthead.com

В поисках новых открытий в старых данных

Что происходит со старыми лабораторными тетрадями и другими записями научных данных? Это все еще полезно, хотя не так сильно, когда оно отливается в ящике в нижней части шкафа. Но теперь группа ученых, недавно встретившаяся на конференции Комитета по данным для науки и техники (CODATA), начинает глобальные усилия по получению этих данных, сообщило Nature на прошлой неделе. Группа спросит исследователей, музеи и университеты, что они могли бы спрятать, и опубликует список того, что они найдут в 2012 году. Отчеты о природе :

Это не только данные в старых книгах или фотографиях, которые находятся в опасности. Цифровая информация, собираемая в период между 1950 и 1980 годами, также находится под угрозой, поскольку она хранится на устаревших носителях, часто подверженных износу, таких как магнитная лента и дискеты, что усложняет доступ и получение. В развивающихся странах хранятся некоторые из наиболее ценных данных - от землепользования до статистики заболеваний - и наиболее угрожаемые, например, из-за локальных конфликтов и неадекватного или неоднородного хранения.

Старые записи уже более чем доказали свою ценность. Например, данные из бортовых журналов использовались для изучения истории китобойного промысла, изменения климата и магнитного поля планеты. Zooniverse - которая в прошлом использовала способность скучающих людей с компьютерами для поиска по небесным снимкам сверхновых и космических слияний - выпустила свою орду гражданских ученых на книги рекордов с кораблей Королевского флота Первой мировой войны собрать данные и улучшить базу данных экстремальных погодных явлений.

Потратьте немного времени на этот сайт Zooniverse, и вы быстро поймете, какой это огромный проект для извлечения данных из любых источников, найденных группой CODATA. Поскольку недостаточно просто знать, что там есть - для того, чтобы данные могли быть использованы и сохранены для будущего, их также необходимо будет оцифровать. И управление всеми этими данными будет еще одной проблемой. Но иметь слишком много данных - проблема, я думаю, что большинство ученых не против.

В поисках новых открытий в старых данных