Мы все знаем, что в наших мирах гораздо больше информации, чем раньше. Что касается того, насколько больше, ну, большинство из нас довольно невежественны.
Связанный контент
- Инфографика сквозь века подчеркивает визуальную красоту науки
- Почему Google Flu Trends не может отследить грипп (пока)
Вот бесценный самородок со всей этой информацией, комплименты Дейва Турека, парня, отвечающего за разработку суперкомпьютеров в IBM: с 2003 года и в обратном направлении к началу человеческой истории мы сгенерировали, по подсчетам IBM, пять экзабайт - это пять миллиардов гигабайт - информации. К прошлому году мы проверяли столько данных каждые два дня. К следующему году, прогнозирует Турек, мы будем делать это каждые 10 минут.
Но как это возможно? Как данные стали такими цифровыми кудзу? Проще говоря, каждый раз, когда ваш мобильный телефон отправляет свое местоположение GPS, каждый раз, когда вы покупаете что-то в Интернете, каждый раз, когда вы нажимаете кнопку «Нравится» на Facebook, вы помещаете в бутылку еще одно цифровое сообщение. И теперь океаны в значительной степени покрыты ими.
И это только часть истории. Текстовые сообщения, записи клиентов, транзакции банкоматов, изображения с камер наблюдения ... список можно продолжать и продолжать. Модным словом для описания этого является «Большие данные», хотя вряд ли это соответствует масштабам созданного нами монстра.
Это последний пример того, как технологии используют наши возможности. В этом случае мы еще не начали догонять нашу способность собирать информацию, поэтому в наши дни любимым трюком управленческих экспертов является то, что будущее принадлежит компаниям и правительствам, которые могут разобраться во всех данных, которые они сбор, желательно в режиме реального времени.
Предприятия, которые могут интерпретировать каждую цифровую крошку, которую оставляют их клиенты, будут иметь преимущество - думает не только о том, кто что купил за последний час, но и о том, написали ли они в Твиттере об этом или опубликовали фотографию где-то в вихре социальных сетей. То же самое касается городов, которые могут собирать данные с тысяч датчиков, которые теперь усеивают городские ландшафты и превращают капризы городской жизни, такие как транспортный поток, в науку.
Неудивительно, что политические кампании уже набирают обороты, яростно добывая данные, чтобы сосредоточиться на «нанотаргетинге» избирателей, чтобы они точно знали, как выдвигать их за свои голоса и деньги. Аналитики, по словам обозревателя New York Times Томаса Эдсалла, пришли к выводу, что республиканцы отдают предпочтение ресторанам «Офис» и Cracker Barrel, в то время как демократы с большей вероятностью смотрят «Позднюю ночь с Дэвидом Леттерманом» и едят в ресторане Chuck E Сыр
Стремление истолковать цифровые флотации объясняет, почему Google на прошлой неделе объявил, что начнет продавать продукт под названием BigQuery, программное обеспечение, которое может сканировать терабайты информации в считанные секунды. И почему стартап под названием Splunk, обладающий технологией, которая может анализировать огромные объемы данных о клиентах и транзакциях, увидел, что стоимость его акций взлетела почти на 90 процентов в день, когда он стал публичным в прошлом месяце. Это для компании, которая потеряла 11 миллионов долларов в прошлом году.
Восстание данных ученого
Но даже доступ к лучшим инструментам расшифровки данных не гарантирует большой мудрости. Очень немногие компании имеют в своем штате людей, которые обучаются не только для оценки огромного количества данных, включая множество неструктурированных лакомых кусочков с миллионов страниц Facebook и смартфонов, но и для того, чтобы действительно что-то с этим делать.
В прошлом году McKinsey Global Insitute опубликовал отчет, в котором «Большие данные» называются «следующей границей инноваций», но также прогнозируется, что к 2018 году компании в США будут испытывать серьезную нехватку талантов, когда речь заходит о необходимых аналитических навыках. столько же 190 000 человек. И он утверждает, что еще 1, 5 миллиона менеджеров должны будут пройти подготовку для принятия стратегических решений с потоком данных.
Однако не каждый верит в магию больших данных. Питер Фейдер, профессор маркетинга в бизнес-школе Penn's Wharton, не уверен, что чем больше данных, тем лучше. Не то чтобы он считает, что компании не следует пытаться узнать как можно больше о своих клиентах. Просто сейчас так много внимания уделяется агрегированию каждого бита данных, что, по его мнению, объем оценивается по сравнению с истинным анализом.
Вот пример, полученный Фейдером из недавнего интервью с MIT's Technology Review: «Даже с бесконечным знанием прошлого поведения у нас часто не хватает информации, чтобы делать значимые прогнозы на будущее. На самом деле, чем больше у нас данных, тем больше ложной уверенности у нас будет ... Важная часть заключается в том, чтобы понять, каковы наши границы, и использовать наилучшую возможную науку, чтобы заполнить пробелы. Все данные в мире никогда не достигнут этой цели для нас ».
Кто твои данные?
Вот пример того, как большие данные используются для решения больших проблем:
- Они знают, когда они были плохими или хорошими: в то время как большинство компаний сосредоточено на анализе своих клиентов, Amazon набирает очки, используя большие данные, чтобы помочь своим.
- Изучение кобелей: Вы хотите знать, какие быки порождают наиболее продуктивных дойных коров? Молочная индустрия изобрела способ сократить количество.
- Диагностика по данным. Исследователи из SUNY Buffalo анализируют огромные массивы данных, пытаясь определить, существует ли связь между рассеянным склерозом и факторами окружающей среды, такими как недостаточное воздействие солнечного света.
- В поисках неприятностей: компания под названием Recorded Future добывает информацию из социальных сетей, правительственных и финансовых сайтов, чтобы делать прогнозы о том, как рост населения, нехватка воды и экстремальные погодные условия могут привести к будущим политическим волнениям и терроризму.
Видео бонус: захват данных - это одно. Сделать его привлекательным и понятным - это совсем другая задача. В этом выступлении на TED Дэвид Маккэндлесс больше раскрывает силу «информационных карт».