https://frosthead.com

Мир Согласно Твиттеру в Картах

Твиты со всего мира, нанесенные на местности как часть нового исследования. Нажмите, чтобы увеличить. Изображение через Первый понедельник / Leetaru et. и др.

Трудно оценить, насколько быстро и тщательно Twitter захватил весь мир. Всего семь лет назад, в 2006 году, эта идея была набросана на блокноте. Сейчас этим сервисом пользуются около 554 миллионов пользователей - число, которое составляет почти 8 процентов от всех людей на планете - и было отправлено около 170 миллиардов твитов, причем это число увеличивается примерно на 58 миллионов каждый день,

Все эти твиты предоставляют бесценный источник новостей, развлечений, разговоров и связей между людьми. Но для ученых они также ценны как нечто совершенно другое: необработанные данные.

Поскольку Twitter имеет открытый API (который позволяет загружать твиты в виде необработанных, анализируемых данных), а многие твиты имеют геотеги, исследователи могут использовать миллиарды этих твитов и анализировать их по местоположению, чтобы узнать больше о географии людей по всей планете. Прошлой осенью, в рамках Global Twitter Heartbeat, команда Университета Иллинойса проанализировала язык и местоположение более миллиарда твитов со всего США, чтобы создать сложные карты таких вещей, как положительные и отрицательные эмоции, выраженные во время урагана «Сэнди», или поддержки Барака. Обама или Митт Ромни во время президентских выборов.

Как отметил Джошуа Китинг в блоге Foreign Idea «Война идей», члены той же группы, возглавляемой Калевом Летару, недавно сделали еще один шаг вперед. Как было опубликовано в новом исследовании в начале этой недели в онлайн-журнале « Первый понедельник», они проанализировали местоположение и языки 46 672 798 твитов, опубликованных в период с 23 октября по 30 ноября прошлого года, чтобы создать потрясающий портрет человеческой деятельности вокруг планеты, показанный на верхняя часть поста. Они использовали Twitter decahose, поток данных, который собирает случайные 10 процентов всех твитов по всему миру в любой момент времени (который составил 1 535 929 521 за период времени), и просто сосредоточился на твитах со связанными географическими данными.

Как отмечают исследователи, географическая плотность твитов во многих регионах, особенно в западном мире, где компьютеры, мобильные устройства и Твиттер используются на пиковых уровнях, близко соответствует показателям электрификации и освещения. В результате карты твитов (например, подробный вид континентальной части США ниже) выглядят очень похоже на спутниковые снимки искусственного света ночью.

Нажмите, чтобы увеличить. Изображение через Первый понедельник / Leetaru et. и др.

В качестве теста, чтобы увидеть, насколько хорошо твиты соответствуют искусственному освещению, они создали составную карту ниже, в которой твиты показаны красными точками, а ночное освещение - синим. Области, где они соответствуют по частоте (и эффективно взаимно исключают друг друга), отображаются белым цветом, а области, где одно перевешивает другое, остаются красными или синими. Многие районы в итоге выглядят довольно белыми, за некоторыми ключевыми исключениями: Иран и Китай, где Twitter запрещен, заметно синие, в то время как многие страны с относительно низкими показателями электрификации (но где Twitter все еще популярен) отображаются красным цветом.

Нажмите, чтобы увеличить. Изображение через Первый понедельник / Leetaru et. и др.

Проект стал еще интереснее, когда исследователи использовали автоматизированную систему для разбивки твитов по языкам. Самым распространенным языком в Твиттере является английский, который представлен в 38, 25% всех твитов. Затем последовали японский (11, 84%), испанский (11, 37%), индонезийский (8, 84%), норвежский (7, 74%) и португальский (5, 58%).

Команда создала карту всех твитов, написанных на 26 самых популярных языках, каждый из которых представлен другим цветом, ниже:

Нажмите, чтобы увеличить. Изображение через Первый понедельник / Leetaru et. и др.

В то время как в большинстве твитов преобладают их официальные языки, во многих из них обнаруживаются твиты на различных других языках. Присмотритесь достаточно внимательно, и вы увидите радугу цветов, тонко высовывающуюся из серых точек (английских твитов), которые покрывают США:

Нажмите, чтобы увеличить. Изображение через Первый понедельник / Leetaru et. и др.

Среди других анализов исследовательская группа даже рассмотрела географию ретвитов и ссылок - среднее расстояние между пользователем и кем-то, кого он или она ретвитит, а также среднее расстояние между этим пользователем и кем-то, на кого он или она просто ссылаются в твите. В среднем расстояние для ретвита составило 1115 миль, а для справки - 1118 миль. Но, как ни странно, существовала положительная связь между тем, сколько раз данный пользователь ретвитнул или ссылался на другого пользователя, и их расстоянием: в целом пары пользователей, у которых было всего несколько взаимодействий, были в большей степени ближе друг к другу (500- 600 миль), чем те, с десятками ретвитов и ссылок между ними.

Это указывает на то, что пользователи, которые живут далеко друг от друга, чаще используют Twitter для регулярного взаимодействия. Одним из объяснений может быть то, что сущности с наибольшим количеством подписчиков - и, следовательно, с наибольшим количеством ссылок и ретвитов - часто являются знаменитостями, организациями или корпорациями, пользователями, с которыми люди знакомы, но на самом деле не имеют личных отношений. Глобальная карта ретвитов между пользователями ниже:

Нажмите, чтобы увеличить. Изображение через Первый понедельник / Leetaru et. и др.

В документе были еще более подробно рассмотрены другие данные, связанные с твитами: соотношение между освещением в новостных лентах и ​​количеством твитов в стране (Европа и США получают непропорциональное освещение в СМИ, в то время как Латинская Америка и Индонезия упускаются из виду), места в Твиттере В последнее время добавлено наибольшее количество пользователей (на Ближнем Востоке и в Испании) и места, где у пользователей в среднем больше всего подписчиков (Южная Америка и Западное побережье).

Есть несколько предостережений ко всем этим данным. Во-первых, хотя количество проанализированных твитов исчисляется десятками миллионов, они по-прежнему составляют всего 0, 3 процента от всех отправленных твитов, поэтому они могут неадекватно представлять все шаблоны Twitter, особенно если пользователи, которые включают геотеггинг, ведут себя не так, как другие. Кроме того, в быстро меняющемся мире Twitter некоторые тенденции, возможно, уже значительно изменились с прошлой осени. Но поскольку Twitter продолжает расти и по мере появления новых данных становится очевидным, что этот вид анализа станет более популярным только для демографов, компьютерных ученых и других исследователей.

Мир Согласно Твиттеру в Картах