Шрифт:
Закладка:
Первые ретвиты слухов об обнаружении бозона Хиггса, 1 июля 2012 года. Точки соответствуют пользователям, а линии – ретвитам
По данным De Domenico et al., 2013
Когда слухи о бозоне Хиггса только появились, одни пользователи писали о возможном открытии, а другие ретвитили эти комментарии своим подписчикам. Если посмотреть на то, как были связаны первые несколько сотен ретвитов, то можно заметить огромную вариативность в передаче (см. иллюстрацию). Большинство твитов распространялись не слишком далеко: их ретвитили один-два пользователя. Но в центре сети оказалась крупная цепь ретвитов, включающая в себя два масштабных события передачи, когда отдельные пользователи передавали слух большому количеству людей.
Такая вариативность передачи характерна для распространения контента в интернете. В 2016 году Дункан Уоттс, в то время работавший в Microsoft Research, вместе с коллегами из Стэнфордского университета анализировал каскады распространения публикаций в твиттере. Они отследили более 620 миллионов сообщений, отмечая, какие пользователи ретвитнули ссылки, которыми поделились другие. Некоторые ссылки проходили через множество пользователей, образующих длинную цепь передачи. Другие вызывали вспышки ретвитов, которые быстро угасали. Третьи вообще не распространялись[384].
В случае с инфекционными болезнями мы говорили о двух крайних формах вспышек. Передача типа «общий источник» происходит тогда, когда все заражаются от одного и того же источника, например через пищу или отравленную воду. При другой крайности – разрастающейся вспышке – инфекция передается от человека к человеку в несколько шагов. В каскадах распространения в интернете наблюдается такая же вариативность. Иногда контент передается многим людям из одного источника – в маркетинге это называют широковещательной передачей, – а иногда по цепочке от одного пользователя к другому. Исследователи из Стэнфорда и Microsoft выяснили, что критически важными элементами самых крупных каскадов были события широковещательной передачи. Приблизительно одно из тысячи сообщений в Твиттере пользователи ретвитят больше ста раз, но лишь небольшая часть этих ретвитов распространяется посредством разрастающейся передачи. Успех каждого распространившегося твита, как правило, обусловлен одной широковещательной передачей.
Когда речь заходит о заражении в интернете, возникает соблазн сосредоточиться только на контенте, который стал популярным. Но нужно помнить, что подавляющее большинство публикаций вообще не распространяется. Исследователи из Microsoft выяснили, что около 95 % каскадов в твиттере состоят из единственного твита, которым никто не поделился. Из оставшихся 5 % большинство сообщений не продвинулись дальше чем на один шаг. То же справедливо для других онлайн-платформ: контент, который распространяется, на самом деле крайне редок, а само распространение чаще всего ограничивается несколькими шагами передачи. Бо́льшая часть публикаций в интернете попросту не заразна[385].
В предыдущей главе мы рассматривали вспышки вооруженного насилия в Чикаго, где передача этого насилия обычно заканчивалась после небольшого числа событий. Похожим образом в человеческой популяции прекращаются некоторые болезни. Например, штаммы птичьего гриппа H5N1 и H7N9 вызывают масштабные эпидемии у птиц, но плохо распространяются среди людей (по крайней мере, пока).
Какого рода вспышек нам следует ожидать, если что-либо распространяется не слишком эффективно? Мы уже знаем, как с помощью репродуктивного числа R оценить, есть ли у инфекционной болезни потенциал для распространения: если R превышает критическое значение, равное единице, то существует вероятность, что начнется эпидемия. Но даже если репродуктивное число меньше единицы, зараженный человек все равно может передать инфекцию кому-то еще. Это менее вероятно, но все же возможно. Всегда, когда значение R больше нуля, можно ожидать эпизодического возникновения вторичных случаев заражения. А новые случаи могут порождать новые этапы передачи инфекции – до тех пор, пока вспышка полностью не прекратится.
Если нам известно значение R затухающей инфекции, можно ли предсказать ее средний масштаб? Оказывается, можно – благодаря одному полезному математическому тождеству. Оно часто применяется при анализе эпидемий, и оно же определило подход Джоны Перетти и Дункана Уоттса к вирусному маркетингу на заре существования BuzzFeed [386].
Предположим, что вспышка начинается с одного зараженного. По определению этот первый случай породит в среднем R вторичных случаев. Новые зараженные, в свою очередь, спровоцируют по R случаев каждый – в сумме R2 – и так далее:
Размер вспышки = 1 + R + R2 + R3 + …
Мы могли бы сложить эти величины, чтобы вычислить ожидаемый размер вспышки. Но, к счастью, есть более простой путь. В XIX веке математики вывели изящное тождество, применимое к таким последовательностям. Для R в диапазоне от 0 до 1 справедливо следующее равенство:
1 + R + R2 + R3 + … = 1/(1 – R).
Иными словами, если репродуктивное число меньше единицы, ожидаемый масштаб вспышки равен 1/(1 – R) случаев. Даже если вы не особенно интересуетесь математикой XIX века, вдумайтесь и оцените, насколько полезно это тождество. Вместо того чтобы моделировать процесс поэтапного затухания инфекции и прекращения вспышки, мы можем просто рассчитать масштаб эпидемии, исходя из репродуктивного числа[387]. Если, например, R = 0,8, то следует ожидать всего 1/(1–0,8) = 5 случаев заболевания. Мы также можем произвести обратное действие и вычислить репродуктивное число по общему объему вспышки. Если вспышка состоит всего из пяти случаев, значит, R = 0,8.
В нашей области исследований мы регулярно используем этот упрощенный метод для оценки репродуктивного числа новых болезней. В начале 2013 года в Китае было зарегистрировано 130 случаев заболевания людей птичьим гриппом H7N9. Большинство заболели после контакта с птицами, но четыре кластера инфекции были, по всей видимости, связаны с передачей от человека к человеку[388]. Поскольку большинство инфицированных никого не заразили, в среднем каждая вспышка H7N9 среди людей включала в себя 1,04 случая, а это значит, что R этого штамма птичьего гриппа для человеческой популяции составляло 0,04.
Этот подход полезен не только для изучения заразных болезней. В середине 2000-х годов Джона Перетти и Дункан Уоттс применили его для оценки маркетинговых кампаний. Это значит, что они могли вычислить заразность той или иной идеи, а не просто описывать, как выглядела кампания. Например, в 2004 году некоммерческая организация The Brady Campaign, которая борется с вооруженным насилием, разослала людям электронные письма с просьбой поддержать новые меры контроля над оружием. Следуя призыву организации, получатели пересылали письмо друзьям. Некоторые из этих