Онлайн
библиотека книг
Книги онлайн » Разная литература » Законы эпидемий. Как развиваются и почему прекращаются эпидемии болезней, финансовые кризисы, вспышки насилия и модные тренды - Адам Кучарски

Шрифт:

-
+

Закладка:

Сделать
1 ... 67 68 69 70 71 72 73 74 75 ... 97
Перейти на страницу:
когда исследователи получают доступ к медицинским базам данных, из них удаляется личная информация пациентов, в частности имена и адреса. Но идентифицировать людей можно и без этих данных. Когда Латания Суини училась в докторантуре MIT в середине 1990-х годов, ей в голову пришла мысль, что если знать возраст, пол и почтовый индекс гражданина США, то его личность вполне можно вычислить. В те времена некоторые медицинские базы данных содержали такую информацию. Суини предположила, что если сопоставить эти данные со списком избирателей, то, скорее всего, станет понятно, чья медицинская карта у вас перед глазами[563].

Так она и поступила. «Чтобы проверить свою гипотезу, мне нужно было кого-то вычислить», – впоследствии вспоминала она[564]. Штат Массачусетс тогда как раз анонимизировал больничные записи и сделал их доступными для исследований. Губернатор Уильям Уэлд утверждал, что личные данные пациентов надежно защищены, но эксперимент Суини показал, что он ошибается. Она заплатила 20 долларов за доступ к спискам избирателей Кембриджа, где жил Уэлд, а затем сопоставила возраст, пол и почтовый индекс губернатора, указанные в списке, с информацией из больничной базы данных. Вычислив медицинскую карту Уэлда, Суини отправила ему копию по электронной почте. Эксперимент и последовавший за ним публичный скандал в итоге привели к серьезным изменениям в правилах хранения и передачи медицинских данных в США[565].

Данные перетекают с одного компьютера на другой – а вместе с ними и уникальные сведения о жизни людей. И это не только медицинская или генетическая информация, с которой следует обращаться особенно осторожно; даже безобидные на первый взгляд наборы данных могут содержать очень личные подробности. В марте 2014 года Крис Вонг, называющий себя «фанатиком данных», воспользовался американским Законом о свободе информации, чтобы получить сведения обо всех поездках в такси в Нью-Йорке за предыдущий год. Набор данных, обнародованный агентством New York City Taxi and Limousine Commission, содержал информацию о времени и месте посадки и высадки пассажиров, стоимости поездок и о том, сколько чаевых оставил каждый из пассажиров[566]. Всего за год было совершено более 173 миллионов поездок. Для каждой машины указывался не номерной знак, а набор якобы случайных цифр. Однако данные оказались вовсе не такими уж анонимными. Через три месяца после публикации данных специалист по информатике Виджай Пандуранган показал, как расшифровать коды такси и превратить наборы цифр в реальные номера машин. Затем докторант Энтони Токар рассказал в своем блоге, какие еще сведения содержит база данных. Он выяснил, что с помощью нескольких простых приемов можно извлечь из файлов массу деликатной информации[567].

Для начала он показал, как выследить известных персон. Потратив пару часов на поиск фотографий по запросу «Знаменитости в такси на Манхэттене в 2013 году», Токар нашел несколько снимков, на которые попал номерной знак автомобиля. Сверившись с блогами знаменитостей и глянцевыми журналами, он вычислил, где такси забирало или высаживало пассажира, и сопоставил эти сведения с якобы анонимизированной базой данных. Кроме того, он выяснил, какие чаевые оставляли знаменитости – и оставляли ли их вообще. «Конечно, это относительно безобидные данные, особенно по прошествии года, – однако мне все же удалось раскрыть информацию, которая до этого не была общедоступной», – писал Токар.

Токар понимал, что у большинства людей такие изыскания не вызовут особого беспокойства, поэтому решил копнуть глубже. Он обратил внимание на один стриптиз-клуб на Манхэттене, в районе под названием Адская Кухня, и решил изучить ночные поездки на такси из этого клуба. Вскоре он вычислил постоянных клиентов и их домашние адреса. Ему не понадобилось много времени, чтобы найти этих людей в соцсетях; теперь он знал, как они выглядят, сколько стоят их дома и каково их семейное положение. Токар решил не публиковать эту информацию, но то же самое вполне мог проделать любой другой человек. «Возможные последствия таких изысканий трудно переоценить», – заключил Токар.

Высокоточные данные GPS также позволяют без труда идентифицировать людей[568]. Записи GPS-трекеров рассказывают, где мы живем, по какой дороге едем на работу, когда, где и с кем встречаемся. Как и данные нью-йоркского такси, эта информация может представлять огромную ценность для папарацци, грабителей и шантажистов. В ходе опроса, проведенного в 2014 году, 85 % американских приютов для жертв домашнего насилия сообщили, что защищают людей от агрессоров, которые следят за жертвами с помощью GPS[569]. Порой пользовательские данные GPS даже ставят под угрозу военные операции. В 2017 году информация с личных фитнес-трекеров военнослужащих позволила раскрыть точное местоположение армейских баз – военные просто загружали маршруты для бега и велопрогулок[570].

Несмотря на эти риски, доступность данных о передвижении людей очень важна: ученые получают возможность выяснить, где будут распространяться вирусы; спасательные команды эффективнее помогают населению после природных катастроф; специалисты по городскому планированию видят, как следует усовершенствовать систему городского транспорта[571]. Высокоточные данные GPS даже позволяют анализировать взаимодействие между определенными группами людей. Так, исследователи уже использовали данные мобильной связи, чтобы изучать социальную сегрегацию, политические группировки и неравенство в самых разных странах, от США до Китая[572].

Если последнее предложение вызвало у вас некоторый дискомфорт, вы не одиноки. С повышением доступности цифровых данных растут и опасения по поводу конфиденциальности. Проблема неравенства имеет огромное значение для общества и, бесспорно, достойна изучения – но остается вопрос: насколько глубоко исследователи подобных проблем могут погружаться в подробности, связанные с нашими доходами, политическими взглядами и социальной жизнью? Когда речь заходит об изучении поведения людей, нам часто приходится решать, какова допустимая цена этих знаний.

Работая над проектами с использованием данных о передвижении, мы с коллегами всегда уделяли первостепенное внимание конфиденциальности. С одной стороны, мы стремились по возможности собрать максимум полезных данных, особенно если они помогали спасти общество от эпидемии. С другой стороны, мы должны были защитить частную жизнь людей в этих сообществах, даже если ради этого приходилось отказаться от сбора и публикации некоторых сведений. Ситуация осложняется, когда дело касается таких болезней, как грипп или корь, поскольку дети, подвергающиеся высокому риску заражения, – это особенно уязвимая возрастная группа[573]. Существуют способы провести массу исследований и узнать много полезного и интересного о социальном поведении, но эти способы предполагают вторжение в частную жизнь, а такое вторжение трудно будет оправдать.

В тех редких случаях, когда нам приходилось использовать высокоточные данные GPS, участники исследования были проинформированы, что доступ к данным об их местоположении будет иметь только наша группа, и давали согласие. Но не все относятся к частной жизни

1 ... 67 68 69 70 71 72 73 74 75 ... 97
Перейти на страницу: