Голландский студент собрал данные 35 миллионов пользователей Google

В подтверждении того, что размещенная в интернете информация остается в нем навсегда, студент Амстердамского Университета Matthijs R. Koot составил огромную базу данных интернет-юзеров. В его справочник входят имена, почтовые адреса, а также биографии 35 миллионов людей. Много, — скажете вы? Нет, — ответит студент, — не много. Свою базу он собрал за один месяц.

Наградой трудолюбивому жителю Нидерландов стал бесценный экзистенциальный опыт. Любопытному юноше было интересно узнать насколько легко собираются данные в интернете, каких трудов стоит какому-нибудь частному детективу собрать персональную информации, например, на Google Profiles, в объеме, достаточном для вознаграждения своих трудов. Ответ прямо перед нами: проще некуда! Сами Google Profiles открыты для всех и совершенно не возражают против индексации информации, в отличие, к примеру, от Facebook, чья политика запрещает вышеупомянутое под страхом смерти через китайские пытки.

Успех студента в том, что инженеры компании Google не отказывают в доступе к информации, фактически все записи о клиентах собраны в одном файле, названном profiles-sitemap.xml. Сам код голландского студента, используемый для сбора данных, находится здесь.

«Как это началось? Было скучно, и я написал небольшой скрипт, чтобы скачать все файлы sitemap-NNN(N).txt — сначала скачал 10 000, потом 100 000, пока не добрался до 1 000 000. Я был удивлен, не встретив никакого сопротивления или CAPTCHA. А потом, я выпил зеленого чаю и скачал остальные 34 000 000».

В своем блоге на Blogger он написал, что его действия служат исследовательской цели и попросил не искать в них подводных течений.

«Я очень любопытный, — говорит Koot, — а сейчас мне любопытнее всего, что может остановить другого любопытного человека от скачивания целых архивов пользовательских данных. Интересно посмотреть как отреагирует Google: предпримут ли, в компании какие-либо действия для защиты персональной информации своих пользователей или продолжат делать вид, что ничего не происходит».

В ответ на это Google выступил с официальным заявлением: «… общедоступная пользовательская информация легко находится нажатием кнопки поиска. Информация, полученная таким образом, не нарушает ничьих прав. Ну, вы же знаете, публичная информация такая публичная…».

Но, Google  не единственная компания, которая безалаберно относиться к пользовательским данным. В июне прошлого года, например, независимый исследователь скомпилировал в один файл имена и URL 100 000 000 пользователей Facebook и разместил для свободного скачивания. Все загрузившие файл получили доступ к этим страницам независимо от того, закрыли свои профили пользователи или нет.

Как и Google, Facebook позволяет настроить профиль так, чтобы страница не индексировалась, но, увы и ах, для жертв независимого исследователя по-прежнему нет хороших новостей.

«Всю базу я загрузил с одного IP. Хочу, чтобы впредь люди думали, прежде чем постить что-нибудь на Google, Facebook, Twitter или других сервисах: не будете осторожными — окажетесь в ежовых рукавицах».

Категории: Интернет и связь