Глазами хакера: куда деть полмиллиарда украденных записей

Тема выпуска — похищенная информация как большие данные

За последние несколько месяцев свыше полумиллиарда человек стали жертвами хакеров. Их личная информация, вероятно, находится на рынке и может многое рассказать об обществе потребления.

На прошлой неделе выяснилось, что четыре года назад хакерам удалось получить доступ к полумиллиарду записей из системы бронирования отелей сети Starwood, принадлежащих Marriott. Для 327 млн гостей дело не ограничивалось именем и адресом электронной почты — часто речь шла о паспортах и зашифрованных данных кредитных карт. При этом в Marriott не исключают, что хакеры могли дешифровать номера карт. Из заявления Marriott не вполне ясно, могли ли хакеры обновлять свои данные или это была серия отдельных проникновений.

У этого случая есть две важных детали.

Во-первых, о взломе публично сообщили только в конце ноября 2018 года. Четыре года гости Starwood (как и сам Starwood) не знали, что делятся личными данными с кем-то еще. В среднем компании на обнаружение проникновения требуется 191 день.

Во-вторых, при таких объемах информация даже из одного источника обладает тремя из пяти основных свойств больших данных: объемом, ценностью, точностью.

Если такие данные постоянно собирать из нескольких источников, стараясь сохранять доступ к вскрытым базам данных как можно дольше, это дает остальные два свойства: скорость [генерации данных] и многообразие (неструктурированность).

За примерами далеко ходить не надо. Год назад кредитное бюро Equifax обнаружило потенциальную утечку почти 150 млн записей заемщиков. Утекли страшные данные — кредитные карты, дата рождения, номер социального страхования и так далее. Уязвимость позволила хакерам 76 дней активно общаться с базой данных, так как мониторинг аномального числа запросов не работал. На удивление, роста числа мошенничеств, связанных со взломом, пока не обнаружено.

Пару месяцев назад злоумышленники похитили минимум 75 тысяч записей с американского правительственного сайта healthcare.gov. Записи содержали часть номеров соцстрахования, персональные данные, в том числе информацию о налоговом статусе.

Совсем недавний взлом затронул сайт вопросов и ответов Quora и 100 млн (треть) его пользователей. Кредитных карт там нет, зато есть личные сообщения, адреса электронной почты, данные привязанных социальных сетей и, возможно, хеши паролей (есть вероятность, что хакеры могут по ним угадать некоторые пароли).

Наконец, взлом года, затронувший 50 млн пользователей Facebook, был обнаружен только этой осенью. Это крупнейшее проникновение за 14 лет существования компании и PR-апокалипсис для компании, чей бизнес состоит в торговле доступом к аудитории. Сравнимый эффект (и неслучайно) имел только скандал с Cambridge Analytica, которая смогла, выполняя политический заказ, получить доступ к частным данным 87 млн пользователей.

Во всех этих случаях объем данных слишком велик, чтобы хакеры попытались использовать все данные для атак, краж и мошенничества. Гораздо выгоднее использовать их так же, как обычно используют большие данные — для генерации инсайтов.

Данные на графике не учитывают урожайный на выявление проникновений конец 2018 года. Последняя точка темно-синей линии должна лежать ближе к 700 млн записей — это цветущий и активно развивающийся бизнес.

Что мне с этого?

С большой долей вероятности вы в виде имени, адреса электронной почты, номера паспорта, кредитной карты или любого другого идентификатора присутствуете в еще не выявленных или уже обнаруженных утекших базах (см. базу 420 тысяч сотрудников Сбербанка). Это факт, который не исправят никакие антивирусы и менеджеры паролей. Проверить, попал ли ваш аккаунт в один из крупных известных взломов, можно здесь, но и это не дает никакой гарантии.

Современные системы анализа данных позволяют не только автоматически собрать ваш профиль из разных баз, но и определить его в тот или иной потребительский кластер, а затем перепродать data-брокерам, собирающим информацию для маркетинга, служб безопасности, внутренних систем риск-менеджмента и других целей, о которых можно только догадываться.

База данных гостей Marriott — это информация о платежеспособных людях, которые путешествуют (их рейтинг уточняет, как часто). База Quora наверняка обнаружит корреляцию с высшим образованием, Equifax расскажет многое о платежеспособности.

Когда речь идет о миллиардах записей, стоимость чьей-либо переписки, то есть взлома, осуществляемого «в розницу», меркнет по сравнению с возможностью продажи потенциальных потребителей оптом. Организовать полмиллиарда взломов невыгодно, да и опасно, тем более что каждый из них способен поставить под удар доступ ко всей информации.

+1 к продуктивности

Как устроено рабочее место специалиста по безопасности Феликса Краузе. Он не использует устройства для «умного дома», а также не носит «умных» часов. Вместо этого обходится смартфоном и двумя ноутбуками — личным и рабочим. Основа его производительности, если убрать довольно длинный список приложений, заключается в разделении режимов создания и потребления.

Read later

Дружба, которая сделала Google великим. New Yorker опубликовал рассказ о двух программистах, которые, сидя за одним компьютером, смогли найти важный баг — если бы его не исправили, Google не смог бы вырасти до нынешних размеров. Их предложение хранить часть индекса в ОЗУ вместо медленных жестких дисков перестроило экономику компании.

Александр Амзин