Как починить "сломанный" интернет?

21 июня 2018, 08:22

Недавний скандал с участием Facebook и Cambridge Analytical был не совсем обычным

Он отличается от большинства других взломов данных, потому что…это был вовсе не взлом. Cambridge Analytica просто вошли через незапертую входную дверь, взяли нужные данные, а затем перевели их на свои серверы, чтобы использовать в абсолютно других целях, чем предполагалось.

Реклама

У возможности делиться своими данными немало преимуществ. Как отметила Шерил Сэндберг, без данных Facebook был бы платным. То же можно сказать и о Google, и обо всех других сервисах, благодаря которым бизнес может размещать рекламу в интернете. Тем не менее, у технологий и обмена данными есть и темная сторона. Она – их самая большая уязвимость.

Обмен данными выходит далеко за пределы социальных сетей. Мы хотим, чтобы врачи делились нашими данными ради лечения. Банкам нужна информация о нас, чтобы предоставлять кредит. Правоохранительные органы нуждаются в доступе к данным для обеспечения безопасности. Но все они в той или иной степени выставляют нашу жизнь напоказ. Проблема не только в Facebook – весь Интернет «сломан». Но новые технологии могут его «починить».

Предпринимателям будет легче получить финансирование для своего бизнесаКраткая история данных

Использование данных в том виде, в котором мы знаем процесс сейчас, впервые было предложено Германом Холлеритом в конце 1880-х. Он разработал систему перфокарт для хранения и подсчета данных бюро переписи населения (перфокарта Холлерита). После изобретения он создал компанию Tabulating Machine, которая вскоре стала основой для известной теперь IBM.

К 1960-м IBM успешно перешла от механических к цифровым компьютерам и цифровым версиям перфокарт Холлерита: так называемым базам данных на плоских файлах, которые тогда были стандартными. Разумеется, они были куда больше, быстрее и эффективнее перфокарт. Но, по сути, работали одинаково и не полностью использовали возможности цифровых машин.

Все изменилось, когда сотрудник IBM Эдгар Ф. Кодд придумал реляционную модель баз данных. Проблема, которую он решил, заключалась в следующем: чтобы получить необходимую информацию, аналитику нужно быть хорошо знакомым со структурой базы данных плоского файла. В модели Кодда, данные, хранимые в базе данных, можно было получить стандартно с помощью языка запросов.

Это была инновация Кодда, которая помогла появиться экономике данных, какой мы знаем ее сегодня. Данные хранятся централизовано, но использовать их можно дистанционно, получив доступ. Это дало открытию нового значения, которое не было залажено изначально. Язык запросов может использоваться для установления связей, которые изначально не были очевидны или не просчитывались.

Обработка данных должна быть защищена

Примерно в то же время, когда Кодд разрабатывал реляционную базу данных, инженеры из Агентства управление перспективными научно-исследовательскими проектами Министерства обороны (ARPA) разрабатывали новую сеть под названием ARPANET, которая стала предшественником Интернета. Она давала возможность огромному количеству людей получить доступ к большему числу баз данных.

Сначала ARPANET ограничивалась небольшим кадровым исследователем в правительственных лабораториях и академических учреждениях – результат должен был использоваться для обмена научными данными. Но к концу 80-х годов узкое предназначение расширилось. В 1989 году Тим Бернерс-Ли создал Всемирную паутину, а в 1991 году Закон о высокопроизводительных вычислениях открыл миру ARPANET и другие сети. Все вместе стало причиной появления того, что мы теперь знаем, как Интернет.

Это также привело нас к проблеме безопасности данных, с которой мы сталкиваемся сегодня. Да, хранящаяся информация может быть защищена с помощью шифрования. Но для того, чтобы ее анализировать, ее нужно дешифровать. Это создало то, что Марк Цукерберг в недавнем интервью назвал «напряженностью ценностей»: между переносимостью данных и их безопасностью.

Хочу прояснить, что скандал с Cambridge Analytica был частично вызван серьезными управленческими проблемами в Facebook. Компания всегда выходила за рамки привычного понимания открытости, что и было частью ее коммерческого успеха. Однако, помимо проблем управления, этот случай проявил зияющую дыру в безопасности, которую пора закрыть. Распределенная обработка данных нуждается в распределенной безопасности.

Однако новость не так уж плоха. Новое поколение технологий «открытой безопасности», называемой протоколом конфиденциального вычисления (SMPC), может дать нам лучшее на стыке: возможность безопасно обмениваться данными для анализа.

Расширяя возможности безопасного сотрудничества

Сейчас прилагается немало усилий, чтобы SMPC стала само собой разумеющейся практикой. Один из них – новая многообещающая экспериментальная программа в Experian. «Нам удалось получить SMPC из экспериментальной технологии, которая может обрабатывать данные нескольких информационных компаний. Это может стать коммерческой технологией, которая в перспективе сможет делать куда более сложный анализ сотен компаний», - сказал Кевин Чен, главный научный советник Experian Datalabs в США.

Как это работает: возьмем группу из десяти банков – у каждого есть данные об активах своих клиентов, доходах, истории платежей по кредиту и т. д. Очевидно, что все они могут получить доступ к данным друг друга, но не хотят делиться из-за конфиденциальности и конкуренции. Experian делает следующее: разбивает данные на части, бесполезные по отдельности, но объединенные в общую среду для анализа.

Другой подход – полностью гомоморфное шифрование (FHE). Разработанное Крейгом Джентри в IBM, оно позволяет анализировать зашифрованные данные. Например, подобная Cambridge Analytics компания может использовать зашифрованные данные Facebook. Но анализировать их будут в зашифрованном виде, и результат тоже будет зашифрован: его передадут обратно для проведения целевых кампаний на Facebook. Таким образом, сами по себе данные остаются закрытыми: им ничего не грозит.

Проблема с FHE, которое является больше экспериментом, заключается в том, что оно куда медленнее, в сотни сотен тысяч раз медленнее, чем обычные методы анализа. Тем не менее, технология быстро улучшается, и по мнению криптографа IBM Ший Халеви, будет доступна для нишевых проектов, вроде исследований геномики, через год или два. К широкому распространению, улучшенная технология может быть готова плюс-минус через пять лет.

Существует также большой потенциал в объединении всех подходов. Например, используя FHE, вы можете зашифровать наиболее важные данные, такие как имена, адреса, номера социального страхования и т. д. Все оставшиеся можно разбить на части. В таких условиях, «плохой парень» вроде Cambridge Analytica, а) сможет получить доступ к данным с огромным трудом, б) все равно не сможет их применить: непонятно, к какому массиву они относятся и о чем говорят.

Сотрудничество ради безопасности

Выше упоминалось, что наша экономика сильно зависит от способности обмениваться данными. «Много сфер основаны на структурировании данных. И медиа-индустрия – всего лишь одна из них. Вопрос касается и других, не менее важных сфер, как здравоохранение, управление рисками и безопасность в Интернете», - говорит Эрик Халлер, директор по глобальному развитию Experian Datalabs. «И если для получения выгоды, данные не придется систематизировать, – это настоящий сдвиг парадигмы. Компании смогут получить больше помощи в принятии разумных решений и лучше защищать своих потребителей».

Нетрудно догадаться, какое именно эти технологии могут оказать влияние. Врачи смогут получить доступ к истории болезни пациентов, чтобы помочь им назначить правильное лечение. Кредиторы в упрощенной форме смогут предоставлять кредиты клиентам. Предпринимателям будет легче получить финансирование для своего бизнеса. Правоохранительные органы смогут более тесно сотрудничать с другими организациями, например, авиакомпаниями, чтобы мы точно были в безопасности.

Скандал Facebook и Cambridge Analytica четко дает понять: действовать, как раньше нельзя. Для распределенного обмена данными требуется распределенная безопасность. Инициативы, такие как GDPR, могут помочь, как и другие технологии вроде Blockchain. Но на самом деле, необходимо защитить именно инфраструктуру наших данных. Мы уже более 30 лет как задолжали технологиям. И этот долг нужно отдать как можно быстрее: больше ждать нельзя.

Как сказал мне Джош Саттон, генеральный директор Agorai и эксперт по когнитивным технологиям: «Данные – это уникальный актив. Они способны давать выгоду самим способом комбинации с другими данными. Как только мы научимся безопасно обмениваться данными, они станут куда более ликвидным активом, предоставляющим больше выгод для каждого».

Перевод НВ

Новое Время обладает эксклюзивным правом на перевод и публикацию колонок Грега Сателла. Републикация полной версии текста запрещена

Оригинал

Присоединяйтесь к нашему телеграм-каналу Мнения Нового Времени

Показать ещё новости