Сбор и анализ огромного количества данных, широко известных как «большие данные», используется для решения все более длинного списка задач. Не должно вызывать удивления то, что для расследования преступлений и задержания преступников также стали использовать большие данные. Публичная и частная информация, такая как, например, информация о праве собственности на недвижимость, сведения о водительских правах и владении транспортным средством, а также криминальная история, всегда были доступны для проверки правоохранительными органами, но во времена классических систем обработки документов было трудно найти информацию и установить связь между соответствующими данными. По мере того как количество публичной информации, хранимой в сети, увеличивается, увеличивается и потенциал для сбора и использования данных для поиска преступников.
Вопрос использования больших данных полицией стал широко обсуждаться с начала текущего десятилетия. Так, в материале «Predictive Policing: Preventing Crime with Data and Analytics» под авторством координатора правительственных программ и лектора по правительственным исследованиям в Центре перспективных правительственных исследований при Университете Джона Хопкинса (США) Дженнифер Бахнер (Jennifer Bachner) рассматривается влияние данных и аналитики на работу правоохранительных служб.
В материале указывается, что доступность массивных наборов данных, хранилищ данных, современное программное обеспечение и персонал, который может выполнять анализ и передавать действенные рекомендации сотрудникам на местах, сделали процесс анализа преступности центральным компонентом работы современной полиции. Кроме того, совместные усилия сотрудников полиции, ученых и высокотехнологичных компаний привели к разработке аналитических методов, которые позволяют снизить вероятность преступлений в том или ином районе.
Одной из основных целей использования больших данных в работе правоохранительных органов является предотвращение преступлений, а не обработка их последствий. Причем такая мысль не является чем-то радикально новым для человечества. Еще в своем научном фантастическом рассказе 1956 года «Особое мнение» (Minority Report), который в последствии экранизировали, Филип К. Дик представляет мир, в котором специальное полицейское подразделение может предсказать любое преступление до его совершения, позволяя офицерам арестовывать подозреваемых до любого причинения общественного вреда. Хотя в вымышленном мире генетическая мутация позволила специальным полицейским предвидеть преступное поведение, не исключено, что на самом деле технологии наблюдения и большие данные в обозримом будущем могут взять на себя эту роль. Действительно, появление больших данных и методов аналитики больших данных привело к росту убежденности политиков и полиции в том, что на самом деле возможно, в некоторой степени, предсказать преступление до того, как оно произойдет.
Инновация в области прогнозирующей полицейской деятельности, теоретически разработанная и, в определенной степени, реализованная, заключается в применении искусственного интеллекта к таким большим наборам данных. В статье «The Promise—and Perils—of Predictive Policing Based on Big Data» описывается предиктивная полицейская деятельность. Термин «предиктивная полицейская деятельность» предполагает, что полиция может предвидеть преступление и быть на месте предполагаемого преступле, чтобы остановить его, прежде чем оно произойдет, и/или сразу же задержать виновных.
На самом базовом уровне практически каждый может без особого труда понять и проанализировать карту преступности и определить районы с более высоким уровнем преступности. Также легко понять, что грабители, как правило, нацелены на кражу в магазинах ночью, когда там нет людей, и в домах в течение дня, когда жильцы находятся на работе. Задача состоит в том, чтобы проанализировать комбинацию из десятка таких факторов, чтобы определить, где преступления с большей вероятностью будут совершаться, и кто с большей вероятностью их совершит. Алгоритмы прогнозирования становятся все более эффективными в анализе такого рода. Все это приближает нас к миру произведения «Особое мнение».
Впрочем, как уверяет автор данной статьи, на самом деле мы не можем приблизиться к стопроцентной определенности результата прогнозирования, даже с передовыми технологиями. Он утверждает, что прогнозы могут быть настолько точны, насколько точны входные данные, и довольно часто эти входные данные имеют ошибки. Но даже при совершенных, безошибочных входных данных и беспристрастной обработке алгоритмы в конечном итоге определяют корреляции. Даже если у полиции есть отличные знания о трудном детстве какого-либо человека, о том, что он общается с членами банды, о том, что у него нет постоянной работы и о недавних покупках им оружия, все, что может сделать лучший алгоритм, это сказать, что, вероятно (но не со стопроцентной уверенностью), что этот человек совершит насильственное преступление. В конце концов, безоговорочно верить в такие предсказания, значит отрицать свободную волю.
Что большие данные могут сделать, это дать вероятность, а не уверенность. Качественные данные в сочетании с эффективным анализом могут дать очень хорошие оценки вероятности. Например, анализ данных может обеспечить вероятность того, что конкретный дом будет взломан в определенный день, на основе исторических данных о похожих домах в этом районе в аналогичные дни.
Полицейское управление может сложить эти вероятности относительно всех домов по соседству, чтобы оценить, насколько вероятно, что в этом районе произойдет кража со взломом. Затем отдел полиции может отправить на патрулирование больше офицеров в районы с более высокой вероятностью совершения преступления с целью сдерживания неправомерных действий. Таким образом, в районе сокращается уровень преступности, а также при этом достигается целевое использование ресурсов полиции.
Подобные инструменты могут быть использованы в нескольких областях, где мы сталкиваемся с ограниченными ресурсами. Например, таможенники не могут тщательно обыскать каждого пассажира и каждую сумку, налоговые органы не могут проверить каждую налоговую декларацию. Таким образом, новый инструмент нацелен на работу с «наиболее вероятными» преступниками.
Рассмотрим случай с Тайроном Брауном (Tyrone Brown), описанным в статье в издании New York Times. Полиция Канзас-Сити на основе результатов предиктивного алгоритма специально обратила на него внимание, потому что он дружил с известными членами банды. Другими словами, алгоритм выбрал его как имеющего более высокую вероятность совершения преступления, основанного на компании, с которой он был знаком. В полиции предупредили его, что за ним следят, и если будет вовлечен во что-либо криминальное, то с ним будут обращаться по всей строгости закона.
Алгоритм не «ошибся» при выборе кого-то вроде Тайрона Брауна. Возможно, он правильно определил, что Тайрон с большей вероятностью совершит убийство, чем среднестатистический гражданин. Но это сильно отличается от того, чтобы сказать, что он наверняка кого-то убьет.
Предположим, есть вероятность того, что среднестатистический гражданин совершит убийство с вероятностью один на миллион, но есть один шанс из тысячи, что убийство совершит Тайрон. Это делает его в тысячу раз подозрительнее, чем в случае с обычным гражданином. Поэтому имеет смысл для полиции сосредоточить свое внимание на нем.
Также с целью минимизации вероятности вовлечения Тайрона Брауна и ему подобных в преступные деяния, чиновники подготовили специальную программу реабилитации. Они помогли ему найти жилье и заставили его устроиться на работу – теперь он работает водителем в сервисе доставки еды. Кроме того, Тайрон работает с молодыми людьми, чтобы помочь им избежать неприятностей с законом.
В статье «Policing by Numbers: Big Data and the Fourth Amendment» профессор права Калифорнийского университета в Дэвисе Элизабет Джо (Elizabeth Joh) идентифицирует прогнозирование преступности как одно из наиболее важных событий в использовании больших данных полицией. Компьютерное моделирование, применяемое к историческим данным о преступности, позволяет идентифицировать будущие места, где может произойти преступление (так называемые «горячие точки преступления»). Самые основные модели прогнозирования опираются на прошлые преступления, но источники данных могут включать в себя такие переменные факторы, как графики выплат, сезонные колебания, местоположения магазинов с алкогольной продукцией и т.д.
По мнению автора инновация в прогнозирующей полицейской деятельности – это применение искусственного интеллекта к таким большим наборам данных. Определение будущих географических мест, которые, вероятно, будут рассадниками преступности, привлекает наибольшее внимание аналитиков. Их прогностические модели опираются на устоявшиеся наблюдения о пространственном распределении преступного поведения. Преступность не распределяется случайным образом по всему городу, а скорее имеет тенденцию попадать в ограниченные, и часто очень маленькие, области. Например, исследователи обнаружили, что за четырнадцать лет, около пятидесяти процентов преступления в Сиэтле были ограничены 4,5 процентами городских улиц. Исходя из этой связи между преступностью и местом, компьютерные модели используют разные подходы к прогнозированию преступности.
Также в литературе описывается еще один тип прогностической технологии, который фокусируется на применении алгоритмов к социальным сетям с целью выявления вероятной склонности к преступлению на основе той роли, которую индивид играет в социальной сети. Этот анализ социальных сетей начинается с предположения о том, что в таких сетях совершается множество преступлений. Сеть нелегальных торговцев наркотиками может свободно следовать иерархической структуре законного бизнеса с поставщиками, дистрибьюторами, покупателями и финансистами. Алгоритмы, используемые в программном обеспечении анализа социальной сети, могут помочь полиции визуализировать плотность связей, которые человек имеет в социальной сети. Эти связи могут принимать форму обмена, общения, семейных связей, участия в преступлениях или связи с какой-либо организацией. При использовании в отделении полиции анализ социальной сети может использоваться для идентификации «центрального узла»: человека с высокой степенью связности внутри сети. Хотя традиционная работа полиции может легко выявить лидеров внутри преступной организации, анализ социальных сетей может выявить тех, кто имеет влияние, или тех, кто быстро передает информацию в группе, и при этом роли которых не очевидны другим.
Несмотря на обилие современных методов прогнозирования, революция в области больших данных только начинается. Если сегодня алгоритмы используются для прогнозирования областей преступлений, то прогнозирование действий отдельных лиц может стать следующим шагом по сравнению с нынешним сценарием.
© digitrode.ru