Как в США данные помогают бороться за избирателей

Публикуем перевод статьи MIT Technology Review о микротаргетинге, сборе данных и прочих способах заполучить голоса избирателей, практикуемых в США с 2016 года.

Оставить комментарий

В политических и избирательных кампаниях всё всегда было про информацию: за обещаниями решать проблемы электората и бороться за будущее семей избирателей стоит целый бизнес, завязанный на метриках и данных. Организаторы успешных кампаний умеют выжать максимум из соцопросов, данных о предпочтениях аудитории, явке, впечатлениях, демографических данных, махинаций с географией участков и выбрать такой подход к избирателям, который найдёт отклик в их разуме и заставит отдать свой голос нужному кандидату. Побеждает тот, кто способен сделать это лучше конкурентов.

И происходит это не один год. В 2017-м году Хиллари Клинтон сетовала на Национальный комитет демократической партии, который якобы подсунул её команде устаревшие данные. Она частично списывала на это свой провал на выборах 2016 года, в которых её переиграли республиканцы во главе с Дональдом Трампом и с прекрасным механизмом работы с данными. НКДП заявил, что в поражении Клинтон виноваты не данные, а то, что ими не сумели грамотно воспользоваться.

В 2020 году штабы кандидатов используют новые тактики сбора и обработки информации. Традиционным социологическим опросам пришло на смену прогнозное моделирование на базе искусственного интеллекта; обмен огромными массивами данных, законность которого не так давно ставилась под вопрос, позволяет координировать усилия политическим комитетам и другим группам. И куда же без микротаргетинга: организаторы кампаний обоих кандидатов хотят знать взгляды каждого потенциального избирателя, в чём им помогают алгоритмы для более точной и рациональной сегментации и таргетирования электората.

Данные об избирателях

Последние несколько лет организаторы предвыборных кампаний стабильно и активно расширяют свои базы персональной информации о голосующих. Среди прочего для этого применяется реклама прямого отклика, цель которой — получить контактные данные или мнение человека непосредственно от него. По состоянию на май, свыше 80% рекламного бюджета президентских кампаний обоих американских кандидатов уходило именно на такую разновидность рекламы.

Кандидаты не любят говорить, сколько данных уже собрано об электорате. Большинство файлов-«досье» — сводных баз с регистрационной информацией об американских избирателях — содержат по 500-2500 записей на человека, предполагает MIT Technology Review. Базу пополняет каждый рекламный ролик, телефонный звонок, электронное сообщение или переход по ссылке в интернете. Платформа Democratic Data Exchange (DDx) с момента запуска в июне собрала более миллиарда дата-поинтов, в основном это контактные данные.

Тем не менее бо́льшая часть этой личной информации собрана от людей, которые уже решили, за кого проголосуют. В приложении кампании Трампа, например, есть опция автоматического сопряжения устройств через Bluetooth, которая позволяет установить местоположение пользователя (а Bluetooth-маячки раньше находили в трамповских рекламных щитах, расставляемых его сторонниками на газонах перед домами). Довольно нестандартный метод слежки, но и в нём можно найти смысл: люди, установившие приложение, скорее всего, поддерживают кандидата, к тому же преданные избиратели с большей вероятностью пожертвуют деньги на кампанию.

Платформы по обмену данными

Подобные платформы обеспечивают трансфер данных между кампаниями кандидатов и комитетами политических действий, позволяя им расширить охват и сделать коммуникацию более эффективной и релевантной. Представители Республиканской партии с 2013 года используют платформу Data Trust, которая предоставляет услуги хостинга и обмена данными об избирателях. Демократы поначалу считали это нарушением правил Федеральной избирательной комиссии, запрещающих сотрудничество между политическими организациями различного типа, например комитетами политических действий, некоммерческими организациями и собственно членами президентских кампаний. Группа American Democracy Legal Fund проиграла судебное дело против DataTrust, а в июне партия демократов запустила свою версию такой платформы — Democratic Data Exchange.

Миссия таких площадок — обеспечить обмен данными между солидарными организациями. К примеру, DDx предоставляет дашборд, где отображается, в какой мере тот или иной избиратель поддерживает голосование по почте — и эти данные доступны всем группам на площадке, которым раньше приходилось тратиться на сбор всей этой информации по отдельности. Data Trust республиканцев уже не раз проявил себя в деле: например, он помог собрать информацию по избирателям, которые голосовали досрочно на промежуточных выборах в 2018 году. Организаторы кампании не таргетили этих людей, благодаря чему сэкономили $100 млн.

Микротаргентинг 2.0

В Древнем Риме рабов заставляли запоминать имена избирателей, которых можно было сагитировать в пользу их хозяина, чтобы тот мог найти их и обратиться к ним лично. Сегодня персонализированный таргетинг строится на AI-моделях, которые сегментируют аудиторию на группы с общими признаками, и обширном A/B-тестировании рекламных посланий.

Соцсети по-разному относятся к технологиям микротаргетинга. Facebook, например, позволяет организаторам кампаний таргетировать небольшие группы и отдельных пользователей. У неё есть специальная опция для загрузки электронных таблиц с профилями пользователей, позволяющая рассылать сообщения с хирургической точностью. Также у соцсети есть инструмент, который на основе этих таблиц ищет профили людей, которые с высокой вероятности отреагируют на сообщение (отказаться от такого таргетинга можно в настройках). Этим пользуются штабы обоих кандидатов на пост президента США, а их рекламные посты отслеживает один из проектов Нью-Йоркского университета.

Так, за период с 30 июля по 4 августа баннер с лозунгом «Our Recovery Will Be Made in America» появился в ленте примерно 2,5 тысяч пользователей Facebook в штате Висконсин. Они были отобраны по имени профиля из списка, загруженного членами кампании Джо Байдена. Проследить происхождение этого списка практически невозможно — вероятно, он был куплен у сторонней компании.

На других платформах ограничения более жёсткие. Google запретила микротаргетинг в политических целях в прошлом году, а Twitter забанил политическую рекламу кандидатов.

AI-модели VS опросы общественного мнения

Предвыборные соцопросы больше не работают — кризис вскрыли выборы 2016 года, когда стало понятно, что результаты таких исследований не отражают действительность, потому что многие избиратели не отвечают на телефонные звонки с незнакомых номеров и всё реже склонны открыто отвечать на вопросы о своих политических предпочтениях.

Это привело организаторов политических кампаний к технологиям машинного обучения и искусственного интеллекта, которые позволяют предсказать поведение избирателей. Они позволяют проводить анализ аудитории не периодически, а непрерывно на постоянно обновляемых датасетах. Один из самых распространённых приёмов, используемых в кампаниях, заключается в присвоении группе избирателей рейтинга от 1 до 100 исходя из того, с какой вероятностью они выполнят определённое действие или придерживаются определённой точки зрения. На основе этой информация вырабатывается дальнейшая стратегия: пытаться убеждать колеблющийся электорат либо мобилизировать и направлять средства в электорат с твёрдым мнением.

Но и модели не идеальны. В 2016 году они предсказывали победу Клинтон — с таким же отрывом, какой предполагался по результатам опросов. Хотя их точность будет повышаться по мере расширения их датасетов.

Итог

Обращаться к группам избирателей становится всё менее важно, а отслеживать бесчисленное множество кастомизированных посланий политических групп — сложнее. Персонализация означает, что каждый отдельно взятый человек будет воспринимать кампанию иначе, чем другие, потому что у каждого будет уникальное информационное поле. Искажать и фальсифицировать факты становится всё проще — особенно общественным деятелям, к постам которых соцсети применяют свои правила довольно избирательно. Технологии уже сегодня широко используются организаторами кампаний для того, чтобы искусственно расколоть общество, манипулировать процессом формирования общественного мнения и голосованием.

Несмотря на это, усиливается обратная реакция общественности на подобные методы. 54% американцев, опрошенных Исследовательским центром Пью, высказались против политической рекламы в соцсетях, а 77% респондентов считают, что собираемые ими данные не должны использоваться для политического таргетинга.

В Конгресс США представителями обеих партий был внесён законопроект, который заставит компании отчитываться о том, как именно они используют собираемые персональные данные и в какую сумму оценивают их, а также проект закона, запрещающий политический микротаргетинг. Оба документа будут рассматриваться в 2021 году.

10 курсов по Docker для новичков и профессионалов
По теме
10 курсов по Docker для новичков и профессионалов
«Вода закипала, а мы приоткрыли крышку». Марат Эбзеев — о конфликте в SaM Solutions
По теме
«Вода закипала, а мы приоткрыли крышку». Марат Эбзеев — о конфликте в SaM Solutions
Студенты и преподаватели БНТУ записали видеообращение
По теме
Студенты и преподаватели БНТУ записали видеообращение
Кто такой Data Scientist. Обзор изнутри от Арсения Кравченко
По теме
Кто такой Data Scientist. Обзор изнутри от Арсения Кравченко

Читать на dev.by