Где в Беларуси живут «экстремисты»? Анализ списка МВД из 1700+ человек

Автор телеграм-канала «LAB-66·Лабораторный журнал беларуского химика», лучший техноавтор Хабра 2021 года Сергей Бесараб проанализировал список «причастных к экстремистской деятельности» от МВД. И создал «топографическую карту беларуского экстремизма». Вот что получилось.

5 комментариев

Сергей Бесараб проанализировал «Перечень граждан Республики Беларусь, иностранных граждан или лиц без гражданства, причастных к экстремистской деятельности», размещённый на сайте МВД Беларуси. На момент исследования там было 1714 человек.

Оказалось, что 80,3% из попавших в список — мужчины (1377 человек). Большинство — возрастом 33-35 лет. Минимальный зафиксированный возраст — 17 лет (мужчина), максимальный — 82 года (женщина).

Что касается топографического распределения, то 28,7% — из Минска. 6,9% — из Бреста, 6,7% — из Гомеля,  5,9% — из Гродно, и 5% — из Жлобина.

Автор также посмотрел соотношение жителей конкретного населённого пункта и «экстремистов». Оказалось, что в Жлобине на 1 «экстремиста» приходится 887 «мирных» жителей. На втором месте — г. п. Красносельский: 1276 жителей на одного, внесённого в список МВД. И на третьем — Пружаны с соотношением 1574 жителя на 1 «экстремиста». 

А самым «безопасным» городом Беларуси оказался Борисов: здесь на 1 «экстремиста» приходится более 24 тысяч обычных жителей.

— Почему я решил заняться обработкой данных из перечня МВД? Потому что расследовательская журналистика — это моё хобби. А она невозможна без веб-скрейпинга, — говорит Бесараб. — В Беларуси очень тяжело найти какую-либо независимую статистическую информацию. Возникло предположение, что перечень экстремистов может быть интересным, неангажированным срезом общества.

Все данные — из списка, опубликованного на сайте МВД. Сначала — скачал в plain html, почистить от тегов, разобрал импортом в CSV. Файл перекинул в GoogleDocs Sheet, там убрал лишние пробелы, привел адреса к общему виду «страна, область, район, населенный пункт». 

Геолокации получал с помощью расширения для получения геокодирования. Пришлось потратить пару дней, так как у Google ограничение на 2500 запросов в день, а я пару раз менял ячейки и запускал процесс заново.

Самые удобные из расширений — Geocode (собирает данные в дополнительные столбцы той же таблицы) и ezGeocode (собирает в отдельные таблицы). Но они одинаково используют Google Geocode API, поэтому ограничение в 2500 запросов всё равно есть.

Собеседник подчёркивает, что не нашёл значимых аномалий в топографических данных участников списка. 

— Как и в графике с возрастами — распределение нормальное. Это не фейк, выборка валидная, хорошая бигдата. Ну, а когда карта уже построена, то можно оценить и «оплоты заразы» — населённые пункты. Поражена вся страна, достаточно равномерно — с поправкой на количество людей в городах.

Борис Мамоненко уехал отбывать 2,5 года «химии» в Гомеле
По теме
Борис Мамоненко уехал отбывать 2,5 года «химии» в Гомеле
В Минске задержали разработчика, создателя «Лічбавай майстэрнi». Его жену тоже
По теме
В Минске задержали разработчика, создателя «Лічбавай майстэрнi». Его жену тоже
«За протестные стикеры». Задержали художника Vizor Games
По теме
«За протестные стикеры». Задержали художника Vizor Games
Силовики задержали Senior Project Coordinator в EPAM — она приехала из Литвы
По теме
Силовики задержали Senior Project Coordinator в EPAM — она приехала из Литвы
Тестировщицу Klika Tech задержали «за беспорядки»
По теме
Тестировщицу Klika Tech задержали «за беспорядки»

Читать на dev.by