2023

Потери России в войне с Украиной. Расследование «Медиазоны» и «Би-би-си»

Entry type: Single project

Country/area: Russia

Publishing organisation: «Медиазона», Русская служба «Би-би-си»

Organisation size: Big

Publication date: 2022-05-06

Language: Russian, English

Authors: Максим Литаврин, редактор дата-отдела «Медиазоны»
Ольга Ившина, корреспондентка Русской службы «Би-би-си»
Анонимная группа волонтеров

В проекте также участвовали другие сотрудники редакций — если наше исследование будет принято, мы просим связаться с нами для того, чтобы уточнить возможность раскрыть имена каждого, кто пожелает. Мы просим отнестись к этому с пониманием, так как тема нашего исследования небезопасна, и не все его участники покинули Россию.

Biography:

Как и в предыдущем случае — мы просим связаться с нами перед публикацией для того, чтобы мы могли подготовить этот блок, учитывая безопасность всех участников и участниц.

Project description:

«Медиазона» совместно с Русской службой «Би-би-си» и командой волонтеров ведет поименный список погибших на войне с Украиной российских солдат.

Чтобы составить этот список, мы изучаем посты в соцсетях, сообщения в региональных СМИ и публикации на сайтах органов государственной власти. Результаты исследования мы публикуем в виде обновляемой интерактивной инфографики.

Impact reached:

Наша публикация стала единственным подробным источником информации о том, что происходит с российской армией на войне с Украиной и какие потери она несет. Число потерь на войне — очень спекулятивная тема (особенно пока боевые действия продолжаются), и мы — не единственные, кто называет число погибших. Уникальность нашего метода заключается в том, что мы можем назвать наименьшее достоверное число, которое подтверждается объективно.

Наши обновляемые сводки стали источником новостей и текстов для десятков коллег и изданий. Наш метод сбора данных по открытым источникам с привлечением волонтеров и читателей (подробнее о методах — ниже) позволил нам сформировать сообщество людей, которые следят за темой, присылают нам информацию и ждут наших публикаций. Кроме того, мы вдохновили на объединение другие волонтерские группы, которые самоорганизовались для сбора информации о погибших в своем регионе — например, они посещают кладбища, ведут телеграм-каналы или присылают информацию нам.

За время работы проекта с мая 2022 года общий охват (соцсети, ссылки в других изданиях и так далее) превысил 10 млн человек.

Techniques/technologies used:

Основная часть работы — это сбор данных по открытым источникам. К ним относятся соцсети (в первую очередь «ВКонтакте»), а также сайты региональных СМИ и телеграм-каналы. Это комбинированный процесс, который сочетает в себе и ручной поиск по ключевым словам, и поиск и извлечение информации при помощи скриптов.

После поиска информации ее первичной обработкой занимаются волонтеры. В тестовом режиме мы стараемся использовать современные подходы к автоматизированной классификации и извлечению информации, в том числе GPT3.
Мы учитываем только сообщения о смерти конкретного человека, в которых называется его имя, и это сообщение размещено в российском источнике. Все найденные нами посты мы архивируем при помощи сторонних сервисов.

Затем мы обогащаем данные при помощи автоматических запросов к государственным источникам — например, к реестру наследственных дел. Это позволяет узнать дополнительные детали — например, возраст погибшего, дату смерти, место службы. Иногда мы используем технологию распознавания и сравнения лиц, чтобы найти страницу погибшего.

Команда волонтеров запустила бота в Telegram, при помощи которого читатели могут проверить, есть ли определенный человек в нашем списке без получения доступа к базе, а также прислать нам информацию о погибшем. Через бот мы получили множество данных от региональных волонтеров, которые фотографируют кладбища

Основная БД — это Google таблица с несколькими уровнями доступа, автоматизированными проверками и правилами по заполнению. Мы постоянно поддерживаем в ней порядок, редактируя и уточняя старые записи, удаляя опечатки и дубли. Поиск дублей был оптимизирован при помощи расстояния Левенштейна.

Журналисты Медиазоны и Би-би-си повторно проверяют каждое сообщение после волонтеров и разбивают погибших по родам войск, используя для этого в том числе косвенные признаки (например, найденные на фотографиях погибших в соцсетях флаги подразделений на могилах, петлицы, нашивки и тд).

Для визуализации мы генерируем из таблицы несколько json-файлов, которые служат основой для инфографики. Вся инфографика сделана нами на D3.js без использования готовых решений.

Context about the project:

С самого начала российской агрессии в Украине один из главных вопросов — это количество российских потерь. Сбор или распространение этой информации запрещены принятыми в России законами о военной цензуре, поэтому мы не упоминаем имена волонтеров и не раскрываем имена всех журналистов, которые работают над этой темой. При этом для самих изданий эта тема не несет больших рисков: «Медиазона» и «Би-би-си» уже заблокированы в России за освещение войны.

Такие проекты возникают, когда государство пытается обмануть общество и оперирует двумя «правдами». Официальная риторика заключатеся в том, что общество будет помнить погибших вечно — при этом число этих погибших не сообщается. Цифры, которые изредка сообщает Минобороны, не имеют никакого отношения к реальности — и мы можем это доказать, так как даже в нашем поименном списке погибших больше, чем у МО.

Обновляемая инфографика на сайте — это лишь вершина айсберга и публичная часть нашей работы. За ней стоит команда волонтеров, которые ежедневно просматривают десятки и сотни некрологов, за каждым из которых стоит чья-то судьба. В будущем (вероятно, когда война закончится) мы планируем опубликовать поименный список целиком — как напоминание о том, какую страшную цену платит общество за агрессию. Мы хотим показать, что все эти люди когда-то жили — и могли бы жить дальше вместо участия в преступной войне. Мы считаем, что без усвоения этого урока ситуация может повториться — и мы хотели бы верить, что наша работа поспособствует тому, чтобы этого не произошло.

Кроме этого, наша база уникальна для исследовательских целей — как сейчас, так и в будущем. Пока что мы сфокусированы на ее заполнении, поддержании и создании сводок, и не успеваем раскрыть весь ее потенциал. Многотысячный поименный список погибших позволяет проанализировать их социально-демографический состав и будет интересен экономистам; данные о датах, месте, обстоятельствах гибели и местах службы — военным исследователям. Кроме того, десятки тысяч постов и сообщений о гибели позволят проанализировать нарратив, который создавался вокруг этой войны как ее участниками, так и СМИ и государственными органами.

Уже сейчас мы открываем к ней доступ коллегам из других изданий и исследователям из академической среды. Мы уверены в том, что в будущем, когда эта тема перестанет быть такой рискованной с точки зрения российского законодательства, данные будут пользоваться еще большим спросом.

What can other journalists learn from this project?

Помимо самих публикаций сводок, на которые ссылаются наши коллеги, мы обмениваемся данными с журналистами из региональных изданий. Это позволяет и нам, и им уточнять число погибших в конкретном городе или области. По запросу мы помогаем коллегам с подготовкой текстов или сюжетов о погибших на войне или о мобилизации. Мы можем подсказать, где искать информацию, рассказать что-то о конкретном погибшем, о каких-то важных событиях на поле боя и так далее.

Кроме того, мы рады поделиться нашим опытом по сбору и обработке информации и опытом по поддержанию сложного проекта, выступая на семинарах или журналистских конференциях.

Project links:

https://zona.media/casualties

https://en.zona.media/article/2022/05/11/casualties_eng

https://www.nytimes.com/2022/12/18/world/europe/russia-death-toll-war.html

https://www.bbc.com/russian/features-64181570