2023 Shortlist
Mapa da Água
Entry type: Single project
Country/area: Brazil
Publishing organisation: Repórter Brasil
Organisation size: Small
Publication date: 2022-03-07
Language: Português
Authors: Ana Aranha, Reinaldo Chaves, Hélen Freitas, Tiago Magalhães, Fábio Kummrow, Marina Gama Cubas, Paulo Campos, André Mota, Piero Locatelli, Fernanda Segabinassi, Alexandre Macedo Costa, Ana Magalhães, Mariana Della Barba e Gisele Lobato.

Biography:
A equipe é formada por jornalistas investigativos, jornalistas de dados, programadores, designers, um professor universitário de química e um técnico em saúde coletiva especialista no banco de dados do Sisagua, sistema do Ministério da Saúde.
[English translation by the organiser]
The team is made up of investigative journalists, data journalists, programmers, designers, a university chemistry professor, and a collective health technician specialized in the Sisagua database, a system of the Ministry of Health.
Project description:
O Mapa da Água revela os municípios onde empresas e órgãos de abastecimento identificaram substâncias químicas e radioativas em doses acima do limite na água que sai da torneira entre 2018 e 2020, a partir de dados do Ministério da Saúde. Ferramenta interativa, é possível clicar na ficha de cada município para saber detalhes sobre substâncias detectadas, além das principais classificações de risco sobre cada uma delas. A ferramenta destaca ainda um “alerta máximo” para os locais onde a mesma substância esteve acima da concentração máxima nos 3 anos analisados – segundo especialistas, os casos mais preocupantes são de contaminação contínua.
[English translation by the organiser]
The Water Map reveals the municipalities where companies and supply agencies identified chemical and radioactive substances in doses above the limit in the water that comes out of the tap between 2018 and 2020, based on data from the Ministry of Health. As an interactive tool, it is possible to click on the record of each municipality to learn details about the detected substances, as well as the main risk classifications for each of them. The tool also highlights a “maximum alert” for locations where the same substance was above the maximum concentration in the 3 years analyzed – according to experts, the most worrying cases are of continuous contamination.
Impact reached:
O interesse público pode ser comprovado pela audiência, republicação e impacto. Foram mais de 400 mil visualizações únicas no mapa e suas matérias apenas no site da Repórter Brasil, além de mais de 600 republicações e reportagens sobre o mapa em sites, canais de TV e estações de rádio – em mais de 20 casos, a reportagem foi consultada e contribuiu diretamente dando entrevistas e passando dados específicos de interesse local.
Como resultado direto da pressão provocada pela publicação do mapa, foram promovidas diversas audiências públicas, além de requisições de deputados federais, estaduais e vereadores que pediam providências aos órgãos responsáveis pela fiscalização da qualidade da água para consumo humano. Um destes apelos chegou ao Ministério da Justiça, que acionou o Instituto Nacional de Criminalística da Polícia Federal para refazer os passos da reportagem e periciar os dados do Sisagua.
Cinco meses após a publicação do mapa, 300 empresas de saneamento básico foram notificadas a apresentar um plano de adequação e convidadas a assinar um Termo de Ajustamento de Conduta. O problema foi identificado em mais de mil municípios. Em contato com o Ministério da Justiça, a reportagem obteve a confirmação de que a operação foi originada pela repercussão do Mapa da Água.
[English translation by the organiser]
The public interest can be demonstrated by the audience, republication, and impact. There were more than 400,000 unique views on the map and its related articles on the Repórter Brasil website, as well as over 600 republications and news reports about the map on websites, TV channels, and radio stations. In over 20 cases, the news report was consulted and contributed directly by providing interviews and specific data of local interest.
As a direct result of the pressure caused by the publication of the map, several public hearings were held, and federal, state, and local representatives requested action from the responsible agencies for monitoring the quality of drinking water. One of these appeals reached the Ministry of Justice, which mobilized the National Institute of Criminalistics of the Federal Police to retrace the steps of the report and examine the Sisagua data.
Five months after the publication of the map, 300 basic sanitation companies were notified to submit an adequacy plan and invited to sign a Conduct Adjustment Term. The problem was identified in more than a thousand municipalities. Contacting the Ministry of Justice, the news report confirmed that the operation was initiated by the repercussion of the Mapa da Água.
Techniques/technologies used:
O trabalho foi feito em Google Colab Pro, para conseguir processar os arquivos do Sisagua, sistema de vigilância da água do Ministério da Saúde, que estão em CSV e cada ano tem mais de um milhão de linhas – cada linha é um teste feito em algum município do Brasil. No total, de 2018 a 2020, são 5.126.181 linhas. Foram analisadas todas essas linhas para criar as quatro novas colunas de avaliação, que indicam se o teste é Consistente ou Inconsistente e se está dentro ou acima do Valor Máximo Permitido para uma substância danosa à saúde.
Esse grande tratamento de dados, que foi feito com a orientação e regras do Ministério da Saúde, não pode ser feito em programas normais de planilha, que têm uma limitação de linhas para processamento. Usamos então a linguagem de programação Python 3, rodando no Google Colab com aumento de memória RAM.
Os scripts em Python usaram bibliotecas voltadas para ciência de dados e envolveu trabalhos de limpeza de dados, estatística, análise exploratória de dados e cruzamento de dados com informações geográficas do IBGE, para obter nomes oficiais dos municípios e a latitude e longitude de cada um.
Com um algoritmo de mais de 30 passos foi possível: processar milhões de dados; compreender quais testes da água eram realmente válidos, com padrões rígidos; entender quais municípios de fato têm testes válidos, e dentro destes saber quais mostram bons padrões de qualidade da água ou abaixo do permitido por órgãos de saúde pública; conseguir mostrar onde não havia informação – seja por falta de testes ou por terem um número excessivo de medições ineficazes; obter diversas estatísticas sobre municípios e suas respectivas substâncias maléficas para saúde, com informações geográficas, de cada substância e das empresas responsáveis pelo tratamento de água em cada cidade do país.
[English translation by the organiser]
The work was done using Google Colab Pro, in order to process the Sisagua files, the water surveillance system of the Ministry of Health, which are in CSV and each year have more than one million rows – each row represents a test done in some municipality in Brazil. In total, from 2018 to 2020, there are 5,126,181 rows. All these rows were analyzed to create the four new evaluation columns, which indicate whether the test is Consistent or Inconsistent and whether it is within or above the Maximum Value Allowed for a harmful substance to health.
This large data processing, which was done with the guidance and rules of the Ministry of Health, could not be done in normal spreadsheet programs, which have a limitation of rows for processing. We used the Python 3 programming language, running on Google Colab with increased RAM.
The Python scripts used data science-oriented libraries and involved data cleaning, statistics, exploratory data analysis, and data crossing with geographic information from IBGE to obtain official names of municipalities and the latitude and longitude of each one.
With an algorithm of more than 30 steps, it was possible to: process millions of data; understand which water tests were truly valid, with strict standards; understand which municipalities actually have valid tests, and within these, know which show good water quality standards or below those permitted by public health agencies; show where there was no information – either due to lack of tests or having an excessive number of ineffective measurements; obtain various statistics about municipalities and their respective harmful substances to health, with geographic information, each substance, and the companies responsible for water treatment in each city in the country.
Context about the project:
O Mapa da Água foi a primeira publicação jornalística brasileira que revelou a presença de substâncias químicas na água que sai da torneira em todo o país. Após mais de um ano de apuração, a reportagem entrou em contato com as maiores empresas de abastecimento do país, além das cidades onde os dados revelaram as piores violações, não encontramos casos de empresas ou órgãos de abastecimento que divulguem esses resultados. Sendo assim, chegamos à conclusão de que o Mapa é, hoje, a única ferramenta no país que dá acesso a esses dados de forma não codificada.
O maior esforço da nossa equipe foi o de traduzir uma informação que é disponibilizada de forma fragmenta e codificada. Para isso, foi preciso a colaboração entre jornalistas investigativos, jornalistas de dados, programadores, designers, um professor universitário de química e um técnico em saúde coletiva especialista no banco de dados em questão.
Além disso, como referência, usamos classificações dos órgãos reguladores mais reconhecidos para as substâncias encontradas na água: Organização Mundial da Saúde (International Agency for Research on Cancer), União Europeia, agência ambiental dos Estados Unidos (Environmental Protection Agency) e agências de regulação do Canadá e da Austrália. Todos os estudos e classificações utilizados estão linkados na descrição de cada substância, nas páginas dos municípios.
Depois do extenso trabalho de apuração e cruzamento dos dados, houve a etapa para traduzir as informações ao público geral. Com um conteúdo cheio de termos técnicos e científicos, a equipe teve a preocupação de construir textos simples e sem jargões. Cada palavra usada nas fichas e nos cabeçalhos foi testada entre especialistas e não especialistas para garantir que era tecnicamente correta e compreensível.
O mapa é uma versão ampliada e com metodologia aprimorada de um primeiro mapa focado na presença de agrotóxicos na água, publicado em 2019 (por usa vez, a primeira publicação dos dados de agrotóxicos na água de todo o país). Importante ressaltar que os dados do Sisagua passaram a ser publicados no portal de transparência do governo federal após solicitação de nossa equipe em 2018. Mesmo assim, trata-se de um banco complexo e inacessível para o público não especializado.
Além dos dados por município, o Mapa da Água traz ainda uma série de reportagens que desfiam os resultados e avançam a investigação em diferentes contextos. Revelamos que o maior problema entre as substâncias químicas acima do limite são justamente aquelas derivadas do tratamento da água. E descobrimos a sua origem: falta de tratamento do esgoto. Justamente porque a água chega para o tratamento misturada ao esgoto, as empresas usam mais produtos para desinfecção, aumentando assim a presença de substâncias perigosas à saúde humana. A página do mapa traz um menu com as principais descobertas feitas pela nossa equipe, publicações que continuam sendo produzidas.
[English translation by the organiser]
The Water Map was the first journalistic publication in Brazil to reveal the presence of chemical substances in tap water throughout the country. After over a year of investigation, the report contacted the largest water supply companies in the country, as well as the cities where the data revealed the worst violations, but we did not find any cases of companies or supply agencies that disclose these results. Therefore, we concluded that the Map is currently the only tool in the country that provides access to this data in an unencoded way.
The greatest effort of our team was to translate information that is provided in a fragmented and encoded way. To do so, it was necessary to collaborate among investigative journalists, data journalists, programmers, designers, a university chemistry professor, and a public health technician who specializes in the relevant database.
In addition, as a reference, we used classifications from the most recognized regulatory agencies for the substances found in water: the World Health Organization (International Agency for Research on Cancer), the European Union, the US Environmental Protection Agency, and regulatory agencies in Canada and Australia. All of the studies and classifications used are linked in the description of each substance on the municipality pages.
After the extensive work of investigating and cross-referencing data, there was a stage of translating the information to the general public. With content full of technical and scientific terms, the team was careful to construct simple and jargon-free texts. Each word used in the records and headers was tested among specialists and non-specialists to ensure that it was technically correct and understandable.
The map is an expanded version with an improved methodology of a first map focused on the presence of pesticides in water, published in 2019 (which, in turn, was the first publication of pesticide data in water throughout the country). It is important to note that Sisagua data began to be published on the federal government’s transparency portal after our team’s request in 2018. Nonetheless, it is a complex and inaccessible database for the non-specialized public.
In addition to the data by municipality, the Water Map also includes a series of reports that explain the results and advance investigation in different contexts. We revealed that the biggest problem among the chemical substances above the limit are precisely those derived from water treatment. And we discovered their origin: lack of sewage treatment. Precisely because the water arrives for treatment mixed with sewage, companies use more disinfection products, thus increasing the presence of dangerous substances for human health. The map page includes a menu with the main findings made by our team, publications that continue to be produced.
What can other journalists learn from this project?
Outros jornalistas podem aprender de diferentes formas com este projeto. A primeira é utilizando as informações do próprio Mapa da Água. Eles podem analisar os dados que estão na plataforma para produzir novas reportagens com abordagem regionais ou até municpais para passar mais informações sobre a qualidade da água para a população. Além disso, eles podem entender quais são as susbtâncias que são analisadas, seus riscos e até onde encontrar essas informações com base científicas.
Outra forma é mostrar que é possível fazer reportagens com base em dados complexos, como a do Ministério da Saúde. Disponibilizamos no site a metodologia metodologia geral do projeto e do site Mapa da Água (https://mapadaagua.reporterbrasil.org.br/metodologia). E a metodologia específica do tratamento dos dados está neste Github, na pasta metodologia em um PDF (https://github.com/Reporter-Brasil/mapadaagua/tree/main/metodologia). Assim, os jornalistas podem ver e entender como desenvolvemos o site, quais os critérios que utilizamos para poder replicar e aprimorar em novos projetos.
[English translation by the organiser]
Other journalists can learn in different ways from this project. The first is by using the information from the Mapa da Água itself. They can analyze the data on the platform to produce new reports with regional or even municipal approaches to provide more information about water quality to the population. In addition, they can understand which substances are analyzed, their risks, and where to find this information based on scientific basis.
Another way is to show that it is possible to make reports based on complex data, such as that from the Ministry of Health. We have made available on the website the general methodology of the project and the Mapa da Água site (https://mapadaagua.reporterbrasil.org.br/metodologia). The specific methodology for data treatment is in this Github folder, in a PDF (https://github.com/Reporter-Brasil/mapadaagua/tree/main/metodologia). Thus, journalists can see and understand how we developed the site, which criteria we used, in order to replicate and improve it in new projects.
Project links:
https://mapadaagua.reporterbrasil.org.br/
https://reporterbrasil.org.br/2022/03/mapa-da-agua-como-garantir-uma-agua-limpa-para-beber/