2023

Com que programa eleitoral sairia para jantar?

Entry type: Single project

Country/area: Portugal

Publishing organisation: Público

Organisation size: Big

Publication date: 2022-01-21

Language: Portuguese

Authors: Rui Barros, José Volta e Pinto, Pedro Rios, David Costa Mano (desenvolvimento), Gabriel Sousa (design),

Biography:

Fundado em 1990, o PÚBLICO é um dos jornais de referência em Portugal. Com uma aposta forte em jornalismo de qualidade, o jornal foi pioneiro na infografia e, mais tarde, no jornalismo de dados em Portugal. Ao longo dos últimos anos, essa aposta revelou-se um importante componente do que é a marca PÚBLICO, com produtos inovadores e que definem o jornalismo de referência pelo qual se pauta.

Project description:

Os principais partidos políticos portugueses apresentaram-se às eleições legislativas com um total de mais de mil páginas em programas eleitorais. Apesar da cobertura dos média, dos debates e da propaganda, torna-se impossível para uma grande maioria dos eleitores saber exactamente o que propõem.

Partindo desse pressuposto, a equipa de dados do PÚBLICO transformou todos estes programas eleitorais numa gigante folha de cálculo, onde numa matriz era possível saber se um partido concordava, discordava ou não tinha opinião sobre um tópico.

O resultado? Uma espécie de clone do tinder para responder à pergunta: “Com que programa eleitoral sairia para jantar?”.

Impact reached:

Este terá sido o projecto mais viral que a nossa equipa já produziu, superando as nossas expectativas e mostrando que nada como uma boa base de dados e um conceito “fora da caixa” para deixar os cidadãos interessados pelas ideias dos partidos.

Techniques/technologies used:

O grande desafio neste trabalho foi transformar dados não estruturados – programas eleitorais – em dados estruturados – uma matriz de concordância, indiferença ou discordância face a um tema. Como o desafio era demasiado grande para ser apenas feito por humanos, começamos por usar Natural Language Processing (NLP) usando a linguagem de programação R para identificar os temas mais importantes para cada partido. Para tal usamos tf–idf. Identificados esses temas, sinalizamos nos respectivos programas eleitorais onde é que essas palavras surgiam – indicando que possivelmente seria ali que deveríamos ler para encontrar o posicionamento do partido face à questão.

Feito este primeiro trabalho mais automatizado, procedeu-se à leitura exaustiva de todos os programas, fazendo uso do Google Sheets para criar a respectiva matriz de concordância/discordância nos vários temas.

Context about the project:

Penso que isso já foi descrito acima. É o género de trabalho que não transparece que houve trabalho de dados. No entanto, foi feito um trabalho grande de análise de dados para permitir analisar o conteúdo de todos os programas eleitorais em tempo recorde.

What can other journalists learn from this project?

Penso que a grande lição é: “dados não estruturados podem ser dados estruturados”. Mas isso requer uma grande dose de esforço. Numa altura em que, na minha opinião, o jornalismo de dados se deixa condicionar demasiado pela existência/não existência de dados estruturados, foi uma importante lição a retirar.

Project links:

https://www.publico.pt/eleicoes-legislativas-2022/propostas-partidos