Essa aplicação é uma versão gratuita do Monitor Nuclear PRO. Por enquanto, o acesso à versão completa ainda é gratuito, mediante cadastro no site, e será fechado em breve, ficando disponível apenas para membros do Núcleo Jornalismo. Considere apoiar para continuar com acesso completo. Uma versão com menos recursos continuará aqui.
Para citações, fazer referência a Monitor de Twitter, do Núcleo Jornalismo
ou Monitor Nuclear
, se possível com link para www.nucleo.jor.br/monitor
.
SOBRE O PROJETO
O Monitor Nuclear é uma aplicação do Núcleo que identifica tendências de engajamento no Twitter, considerando tweets publicados pelos principais políticos brasileiros e possíveis pré-candidatos à eleição presidencial de 2022.
Esses dados são relevantes porque podem indicar tanto o humor do momento quanto a mobilização de bases de apoio ou de oposição em relação a certo ator político ou assunto.
Com pouco mais de 16 milhões de usuários [1], o Twitter não representa o eleitorado brasileiro [2], mas, nos últimos anos, a rede social passou a funcionar como um termômetro do debate político no Brasil [3] e em muitos outros países.
A rede social é recorrentemente um meio utilizado por autoridades para se comunicar diretamente com suas bases, o que a tornou uma ferramenta de tomada de decisões, além de pautar a imprensa e boa parte do debate.
Para entender mais a importância do Twitter na política e na diplomacia, acesse o estudo Twiplomacy[4]. Segundo a pesquisa, governos e líderes de 189 países possuíam uma presença oficial na rede social -- quase todos os membros das Nações Unidas.
METODOLOGIA
A fim de garantir total transparência para nossos métodos e abordagens, descrevemos abaixo passo a passo de como chegamos aos resultados do gráfico.
A base do código é aberta e tem como referência a ferramenta Science Pulse, projeto de monitoramento de ciência do Volt Data Lab, a empresa por trás do Núcleo.
Escolha dos nomes
Os perfis dos políticos foram baseados em diversas fontes:
- Lista de senadores, via conta oficial do Senado Federal
- Lista de deputados, via conta oficial da Câmara dos Deputados
- Lista de governadores, via Sérgio Spagnuolo (editor do Núcleo)
- Lista de ministros, via Sérgio Spagnuolo (editor do Núcleo)
- Lista com presidente e vice-presidente via Sérgio Spagnuolo (editor do Núcleo)
- Lista de atores políticos, que contém personagens relevantes na cena política, políticos eleitos que não constam nas outras listas e políticos ou autoridades sem cargos eletivos, com curadoria de Sérgio Spagnuolo (editor do Núcleo)
A lista pode ser aumentada, e, inclusive, reduzida, a depender de fatores políticos e eleitorais.
Qualquer pessoa pode sugerir um nome para integrar a lista de atores políticos, através deste formulário, explicando por que.
Dados
Os dados são baseados em tweets originais (retweets são desconsiderados) publicados pelos próprios atores em seus perfis oficiais e verificados pelo Twitter.
Os dados analisados são obtidos diretamente da API do Twitter[5], e atualizados a cada 20 minutos. O código para extração pode ser encontrado neste gist. A política de API do Twitter não permite a reprodução integral dos dados.
A API gratuita do Twitter só permite retornar os últimos 3.200 tweets de cada perfil.
Base da análise
A análise é baseada em três variáveis: data de publicação, total de curtidas por tweet e total de retweets por tweet.
Os dados não consideram comentários, por dois motivos:
1. curtidas e retweets estão limitados a apenas um por perfil, funcionando quase como uma métrica de endosso ao conteúdo. Isso torna mais difícil para bots e perfis falsos inflarem artificialmente tweets originais, ao contrário do que acontece com uma hashtag, por exemplo, à medida que um perfil pode curtir múltiplos tweets com um termo.
2. comentários são ilimitados, o que pode inflar indevidamente o número de interações. Além disso, eles frequentemente não refletem uma interação provável de endosso, podendo ser críticos, ofensivos, spam, piadas, memes ou tags para pessoas acompanharem o assunto.
Vale notar que a metodologia do Monitor é válida para se visualizar engajamento em perfis específicos, mas não acerca de dados conversacionais. Com uma hashtag ou campanha online, por exemplo, o caso é diferente, à medida que há vários tweets com hashtags ou termos que um bot ou um humano possam interagir em massa.
Fórmulas
O Monitor agrega, por dia, o número de tweets disparados entre 00h e 23h59 e soma o total de curtidas e retweets. Essa soma é considerada como o total de interações
.
Isso nos permite calcular duas métricas fundamentais para nossa análise: a taxa de engajamento
e tendência de engajamento
.
Taxa de engajamento
: é a média simples do total de interações pelo número de tweets disparados em um único dia. Assim, se um perfil tuitou 10 vezes e teve 100 interações, a taxa de engajamento é de 10 interações por tweet. Se outro perfil tuitou uma vez e teve 100 interações, essa taxa é de 100 por tweet;Tendência de engajamento
: é a média móvel exponencial de X dias da taxa de engajamento. Consideramos 15 dias como o default, indicando um ciclo noticioso rápido, mas constante;Tweets em alta
: lista tweets de autoria de perfis monitorados pelo Monitor Nuclear que tenham o maior número de retweets de toda a população de usuários (contagem de RTs), no momento da última coleta de dados. Usuários podem escolher duas opções para visualização: Descoberta mostra tweets de usuários que estejam abaixo da mediana do número de seguidores dentre os perfis listados no Monitor Nuclear, e Popularidade mostra tweets de todos os perfis da base de dados.
Em todos os casos, a linha de tendência utiliza regressão local (LOESS), um método estatístico que estima curvas e superfícies através de suavização, melhor para identificar tendências de curto prazo.
Fundamentos técnicos
O Monitor é construído com a linguagem de programação R, utilizando o pacote Shiny
. O ETL (processo de captura e organização de dados) é feito a partir de uma instância no Rstudio, e o banco de dados que armazena as informações é PostgresSQL
.
Referências
Statista, ref. fevereiro de 2021 ↩︎
TSE - Estatísticas de Eleitorado ↩︎
Uma definição interessante vem do jornalista José Roberto de Toledo, no podcast Foro de Teresina: "O Twitter não é um espelho da sociedade, ele é um espelho do debate político e ali o que a gente está medindo é o engajamento, a força dos atores, de quanto eles conseguem mobilizar suas bases." - Episódio #95, Foro de Teresina aos 28m28s ↩︎