APOIO: logo ICFJ Logo Serrapilheira


Você pode acessar nosso código aberto desta aplicação neste link.

O Science Pulse é um projeto liderado pelo ICFJ Knight Fellow Sérgio Spagnuolo, também editor do Núcleo e do Volt Data Lab, agência de dados fundada por ele em São Paulo. O projeto é apoiado pelo Centro Internacional para Jornalistas (ICFJ) e pela agência de jornalismo científico Bori.

POR QUE ISSO É RELEVANTE?

Cientistas e jornalistas possuem uma história de colaboração. Mas, em um momento no qual as mídias sociais criam suas próprias bolhas, difíceis de superar, às vezes uma ponte é necessária entre as conversas acontecendo dos dois lados. Jornalistas podem se beneficiar muito de saber o que cientistas e especialistas estão compartilhando em redes sociais.

O Science Pulse quer ser esta ponte. Em uma época na qual o conhecimento científico está em grande demanda, há também grandes desafios acerca de como pesquisas e trabalhos acadêmicos e resultados preliminares são comunicados. Dados, conclusões e decisões podem mudar rapidamente.

Além disso, é difícil acompanhar tudo o que se passa nas redes sociais hoje em dia, e mais difícil ainda seguir centenas ou milhares de novos perfis, mesmo que estejamos interessados no que eles têm a dizer. E, mesmo seguindo todos esses novos perfis, boa parte das mensagens que eles vão passar ficarão perdidas entre outras publicações.

É por isso que decidimos fazer uma ferramenta que pode aumentar a descoberta em torno da conversa científica que acontece agora nas redes sociais, especialmente no contexto da pandemia de coronavírus. É uma forma de aumentar nosso conhecimento, assim como filtrar boa parte do ruído. Daremos espaço para cientistas e especialistas, muitos dos quais são brilhantes em seus campos, mas que não se destacam nas redes sociais.

SOBRE OS DADOS

COLETA DE PERFIS E PÁGINAS

Todos os perfis e páginas de cientistas, especialistas, médicos, universidades, organizações e iniciativas científicas foram compilados pela equipe de desenvolvimento do Science Pulse por uma variedade de métodos. Encontramos esses perfis e páginas, principalmente, de três formas:

Um crowdsourcing, pelo qual convidamos as pessoas a sugerir perfis;

Ao identificar usuários com perfis verificados pelo Twitter ou Facebook e, a partir deles, encontrar novos perfis/páginas a partir de quem seguem;

Consultando listas de Twitter e Facebook feitas por universidades, jornalistas ou outras iniciativas.

Qualquer pessoa pode sugerir um novo perfil para ser incluído em nossa plataforma através deste formulário.

Caso seja um cientista ou especialista com o perfil mapeado por esta ferramenta, você pode solicitar sua exclusão do banco de dados do Science Pulse. Envie um email para [email protected].

COLETA DE DADOS

Atualmente, coletamos dados de tweets e posts no Facebook.

No Twitter, nosso banco de dados é atualizado regularmente com novos tweets e contagens, respeitando os limites da API gratuita. Nossa coleta é atualizada a cada 20 minutos, mas disponibilizamos somente postagens dos últimos 30 dias.

No Facebook, restringimos a coleta de dados aos posts com performance superior ao esperado (overperforming) realizados pelas páginas monitoradas nas últimas 24 horas. Além disso, seguindo as regras de uso da API do Crowd Tangle, não disponibilizamos a íntegra dos bancos de dados de posts coletados.

SOBRE O ALGORITMO

DADOS DE TWITTER

TENDÊNCIAS

Todas as nossas tendências consideram apenas tweets publicados ou recompartilhados nas últimas 12 horas pelos perfis que seguimos.

Nossa aba principal de tendências é separada em três grupos para cada idioma:

  • Isso é tendência: mostra os tweets com o maior número de interações (likes + RTs) comparados ao que um perfil normalmente possui. Essa medida é desenhada para encontrar conteúdos que se destacam da média de um perfil. Ele é inspirado na medida de overperforming do CrowdTangle: estabelecemos uma espécie de penalidade para usuários com menos engajamento, para não permitir que posts com um número muito baixo de interações apareça somente porque o autor possui um baixo número de seguidores.
  • Pegando fogo: lista tweets de autoria de perfis monitorados pelo Science Pulse que tenham um número substantivo de retweets de toda a população de usuários (contagem de RTs), no momento da última coleta de dados. Usuários podem escolher duas opções para visualização: Descoberta ranqueia os cinco tweets com maior proporção de RTs por seguidores (RT:followers) publicados por membros da lista do Science Pulse (apenas se tiverem mais de 1 retweet), e Popularidade mostra os tweets com maior número de RTs dentre todos os perfis monitorados.
  • Radar pulse: mostra uma lista de 5 tweets aleatórios que tiveram mais que um RT (por usuários de toda a rede social) e são de autoria de perfis listados no Science Pulse. Ao clicar no ícone "Mostrar novos tweets" o usuário sorteia uma nova lista com 5 tweets aleatórios. Essa amostra de 5 tweets é estratificada para sempre mostrar dois tweets de especialistas/acadêmicos não-homens.

DESCUBRA MAIS

Essa aba serve para maior exploração do banco de dados de tweets do Science Pulse. Ela contém cinco conjuntos de informações sobre tweets publicados nas últimas 12 horas, também filtrados por idioma:

Usuários ativos: os usuários que mais tuitaram no período;

Hashtags: as hashtags mais compartilhadas no mesmo período;

Também populares no pulse: utilizamos um algoritmo de agrupamento (k-means clustering) para classificar esses tweets em quatro grupos, de acordo com sua contagem de retweets com base na última coleta de dados (de 1 a 4, sendo 4 o grupo com mais retweets). Então, consideramos apenas tweets do "grupo 2", eliminando aquelas que provavelmente são mensagens pessoais e, assim, possuem menos retweets (grupo 1) e aquelas que atingiram o topo dos nossos trending topics (da aba Trends) ou com grande volume orgânico (grupos 3 ou 4). Dentro do grupo 2 é utilizada a mesma métrica da coluna "Popular no Pulse" da aba Tendências.

Radar Pulse: este conjunto de dados representa uma amostra aleatória de cinco tweets do grupo 2 (descrito acima). Os tweets apresentados nesta coluna podem coincidir com aqueles do conjunto anterior, mas ela proporciona ao usuário maiores chances de encontrar conteúdo científico interessante e que não alcançou os trends.

Popular entre cientistas: mostra as publicações mais retuitadas pelos perfis monitorados pelo Science Pulse. Toda vez que um perfil que monitoramos compartilha um tweet, ele conta como um (n = 1). As publicações melhor ranqueadas possuem o maior número de retweets dentro dessa amostragem, assim identificando os tweets que conseguiram mais atenção entre os perfis monitorados pelo Science Pulse. Por exemplo: se 15 perfis em nosso banco de dados compartilharam este  tweet da OMS, ele possui um taxa de compartilhamento de 15.

ESPECIAL COVID-19

O ESPECIAL COVID-19 apresenta tweets em destaque nas últimas 12 horas em posts filtrados por palavras-chave relacionadas à pandemia. As métricas utilizadas são as mesmas para usuários ativos e hashtags da aba Descubra Mais - com a exclusão de hashtags mais recorrentes, como #COVID-19 - e das colunas da aba Tendências.

Essas são as palavras-chave aplicadas como filtro: “Covid”, “covid”, “Coronavirus”, “coronavirus”, “Corona”, “corona”, “SARS-CoV-2”, “Sars-CoV-2”, “SRAG”, “sindrome”, “syndrome”, “pandemic”, “pandemia”, “WHO”, “OMS”, “quarantine”, “social distancing”, “quarentena”, “isolamento social”, “distanciamento social”, “mascara”, “mask”, “distanciamiento social”, “spread”, “asymptomatic”, “epidemic”, “outbreak”, “epidemia”, “vacina”, “vaccine”, “wuhan”, “Wuhan”, “herd immunity”, “imunidade de rebanho”, “imunidade coletiva”, “lockdown”, “blood clot”, “coágulo”, “AstraZeneca”, “Astrazeneca”, “astrazeneca”, “Coronovac”, “CoronoVac”, “coronavac”, “Janssen”, “janssen”, “Sputnik”, “sputnik”, “máscara”, “mascara”, “mask”.

PERFIS ACOMPANHADOS

Na aba Perfis Acompanhados, listamos todos os perfis que compõe a curadoria do Science Pulse, entre cientistas, instituições, pesquisadores e especialistas. Para ajudar usuários a descobrir novas fontes de informação científica, a tabela Encontre novos especialistas retorna uma amostra aleatória de cinco perfis que possuam o número de seguidores menor do que a mediana dessa medida dentre todos os perfis em nosso banco de dados.

ABA BUSCA POR TWEETS

Na aba Busca por Tweets, usuários podem pesquisar tweets dos últimos 90 dias de acordo com diferentes filtros, como algumas palavras-chave, intervalo de datas, perfis verificados, retweets ou replies.

DADOS DE FACEBOOK

POSTS POPULARES

Essa seção é composta por posts de Facebook com performance superior ao esperado (overperforming) feitas nas últimas 24 horas. Ela apresenta duas colunas com posts em destaque nas páginas seguidas pelo Science Pulse, a partir de dados do Crowd Tangle, além de uma coluna com a possibilidade do usuário explorar outros posts nas páginas monitoradas pela nossa ferramenta.

Os três grupos de postagem são:

Desempenho em alta: posts com os maiores escores na medida de desempenho em alta (overperforming), desenvolvida pelo Crowd Tangle. Essa métrica mostra publicações que estão se saindo melhor em engajamento em relação ao que seria esperado pelas características da página em que ela foi publicada.

Populares: postagens com o maior número de compartilhamentos na lista de páginas selecionadas pelo Science Pulse. Essa métrica serve para identificar o que tem sido compartilhado em massa.

Descubra mais: amostra aleatória de 5 posts das páginas monitoradas pelo Science Pulse. Ao clicar no ícone "Mostrar novos posts" o usuário sorteia uma nova lista com 5 posts.

ABA PÁGINAS ACOMPANHADAS

Nesta aba, listamos todas as páginas públicas do Facebook que no momento são monitoradas pelo Science Pulse. Esta lista é formada por páginas de universidades, organizações científicas e iniciativas de divulgação de pesquisas brasileiras e internacionais. A coluna Encontre novas páginas mostra uma amostra aleatória de cinco páginas que possuam um número de seguidores menor do que a mediana de todas as páginas em nosso banco de dados.