Bot ou não: quem segue os candidatos a presidente?

Analisamos qual é o perfil dos seguidores dos pré-candidatos à Presidência da República no Twitter.

Como vamos discutir as eleições de 2018? Onde buscaremos as novidades da corrida que definirá a liderança política do país nos próximos quatro anos? Campanhas e debates políticos se fazem cada vez mais presentes na internet e passam a se apropriar das redes sociais e de ferramentas a elas relacionadas. Com isso, uma das questões que surgem é sobre o possível uso de táticas de manipulação da percepção dos cidadãos sobre o processo eleitoral no ambiente digital.

Não se trata apenas de fake news – boatos, conspirações ou sensacionalismos publicados em um formato de texto jornalístico. Durante o período eleitoral, campanhas, seus apoiadores ou qualquer agente que vise interferir no processo ganha novas possibilidades à medida que a nossa atenção é dirigida aos diferentes feeds e conteúdos personalizados. Mesmo que tais técnicas já tenham sido exploradas no Brasil antes, as eleições presidenciais de 2016 nos EUA mostraram como essa história está apenas começando. Parte dela tem a ver com a desinformação gerada pela interferência de robôs no debate público, automatizações em perfis de redes sociais que não se revelam como tal e que podem gerar grande ruído na percepção de quem está participando do debate público.

Isso estará presente em nossa eleição? Seriam os políticos no Brasil seguidos por bots? Com esta primeira pergunta em mente fizemos um levantamento no Twitter sobre qual seria o perfil dos seguidores dos pré-candidatos à Presidência da República na plataforma. Os principais resultados foram reunidos nesse post e um relatório completo da pesquisa com a metodologia aplicada pode ser conferido aqui.

O que são bots?

Os robôs, ou, como são conhecidos, os bots, são um tipo específico de programa de computador que realiza tarefas de forma autônoma, a partir de algoritmos. Eles são programados para executar uma série de funções, desde facilitar a navegação na internet até interagir com indivíduos. Ainda que sejam mais conhecidos por terem sido supostamente usados para influenciar as eleições nos EUA em 2016, eles são, na verdade, bem comuns na internet e essenciais para o seu funcionamento. De todo o tráfego da internet, 65,1% é operacionalizado por meio de bots [1]. Os crawlers, por exemplo, são os robôs que navegam nos sites para organizar as informações para buscadores como o Google, enquanto que os chatbots podem ser usados em diversas plataformas para responder a usuários, fornecer informações e facilitar atendimentos.

Mais especificamente nas redes sociais, os bots podem ser usados não apenas nos chats, mas também para automatizar contas e perfis. Essas contas podem deixar claro ao usuário que são controladas por robôs e serem usadas para promover engajamento político de usuários, fornecer informações de interesse público, ou, até mesmo, apenas para fins de entretenimento. A bot Fátima, por exemplo, da agência Aos Fatos, está presente no Twitter e no Facebook, e foi elaborada para disseminar a checagem de fatos nas plataformas. Além dela, no Twitter, contas como o @big_ben_clock, que informa o horário com “badaladas” do sino, e o Ruibarbot, criado pelo Jota para informar sobre atrasos em processos no judiciário brasileiro, se apresentam como usuários automatizados e executam tarefas que podem ter um impacto positivo para os usuários.

Bots, debate político e políticas das plataformas

Um problema surge, todavia, quando os bots são usados para automatizar contas e perfis falsos, de forma não transparente, para que eles se passem por usuários comuns das redes sociais. Com o objetivo de alavancar conteúdos e indivíduos artificialmente, eles podem ser programados para seguir pessoas, interagir em debates ou publicar e curtir conteúdos de forma orquestrada. No contexto de disputas político-eleitorais, os bots podem ser empregados dessa forma para distorcer a dimensão de movimentos políticos, manipular e radicalizar debates, e criar falsas percepções sobre disputas e consensos nas redes sociais. Eles podem fazer parecer que determinada figura é mais popular do que de fato é ou, ainda, serem utilizados para replicar discursos em série, fazendo parecer que há uma enorme adesão à uma causa quando não há.

No Brasil, é possível diagnosticar o uso de bots em contextos eleitorais desde pelo menos 2011 e há evidências de que eles tenham sido utilizados no Twitter para apoiar candidatos nas eleições de 2014, durante o processo de impeachment e nas eleições municipais de 2016 [2].

Como esses mecanismos inflam artificialmente a audiência, eles são contrários às próprias políticas das plataformas. No caso do Twitter, a plataforma anunciou mudanças na sua política com o objetivo de combater esses perfis automatizados [3]. As alterações reduziram a capacidade de uma pessoa ou serviço que controlam diversas contas de realizar spam através de tweets semelhantes ou de curtidas e retweets em massa.

Com a aproximação das eleições presidenciais deste ano, surgem inquietações sobre o possível uso desses mecanismos automatizados em processos de desinformação e manipulação de opiniões. Em 2018, pela primeira vez, a legislação eleitoral vai admitir propaganda política na internet por meio de impulsionamento. Estas eleições serão provavelmente a primeira na história na qual a internet, e principalmente as redes sociais, terão um papel importante na campanha eleitoral.

É exatamente diante desse cenário que nos perguntamos se os atuais pré-candidatos à presidência seriam seguidos por bots. Utilizando as APIs [4] do Twitter e do Botometer, coletamos informações sobre uma amostra dos seguidores totais, analisamos a probabilidade deles serem bots e fizemos estudos estatísticos e topográficos sobre como é composto o conjunto de seguidores de cada pré-candidato.

Botometer: pistas se um perfil é ou não um bot

Para analisar quantos prováveis bots seguem cada pré-candidato nós utilizamos o Botometer, que calcula a probabilidade de um perfil do Twitter ser um bot. Como não encontramos ferramenta semelhante para outras redes sociais, a pesquisa analisou apenas os perfis dos pré-candidatos no Twitter.

O Botometer é um sistema desenvolvido pela Universidade de Indiana que utiliza o algoritmo de floresta aleatória para classificar perfis do Twitter com relação à probabilidade de serem automatizados. Esse algoritmo foi treinado a partir de bases de dados compostas por bots identificados por seres humanos. A ferramenta possui uma baixa probabilidade de classificar erroneamente perfis que seriam claramente apontados como bots ou como usuários reais. Os casos que podem gerar erros da ferramenta são principalmente aqueles que envolvem perfis dúbios, nos quais as características de bots ou de humanos não ficam claras. Ainda assim, foi demonstrado que o Botometer possui um fator de confiança médio de 86% [5].

Dentre os diversos resultados fornecidos pelo Botometer ao analisar um perfil, foi utilizado nessa pesquisa o CAP, um índice percentual que indica a probabilidade daquela conta ser totalmente automatizada. O CAP já foi utilizado em pesquisas que analisaram o comportamento de contas automatizadas no Twitter [6], e é o índice recomendado pelos desenvolvedores do Botometer por ser uma estimativa mais conservadora, o que reduz as chances de uma conta ser erroneamente classificada como bot.

Quem são os seguidores dos pré-candidatos?

Para analisar o perfil dos seguidores dos pré-candidatos no Twitter, desenvolvemos um método simples que juntou dados coletados junto ao Twitter e análises feitas no Botometer, o que permitiu calcular o CAP (ou seja, o índice percentual que indica a probabilidade dessa conta ser totalmente automatizada) de uma amostra aleatória dos seguidores de cada um desses perfis (mais detalhes sobre a nossa metodologia podem ser encontrados no relatório completo).

A coleta de dados foi feita entre os dia 4 e 28 de junho e os seguintes pré-candidatos à presidência da república tiveram seus seguidores analisados: Adilson Barroso (PATRIOTA), Álvaro Dias (PODEMOS), Ciro Gomes (PDT), Fernando Collor (PTC), Flávio Rocha (PRB), Geraldo Alckmin (PSDB), Guilherme Boulos (PSOL), Henrique Meirelles (MDB), Jair Bolsonaro (PSL), Jaques Wagner (PT), João Amoêdo (NOVO), Lula (PT), Manuela D’Ávila (PCdoB), Marina Silva (REDE), Paulo Rabello (PSC), Rodrigo Maia (DEM).

Além dos pré-candidatos, foi incluído na pesquisa os dados coletados do perfil do chef de cozinha Michael Symon. No início deste ano, o New York Times produziu uma reportagem sobre o mercado de compra de bots para inflar o número de seguidores. Michael Symon foi um dos famosos apontados pela prática e admitiu ter comprado bots. Com essa informação prévia de que ele possui efetivamente seguidores bots, seus dados foram acoplados à pesquisa para fins de comparação e validação da metodologia utilizada.

A partir dos dados levantados com o Botometer, foi calculado estatisticamente o número máximo e o número mínimo de bots que seguem cada pré-candidato, chamado de Intervalo de Confiança. Com a média desse Intervalo, estimamos o percentual de seguidores de cada candidato que são potencialmente bots, e organizamos os dados no gráfico abaixo:

Percentual de seguidores que são potencialmente bots para cada um dos perfis dos pré-candidatos. A linha verde representa o percentual encontrado para Michael Symon: 38.1%

O pré-candidato Guilherme Boulos apresentou o menor percentual, com um Intervalo de Confiança entre 13.3% e 14.7%, o que representa uma média de aproximadamente 9.185 bots entre seus seguidores. Na outra ponta do gráfico, acima dos 38,1% de Michael Symon, se encontram Fernando Collor, Geraldo Alckmin, Adilson Barroso e Álvaro Dias. Este último possui o maior percentual entre todos, com um Intervalo de Confiança entre 63.7% e 65.0%, equivalente a uma média de 262.950 seguidores bots.

Em nenhum caso o percentual chegou a zero ou próximo disso. Essa alta quantidade de bots nos perfis dos pré-candidatos à presidência, todavia, não indica, necessariamente, que houve qualquer tipo de aquisição de seguidores por eles ou pelas empresas de marketing que os auxiliam. O Brasil é um dos países com o maior uso de bots em redes sociais [7] e, de acordo com um relatório da Symantec de 2016, o Brasil hospeda o 8º maior número de bots do mundo. Além disso, como já foi dito acima, isso não é algo fundamentalmente novo, afinal a atividade de robôs no Twitter já foi identificada na última eleição presidencial em 2014, durante o processo de impeachment e nas eleições municipais de 2016 [8]. Como mostram tais estudos, descobrir a finalidade e os possíveis controladores de tais perfis exige uma maior investigação.

O seguidores bots de um(a) presidenciável seguem seus possíveis adversários?

O funcionamento de bots nas plataformas é muito diversificado, nem sempre eles são objeto de compra, podendo seguir usuários e interagir com conteúdos com base em palavras-chave, assunto, conjuntos de interesse etc. Mapear esses bots a partir de quem eles seguem em comum pode levantar pistas sobre isso. Há mais chances de que eles sejam ativados a partir de palavras-chave, por exemplo, se eles seguem mais de um perfil com características semelhantes.

Diante disso, com o mesmo método explicado anteriormente, nós mapeamos a rede de seguidores bots existente entre os pré-candidatos. A partir dela, criamos um grafo de quais perfis os seguidores com CAP maior que 90% [9] dessa amostra seguiam, com o objetivo de verificar se esses bots seguiam vários pré-candidatos em comum ou apenas um perfil dentre eles. Nessa visualização, quanto mais próximos os pré-candidatos estão entre si, maior o número de seguidores bots em comum. As cores indicam a formação de aparentes clusters, em decorrência de um relativo alto número de seguidores compartilhados entre eles, conforme pode ser observado abaixo:

Grafo da distribuição dos bots analisados na pesquisa. Cada nó representa uma conta, e as arestas significam que um perfil segue o outro.

No grafo acima, os clusters identificados a partir dos seguidores em comum contemplam de alguma maneira o atual cenário político-eleitoral no Brasil, não se distanciando muito do que foi feito em pesquisas que se utilizaram de metodologia semelhante para mapear debates políticos nas redes sociais [10]. Além disso, esse tipo de abordagem para encontrar perfis que são potencialmente bots já foi também aplicado em outros estudos [11], que usaram como base para a captura de dados, todavia, hashtags, e não perfis específicos.

Há uma distorção, todavia, que pode ser observada com relação ao candidato Álvaro Dias, que claramente se isola dos demais. Esse achado indica, principalmente, que entre ele e os outros pré-candidatos existe um baixo número de seguidores bots compartilhados, se comparado com a situação dos demais. Como esse candidato apresentou uma elevada quantidade de bots estimada para o ser perfil e um padrão de seguidores que difere dos demais, foram levantadas suspeitas de que algo incomum poderia ter ocorrido no seu perfil.

Comparações entre padrões de compra de bots

Na reportagem produzida pelo New York Times, acima mencionada, foi aplicada uma metodologia que permitiu identificar a ordem em que cada conta passou a seguir um perfil no Twitter, seja ela bot ou não, e sua respectiva data de criação. Essa abordagem possibilitou identificar momentos nos quais muitos prováveis bots passaram a seguir um perfil em conjunto, o que pode indicar uma suposta compra de bots.

Para replicar essa investigação no perfil dos pré-candidatos, nós adaptamos a metodologia para utilizarmos o índice CAP calculado pelo Botometer. A partir disso, elaboramos gráficos que cruzam a ordem em que cada seguidor passou a seguiu aquele pré-candidato (eixo horizontal) com a probabilidade desses seguidores serem bots (eixo vertical). Concentrações de seguidores no topo do gráfico indicam que em determinado momento muitos prováveis bots seguiram aquele candidato, enquanto que concentrações na parte de baixo se referem a seguidores humanos.

Primeiro nós aplicamos essa metodologia ao perfil de Michael Symon, que já havia confessado a compra de bots. No gráfico abaixo, observamos no topo algumas aglomerações e perfis que são provavelmente automatizados (score CAP próximo de 1.0), o que indica o momento nos quais essas compras ocorreram.

Contorno do score CAP dos seguidores de Michael Symon, que confessou ter comprado bots. A mancha escura na área superior à direita indica esse comportamento.

Esse processo foi feito com todos os pré-candidatos à presidência da república, e alguns dos gráficos podem visualizados abaixo:

Contorno dos seguidores de três pré-candidatos à presidência. Nos perfis dos candidatos Ciro Gomes e Geraldo Alckmin não encontramos a mesma mancha do perfil de Michael Symon, mas no perfil de Álvaro Dias pode ser identificado um padrão semelhante.

De todos os pré-candidatos pesquisados, apenas Álvaro Dias apresentou características semelhantes àquelas observadas no gráfico de Michael Symon. Esse contorno anormal, todavia, não significa, necessariamente, uma compra de seguidores robôs, mas que em algum momento na história do perfil todos os novos seguidores eram provavelmente bots, algo que não é comum em um crescimento orgânico na relevância de um perfil.

***

As análises deste estudo não têm a pretensão de traçar afirmações categóricas sobre a origem e o uso de bots no cenário político-eleitoral, mas de começar a olhar para esse cenário. As conclusões aqui encontradas nos revelam que a presença de bots no discurso político nas eleições de 2018 será uma realidade. Mais de 1 milhão de robôs seguem os pré-candidatos e em muitos casos seguem mais de um simultaneamente. Além disso, todos os candidatos possuem um percentual considerável de seus seguidores composto por contas automatizadas. Tudo isso aponta a importância de que tanto cidadãos quanto a justiça eleitoral estejam atentos à essas questões durante a campanha eleitoral.

Os algoritmos elaborados para desenvolver essa pesquisa estão disponíveis e podem ser acessados em: https://github.com/internetlab-br/Twitter-Bots

_______

[1] Report: Bot traffic is up to 61.5% of all website traffic. Incapsula, 9 de dezembro de 2013. Fonte: https://www.incapsula.com/blog/bot-traffic-report-2013.html

[2] ARNAUD, Dan. Computational propaganda in Brazil: social bots during elections. University of Oxford Working Paper, n.8, 2017. Disponível em: http://blogs.oii.ox.ac.uk/politicalbots/wp-content/uploads/sites/89/2017/06/Comprop-Brazil-1.pdf

[3] https://blog.twitter.com/official/en_us/topics/company/2018/2016-election-update.html https://blog.twitter.com/developer/en_us/topics/tips/2018/automation-and-the-use-of-multiple-accounts.html

[4] APIs (Interface de Programação de Aplicação) é um conjunto de interfaces estabelecidas por um software – como o Twitter e o Botometer – para permitir que outras aplicações utilizem funcionalidades do software sem precisar se envolver completamente com o seu funcionamento.

[5] VAROL, Onur; et al. Online Human-Bot Interactions: Detection, Estimation, and Characterization. In: Proceedings of the Eleventh International AAAI Conference on Web and Social Media, 2017, pp. 280–289. Disponível em: https://aaai.org/ocs/index.php/ICWSM/ICWSM17/paper/view/15587/14817

[6] POZZANA, Iacopo; FERRARA, Emilio. Measuring bot and human behavioral dynamics. 2018. Disponível em: https://arxiv.org/pdf/1802.04286.pdf; GRAMLICH, John. Q&A: How Pew Research Center identified bots on Twitter. Pew Research Center, 19 abr. 2018. Disponível em: http://www.pewresearch.org/fact-tank/2018/04/19/qa-how-pew-research-center-identified-bots-on-twitter/

[7] ARNAUD, Dan. Computational propaganda in Brazil: social bots during elections. University of Oxford Working Paper, n.8, 2017. Disponível em: http://blogs.oii.ox.ac.uk/politicalbots/wp-content/uploads/sites/89/2017/06/Comprop-Brazil-1.pdf

[8] ARNAUD, Dan. Computational propaganda in Brazil: social bots during elections. University of Oxford Working Paper, n.8, 2017. Disponível em: http://blogs.oii.ox.ac.uk/politicalbots/wp-content/uploads/sites/89/2017/06/Comprop-Brazil-1.pdf

[9] O score CAP reflete a probabilidade de uma conta ser totalmente automatizada. Estudos acadêmicos selecionaram um score entre 40 e 60% para considerar a conta um robô, todavia para essa pesquisa nós escolhemos um score mais conservador com o objetivo de reduzir ao máximo a chance de falsos positivos.

[10] MALINI, Fábio. UM MÉTODO PERSPECTIVISTA DE ANÁLISE DE REDES SOCIAIS: cartografando topologias e temporalidades em rede. In: XXV Encontro Anual da Compós, 2016. Goiânia: Associação Nacional dos Programas de Pós-Graduação em Comunicação. Disponível em: http://www.labic.net/wp-content/uploads/2016/06/compos_Malini_2016.pdf.

[11] CÔRTES, Thaísa G. et al. O #VemPraRua em dois ciclos: análise e comparação das manifestações no Brasil em 2013 e 2015. In: XXXIX Congresso Brasileiro de Ciências da Comunicação, 2016. São Paulo: Intercom – Sociedade Brasileira de Estudos Interdisciplinares da Comunicação. Disponível em: http://portalintercom.org.br/anais/nacional2016/resumos/R11-1938-1.pdf

Por Lucas Lago (lucas.lago@internetlab.org.br) e Heloisa Massaro (heloisa.massaro@internetlab.org.br). Colaborou Francisco Brito Cruz (francisco@internetlab.org.br).

NEWSLETTER