![](https://internetlab.org.br/wp-content/uploads/2022/10/wordcloud_amostra_v2.jpg)
Embate entre quem defendia e ofendia nordestinos abriu espaços para alegações de fraudes das eleições no Twitter
Levantamento realizado pelo IntenetLab que analisou tuítes que mencionavam Nordeste e nordestinos no dia seguinte ao primeiro turno indica circulação de desinformação sobre o sistema eleitoral.
Nos dias seguintes ao primeiro turno das eleições gerais de 2022, ofensas com conteúdo xenofóbico e narrativas contrárias ao nordeste e aos nordestinos foram recorrentes no Twitter. Essa onda de comentários xenofóbicos suscitaram algumas questões: qual a prevalência de conteúdo ofensivo contra a região na plataforma? Como se dá a relação entre as diferentes regiões do país no que tange os resultados eleitorais? Como discussões mais amplas sobre a corrida eleitoral podem ter feito parte do ataque ao Nordeste?
Para avaliar o debate sobre preconceitos regionais e eleições no Brasil, o InternetLab realizou um levantamento sobre as narrativas e ofensas sobre o Nordeste nas eleições de 2022. Foram coletados 150.867 tuítes do dia 03 de outubro, dia seguinte ao primeiro turno das eleições, que faziam referência ao eleitorado nordestino. Para a coleta, foi desenvolvido um léxico de termos sobre a região, como “nordestina/o” e “nordeste”, e termos potencialmente ofensivos, como, por exemplo: “merdestino”, “baiano burro” e “paraíba burro”. O léxico foi desenvolvido a partir de pesquisas exploratórias no Twitter. A partir dos quase 150 mil tuítes, foi aplicado o método estatístico de amostragem para calcular um tamanho menor e válido do conjunto de dados. Com margem de erro de 3% para mais ou para menos e nível de confiança de 95% chegamos a uma amostra aleatória de 1060 tuítes. Esses tuítes foram analisados manualmente por cinco pesquisadoras do InternetLab que classificaram se o tuíte era ou não ofensivo e qual narrativa o tuíte construía.
Estima-se que, no dia seguinte ao primeiro turno, 19,4% dos tuítes que mencionam os termos “nordestina/o”, “nordeste” ou termos potencialmente ofensivos contra a região direcionaram ataques e ofensas aos nordestinos. 13,4% dos tuítes analisados na amostra traziam, ainda, alegações de fraude nas eleições.
![](https://internetlab.org.br/wp-content/uploads/2022/10/tuites-ofensivos.png)
Entre os principais assuntos que circularam no Twitter no dia 03 de outubro estavam os debates sobre xenofobia, orgulho de ser nordestino(a), fraude, a culpa dos nordestinos pelos resultados das eleições, pobreza, fome e água , como demonstra a nuvem de palavras da amostra de tuítes analisados.
![](https://internetlab.org.br/wp-content/uploads/2022/10/wordcloud_amostra_v2-1-1024x637.jpg)
Saída em defesa do nordeste: orgulho nordestino e denúncia de xenofobia
A coleta dos dados sugere que as ofensas direcionadas aos(às) nordestinos(as) no Twitter cresciam na mesma proporção em que cresciam tuítes em defesa do nordeste. Da amostra analisada, 21,03% dos tuítes eram favoráveis ao Nordeste, somando tuítes de pessoas nordestinas que demonstravam orgulho da sua origem e da sua região, e de pessoas de outras regiões que saíam em defesa do Nordeste, frente aos ataques e ofensas xenofóbicas.
![](https://internetlab.org.br/wp-content/uploads/2022/10/1-4-1024x1024.png)
Os tuítes em defesa do Nordeste variavam desde pessoas alinhadas ao PT e às pautas de esquerda, até mesmo ao usuários alinhados ao bolsonarismo e ao governo, que afirmavam que os nordestinos não tinham culpa pelos resultados das eleições do primeiro turno, como demonstra o seguinte tuíte:
![](https://internetlab.org.br/wp-content/uploads/2022/10/2-4-1024x1024.png)
![](https://internetlab.org.br/wp-content/uploads/2022/10/2-5-1024x1024.png)
Foram identificados também conteúdos que apontavam criticamente para os casos de xenofobia que circulavam nas redes. Da amostra analisada, 15% dos tuítes eram de denúncias, críticas ou apontamentos de casos de xenofobia. Muitos faziam referência a casos de xenofobia sofridos pelos próprios usuários (vide imagem 4) ou continham um posicionamento contrário à xenofobia, apontando o comportamento como um crime (vide imagem 5 e 6).
![](https://internetlab.org.br/wp-content/uploads/2022/10/2-6-1024x1024.png)
![](https://internetlab.org.br/wp-content/uploads/2022/10/2-7-1024x1024.png)
![](https://internetlab.org.br/wp-content/uploads/2022/10/2-8-1024x1024.png)
Circulação de desinformação: as alegações de fraude eleitoral no Nordeste
Entre as principais narrativas que circularam no Twitter no dia seguinte às eleições estava o questionamento à lisura do voto nordestino. Na amostra analisada, 13,40% dos tuítes afirmavam que os resultados das eleições no Nordeste foram fraudados. Em muitos dos tuítes, alegava-se que uma suposta ausência de comemorações e de festas seria uma comprovação da fraude (vide imagem 7). Em outros, o número de deputados ou senadores bolsonaristas ou alinhados ao Bolsonaro eleitos era o suficiente para comprovar a fraude no resultado das eleições presidenciais.
![](https://internetlab.org.br/wp-content/uploads/2022/10/2-9-1024x1024.png)
No corpus analisado, houve uma sobreposição entre os debates sobre fraude e sobre defesa do eleitorado nordestino. (vide imagem 8).
![](https://internetlab.org.br/wp-content/uploads/2022/10/2-10-1024x1024.png)
As principais narrativas contra o nordeste
Alegações de que o Nordeste não sabe votar ou de que os eleitores nordestinos eram manipulados pela esquerda e pelo PT apareceram em 8,87% dos tuítes analisados (vide imagem 9 e 10). 6,7% dos tuítes faziam referência a miséria ou pobreza dos estados nordestinos, e afirmavam que os nordestinos migravam para o Sul e Sudeste porque fugiam da situação de pobreza que os próprios nordestinos criam com suas más escolhas políticas(vide imagem 11). Em 3,3% do material analisado, nordestinos eram chamados de burros (vide imagem 12). A pauta de separação do Nordeste do resto do país foi levantado em 4,43% dos tuítes analisados (vide imagem 13). Em relação à separação do Nordeste, foram encontrados, de um lado, tuítes de apoiadores do ex-presidente Lula, que consideram os votos dos nordestinos como melhores e, por isso, querem separar o Nordeste, que é entendida como “uma região superior”. Por outro lado, parte dos tuítes de apoiadores de Bolsonaro afirmam querer separar o Nordeste, por ser uma região que inferior que não sabe escolher os políticos.
![](https://internetlab.org.br/wp-content/uploads/2022/10/2-11-1024x1024.png)
![](https://internetlab.org.br/wp-content/uploads/2022/10/2-12-1024x1024.png)
![](https://internetlab.org.br/wp-content/uploads/2022/10/2-13-1024x1024.png)
![](https://internetlab.org.br/wp-content/uploads/2022/10/2-14-1024x1024.png)
![](https://internetlab.org.br/wp-content/uploads/2022/10/2-15-1024x1024.png)
Metodologia e informações sobre o conjunto de dados
Em relação aos 150 mil tuítes coletados, foram identificados tuítes de aproximadamente 105 mil usuários. O alto número de usuários demonstra que diversas pessoas se engajaram neste debate . Entretanto, ressalta-se que não foi feita uma análise para saber se havia bots nesta diversidade de usuários.
Dos 150 mil tuítes coletados, as palavras mais recorrentes foram: nordeste, nordestin(o|a|os|as), povo, Lula, Brasil e Bolsonaro. Além dessas, as palavras abaixo apareceram em quase 90% dos tuítes coletados, ordenadas em grau de frequência, das mais frequentes às menos frequentes: Sul, xenofobia, Sudeste, orgulho, vergonha, contra, esquerda, fraude, vida, água, deus, norte, fome, pobre, culpa.
Dos 150 mil tuítes coletados, os usuários mais citados foram Rodrigo Constantino e a Juliette:
![](https://internetlab.org.br/wp-content/uploads/2022/10/uigju.png)
As 10 hashtags mais usadas, dentre os 150 mil tuítes coletados foram as seguintes:
![](https://internetlab.org.br/wp-content/uploads/2022/10/quintaidade.png)
Uma rápida análise na linha do tempo mostra que o debate que pareceu ter perdido a força mais cedo foi relacionado a uma possível fraude nas urnas, o que explicaria a vitória do Lula no Nordeste. Os outros debates, que envolviam ofensas e defesas, demoraram um pouco mais para perder a força, entretanto mantiveram volume de publicações equiparados com o passar das horas.
Lista das narrativas identificadas nos tuítes
![](https://internetlab.org.br/wp-content/uploads/2022/10/dxxrx.png)
Metodologia
- Metodologia da coleta de tuítes:
Foram coletados tuítes desta data que possuíam uma ou mais palavras do léxico. A coleta foi realizada com uso da linguagem de programação Python e biblioteca Tweepy.
- Metodologia da amostragem:
Dado o grande volume de dados coletados, foi aplicado o método estatístico de amostragem para calcular um tamanho menor e válido de conjunto de dados. Assim, para um nível de confiança de 95% e margem de erro de 3%, o tamanho da amostra foi definido em 1060 tuítes. Para otimizar a seleção dos 1060 tuítes que formariam esta amostra, foi aplicado previamente um algoritmo de clusterização de texto para agrupar os tuítes de acordo com o grau de similaridade entre eles. O algoritmo identificou e agrupou estes tuítes em quatro grupos. Dessa forma, o conjunto amostral final foi formado por seleções aleatórias de 265 tuítes de cada um desses grupos (265 * 4 = 1060).
A clusterização foi feita com os algoritmos Transformers Sentence Embedding e Complete Linkage. O cálculo da amostragem foi feito com a Fórmula de Amostragem para População Finita.