
Embate entre quem defendia e ofendia nordestinos abriu espaços para alegações de fraudes das eleições no Twitter
Levantamento realizado pelo IntenetLab que analisou tuítes que mencionavam Nordeste e nordestinos no dia seguinte ao primeiro turno indica circulação de desinformação sobre o sistema eleitoral.
Nos dias seguintes ao primeiro turno das eleições gerais de 2022, ofensas com conteúdo xenofóbico e narrativas contrárias ao nordeste e aos nordestinos foram recorrentes no Twitter. Essa onda de comentários xenofóbicos suscitaram algumas questões: qual a prevalência de conteúdo ofensivo contra a região na plataforma? Como se dá a relação entre as diferentes regiões do país no que tange os resultados eleitorais? Como discussões mais amplas sobre a corrida eleitoral podem ter feito parte do ataque ao Nordeste?
Para avaliar o debate sobre preconceitos regionais e eleições no Brasil, o InternetLab realizou um levantamento sobre as narrativas e ofensas sobre o Nordeste nas eleições de 2022. Foram coletados 150.867 tuítes do dia 03 de outubro, dia seguinte ao primeiro turno das eleições, que faziam referência ao eleitorado nordestino. Para a coleta, foi desenvolvido um léxico de termos sobre a região, como “nordestina/o” e “nordeste”, e termos potencialmente ofensivos, como, por exemplo: “merdestino”, “baiano burro” e “paraíba burro”. O léxico foi desenvolvido a partir de pesquisas exploratórias no Twitter. A partir dos quase 150 mil tuítes, foi aplicado o método estatístico de amostragem para calcular um tamanho menor e válido do conjunto de dados. Com margem de erro de 3% para mais ou para menos e nível de confiança de 95% chegamos a uma amostra aleatória de 1060 tuítes. Esses tuítes foram analisados manualmente por cinco pesquisadoras do InternetLab que classificaram se o tuíte era ou não ofensivo e qual narrativa o tuíte construía.
Estima-se que, no dia seguinte ao primeiro turno, 19,4% dos tuítes que mencionam os termos “nordestina/o”, “nordeste” ou termos potencialmente ofensivos contra a região direcionaram ataques e ofensas aos nordestinos. 13,4% dos tuítes analisados na amostra traziam, ainda, alegações de fraude nas eleições.

Entre os principais assuntos que circularam no Twitter no dia 03 de outubro estavam os debates sobre xenofobia, orgulho de ser nordestino(a), fraude, a culpa dos nordestinos pelos resultados das eleições, pobreza, fome e água , como demonstra a nuvem de palavras da amostra de tuítes analisados.

Saída em defesa do nordeste: orgulho nordestino e denúncia de xenofobia
A coleta dos dados sugere que as ofensas direcionadas aos(às) nordestinos(as) no Twitter cresciam na mesma proporção em que cresciam tuítes em defesa do nordeste. Da amostra analisada, 21,03% dos tuítes eram favoráveis ao Nordeste, somando tuítes de pessoas nordestinas que demonstravam orgulho da sua origem e da sua região, e de pessoas de outras regiões que saíam em defesa do Nordeste, frente aos ataques e ofensas xenofóbicas.

Os tuítes em defesa do Nordeste variavam desde pessoas alinhadas ao PT e às pautas de esquerda, até mesmo ao usuários alinhados ao bolsonarismo e ao governo, que afirmavam que os nordestinos não tinham culpa pelos resultados das eleições do primeiro turno, como demonstra o seguinte tuíte:


Foram identificados também conteúdos que apontavam criticamente para os casos de xenofobia que circulavam nas redes. Da amostra analisada, 15% dos tuítes eram de denúncias, críticas ou apontamentos de casos de xenofobia. Muitos faziam referência a casos de xenofobia sofridos pelos próprios usuários (vide imagem 4) ou continham um posicionamento contrário à xenofobia, apontando o comportamento como um crime (vide imagem 5 e 6).



Circulação de desinformação: as alegações de fraude eleitoral no Nordeste
Entre as principais narrativas que circularam no Twitter no dia seguinte às eleições estava o questionamento à lisura do voto nordestino. Na amostra analisada, 13,40% dos tuítes afirmavam que os resultados das eleições no Nordeste foram fraudados. Em muitos dos tuítes, alegava-se que uma suposta ausência de comemorações e de festas seria uma comprovação da fraude (vide imagem 7). Em outros, o número de deputados ou senadores bolsonaristas ou alinhados ao Bolsonaro eleitos era o suficiente para comprovar a fraude no resultado das eleições presidenciais.

No corpus analisado, houve uma sobreposição entre os debates sobre fraude e sobre defesa do eleitorado nordestino. (vide imagem 8).

As principais narrativas contra o nordeste
Alegações de que o Nordeste não sabe votar ou de que os eleitores nordestinos eram manipulados pela esquerda e pelo PT apareceram em 8,87% dos tuítes analisados (vide imagem 9 e 10). 6,7% dos tuítes faziam referência a miséria ou pobreza dos estados nordestinos, e afirmavam que os nordestinos migravam para o Sul e Sudeste porque fugiam da situação de pobreza que os próprios nordestinos criam com suas más escolhas políticas(vide imagem 11). Em 3,3% do material analisado, nordestinos eram chamados de burros (vide imagem 12). A pauta de separação do Nordeste do resto do país foi levantado em 4,43% dos tuítes analisados (vide imagem 13). Em relação à separação do Nordeste, foram encontrados, de um lado, tuítes de apoiadores do ex-presidente Lula, que consideram os votos dos nordestinos como melhores e, por isso, querem separar o Nordeste, que é entendida como “uma região superior”. Por outro lado, parte dos tuítes de apoiadores de Bolsonaro afirmam querer separar o Nordeste, por ser uma região que inferior que não sabe escolher os políticos.





Metodologia e informações sobre o conjunto de dados
Em relação aos 150 mil tuítes coletados, foram identificados tuítes de aproximadamente 105 mil usuários. O alto número de usuários demonstra que diversas pessoas se engajaram neste debate . Entretanto, ressalta-se que não foi feita uma análise para saber se havia bots nesta diversidade de usuários.
Dos 150 mil tuítes coletados, as palavras mais recorrentes foram: nordeste, nordestin(o|a|os|as), povo, Lula, Brasil e Bolsonaro. Além dessas, as palavras abaixo apareceram em quase 90% dos tuítes coletados, ordenadas em grau de frequência, das mais frequentes às menos frequentes: Sul, xenofobia, Sudeste, orgulho, vergonha, contra, esquerda, fraude, vida, água, deus, norte, fome, pobre, culpa.
Dos 150 mil tuítes coletados, os usuários mais citados foram Rodrigo Constantino e a Juliette:

As 10 hashtags mais usadas, dentre os 150 mil tuítes coletados foram as seguintes:

Uma rápida análise na linha do tempo mostra que o debate que pareceu ter perdido a força mais cedo foi relacionado a uma possível fraude nas urnas, o que explicaria a vitória do Lula no Nordeste. Os outros debates, que envolviam ofensas e defesas, demoraram um pouco mais para perder a força, entretanto mantiveram volume de publicações equiparados com o passar das horas.
Lista das narrativas identificadas nos tuítes

Metodologia
- Metodologia da coleta de tuítes:
Foram coletados tuítes desta data que possuíam uma ou mais palavras do léxico. A coleta foi realizada com uso da linguagem de programação Python e biblioteca Tweepy.
- Metodologia da amostragem:
Dado o grande volume de dados coletados, foi aplicado o método estatístico de amostragem para calcular um tamanho menor e válido de conjunto de dados. Assim, para um nível de confiança de 95% e margem de erro de 3%, o tamanho da amostra foi definido em 1060 tuítes. Para otimizar a seleção dos 1060 tuítes que formariam esta amostra, foi aplicado previamente um algoritmo de clusterização de texto para agrupar os tuítes de acordo com o grau de similaridade entre eles. O algoritmo identificou e agrupou estes tuítes em quatro grupos. Dessa forma, o conjunto amostral final foi formado por seleções aleatórias de 265 tuítes de cada um desses grupos (265 * 4 = 1060).
A clusterização foi feita com os algoritmos Transformers Sentence Embedding e Complete Linkage. O cálculo da amostragem foi feito com a Fórmula de Amostragem para População Finita.