MonitorA 2024 e o apagão de dados no Brasil

Terceira edição do observatório enfrenta problemas para coleta de dados e convida audiência a denunciar conteúdos alterados por Inteligência Artificial para atacar candidaturas.

Especial Desigualdades e Identidades 12.09.2024 por Fernanda K. Martins, Clarice Tavares, Alessandra Gomes e Ana Carolina Araújo

Em 2024, o MonitorA, observatório de violência política de gênero e raça – uma parceria do InternetLab, Instituto AzMina e Núcleo Jornalismo –  ocupa as redes novamente. Em sua terceira edição, o projeto enfrenta novos obstáculos. Em 2020, nosso principal desafio era demonstrar a existência da  violência política de gênero online – e  fizemos. Em 2022, aprofundamos a discussão sobre violência política versus liberdade de expressão, propondo uma metodologia mais robusta sobre  manutenção ou exclusão de conteúdos das redes. Agora, o nosso principal desafio está na falta de acesso a dados para realização da pesquisa.

Relembre as outras edições do MonitorA 
MonitorA 2020
MonitorA 2022

O “apagão de dados”, como algumas pesquisadoras e pesquisadores brasileiros têm nomeado, afeta amplamente as pesquisas sobre as dinâmicas sociais nas plataformas digitais. No caso do MonitorA, compromete a série histórica com os seguintes desafios: o fechamento do CrowdTangle, plataforma da Meta utilizada para realização de pesquisa, em 14 de agosto, e os valores exorbitantes cobrados pelo  o X, antigo Twitter, agora bloqueado no país, para fornecer acesso aos dados. Além disso, API do TikTok disponibilizou sua API  para Estados Unidos e Europa, e o Kwai não tem API aberta.

Nos anos anteriores, pudemos acessar os conteúdos ofensivos contra candidatas em coletas gratuitas pela API do Twitter, além de comentários do Instagram e do Facebook com técnicas de raspagem de dados. Além disso, tivemos acesso aos comentários nos canais das candidaturas acompanhadas no YouTube. Sem uma API do TikTok disponível, optamos por fazer uma etnografia online na rede de vídeos curtos. Em 2024, dentre as maiores plataformas presentes no cotidiano de brasileiras e brasileiros, só contamos com interfaces de pesquisa do YouTube e do Telegram.

Diante do atual cenário, remodelamos nossa metodologia para ampliar e adaptar nossa perspectiva. Mais uma vez, decidimos colocar o MonitorA nas redes, observatório que, por meio de pesquisa científica, tem servido de insumo para discussões dos setores público e privado. Nosso propósito é contribuir com a mitigação e enfrentamento da violência política por diferentes setores sociais, mesmo com a escassez de dados. 

Veja na tabela abaixo como as plataformas têm disponibilizado dados para pesquisadoras(es) no país.

Rede SocialTem API?Tipos de APIValorPlanos PagosChave de acessoPré-requisitoAções possíveis Obs
KwaiNão
Meta (Facebook e Instagram)Sim

Meta Content Library API
Gratuitohttps://developers.facebook.com/docs/content-library-api/get-access– Ter conta no Facebook e Instagram
– Ser vinculado  a alguma instituição de pesquisa
Permite a coleta de dados definidos como públicos de páginas, grupos, eventos, perfis, posts e comentários do Facebook.
Permite a coleta de dados definidos como públicos de criadores de conteúdo, business, um subconjunto de contas pessoais públicas e comentários.
– Link para aplicar para o acesso: https://somar.infoready4.com/#freeformCompetitionDetail/1910793
– Link com instruções sobre o processo de aplicação: https://docs.google.com/document/d/1iN4KOvFaYGZro23cB4j1FveouXMBcZnKl-yTUyx6fCg/edit#heading=h.kjlxxu2ilb35
TikTokSim– Research API
– Display API
-Commercial Content API
Gratuitohttps://developers.tiktok.com/doc/getting-started-create-an-appTer conta no TikTok

– A Research API permite a coleta mais completa: dados do usuário, vídeo, tamanho vídeo, geolocalização, data da publicação, hashtags. (https://developers.tiktok.com/doc/research-api-get-started)
– A Display API permite a coleta de vídeos e as quantidades de curtidas e comentários.
– A Commercial Content API permite a coleta de dados de anúncios: vídeos, alcance, período do anúncio e quem pagou pelo anúncio
A Research API é voltada apenas para pesquisadores dos EUA e Europa
X/TwitterSim– Versão Gratuita
– Basic
– Pro
– Enterprise
Gratuito e pago

– O Plano Basic custa $100/mês
– O Plano Pro custa $5000/mês
– O Enterprise aponta para um formulário para entrar em contato (https://docs.google.com/forms/d/e/1FAIpQLScO3bczKWO2jFHyVZJUSEGfdyfFaqt2MvmOfl_aJp0KxMqtDA/viewform)
https://developer.twitter.com/en/docs/twitter-api/getting-started/about-twitter-api

Ter conta no X/Twitter
– A versão gratuita não permite coleta de tweets
– O Plano Basic permite coletar 10.000 tweets por mês
– O Plano Pro permite coletar 1.000.000 tweets por mês
– O Enterprise aponta para um formulário para entrar em contato (https://docs.google.com/forms/d/e/1FAIpQLScO3bczKWO2jFHyVZJUSEGfdyfFaqt2MvmOfl_aJp0KxMqtDA/viewform)
– A versão gratuita permite automatização na publicação de tweets, mas não permite a coleta. Os planos pagos variam entre Basic, Pro e Enterprise.
– O Enterprise aponta para um formulário para entrar em contato (https://docs.google.com/forms/d/e/1FAIpQLScO3bczKWO2jFHyVZJUSEGfdyfFaqt2MvmOfl_aJp0KxMqtDA/viewform)
YouTubeSimYoutube API v3Gratuitohttps://developers.google.com/youtube/registering_an_application?hl=pt-br

Ter conta no Google (Gmail)
Permite a coleta de vídeos e dados dos vídeos (título dos vídeos, data de upload, legendas, duração do vídeo, idioma, etc) comentários, quantidade de likes, dados de canais, de playlists.– Não é possível coletar a quantidade de dislikes dos vídeos
– Os limites de uso da API são calculados de acordo com cotas. A tabela com os valores necessários para coleta ou upload de recursos está disponível em https://developers.google.com/youtube/v3/determine_quota_cost?hl=pt-br
Microsoft (LinkedIn)Sim

Linkedin possui API para 6 categorias: Consumer, Compliance, Learning, Marketing, Sales, and Talent Solutions. (https://learn.microsoft.com/en-us/linkedin/). Os acessos possuem a versão “self-serve” e “vetted” (https://www.linkedin.com/legal/l/api-terms-of-use). A versão self-serve é gratuita e basta ter uma conta no Linkedin para solicitar o acesso. A versão vetted oferece acessos mais privados e para conseguí-lo é necessário ser um Linkedin Partner (https://developer.linkedin.com/content/developer/global/en_us/index/partner-programs/apply)
Gratuitohttps://learn.microsoft.com/pt-br/linkedin/shared/authentication/getting-accessSelf-verse API: Ter conta no LinkedIn
Vetted API: ser Linkedin Partner
– Os limites de coleta não estão muito claros. A única definição mais exata identificada foi de no máximo 100 mil chamadas de API por dia.Link para aplicar para o Linkedin Partner: https://developer.linkedin.com/content/developer/global/en_us/index/partner-programs/apply
Meta (WhatsApp)SimBusiness APIGratuitohttps://business.facebook.com

Ter conta Whatsapp empresarial
Esta API é voltada para automação de marketing: coleta de dados de chatbot, envio automático de mensagens, e-commerce, embedar chat do app em website, etc.A API é gratuita, mas há um custo por mensagem automatizada enviada (chatbot).
– Marketing (oferta de produtos): $0.0625
– Utilitários (comunicação de transações comerciais, notificações, etc): $0.008
– Serviço (conversas iniciadas pelo usuário/cliente): $0.03
– Autenticação (envio de senhas ou códigos de autenticação): $0.0315
Os preços: https://business.whatsapp.com/products/platform-pricing?lang=pt_BR
TelegramSim– Telegram Bot API
– Telegram Database Library (TDLib)
GratuitoEnviar a mensagem “/newbot” para o bot @BotFather (https://t.me/botfather)

Ter conta no Telegram
– Bot API: API para criar bots
– TDLib: API para implementação de apps locais de mensagem
– Assim como Whatsapp, a API do Telegram é voltada para automatização de tarefas via bot. Não são focadas em fornecimento de dados para pesquisa ou análises
– Exemplo de uso da TDLib: uma empresa decide implementar um app corporativo, para troca de mensagens interna. Ao invés de criar um app do zero, ele utiliza os recursos da TDLib para criar este app.


Como funciona o MonitorA 2024

O MonitorA 2024 tem como foco as narrativas de violência política de gênero. Para isso, temos monitorado candidaturas para vereadoras, prefeitas e vice-prefeitas no YouTube e Telegram.  Adicionalmente, a fim de entender como Inteligência Artificial está sendo usada (ou não) como ferramenta  de violência política de gênero, temos mapeado casos de alteração de conteúdos que busquem atingir candidaturas a partir de deepfakes.

Diferentemente das edições anteriores, este ano não olhamos apenas para comentários direcionados às candidatas, mas também narrativas de gênero que envolvam as candidaturas e o debate político de forma mais ampla. Além dos comentários deixados nos canais das candidatas no YouTube, analisamos também interações em podcasts, entrevistas e sabatinas com as candidatas.

Avanços na técnica de produção do nosso léxico

Este ano, ampliamos a interdisciplinaridade do projeto, trazendo o apoio de Carolina González, mestre e doutora em Linguística pela Universidade de Brasília, para a construção do léxico. Sendo assim, o conjunto de termos analisados têm sido atualizado a partir dos dados das redes sociais analisadas (Telegram e YouTube), permitindo a identificação de termos mais específicos e mais comumente usados. 

Candidaturas selecionadas

Selecionamos todas as candidatas de capitais à prefeitura e vice-prefeitura; uma candidata à prefeitura e vice-prefeitura no interior de cada estado; 3 candidatas a vereadoras de cada estado. Para além da candidatura de mulheres, selecionamos 25 homens para grupo de controle (com foco em diversidade de marcadores sociais).  

Nossos requisitos para seleção das candidatas mulheres foram a busca por equilíbrio entre partidos de direita, centro e de esquerda; 50% de mulheres negras, quando possível, dentro de cada cargo; 30% com menos de 40 anos, e 10% ao menos para outros marcadores (identidade de gênero, orientação sexual, PCDs, mães).

Canais do YouTube 

Nem todas as candidaturas utilizam o YouTube, e mesmo se usam, pode haver poucos comentários nos vídeos postados. Para acessar mais dados, decidimos monitorar comentários  feitos em alguns debates políticos com candidatas e candidatos ao Executivo municipal. 

Para além das sabatinas, temos coletado dados de entrevistas e participação das candidaturas monitoradas em podcasts. A partir de uma coleta automatizada com as  palavras-chave “candidata” e “podcast”, identificamos 18 podcasts em que candidatas deram entrevistas.

Canais do Telegram 

Para o monitoramento no Telegram, trabalhamos em parceria com o UFBA Digital Humanities Laboratory – LABHDUFBA, monitorando em fluxo contínuo de canais de extremistas na plataforma, a partir da coleta de mensagens com menção às candidaturas monitoradas e ao léxico construído.

Mapeamento do uso de IA nas eleições

O mapeamento do uso malicioso de Inteligência Artificial (IA) nas eleições ocorre a partir de parcerias com checadoras de fato, mapeamento de matérias jornalísticas de diferentes veículos do país, sempre que mencionam casos como esses. Também temos  canais de diálogo com candidaturas de todo o país, que podem contribuir conosco através de um chatbot no Telegram, conduzido pela AzMina, em que as próprias candidatas podem encaminhar casos de deepfake.

O MonitorA precisa de você!

Apesar de termos remodelado nossa metodologia, nós precisamos de você nessa edição! Criamos esse formulário para receber denúncias! Por favor, envie para nós casos suspeitos de uso de IA para prática de violência política de gênero contra candidatas e candidatos. Como uma tecnologia nova, apesar dos nossos esforços, está sendo difícil acessar esses casos. Pedimos também que nos envie conteúdos nas plataformas TikTok, Kwai, Instagram e Facebook que você identifique como violência política! 

Todas as denúncias serão analisadas, categorizadas e encaminhadas às plataformas. 

Contamos com você para manter o nosso projeto robusto e de impacto!

Não perca as próximas notícias do MonitorA, as nossas análises estão a todo vapor e traremos novidades em breve!

compartilhe