opção
Lar
Notícias
Ai para o mundo, ou apenas o oeste? Como os pesquisadores estão enfrentando lacunas globais da Big Tech

Ai para o mundo, ou apenas o oeste? Como os pesquisadores estão enfrentando lacunas globais da Big Tech

12 de Abril de 2025
109

Ai para o mundo, ou apenas o oeste? Como os pesquisadores estão enfrentando lacunas globais da Big Tech

Desde o lançamento do ChatGPT da OpenAI em 2022, a inteligência artificial (AI) se integrou profundamente ao tecido de nossas vidas diárias. No entanto, o destaque frequentemente recai sobre produtos de AI projetados com o público americano e europeu em mente, apesar das alegações de serem ferramentas universais que democratizam o acesso à tecnologia. Desde as aplicações que atendem até as línguas que suportam, essas ferramentas nem sempre são tão globais quanto parecem.

Em toda a África, pesquisadores e tecnólogos estão reagindo contra essa tendência, desafiando o status quo e a dinâmica de poder mais ampla dentro da indústria de AI. Seu trabalho busca mudar o foco para soluções que realmente atendam às necessidades e comunidades locais.

Um Desequilíbrio Global de Poder em AI

O Instituto de Pesquisa em AI Distribuída (DAIR) se destaca como um farol de mudança, um coletivo internacional dedicado à "pesquisa em AI independente e enraizada na comunidade, livre da influência generalizada das grandes empresas de tecnologia". Tive a oportunidade de conversar com membros do DAIR que estão desenvolvendo soluções de AI adaptadas especificamente para contextos africanos, abordando necessidades sociais em vez dos interesses de corporações multinacionais ou usuários predominantemente ocidentais.

Nyalleng Moorosi, pesquisadora sênior no DAIR baseada em Lesoto e membro fundador do Deep Learning Indaba, é uma dessas pioneiras. Sua experiência em aprendizado de máquina e ensino em escolas públicas sul-africanas moldou suas visões sobre equidade em tecnologia. Como ex-educadora na Universidade de Forte — uma das poucas universidades na África do Sul que admitia estudantes negros durante o apartheid — ela viu em primeira mão como a pobreza afetava as jornadas educacionais dos alunos. "Era incompreensível imaginar fazer as coisas que fiz durante a graduação e pós-graduação sobrecarregada por tanta insegurança", ela refletiu.

Após sua passagem como professora, Moorosi ingressou no Google como uma das primeiras funcionárias do laboratório de pesquisa em AI do Google África em Gana. Sua função como engenheira de software permitiu que ela desenvolvesse metodologias e tecnologias destinadas a garantir o desenvolvimento responsável de AI. "Entrei no Google porque eles estavam construindo um escritório na África, e eu queria estar na África", explicou Moorosi. "Eu não queria apenas ir para o Google. Eu queria ir para o Google África."

No entanto, uma conversa com Timnit Gebru, fundadora do DAIR e ex-co-líder da equipe de ética em AI do Google, levou Moorosi a questionar se o Google era a plataforma certa para o tipo de trabalho focado em equidade que ela imaginava no aprendizado de máquina. Isso a levou a se juntar ao DAIR, onde ela e Gebru buscaram empoderar comunidades historicamente marginalizadas pela indústria de tecnologia, mantendo e financiando especialistas locais no terreno.

Estudo de AI do DAIR

Em 2018, Moorosi, Gebru e a colega do DAIR Raesetje Sefala embarcaram em um projeto para analisar imagens de satélite de townships sul-africanos — bairros historicamente de classe trabalhadora povoados por residentes negros. Seu objetivo era entender como essas áreas haviam evoluído desde o fim do apartheid. Eles compilaram um conjunto de dados para avaliar se a qualidade de vida dos residentes dos townships havia melhorado ao longo do tempo.

Os townships sul-africanos, localizados nos arredores das cidades, frequentemente sofrem com subdesenvolvimento e condições de vida mais precárias em comparação com subúrbios mais ricos. Os dados do censo do governo, que tendem a favorecer áreas mais abastadas, tornaram os dados dos townships quase invisíveis, perpetuando o apartheid espacial e limitando o acesso a serviços essenciais como saúde, educação e espaços verdes.

A pesquisa do DAIR enfrentou desafios devido às limitações dos modelos de AI sul-africanos existentes, que tinham dificuldade em diferenciar townships de subúrbios. Para superar isso, os pesquisadores utilizaram milhões de imagens de satélite e dados geoespaciais para treinar modelos de aprendizado de máquina. Esses modelos conseguiram categorizar áreas em clusters de construções ricas, não ricas e não residenciais, incluindo terrenos vagos ou zonas industriais.

Apesar desses esforços, o DAIR enfrentou resistência ao tentar publicar suas descobertas. Instituições acadêmicas predominantemente brancas do Ocidente criticaram o estudo como sendo apenas geográfico, em vez de pesquisa em aprendizado de máquina. Moorosi expressou frustração: "Usamos as mesmas métricas, algoritmos e métodos de comunicação, incluindo gráficos e tudo mais. É tão louco porque muitos conjuntos de dados de brinquedo estavam sendo usados na época, mas tínhamos esse conjunto de dados sobre coisas reais, e ele era considerado muito nichado."

Ainda assim, Moorosi destacou a relevância do estudo: "Esse rastreamento de como a segregação histórica afeta como vivemos está presente em muitas ex-colônias britânicas. Está em Nairóbi. Está em Lagos. Nas colônias, era padrão que os brancos viviam ali e os negros viviam lá. E a distribuição de recursos era diferente entre ali e lá."

Ela destacou que o conteúdo do estudo, mais do que sua qualidade, parecia minar seu reconhecimento em uma indústria dominada pelo Ocidente.

Provisão para Comunidades Mal Atendidas

Asmelash Teka Hadgu, cofundador e CTO da Lesan AI e pesquisador do DAIR, reforçou esse ponto. Ele discutiu o Lesan, uma ferramenta projetada para traduzir e transcrever línguas indígenas africanas. Diferentemente das gigantes de tecnologia baseadas nos EUA, a Lesan AI foca em línguas de baixo recurso, como amárico e tigrínia. A conexão pessoal de Hadgu com essas línguas permitiu que ele construísse um conjunto de dados robusto usando conteúdo de jornais e rádios locais reaproveitados.

No contexto africano, modelos de linguagem populares de gigantes de tecnologia como OpenAI e Anthropic falham em representar a paisagem linguística diversa do continente. De acordo com o artigo de Wei Rui Chen, Fumbling in Babel: An Investigation into ChatGPT's Language Identification Ability, as línguas africanas recebem o menor suporte. "O ChatGPT da OpenAI está completamente quebrado, não apenas um pouco errado, mas criando gibberish em línguas como amárico e tigrínia", observou Hadgu. "Ainda assim, eles continuam dobrando a aposta naquela velha maneira de pensar que se centra em encontrar soluções para o inglês primeiro. E presumindo que outras línguas vão acompanhar."

O Lesan visa preencher essa lacuna, fornecendo traduções precisas para milhões de usuários, abrindo o conteúdo da web para essas comunidades. Hadgu enfatizou que essas línguas não são meros complementos: "Não gastamos 95% dos nossos recursos em um punhado de línguas e depois trabalhamos no que eles chamam de línguas de cauda longa."

Empresas de AI ocidentais enfrentam dificuldades para representar adequadamente línguas de baixo recurso porque essas línguas estão menos disponíveis para raspagem de dados online, especialmente em comparação com o conteúdo dominado pelo inglês. Além disso, os dados usados para treinar modelos de AI vêm predominantemente da Europa e da América do Norte, com apenas uma pequena fração vinda da África, de acordo com um estudo da Iniciativa de Proveniência de Dados.

Hadgu criticou a abordagem de projetos como o No Language Left Behind do Facebook, que ele descreveu como dependente de raspagem de dados de "conveniência" e métodos automatizados. Ele observou que as línguas africanas recebem financiamento mínimo em comparação com iniciativas focadas no inglês. A Bloomberg relatou que a Orange SA, em colaboração com a OpenAI e a Meta Platforms Inc., está trabalhando para abordar isso treinando programas de AI em línguas africanas como Woolof, Pulaar e Bambara.

No entanto, muitas línguas africanas dependem de sistemas tonais e tradições orais, que frequentemente são negligenciadas pelos LLMs ocidentais. Hadgu enfatizou a importância de envolver anciãos e membros da comunidade para garantir uma representação precisa dos contextos locais.

Mesmo quando grandes empresas de tecnologia colaboram com startups de AI menores para desenvolver modelos específicos para línguas, elas frequentemente exploram o trabalho de código aberto para capturar ideias e recursos. Georg Zoeller, do Centro de Liderança em AI em Singapura, destacou essa questão: "Ao abrir o código das ferramentas básicas de AI, as hyperscalers permitiram que startups construíssem produtos no campo e os usaram para substituir equipes internas como a principal fonte de P&D de produtos."

O Dr. Paul Azunre, cofundador da Ghana NLP, compartilhou sua experiência de grandes empresas apropriando-se de dados sem compensação. Após o Facebook usar seus dados para um modelo de código aberto, eles abordaram a Ghana NLP para propostas de financiamento. "Uma vez o Facebook veio até nós depois que lançaram um modelo, que era de código aberto e foi construído com nossos dados. Depois, eles estavam fazendo uma chamada aberta para propostas. Eles vieram até nós e disseram, 'Por que vocês não apresentam uma proposta para financiamento?' E nós dissemos, 'Bem, vocês já estão usando nosso trabalho.' 'Então, o que mais precisamos provar para vocês? Apenas nos paguem,'" relatou Azunre.

A Ghana NLP foca em preencher a lacuna em produtos de software como o Google Translate, desenvolvendo reconhecimento de voz, texto para fala e tradução de fala para texto em línguas locais como Twi, Ewe, Yoruba, Fante e Ga, com planos de expandir para países vizinhos. Azunre enfatizou a importância de priorizar as comunidades locais: "Como desenvolvedor que tenta criar produtos autossustentáveis, sou simpático ao motivo pelo qual certos produtos ou projetos são priorizados de certa forma. Vamos lançar o Twi primeiro porque em Gana temos 30 milhões de falantes de Twi… mas a diferença entre o que estamos fazendo e as gigantes de tecnologia é que, para nós, o princípio orientador é que os locais estão em primeiro plano."

Ele destacou a necessidade de manter empregos e controle de dados dentro das comunidades das quais o conhecimento é extraído, defendendo a soberania de dados da comunidade e a criação de fontes de dados locais para empoderar as comunidades africanas e preservar suas identidades linguísticas e culturais em soluções de AI.

O Que Vem a Seguir para a AI na África

A pesquisadora de governança de tecnologia Chinasa T. Okolo observou que vários governos africanos estão desenvolvendo estruturas de governança de AI para combater a influência de corporações multinacionais. Sete países africanos elaboraram estratégias nacionais de AI, embora nenhum tenha implementado estratégias formais de regulação de AI ainda. O governo sul-africano lançou uma Estrutura Nacional de Política de AI para garantir acesso equitativo às tecnologias de AI, particularmente em áreas carentes e rurais. Além disso, 36 países africanos estabeleceram regulamentações de proteção de dados, pavimentando o caminho para estruturas regulatórias de AI mais abrangentes.

Enquanto isso, empresas de AI ocidentais estão começando a focar em LLMs específicos para regiões, como o modelo da Mistral para países de língua árabe na região do MENA e a expansão da Meta AI para suportar usuários de língua árabe. No entanto, os paralelos entre a extração colonial e as tendências atuais de desenvolvimento de AI estão se tornando cada vez mais evidentes. Karen Hao, do MIT Tech Review, apontou: "Embora diminua a profundidade dos traumas passados dizer que a indústria de AI está repetindo as exatas modalidades de violência colonial hoje, ela agora está usando outros meios, mais insidiosos, para enriquecer os ricos e poderosos às custas dos pobres."

Artigo relacionado
Escapadas na praia do Havaí: Novos vínculos e reviravoltas surpreendentes Escapadas na praia do Havaí: Novos vínculos e reviravoltas surpreendentes Imagine-se em uma praia imaculada do Havaí, com a luz do sol aquecendo sua pele e as ondas criando um ritmo relaxante. Para Josh, essa visão se tornou realidade após anos de dedicação. O que começa c
Vídeo animado 'Crazy Train' de Ozzy Osbourne: Um mergulho profundo em sua arte e impacto Vídeo animado 'Crazy Train' de Ozzy Osbourne: Um mergulho profundo em sua arte e impacto "Crazy Train", de Ozzy Osbourne, transcende seu status de clássico do heavy metal, incorporando um marco cultural. Seu videoclipe animado oferece uma jornada visual impressionante que amplifica a ene
EleutherAI Revela Conjunto de Dados de Texto Licenciado Massivo para Treinamento de IA EleutherAI Revela Conjunto de Dados de Texto Licenciado Massivo para Treinamento de IA EleutherAI, um grupo líder em pesquisa de IA, lançou uma das maiores coleções de texto licenciado e de domínio aberto para treinamento de modelos de IA.Chamado de Common Pile v0.1, este conjunto de da
Comentários (42)
0/200
WillieJohnson
WillieJohnson 26 de Agosto de 2025 à25 06:25:25 WEST

AI's global reach sounds grand, but it’s mostly a Western party. Cool to see researchers poking at Big Tech's blind spots—hope they dig deeper! 🌍

DavidLewis
DavidLewis 4 de Agosto de 2025 à0 07:01:00 WEST

It's wild how AI like ChatGPT seems so universal but mostly caters to Western vibes. Kinda makes you wonder if the 'global' tag is just marketing fluff. Are we ever gonna see AI that truly gets the rest of the world? 🤔

JustinJackson
JustinJackson 23 de Abril de 2025 à47 19:47:47 WEST

AI para o mundo ou só para o Ocidente? É legal que a AI esteja em todos os lugares agora, mas por que parece sempre feita para americanos e europeus? Queria que focassem mais em torná-la realmente global. Ainda assim, é um passo na direção certa! 🌍👀

WilliamAllen
WilliamAllen 22 de Abril de 2025 à38 20:37:38 WEST

AI for the world? More like AI for the West! It's cool that AI is everywhere now, but why does it always seem tailored for American and European folks? I wish there was more focus on making it truly global. Still, it's a step in the right direction! 🌍👀

CharlesWhite
CharlesWhite 22 de Abril de 2025 à35 03:11:35 WEST

¡Lectura interesante sobre el impacto global de la IA! Es genial ver a los investigadores abordando las brechas en la tecnología, pero es frustrante ver tanto enfoque aún en Occidente. Necesitamos más herramientas diseñadas para todos, no solo para los sospechosos habituales. ¡Sigan empujando por una IA verdaderamente global, chicos! 🌍

JackPerez
JackPerez 21 de Abril de 2025 à34 19:15:34 WEST

Leitura interessante sobre o impacto global da IA! É ótimo ver pesquisadores abordando as lacunas na tecnologia, mas é frustrante ver tanto foco ainda no Ocidente. Precisamos de mais ferramentas projetadas para todos, não apenas para os suspeitos habituais. Continuem empurrando por uma IA verdadeiramente global, pessoal! 🌍

De volta ao topo
OR