オプション
ニュース
世界のためのai、または西側だけですか?研究者がビッグテックのグローバルなギャップにどのように取り組んでいるか

世界のためのai、または西側だけですか?研究者がビッグテックのグローバルなギャップにどのように取り組んでいるか

2025年4月12日
77

世界のためのai、または西側だけですか?研究者がビッグテックのグローバルなギャップにどのように取り組んでいるか

Desde o lançamento do ChatGPT da Openai em 2022, a inteligência artificial (AI) se tecia profundamente no tecido de nossas vidas diárias. No entanto, os holofotes geralmente brilham em produtos de IA projetados com o público americano e europeu em mente, apesar das reivindicações de serem ferramentas universais que democratizam o acesso à tecnologia. A partir das aplicações que atendem aos idiomas que apóiam, essas ferramentas nem sempre são tão globais quanto parecem.

Na África, pesquisadores e tecnólogos estão recuando contra essa tendência, desafiando o status quo e a dinâmica mais ampla de poder na indústria de IA. O trabalho deles busca mudar o foco para soluções que realmente atendem às necessidades e comunidades locais.

Um desequilíbrio global de energia de IA

O Instituto de Pesquisa Distribuído de IA (Dair) é um farol de mudança, um coletivo internacional dedicado a "pesquisa de IA independente e com raízes comunitárias, livre da influência generalizada da Big Tech". Tive a oportunidade de falar com membros da Dair que estão criando soluções de IA adaptadas especificamente para contextos africanos, atendendo às necessidades da sociedade, e não aos interesses de empresas multinacionais ou usuários predominantemente ocidentais.

Nyalleng Moorosi, pesquisador sênior da Dair, com sede em Lesoto e membro fundador da Deep Learning Indaba, é um desses pioneiros. Sua formação em aprendizado de máquina e experiência no ensino nas escolas públicas sul -africanas moldou suas opiniões sobre a equidade em tecnologia. Como ex -educador da Universidade de Forte - uma das poucas universidades da África do Sul que admitiu estudantes negros durante o apartheid - ela viu em primeira mão como a pobreza afetou as jornadas educacionais dos alunos. "Foi impressionante imaginar fazer as coisas que fiz através de graduação e pós-graduação sobrecarregados por tanta insegurança", refletiu ela.

Após sua passagem pelo ensino, Moorosi se juntou ao Google como um dos primeiros funcionários do laboratório de pesquisa do Google Africa AI em Gana. Seu papel como engenheiro de software permitiu que ela desenvolvesse metodologias e tecnologias destinadas a garantir o desenvolvimento responsável da IA. "Entrei para o Google porque eles estavam construindo um escritório na África e queria estar na África", explicou Mooresi. "Eu não queria apenas ir ao Google. Eu queria ir ao Google Africa".

No entanto, uma conversa com Timnit Gebru, fundadora da Dair e um ex-co-líder da equipe ética da IA ​​do Google, levou a Mooresi a questionar se o Google era a plataforma certa para o tipo de trabalho focado em ações que ela imaginava no aprendizado de máquina. Isso a levou a se juntar à Dair, onde ela e Gebru procuraram capacitar as comunidades historicamente afastadas pela indústria de tecnologia, mantendo e financiando especialistas locais no terreno.

Estudo de IA da Dair

Em 2018, Moorosi, Gebru e Dair, Raesetje Sefala, embarcaram em um projeto para analisar imagens de satélite de municípios da África do Sul-bairros históricos da classe trabalhadora preenchidos por moradores negros. Seu objetivo era entender como essas áreas evoluíram desde o final do apartheid. Eles compilaram um conjunto de dados para avaliar se a qualidade de vida dos moradores do município havia melhorado ao longo do tempo.

Os municípios da África do Sul, localizados nos arredores das cidades, geralmente sofrem de subdesenvolvimento e condições de vida mais pobres em comparação aos subúrbios mais ricos. Os dados do censo do governo, que tendem a favorecer áreas mais abastadas, tornaram os dados do município quase invisíveis, perpetuando o apartheid espacial e o acesso limitando serviços essenciais, como assistência médica, educação e espaços verdes.

A pesquisa da Dair enfrentou desafios devido às limitações dos modelos de IA sul -africanos existentes, que lutavam para diferenciar municípios dos subúrbios. Para superar isso, os pesquisadores utilizaram milhões de imagens de satélite e dados geoespaciais para treinar modelos de aprendizado de máquina. Esses modelos categorizaram com sucesso as áreas em aglomerados de construção ricos, não-ricos e não residenciais, incluindo zonas terrestres ou industriais vagas.

Apesar desses esforços, a Dair enfrentou resistência ao tentar publicar suas descobertas. As instituições acadêmicas ocidentais predominantemente brancas criticaram o estudo como apenas uma pesquisa de aprendizado de máquinas, e não para aprendizado de máquina. Mooresi expressou frustração: "Usamos as mesmas métricas, algoritmos e métodos de comunicação, incluindo lotes e tudo. É tão louco porque muitos conjuntos de dados de brinquedos estavam sendo usados ​​na época, mas tínhamos esse conjunto de dados sobre coisas reais e era muito nicho".

No entanto, Moorosi enfatizou a relevância do estudo: "Esse rastreamento de como a segregação histórica afeta a forma como vivemos está presente em muitas colônias ex-britânicas. É em Nairóbi. Está em Lagos. Nas colônias, era o padrão que os brancos viviam lá e os negros viviam lá. E a distribuição dos recursos estava diferente entre lá.

Ela destacou que o conteúdo do estudo, e não sua qualidade, parecia minar seu reconhecimento em uma indústria dominada por ocidentais.

Fornecendo comunidades carentes

Asmelash Teka Hadgu, co-fundador e CTO de Lesan AI e um pesquisador da Dair, destacaram ainda mais esse ponto. Ele discutiu Lesan, uma ferramenta projetada para traduzir e transcrever idiomas africanos indígenas. Ao contrário dos gigantes de tecnologia dos EUA, Lesan AI se concentra em idiomas de baixo resistência, como Amharic e Tigrinya. A conexão pessoal de Hadgu com esses idiomas permitiu que ele construísse um conjunto de dados robusto usando o jornal local e o conteúdo de rádio local.

No contexto africano, modelos de idiomas populares de gigantes da tecnologia como OpenAI e Anthropic cai em representar a diversidade de paisagem linguística do continente. De acordo com o artigo de Wei Rui Chen, atrapalhando Babel: uma investigação sobre a capacidade de identificação de idiomas do ChatGPT, os idiomas africanos recebem o menor apoio. "O chatgpt do Openai está totalmente quebrado, não um pouco errado, mas criando sem sentido em idiomas como Amharic e Tigrini", observou Hadgu. "No entanto, eles ainda estão dobrando a maneira antiga de pensar que se concentra em soluções para o inglês primeiro. E assumindo que outros idiomas o alcançam".

Lesan pretende preencher essa lacuna, fornecendo traduções precisas para milhões de usuários, abrindo o conteúdo da Web para essas comunidades. Hadgu enfatizou que esses idiomas não são meros complementos: "Não gastamos 95% de nossos recursos em um punhado de idiomas e depois trabalhamos no que eles chamam de idiomas de cauda longa".

As empresas ocidentais de IA lutam para representar os idiomas de baixa resistência adequadamente, porque esses idiomas estão menos disponíveis para a eliminação de dados on-line, principalmente quando comparados ao conteúdo dominado por inglês. Além disso, os dados usados ​​para treinar os modelos de IA são predominantemente da Europa e da América do Norte, com apenas uma pequena fração proveniente da África, de acordo com um estudo da iniciativa de proveniência de dados.

Hadgu criticou a abordagem de projetos como o Language do Facebook deixado para trás, que ele descreveu como confiando na "conveniência" de eliminação de dados e métodos automatizados. Ele observou que os idiomas africanos recebem financiamento mínimo em comparação com iniciativas focadas em inglês. A Bloomberg relatou que a Orange SA, em colaboração com a Openai e a Meta Platforms Inc., está trabalhando para lidar com isso treinando programas de IA em idiomas africanos como Wooloof, Pulaar e Bambara.

No entanto, muitas línguas africanas dependem de sistemas tonais e tradições orais, que geralmente são negligenciadas pelo Western LLMS. Hadgu enfatizou a importância de envolver idosos e membros da comunidade para garantir uma representação precisa dos contextos locais.

Mesmo quando as grandes empresas de tecnologia colaboram com startups menores de IA para desenvolver modelos específicos de idiomas, elas geralmente exploram o trabalho de código aberto para capturar idéias e recursos. Georg Zoeller do Centro para Liderança de IA em Cingapura destacou esta edição: "Ao gerar abertura das ferramentas básicas para a IA, os hipercalers permitiram às startups construir produtos em campo e o usaram para substituir as equipes internas como a principal fonte de pesquisa e desenvolvimento do produto".

O Dr. Paul Azunre, co-fundador da Gana PNL, compartilhou sua experiência de grandes empresas caçando dados sem compensação. Depois que o Facebook usou seus dados para um modelo de código aberto, eles abordaram a PNL do Gana para obter propostas de financiamento. "Quando o Facebook chegou até nós depois que eles lançaram um modelo, que era de código aberto e foi construído sobre nossos dados. Então, eles estavam fazendo uma chamada aberta para propostas. Eles vieram até nós e disseram: 'Por que você não fez uma proposta de financiamento?' E dissemos: 'Bem, você já está usando nosso trabalho'. "Então, o que mais precisamos provar para você?

O Gana PNL se concentra em preencher a lacuna em produtos de software como o Google traduzem, desenvolvendo o reconhecimento de voz de voz, a conversão de texto e fala e fala em texto em idiomas locais como TWI, EWE, Yoruba, Fine e GA, com planos de expandir para os países vizinhos. Azunre emphasized the importance of prioritizing local communities: "As a developer who tries to make self-sustaining products, I am sympathetic to why certain products or projects are prioritized in a certain way. We are going to put out Twi first because in Ghana we have 30 million Twi speakers… but the difference between what we are doing and tech giants is for us, the guiding principle is the locals are top of mind."

Ele enfatizou a necessidade de manter empregos e controle de dados nas comunidades das quais o conhecimento é extraído, defendendo a soberania dos dados da comunidade e a criação de fontes de dados locais para capacitar as comunidades africanas e preservar suas identidades lingüísticas e culturais nas soluções de IA.

O que vem a seguir para a IA na África

O pesquisador de governança de tecnologia Chinasa T. Okolo observou que vários governos africanos estão desenvolvendo estruturas de governança de IA para combater a influência de empresas multinacionais. Sete países africanos redigiram estratégias nacionais de IA, embora nenhuma ainda tenha implementado estratégias formais de regulamentação de IA. O governo sul -africano divulgou uma estrutura de política nacional de IA para garantir o acesso equitativo às tecnologias de IA, particularmente em áreas carentes e rurais. Além disso, 36 países africanos estabeleceram regulamentos de proteção de dados, abrindo caminho para estruturas regulatórias de IA mais abrangentes.

Enquanto isso, as empresas ocidentais de IA estão começando a se concentrar nos LLMs específicos regionais, como o modelo de Mistral para países de língua árabe na região de Mena e a expansão da Meta AI da Meta para apoiar os usuários de língua árabe. No entanto, os paralelos entre extração colonial e tendências atuais de desenvolvimento de IA estão se tornando cada vez mais evidentes. Karen Hao, da MIT Tech Review, apontou: "Embora diminuísse a profundidade dos traumas do passado para dizer que a indústria da IA ​​está repetindo as modalidades exatas da violência colonial hoje, agora está usando outros meios mais insidiosos para enriquecer os ricos e poderosos às grandes despesas dos pobres".

関連記事
契約作成をClauseBuddyのAI搭載ツールで効率化 契約作成をClauseBuddyのAI搭載ツールで効率化 今日の急速に変化する法的環境では、効率性が成功を左右します。契約書の作成は時間がかかる作業ですが、AI搭載ツールが法務専門家や企業向けにプロセスを革新しています。この詳細なガイドでは、Microsoft Word用の先進的なAIアドインであるClauseBuddyを紹介します。これは、正確かつ迅速に契約書を作成するために設計されています。ClauseBuddyの強力な機能がどのように時間を節約し、
ブランドをTechCrunch Sessions: AIのサイドイベントで高める ブランドをTechCrunch Sessions: AIのサイドイベントで高める この6月、トップAIイノベーターたちがTC Sessions: AIに集結し、貴社のブランドが注目の的となる絶好の機会を提供します。6月1日から7日まで、TechCrunchはUCバークレーのゼラーバッハホールで6月5日に開催されるメインイベントと並行して、サイドイベントの1週間を主催します。独占的なミートアップ、ソートリーダーシップパネル、VIPレセプション、またはインタラクティブなデモなど、ダ
AI駆動のDocumindがドキュメント分析とチームコラボレーションを変革 AI駆動のDocumindがドキュメント分析とチームコラボレーションを変革 今日のダイナミックな職場環境では、重要な洞察を抽出するために長編PDFドキュメントをふるいにかけることは、困難で時間がかかる作業です。市場調査、業界出版物、トレーニングガイドのページをめくって単一のデータポイントを探す情景を想像してください。Documindは、ドキュメントとのインタラクションを革命的に変える革新的なAI駆動ツールです。研究を効率化し、コラボレーションを促進し、重要な情報への即時ア
コメント (40)
0/200
FrankRodriguez
FrankRodriguez 2025年4月13日 0:00:00 JST

I've been using this AI tool and honestly, it feels like it's missing the mark for non-Western users. It's great for English speakers, but where's the love for other languages and cultures? Could be more inclusive, you know? Step up your game!

IsabellaLevis
IsabellaLevis 2025年4月13日 0:00:00 JST

このAIツール、使ってみたけど、西洋以外のユーザーにはちょっと物足りない感じ。英語話者にはいいかもしれないけど、他の言語や文化への配慮が足りないよね。もっと包括的になってほしいな。頑張ってほしい!

JamesMiller
JamesMiller 2025年4月13日 0:00:00 JST

Usei essa ferramenta de IA e, sinceramente, parece que ela não atende bem aos usuários não ocidentais. É ótima para quem fala inglês, mas e o resto do mundo? Precisa ser mais inclusiva, né? Vamos lá, pode melhorar!

WillieJones
WillieJones 2025年4月13日 0:00:00 JST

He usado esta herramienta de IA y la verdad es que parece que no está pensada para usuarios no occidentales. Es genial para los que hablan inglés, pero ¿y el resto del mundo? Debería ser más inclusiva, ¿no crees? ¡A ver si se ponen las pilas!

ChristopherRamirez
ChristopherRamirez 2025年4月13日 0:00:00 JST

Tôi đã sử dụng công cụ AI này và thật sự cảm thấy nó không phù hợp với người dùng không phải phương Tây. Nó tốt cho người nói tiếng Anh, nhưng còn những ngôn ngữ và văn hóa khác thì sao? Cần phải bao quát hơn, bạn biết đấy? Cố lên!

ArthurJones
ArthurJones 2025年4月12日 0:00:00 JST

I find it super frustrating that most AI tools seem to cater only to Western audiences. It's like the rest of the world doesn't exist! This article really opened my eyes to the global gaps in AI. More focus on diverse cultures, please!

トップに戻ります
OR