옵션
소식
세계를위한 AI, 또는 서쪽에? 연구원들이 Big Tech의 글로벌 격차를 해결하는 방법

세계를위한 AI, 또는 서쪽에? 연구원들이 Big Tech의 글로벌 격차를 해결하는 방법

2025년 4월 12일
77

세계를위한 AI, 또는 서쪽에? 연구원들이 Big Tech의 글로벌 격차를 해결하는 방법

Desde o lançamento do ChatGPT da Openai em 2022, a inteligência artificial (AI) se tecia profundamente no tecido de nossas vidas diárias. No entanto, os holofotes geralmente brilham em produtos de IA projetados com o público americano e europeu em mente, apesar das reivindicações de serem ferramentas universais que democratizam o acesso à tecnologia. A partir das aplicações que atendem aos idiomas que apóiam, essas ferramentas nem sempre são tão globais quanto parecem.

Na África, pesquisadores e tecnólogos estão recuando contra essa tendência, desafiando o status quo e a dinâmica mais ampla de poder na indústria de IA. O trabalho deles busca mudar o foco para soluções que realmente atendem às necessidades e comunidades locais.

Um desequilíbrio global de energia de IA

O Instituto de Pesquisa Distribuído de IA (Dair) é um farol de mudança, um coletivo internacional dedicado a "pesquisa de IA independente e com raízes comunitárias, livre da influência generalizada da Big Tech". Tive a oportunidade de falar com membros da Dair que estão criando soluções de IA adaptadas especificamente para contextos africanos, atendendo às necessidades da sociedade, e não aos interesses de empresas multinacionais ou usuários predominantemente ocidentais.

Nyalleng Moorosi, pesquisador sênior da Dair, com sede em Lesoto e membro fundador da Deep Learning Indaba, é um desses pioneiros. Sua formação em aprendizado de máquina e experiência no ensino nas escolas públicas sul -africanas moldou suas opiniões sobre a equidade em tecnologia. Como ex -educador da Universidade de Forte - uma das poucas universidades da África do Sul que admitiu estudantes negros durante o apartheid - ela viu em primeira mão como a pobreza afetou as jornadas educacionais dos alunos. "Foi impressionante imaginar fazer as coisas que fiz através de graduação e pós-graduação sobrecarregados por tanta insegurança", refletiu ela.

Após sua passagem pelo ensino, Moorosi se juntou ao Google como um dos primeiros funcionários do laboratório de pesquisa do Google Africa AI em Gana. Seu papel como engenheiro de software permitiu que ela desenvolvesse metodologias e tecnologias destinadas a garantir o desenvolvimento responsável da IA. "Entrei para o Google porque eles estavam construindo um escritório na África e queria estar na África", explicou Mooresi. "Eu não queria apenas ir ao Google. Eu queria ir ao Google Africa".

No entanto, uma conversa com Timnit Gebru, fundadora da Dair e um ex-co-líder da equipe ética da IA ​​do Google, levou a Mooresi a questionar se o Google era a plataforma certa para o tipo de trabalho focado em ações que ela imaginava no aprendizado de máquina. Isso a levou a se juntar à Dair, onde ela e Gebru procuraram capacitar as comunidades historicamente afastadas pela indústria de tecnologia, mantendo e financiando especialistas locais no terreno.

Estudo de IA da Dair

Em 2018, Moorosi, Gebru e Dair, Raesetje Sefala, embarcaram em um projeto para analisar imagens de satélite de municípios da África do Sul-bairros históricos da classe trabalhadora preenchidos por moradores negros. Seu objetivo era entender como essas áreas evoluíram desde o final do apartheid. Eles compilaram um conjunto de dados para avaliar se a qualidade de vida dos moradores do município havia melhorado ao longo do tempo.

Os municípios da África do Sul, localizados nos arredores das cidades, geralmente sofrem de subdesenvolvimento e condições de vida mais pobres em comparação aos subúrbios mais ricos. Os dados do censo do governo, que tendem a favorecer áreas mais abastadas, tornaram os dados do município quase invisíveis, perpetuando o apartheid espacial e o acesso limitando serviços essenciais, como assistência médica, educação e espaços verdes.

A pesquisa da Dair enfrentou desafios devido às limitações dos modelos de IA sul -africanos existentes, que lutavam para diferenciar municípios dos subúrbios. Para superar isso, os pesquisadores utilizaram milhões de imagens de satélite e dados geoespaciais para treinar modelos de aprendizado de máquina. Esses modelos categorizaram com sucesso as áreas em aglomerados de construção ricos, não-ricos e não residenciais, incluindo zonas terrestres ou industriais vagas.

Apesar desses esforços, a Dair enfrentou resistência ao tentar publicar suas descobertas. As instituições acadêmicas ocidentais predominantemente brancas criticaram o estudo como apenas uma pesquisa de aprendizado de máquinas, e não para aprendizado de máquina. Mooresi expressou frustração: "Usamos as mesmas métricas, algoritmos e métodos de comunicação, incluindo lotes e tudo. É tão louco porque muitos conjuntos de dados de brinquedos estavam sendo usados ​​na época, mas tínhamos esse conjunto de dados sobre coisas reais e era muito nicho".

No entanto, Moorosi enfatizou a relevância do estudo: "Esse rastreamento de como a segregação histórica afeta a forma como vivemos está presente em muitas colônias ex-britânicas. É em Nairóbi. Está em Lagos. Nas colônias, era o padrão que os brancos viviam lá e os negros viviam lá. E a distribuição dos recursos estava diferente entre lá.

Ela destacou que o conteúdo do estudo, e não sua qualidade, parecia minar seu reconhecimento em uma indústria dominada por ocidentais.

Fornecendo comunidades carentes

Asmelash Teka Hadgu, co-fundador e CTO de Lesan AI e um pesquisador da Dair, destacaram ainda mais esse ponto. Ele discutiu Lesan, uma ferramenta projetada para traduzir e transcrever idiomas africanos indígenas. Ao contrário dos gigantes de tecnologia dos EUA, Lesan AI se concentra em idiomas de baixo resistência, como Amharic e Tigrinya. A conexão pessoal de Hadgu com esses idiomas permitiu que ele construísse um conjunto de dados robusto usando o jornal local e o conteúdo de rádio local.

No contexto africano, modelos de idiomas populares de gigantes da tecnologia como OpenAI e Anthropic cai em representar a diversidade de paisagem linguística do continente. De acordo com o artigo de Wei Rui Chen, atrapalhando Babel: uma investigação sobre a capacidade de identificação de idiomas do ChatGPT, os idiomas africanos recebem o menor apoio. "O chatgpt do Openai está totalmente quebrado, não um pouco errado, mas criando sem sentido em idiomas como Amharic e Tigrini", observou Hadgu. "No entanto, eles ainda estão dobrando a maneira antiga de pensar que se concentra em soluções para o inglês primeiro. E assumindo que outros idiomas o alcançam".

Lesan pretende preencher essa lacuna, fornecendo traduções precisas para milhões de usuários, abrindo o conteúdo da Web para essas comunidades. Hadgu enfatizou que esses idiomas não são meros complementos: "Não gastamos 95% de nossos recursos em um punhado de idiomas e depois trabalhamos no que eles chamam de idiomas de cauda longa".

As empresas ocidentais de IA lutam para representar os idiomas de baixa resistência adequadamente, porque esses idiomas estão menos disponíveis para a eliminação de dados on-line, principalmente quando comparados ao conteúdo dominado por inglês. Além disso, os dados usados ​​para treinar os modelos de IA são predominantemente da Europa e da América do Norte, com apenas uma pequena fração proveniente da África, de acordo com um estudo da iniciativa de proveniência de dados.

Hadgu criticou a abordagem de projetos como o Language do Facebook deixado para trás, que ele descreveu como confiando na "conveniência" de eliminação de dados e métodos automatizados. Ele observou que os idiomas africanos recebem financiamento mínimo em comparação com iniciativas focadas em inglês. A Bloomberg relatou que a Orange SA, em colaboração com a Openai e a Meta Platforms Inc., está trabalhando para lidar com isso treinando programas de IA em idiomas africanos como Wooloof, Pulaar e Bambara.

No entanto, muitas línguas africanas dependem de sistemas tonais e tradições orais, que geralmente são negligenciadas pelo Western LLMS. Hadgu enfatizou a importância de envolver idosos e membros da comunidade para garantir uma representação precisa dos contextos locais.

Mesmo quando as grandes empresas de tecnologia colaboram com startups menores de IA para desenvolver modelos específicos de idiomas, elas geralmente exploram o trabalho de código aberto para capturar idéias e recursos. Georg Zoeller do Centro para Liderança de IA em Cingapura destacou esta edição: "Ao gerar abertura das ferramentas básicas para a IA, os hipercalers permitiram às startups construir produtos em campo e o usaram para substituir as equipes internas como a principal fonte de pesquisa e desenvolvimento do produto".

O Dr. Paul Azunre, co-fundador da Gana PNL, compartilhou sua experiência de grandes empresas caçando dados sem compensação. Depois que o Facebook usou seus dados para um modelo de código aberto, eles abordaram a PNL do Gana para obter propostas de financiamento. "Quando o Facebook chegou até nós depois que eles lançaram um modelo, que era de código aberto e foi construído sobre nossos dados. Então, eles estavam fazendo uma chamada aberta para propostas. Eles vieram até nós e disseram: 'Por que você não fez uma proposta de financiamento?' E dissemos: 'Bem, você já está usando nosso trabalho'. "Então, o que mais precisamos provar para você?

O Gana PNL se concentra em preencher a lacuna em produtos de software como o Google traduzem, desenvolvendo o reconhecimento de voz de voz, a conversão de texto e fala e fala em texto em idiomas locais como TWI, EWE, Yoruba, Fine e GA, com planos de expandir para os países vizinhos. Azunre emphasized the importance of prioritizing local communities: "As a developer who tries to make self-sustaining products, I am sympathetic to why certain products or projects are prioritized in a certain way. We are going to put out Twi first because in Ghana we have 30 million Twi speakers… but the difference between what we are doing and tech giants is for us, the guiding principle is the locals are top of mind."

Ele enfatizou a necessidade de manter empregos e controle de dados nas comunidades das quais o conhecimento é extraído, defendendo a soberania dos dados da comunidade e a criação de fontes de dados locais para capacitar as comunidades africanas e preservar suas identidades lingüísticas e culturais nas soluções de IA.

O que vem a seguir para a IA na África

O pesquisador de governança de tecnologia Chinasa T. Okolo observou que vários governos africanos estão desenvolvendo estruturas de governança de IA para combater a influência de empresas multinacionais. Sete países africanos redigiram estratégias nacionais de IA, embora nenhuma ainda tenha implementado estratégias formais de regulamentação de IA. O governo sul -africano divulgou uma estrutura de política nacional de IA para garantir o acesso equitativo às tecnologias de IA, particularmente em áreas carentes e rurais. Além disso, 36 países africanos estabeleceram regulamentos de proteção de dados, abrindo caminho para estruturas regulatórias de IA mais abrangentes.

Enquanto isso, as empresas ocidentais de IA estão começando a se concentrar nos LLMs específicos regionais, como o modelo de Mistral para países de língua árabe na região de Mena e a expansão da Meta AI da Meta para apoiar os usuários de língua árabe. No entanto, os paralelos entre extração colonial e tendências atuais de desenvolvimento de IA estão se tornando cada vez mais evidentes. Karen Hao, da MIT Tech Review, apontou: "Embora diminuísse a profundidade dos traumas do passado para dizer que a indústria da IA ​​está repetindo as modalidades exatas da violência colonial hoje, agora está usando outros meios mais insidiosos para enriquecer os ricos e poderosos às grandes despesas dos pobres".

관련 기사
계약 초안 작성을 ClauseBuddy의 AI 기반 도구로 간소화 계약 초안 작성을 ClauseBuddy의 AI 기반 도구로 간소화 오늘날 빠르게 변화하는 법률 환경에서 효율성은 성공을 이끄는 핵심입니다. 계약서를 작성하는 것은 시간이 많이 걸리는 작업일 수 있지만, AI 기반 도구는 법률 전문가와 기업의 프로세스를 혁신하고 있습니다. 이 상세한 가이드는 Microsoft Word용 최첨단 AI 애드인인 ClauseBuddy를 소개하며, 정밀하게 계약 작성을 가속화하도록 설계되었습니다.
브랜드를 높이다 TechCrunch Sessions: AI 사이드 이벤트 브랜드를 높이다 TechCrunch Sessions: AI 사이드 이벤트 이번 6월, 최고의 AI 혁신가들이 TC Sessions: AI에 모여 여러분의 브랜드가 주목받을 수 있는 최고의 기회를 제공합니다.6월 1일부터 7일까지, TechCrunch는 UC Berkeley의 Zellerbach Hall에서 6월 5일 메인 이벤트를 중심으로 일주일 동안 사이드 이벤트를 개최합니다. 독점적인 모임, 사상 리더십 패널, VIP 리셉션
AI 기반 Documind가 문서 분석과 팀 협업을 혁신하다 AI 기반 Documind가 문서 분석과 팀 협업을 혁신하다 오늘날의 역동적인 업무 환경에서 긴 PDF 문서에서 핵심 통찰력을 추출하는 것은 어렵고 시간이 많이 걸리는 작업일 수 있습니다. 시장 조사, 산업 간행물, 또는 교육 자료의 페이지를 뒤지며 단일 데이터 포인트를 찾는 상황을 상상해보세요. Documind는 문서 상호작용을 혁신적으로 변화시키기 위해 설계된 AI 기반 도구입니다. 연구를 간소화하고 협업을 촉진
의견 (40)
0/200
FrankRodriguez
FrankRodriguez 2025년 4월 13일 오전 12시 0분 0초 GMT+09:00

I've been using this AI tool and honestly, it feels like it's missing the mark for non-Western users. It's great for English speakers, but where's the love for other languages and cultures? Could be more inclusive, you know? Step up your game!

IsabellaLevis
IsabellaLevis 2025년 4월 13일 오전 12시 0분 0초 GMT+09:00

このAIツール、使ってみたけど、西洋以外のユーザーにはちょっと物足りない感じ。英語話者にはいいかもしれないけど、他の言語や文化への配慮が足りないよね。もっと包括的になってほしいな。頑張ってほしい!

JamesMiller
JamesMiller 2025년 4월 13일 오전 12시 0분 0초 GMT+09:00

Usei essa ferramenta de IA e, sinceramente, parece que ela não atende bem aos usuários não ocidentais. É ótima para quem fala inglês, mas e o resto do mundo? Precisa ser mais inclusiva, né? Vamos lá, pode melhorar!

WillieJones
WillieJones 2025년 4월 13일 오전 12시 0분 0초 GMT+09:00

He usado esta herramienta de IA y la verdad es que parece que no está pensada para usuarios no occidentales. Es genial para los que hablan inglés, pero ¿y el resto del mundo? Debería ser más inclusiva, ¿no crees? ¡A ver si se ponen las pilas!

ChristopherRamirez
ChristopherRamirez 2025년 4월 13일 오전 12시 0분 0초 GMT+09:00

Tôi đã sử dụng công cụ AI này và thật sự cảm thấy nó không phù hợp với người dùng không phải phương Tây. Nó tốt cho người nói tiếng Anh, nhưng còn những ngôn ngữ và văn hóa khác thì sao? Cần phải bao quát hơn, bạn biết đấy? Cố lên!

ArthurJones
ArthurJones 2025년 4월 12일 오전 12시 0분 0초 GMT+09:00

I find it super frustrating that most AI tools seem to cater only to Western audiences. It's like the rest of the world doesn't exist! This article really opened my eyes to the global gaps in AI. More focus on diverse cultures, please!

위로 돌아갑니다
OR