option
Maison
Nouvelles
AI pour le monde, ou juste l'Occident? Comment les chercheurs s'attaquent aux lacunes mondiales de Big Tech

AI pour le monde, ou juste l'Occident? Comment les chercheurs s'attaquent aux lacunes mondiales de Big Tech

12 avril 2025
109

AI pour le monde, ou juste l'Occident? Comment les chercheurs s'attaquent aux lacunes mondiales de Big Tech

Depuis le lancement de ChatGPT d'OpenAI en 2022, l'intelligence artificielle (AI) s'est profondément intégrée dans le tissu de nos vies quotidiennes. Cependant, les projecteurs se concentrent souvent sur les produits AI conçus pour les publics américain et européen, malgré les prétentions à être des outils universels qui démocratisent l'accès à la technologie. Des applications qu'ils servent aux langues qu'ils soutiennent, ces outils ne sont pas toujours aussi mondiaux qu'ils le paraissent.

À travers l'Afrique, les chercheurs et technologues s'opposent à cette tendance, remettant en question le statu quo et les dynamiques de pouvoir plus larges au sein de l'industrie de l'AI. Leur travail vise à recentrer l'attention sur des solutions qui répondent véritablement aux besoins et aux communautés locales.

Un déséquilibre mondial du pouvoir en AI

L'Institut de Recherche en AI Distribuée (DAIR) se dresse comme un phare de changement, un collectif international dédié à la "recherche en AI indépendante et ancrée dans la communauté, libre de l'influence omniprésente des grandes entreprises technologiques". J'ai eu l'opportunité de discuter avec des membres de DAIR qui développent des solutions AI spécifiquement adaptées aux contextes africains, répondant aux besoins sociétaux plutôt qu'aux intérêts des multinationales ou des utilisateurs principalement occidentaux.

Nyalleng Moorosi, une chercheuse senior à DAIR basée au Lesotho et membre fondatrice de Deep Learning Indaba, est l'une de ces pionnières. Son expérience en apprentissage automatique et son enseignement dans les écoles publiques sud-africaines ont façonné ses vues sur l'équité en technologie. En tant qu'ancienne éducatrice à l'Université de Forte—l'une des rares universités en Afrique du Sud à admettre des étudiants noirs pendant l'apartheid—elle a constaté de première main comment la pauvreté affectait les parcours éducatifs des étudiants. "Il était stupéfiant d'imaginer faire ce que j'ai fait pendant mes études de premier cycle et de troisième cycle, accablée par tant d'insécurité," a-t-elle réfléchi.

Après son passage dans l'enseignement, Moorosi a rejoint Google en tant que l'une des premières employées du laboratoire de recherche en AI de Google Africa au Ghana. Son rôle d'ingénieure logicielle lui a permis de développer des méthodologies et des technologies visant à assurer un développement responsable de l'AI. "J'ai rejoint Google parce qu'ils construisaient un bureau en Afrique, et je voulais être en Afrique," a expliqué Moorosi. "Je ne voulais pas juste aller chez Google. Je voulais aller chez Google Africa."

Cependant, une conversation avec Timnit Gebru, fondatrice de DAIR et ancienne co-responsable de l'équipe d'éthique en AI de Google, a conduit Moorosi à se demander si Google était la bonne plateforme pour le type de travail axé sur l'équité qu'elle envisageait en apprentissage automatique. Cela l'a amenée à rejoindre DAIR, où elle et Gebru ont cherché à autonomiser les communautés historiquement marginalisées par l'industrie technologique en gardant et en finançant des experts locaux sur le terrain.

L'étude AI de DAIR

En 2018, Moorosi, Gebru et la collègue de DAIR Raesetje Sefala se sont lancées dans un projet pour analyser les images satellites des townships sud-africains—des quartiers historiquement ouvriers peuplés de résidents noirs. Leur objectif était de comprendre comment ces zones avaient évolué depuis la fin de l'apartheid. Elles ont compilé un ensemble de données pour évaluer si la qualité de vie des résidents des townships s'était améliorée au fil du temps.

Les townships sud-africains, situés en périphérie des villes, souffrent souvent d'un sous-développement et de conditions de vie plus précaires par rapport aux banlieues plus riches. Les données du recensement gouvernemental, qui privilégient les zones plus aisées, ont rendu les données des townships presque invisibles, perpétuant un apartheid spatial et limitant l'accès à des services essentiels comme la santé, l'éducation et les espaces verts.

La recherche de DAIR a rencontré des défis en raison des limitations des modèles AI sud-africains existants, qui peinaient à différencier les townships des banlieues. Pour surmonter cela, les chercheurs ont utilisé des millions d'images satellites et de données géospatiales pour entraîner des modèles d'apprentissage automatique. Ces modèles ont réussi à classer les zones en clusters de bâtiments riches, non riches et non résidentiels, y compris les terrains vacants ou les zones industrielles.

Malgré ces efforts, DAIR a rencontré de la résistance lors de la tentative de publication de leurs résultats. Les institutions académiques occidentales, majoritairement blanches, ont critiqué l'étude comme étant purement géographique plutôt que relevant de la recherche en apprentissage automatique. Moorosi a exprimé sa frustration : "Nous utilisons les mêmes métriques, algorithmes et méthodes de communication, y compris les graphiques et tout. C'est tellement fou parce que de nombreux ensembles de données jouets étaient utilisés à l'époque, mais nous avions cet ensemble de données sur des choses réelles, et il était trop niche."

Pourtant, Moorosi a souligné la pertinence de l'étude : "Ce suivi de la manière dont la ségrégation historique affecte notre façon de vivre est présent dans de nombreuses anciennes colonies britanniques. C'est à Nairobi. C'est à Lagos. Dans les colonies, il était standard que les blancs vivaient ici et les noirs vivaient là. Et la répartition des ressources était différente entre ici et là."

Elle a souligné que le contenu de l'étude, plutôt que sa qualité, semblait nuire à sa reconnaissance dans une industrie dominée par l'Occident.

Fournir aux communautés mal desservies

Asmelash Teka Hadgu, co-fondateur et directeur technique de Lesan AI et chercheur à DAIR, a further renforcé ce point. Il a discuté de Lesan, un outil conçu pour traduire et transcrire les langues africaines indigènes. Contrairement aux géants technologiques basés aux États-Unis, Lesan AI se concentre sur les langues à faible ressource comme l'amharique et le tigrinya. La connexion personnelle de Hadgu avec ces langues lui a permis de construire un ensemble de données robuste en utilisant du contenu de journaux locaux et de radios réutilisés.

Dans le contexte africain, les modèles de langage populaires des géants technologiques comme OpenAI et Anthropic ne parviennent pas à représenter le paysage linguistique diversifié du continent. Selon l'article de Wei Rui Chen, *Fumbling in Babel: An Investigation into ChatGPT's Language Identification Ability*, les langues africaines reçoivent le moins de soutien. "ChatGPT d'OpenAI est complètement défaillant, pas légèrement erroné, mais produit du charabia dans des langues comme l'amharique et le tigrinya," a noté Hadgu. "Pourtant, ils continuent de s'appuyer sur cette vieille manière de penser qui se concentre sur la recherche de solutions pour l'anglais d'abord. Et en supposant que les autres langues suivront."

Lesan vise à combler cet écart en fournissant des traductions précises pour des millions d'utilisateurs, ouvrant ainsi le contenu web à ces communautés. Hadgu a souligné que ces langues ne sont pas de simples ajouts : "Nous ne dépensons pas 95 % de nos ressources sur une poignée de langues pour ensuite travailler sur ce qu'ils appellent des langues à longue traîne."

Les entreprises AI occidentales peinent à représenter adéquatement les langues à faible ressource car ces langues sont moins disponibles pour le scraping de données en ligne, particulièrement par rapport au contenu dominé par l'anglais. De plus, les données utilisées pour entraîner les modèles AI proviennent principalement d'Europe et d'Amérique du Nord, avec seulement une petite fraction provenant d'Afrique, selon une étude de l'Initiative de Provenance des Données.

Hadgu a critiqué l'approche des projets comme *No Language Left Behind* de Facebook, qu'il a décrit comme reposant sur le scraping de données de "convenance" et des méthodes automatisées. Il a noté que les langues africaines reçoivent un financement minimal par rapport aux initiatives axées sur l'anglais. Bloomberg a rapporté qu'Orange SA, en collaboration avec OpenAI et Meta Platforms Inc., travaille à résoudre ce problème en entraînant des programmes AI sur des langues africaines comme le wolof, le pulaar et le bambara.

Cependant, de nombreuses langues africaines reposent sur des systèmes tonals et des traditions orales, souvent négligées par les LLM occidentaux. Hadgu a souligné l'importance d'impliquer les anciens et les membres de la communauté pour garantir une représentation précise des contextes locaux.

Même lorsque les grandes entreprises technologiques collaborent avec de petites startups AI pour développer des modèles spécifiques à une langue, elles exploitent souvent le travail open-source pour capter des idées et des ressources. Georg Zoeller du Centre for AI Leadership à Singapour a mis en lumière ce problème : "En rendant open-source les outils de base pour l'AI, les hyperscalers ont permis aux startups de développer des produits dans ce domaine et les ont utilisés pour remplacer les équipes internes comme principale source de R&D produit."

Dr. Paul Azunre, co-fondateur de Ghana NLP, a partagé son expérience des grandes entreprises qui s'approprient des données sans compensation. Après que Facebook a utilisé leurs données pour un modèle open-source, ils ont approché Ghana NLP pour des propositions de financement. "Une fois, Facebook est venu vers nous après avoir publié un modèle, qui était open-source et construit sur nos données. Ensuite, ils ont lancé un appel ouvert à propositions. Ils sont venus vers nous et ont dit, 'Pourquoi ne pas soumettre une proposition de financement ?' Et nous avons dit, 'Eh bien, vous utilisez déjà notre travail.' 'Alors, que devons-nous encore prouver ? Payez-nous simplement,'" a raconté Azunre.

Ghana NLP se concentre sur combler le vide dans les produits logiciels comme Google Translate en développant la reconnaissance vocale, la synthèse vocale et la traduction texte-parole dans des langues locales comme le twi, l'ewe, le yoruba, le fante et le ga, avec des plans pour s'étendre aux pays voisins. Azunre a souligné l'importance de prioriser les communautés locales : "En tant que développeur qui essaie de créer des produits autosuffisants, je comprends pourquoi certains produits ou projets sont priorisés d'une certaine manière. Nous allons sortir le twi en premier parce qu'au Ghana, nous avons 30 millions de locuteurs twi… mais la différence entre ce que nous faisons et les géants technologiques, c'est que pour nous, le principe directeur est que les locaux sont la priorité."

Il a souligné la nécessité de maintenir les emplois et le contrôle des données au sein des communautés d'où les connaissances sont extraites, plaidant pour la souveraineté des données communautaires et la création de sources de données locales pour autonomiser les communautés africaines et préserver leurs identités linguistiques et culturelles dans les solutions AI.

L'avenir de l'AI en Afrique

La chercheuse en gouvernance technologique Chinasa T. Okolo a noté que plusieurs gouvernements africains développent des cadres de gouvernance de l'AI pour contrer l'influence des multinationales. Sept pays africains ont rédigé des stratégies nationales en AI, bien qu'aucun n'ait encore mis en œuvre de stratégies formelles de régulation de l'AI. Le gouvernement sud-africain a publié un Cadre de Politique Nationale en AI pour garantir un accès équitable aux technologies AI, en particulier dans les zones mal desservies et rurales. De plus, 36 pays africains ont établi des réglementations sur la protection des données, ouvrant la voie à des cadres réglementaires AI plus complets.

Pendant ce temps, les entreprises AI occidentales commencent à se concentrer sur des LLM spécifiques à une région, comme le modèle de Mistral pour les pays arabophones de la région MENA et l'expansion de Meta AI pour soutenir les utilisateurs arabophones. Cependant, les parallèles entre l'extraction coloniale et les tendances actuelles du développement de l'AI deviennent de plus en plus évidents. Karen Hao du MIT Tech Review a souligné : "Bien que cela réduirait la profondeur des traumatismes passés de dire que l'industrie de l'AI répète exactement les modalités de la violence coloniale aujourd'hui, elle utilise maintenant d'autres moyens, plus insidieux, pour enrichir les riches et puissants au détriment des pauvres."

Article connexe
Escapades sur la plage d'Hawaï : Nouveaux liens et virages surprenants Escapades sur la plage d'Hawaï : Nouveaux liens et virages surprenants Imaginez-vous sur une plage hawaïenne immaculée, la lumière du soleil réchauffant votre peau, les vagues créant un rythme apaisant. Pour Josh, cette vision est devenue réalité après des années de dév
La vidéo animée La vidéo animée "Crazy Train" d'Ozzy Osbourne : Une plongée en profondeur dans son art et son impact Crazy Train" d'Ozzy Osbourne transcende son statut de classique du heavy metal et incarne un jalon culturel. Son vidéoclip animé offre un voyage visuel saisissant qui amplifie l'énergie brute et la p
EleutherAI Dévoile un Ensemble de Données Textuelles Sous Licence Massive pour l'Entraînement d'IA EleutherAI Dévoile un Ensemble de Données Textuelles Sous Licence Massive pour l'Entraînement d'IA EleutherAI, un groupe de recherche en IA de premier plan, a lancé l'une des plus grandes collections de textes sous licence et en domaine public pour l'entraînement de modèles d'IA.Nommé le Common Pil
commentaires (42)
0/200
WillieJohnson
WillieJohnson 26 août 2025 07:25:25 UTC+02:00

AI's global reach sounds grand, but it’s mostly a Western party. Cool to see researchers poking at Big Tech's blind spots—hope they dig deeper! 🌍

DavidLewis
DavidLewis 4 août 2025 08:01:00 UTC+02:00

It's wild how AI like ChatGPT seems so universal but mostly caters to Western vibes. Kinda makes you wonder if the 'global' tag is just marketing fluff. Are we ever gonna see AI that truly gets the rest of the world? 🤔

JustinJackson
JustinJackson 23 avril 2025 20:47:47 UTC+02:00

AI para o mundo ou só para o Ocidente? É legal que a AI esteja em todos os lugares agora, mas por que parece sempre feita para americanos e europeus? Queria que focassem mais em torná-la realmente global. Ainda assim, é um passo na direção certa! 🌍👀

WilliamAllen
WilliamAllen 22 avril 2025 21:37:38 UTC+02:00

AI for the world? More like AI for the West! It's cool that AI is everywhere now, but why does it always seem tailored for American and European folks? I wish there was more focus on making it truly global. Still, it's a step in the right direction! 🌍👀

CharlesWhite
CharlesWhite 22 avril 2025 04:11:35 UTC+02:00

¡Lectura interesante sobre el impacto global de la IA! Es genial ver a los investigadores abordando las brechas en la tecnología, pero es frustrante ver tanto enfoque aún en Occidente. Necesitamos más herramientas diseñadas para todos, no solo para los sospechosos habituales. ¡Sigan empujando por una IA verdaderamente global, chicos! 🌍

JackPerez
JackPerez 21 avril 2025 20:15:34 UTC+02:00

Leitura interessante sobre o impacto global da IA! É ótimo ver pesquisadores abordando as lacunas na tecnologia, mas é frustrante ver tanto foco ainda no Ocidente. Precisamos de mais ferramentas projetadas para todos, não apenas para os suspeitos habituais. Continuem empurrando por uma IA verdadeiramente global, pessoal! 🌍

Retour en haut
OR