オプション
ニュース
世界のためのai、または西側だけですか?研究者がビッグテックのグローバルなギャップにどのように取り組んでいるか

世界のためのai、または西側だけですか?研究者がビッグテックのグローバルなギャップにどのように取り組んでいるか

2025年4月12日
109

世界のためのai、または西側だけですか?研究者がビッグテックのグローバルなギャップにどのように取り組んでいるか

2022年にOpenAIのChatGPTが登場して以来、人工知能(AI)は私たちの日常生活に深く浸透しています。しかし、普遍的なツールとして技術へのアクセスを民主化すると主張されているにもかかわらず、注目されるAI製品はしばしばアメリカやヨーロッパの観客を念頭に設計されています。それらが提供するアプリケーションからサポートする言語まで、これらのツールは一見ほどグローバルではありません。

アフリカ全土で、研究者や技術者はこの傾向に抵抗し、AI業界内の現状とより広範な力のダイナミクスに挑戦しています。彼らの仕事は、地域のニーズとコミュニティに真に応えるソリューションに焦点を移すことを目指しています。

グローバルなAIパワーの不均衡

分散AI研究所(DAIR)は、ビッグテックの遍在する影響から解放された「独立したコミュニティに根ざしたAI研究」に専念する国際的な集団として、変化の灯台として立っています。私は、アフリカの文脈に特化したAIソリューションを構築し、社会的ニーズに対処するDAIRのメンバーと話す機会を得ました。これは、多国籍企業や主に西洋のユーザーの利益ではなく、です。

レソトに拠点を置くDAIRのシニア研究者であり、Deep Learning Indabaの創設メンバーであるNyalleng Moorosiは、そのような先駆者の一人です。機械学習の背景と南アフリカの公立学校での教育経験が、彼女の技術における公平性への見方を形成しました。アパルトヘイト時代に黒人学生を受け入れた数少ない南アフリカの大学の一つ、Forte大学の元教育者として、彼女は貧困が学生の教育の旅にどのように影響するかを直接目にしました。「学部や大学院で私がやったことを、非常に多くの不安に悩まされながら想像するのは驚くべきことでした」と彼女は振り返りました。

教育の後、MoorosiはガーナのGoogle Africa AI研究ラボの最初の従業員の一人としてGoogleに参加しました。ソフトウェアエンジニアとしての役割で、彼女は責任あるAI開発を確保するための方法論と技術を開発しました。「Googleがアフリカにオフィスを建設していたから参加したのです。アフリカにいたかったのです」とMoorosiは説明しました。「ただGoogleに行くのではなく、Google Africaに行きたかったのです。」

しかし、DAIRの創設者であり、Googleの倫理的AIチームの元共同リーダーであるTimnit Gebruとの会話が、Moorosiに、Googleが彼女が機械学習で想像していた公平性に焦点を当てた仕事に適切なプラットフォームかどうか疑問を抱かせました。これが彼女をDAIRに参加させ、Gebruと共に、技術業界で歴史的に排除されてきたコミュニティを、現地の専門家を維持し資金提供することでエンパワーすることを目指しました。

DAIRのAI研究

2018年、Moorosi、Gebru、そしてDAIRのフェローであるRaesetje Sefalaは、南アフリカのタウンシップ—歴史的に黒人居住者が住む労働者階級の近隣—の衛星画像を分析するプロジェクトに着手しました。彼らの目的は、アパルトヘイト終了後にこれらの地域がどのように進化したかを理解することでした。彼らは、タウンシップ住民の生活の質が時間とともに向上したかどうかを評価するためのデータセットをまとめました。

南アフリカのタウンシップは、都市の郊外に位置し、しばしば開発不足と富裕な郊外に比べて劣悪な生活条件に悩まされています。政府の国勢調査データは、より裕福な地域を優先する傾向があり、タウンシップのデータはほとんど見えない状態になり、空間的アパルトヘイトが続き、医療、教育、緑地などの基本的なサービスへのアクセスが制限されています。

DAIRの研究は、既存の南アフリカのAIモデルがタウンシップと郊外を区別するのに苦労したため、課題に直面しました。この問題を克服するために、研究者は数百万の衛星画像と地理空間データを使用して機械学習モデルを訓練しました。これらのモデルは、富裕層、非富裕層、非住宅の建築クラスタ(空き地や工業地帯を含む)にエリアを分類することに成功しました。

これらの努力にもかかわらず、DAIRは研究結果を公開しようとした際に抵抗に直面しました。主に白人の西洋の学術機関は、この研究を単なる地理的研究として批判し、機械学習研究ではないとしました。Moorosiは苛立ちを表明しました。「私たちは同じメトリクス、アルゴリズム、コミュニケーション方法を使用し、プロットなども含めています。当時、多くの玩具データセットが使われていましたが、私たちは実際のものに関するデータセットを持っていて、それがあまりにもニッチだとされました。」

それでも、Moorosiはこの研究の関連性を強調しました。「歴史的な分離が私たちの生活にどのように影響するかを追跡することは、ナイロビやラゴスなど、多くの旧英国植民地に存在します。植民地では、白人がここに住み、黒人がそこに住むのが標準でした。そして、資源の配分はそことそこで異なっていました。」

彼女は、研究の内容がその質ではなく、西洋が支配する業界での認識を下げる要因であるように思えると強調しました。

サービス不足のコミュニティへの提供

Lesan AIの共同創設者兼CTOであり、DAIRの研究フェローであるAsmelash Teka Hadguは、この点をさらに強調しました。彼は、アフリカの先住言語の翻訳と文字起こしを目的としたツール、Lesanについて語りました。米国を拠点とするテックジャイアントとは異なり、Lesan AIはアムハラ語やティグリニャ語のような低リソース言語に焦点を当てています。Hadguのこれらの言語との個人的なつながりにより、地元の新聞やラジオのコンテンツを再利用して堅牢なデータセットを構築できました。

アフリカの文脈では、OpenAIやAnthropicのようなテックジャイアントの人気言語モデルは、大陸の多様な言語環境を表現するのに不足しています。Wei Rui Chenの論文「Fumbling in Babel: An Investigation into ChatGPT's Language Identification Ability」によると、アフリカの言語は最もサポートが少ないです。「OpenAIのChatGPTは完全に壊れていて、少し間違っているのではなく、アムハラ語やティグリニャ語のような言語で意味不明な内容を作り出しています」とHadguは指摘しました。「それでも、彼らは英語のための解決策を見つけることを中心とした古い考え方を倍増させ、他の言語が追いつくと想定しています。」

Lesanは、数百万のユーザーに正確な翻訳を提供し、これらのコミュニティにウェブコンテンツを開放することでこのギャップを埋めることを目指しています。Hadguは、これらの言語が単なる追加物ではないと強調しました。「私たちはリソースの95%を少数の言語に費やし、その後、彼らが言うところのロングテール言語に取り組むことはありません。」

西洋のAI企業は、英語が支配するコンテンツに比べてオンラインでのデータスクレイピングが少ない低リソース言語を適切に表現するのに苦労しています。さらに、Data Provenance Initiativeの研究によると、AIモデルのトレーニングに使用されるデータは、主にヨーロッパと北米からのもので、アフリカからのものはごくわずかです。

Hadguは、FacebookのNo Language Left Behindのようなプロジェクトのアプローチを批判し、「便利な」データスクレイピングと自動化された方法に依存していると述べました。彼は、アフリカの言語が英語中心のイニシアチブに比べて最小限の資金しか受けていないと指摘しました。Bloombergは、Orange SAがOpenAIやMeta Platforms Inc.と協力して、Woolof、Pulaar、Bambaraなどのアフリカの言語でAIプログラムをトレーニングしていると報じました。

しかし、多くのアフリカの言語は、トーンシステムや口承伝統に依存しており、西洋のLLMではしばしば見落とされています。Hadguは、地域の文脈を正確に表現するために、年長者やコミュニティメンバーを巻き込むことの重要性を強調しました。

ビッグテック企業が小さなAIスタートアップと協力して言語固有のモデルを開発する際にも、オープンソースの仕事を悪用してアイデアやリソースを奪うことがよくあります。シンガポールのCentre for AI LeadershipのGeorg Zoellerは、この問題を指摘しました。「AIの基本ツールをオープンソース化することで、ハイパースケーラーはスタートアップがその分野で製品を構築できるようにし、内部チームを製品のR&Dの主要なソースとして置き換えるためにそれを利用しました。」

Ghana NLPの共同創設者であるPaul Azunre博士は、大企業がデータを無償で奪う経験を共有しました。Facebookが彼らのデータを使ってオープンソースモデルを構築した後、資金提供の提案を求めてGhana NLPにアプローチしました。「Facebookがモデルを公開した後に私たちにやって来ました。それはオープンソースで、私たちのデータに基づいて構築されていました。そして、彼らは資金提供の提案のオープンコールをしていました。彼らは私たちに『資金提供の提案を出してみませんか?』と言いました。そして私たちは『あなたたちはすでに私たちの仕事を使っているのに』と言いました。『だから何を証明する必要がある?ただ支払ってくれ』」とAzunreは語りました。

Ghana NLPは、Google Translateのようなソフトウェア製品のギャップを埋めることに焦点を当て、Twi、Ewe、Yoruba、Fante、Gaなどの現地言語での音声認識、テキストから音声、音声からテキストの翻訳を開発し、近隣諸国への拡大を計画しています。Azunreは、地元コミュニティを優先することの重要性を強調しました。「自立可能な製品を作ろうとする開発者として、特定の製品やプロジェクトが特定の方法で優先される理由に共感します。私たちはガーナに3000万人のTwi話者がいるので、まずTwiをリリースします…しかし、私たちがやっていることとテックジャイアントとの違いは、私たちにとって指導原則は地元の人々が最優先であることです。」

彼は、知識が抽出されるコミュニティ内で仕事とデータ管理を維持し、コミュニティのデータ主権を提唱し、アフリカのコミュニティをエンパワーし、AIソリューションで彼らの言語的および文化的アイデンティティを保持するための現地データソースの作成の必要性を強調しました。

アフリカのAIの次なる展開

技術ガバナンス研究者のChinasa T. Okoloは、いくつかのアフリカ政府が多国籍企業の影響に対抗するためにAIガバナンスフレームワークを開発していると指摘しました。7つのアフリカ諸国が国家AI戦略を起草しましたが、正式なAI規制戦略を導入した国はまだありません。南アフリカ政府は、特にサービス不足の農村地域でのAI技術への公平なアクセスを確保するために、国家AI政策フレームワークを発表しました。さらに、36のアフリカ諸国がデータ保護規制を確立し、より包括的なAI規制フレームワークへの道を開いています。

一方、西洋のAI企業は、MENA地域のアラビア語圏の国向けのMistralのモデルや、Metaがアラビア語を話すユーザーをサポートするためにMeta AIを拡大するなど、地域固有のLLMに焦点を当て始めています。しかし、植民地時代の搾取と現在のAI開発トレンドの類似性がますます明らかになっています。MIT Tech ReviewのKaren Haoは次のように指摘しました。「AI産業が今日、植民地暴力の正確な形態を繰り返していると言うのは、過去のトラウマの深さを軽視することになりますが、今、それは貧しい人々を犠牲にして裕福で力のある者を豊かにするための、他のより狡猾な手段を使用しています。」

関連記事
ハワイアン・ビーチでの逃避行:新たな絆と意外な展開 ハワイアン・ビーチでの逃避行:新たな絆と意外な展開 自然のままのハワイのビーチで、太陽の光が肌を温め、波が穏やかなリズムを刻む。ジョシュにとって、このビジョンは長年の献身を経て現実のものとなった。静かな逃避行から始まった旅は、やがて新たな友情と予期せぬ展開に満ちたスリリングな旅へと急展開する。ハワイの美しい海岸で繰り広げられる、人とのつながり、ビーチサイドでの楽しみ、そして予期せぬ変化の魅惑的な物語に浸ってみてください。ハイライト長年の夢を叶
オジー・オズボーンの「クレイジー・トレイン」アニメーション・ビデオ:そのアートとインパクトを深く掘り下げる オジー・オズボーンの「クレイジー・トレイン」アニメーション・ビデオ:そのアートとインパクトを深く掘り下げる オジー・オズボーンの「Crazy Train」は、ヘヴィ・メタルの古典としての地位を超越し、文化の金字塔を体現している。そのアニメーション・ミュージック・ビデオは、曲の生のエネルギーとテーマの深みを増幅させる印象的な映像の旅を提供する。この記事では、ビデオの芸術的な選択、核となるメッセージ、不朽の影響力について検証する。主なハイライトCrazy Train」のビデオは、大胆なモノクロのスケッ
EleutherAIがAIトレーニング用の大規模ライセンステキストデータセットを公開 EleutherAIがAIトレーニング用の大規模ライセンステキストデータセットを公開 EleutherAI、主要なAI研究グループは、AIモデルトレーニング用の最大規模のライセンスおよびオープンドメインテキストのコレクションを公開しました。Common Pile v0.1と名付けられたこの8テラバイトのデータセットは、AIスタートアップのPoolside、Hugging Face、およびさまざまな学術機関と協力して2年間で開発されました。このデータセットは、EleutherAIの新
コメント (42)
0/200
WillieJohnson
WillieJohnson 2025年8月26日 14:25:25 JST

AI's global reach sounds grand, but it’s mostly a Western party. Cool to see researchers poking at Big Tech's blind spots—hope they dig deeper! 🌍

DavidLewis
DavidLewis 2025年8月4日 15:01:00 JST

It's wild how AI like ChatGPT seems so universal but mostly caters to Western vibes. Kinda makes you wonder if the 'global' tag is just marketing fluff. Are we ever gonna see AI that truly gets the rest of the world? 🤔

JustinJackson
JustinJackson 2025年4月24日 3:47:47 JST

AI para o mundo ou só para o Ocidente? É legal que a AI esteja em todos os lugares agora, mas por que parece sempre feita para americanos e europeus? Queria que focassem mais em torná-la realmente global. Ainda assim, é um passo na direção certa! 🌍👀

WilliamAllen
WilliamAllen 2025年4月23日 4:37:38 JST

AI for the world? More like AI for the West! It's cool that AI is everywhere now, but why does it always seem tailored for American and European folks? I wish there was more focus on making it truly global. Still, it's a step in the right direction! 🌍👀

CharlesWhite
CharlesWhite 2025年4月22日 11:11:35 JST

¡Lectura interesante sobre el impacto global de la IA! Es genial ver a los investigadores abordando las brechas en la tecnología, pero es frustrante ver tanto enfoque aún en Occidente. Necesitamos más herramientas diseñadas para todos, no solo para los sospechosos habituales. ¡Sigan empujando por una IA verdaderamente global, chicos! 🌍

JackPerez
JackPerez 2025年4月22日 3:15:34 JST

Leitura interessante sobre o impacto global da IA! É ótimo ver pesquisadores abordando as lacunas na tecnologia, mas é frustrante ver tanto foco ainda no Ocidente. Precisamos de mais ferramentas projetadas para todos, não apenas para os suspeitos habituais. Continuem empurrando por uma IA verdadeiramente global, pessoal! 🌍

トップに戻ります
OR