選項
首頁
新聞
AI為世界還是西方?研究人員如何應對Big Tech的全球差距

AI為世界還是西方?研究人員如何應對Big Tech的全球差距

2025-04-12
109

AI為世界還是西方?研究人員如何應對Big Tech的全球差距

自2022年OpenAI推出ChatGPT以來,人工智慧(AI)已深深融入我們的日常生活。然而,焦點往往集中在為美國和歐洲觀眾設計的AI產品上,儘管這些產品宣稱是民主化科技使用的通用工具。從它們服務的應用到支援的語言,這些工具並非總是如表面般全球化。

在非洲,研究人員和技術專家正在反抗這一趨勢,挑戰現狀及AI產業內更廣泛的權力動態。他們的工作旨在將焦點轉向真正滿足當地需求和社區的解決方案。

全球AI權力失衡

分散式AI研究機構(DAIR)是一個變革的燈塔,這是一個致力於「獨立且植根於社區的AI研究,擺脫大型科技公司的廣泛影響」的國際集體。我有機會與DAIR成員交談,他們正在打造專為非洲情境量身定制的AI解決方案,解決社會需求,而非跨國公司或主要為西方用戶的利益。

Nyalleng Moorosi是DAIR的資深研究員,駐地位於萊索托,也是Deep Learning Indaba的創始成員之一,是這方面的開拓者。她在機器學習方面的背景以及在南非公立學校教學的經驗塑造了她對科技公平的看法。作為種族隔離時期南非少數接納黑人學生的Forte大學的前教育工作者,她親眼見證了貧困如何影響學生的教育歷程。她回憶道:「想像在大學和研究生階段,背負如此多的不安全感去做我所做的事情,真是令人震驚。」

在教學工作後,Moorosi加入了Google,成為Google非洲AI研究實驗室在迦納的首批員工之一。作為軟體工程師,她開發了旨在確保負責任AI發展的方法和技術。Moorosi解釋說:「我加入Google是因為他們在非洲設立了辦公室,而我想留在非洲。我不想只是去Google,我想去Google非洲。」

然而,與DAIR創始人、Google前倫理AI團隊共同負責人Timnit Gebru的對話促使Moorosi質疑Google是否是她設想的專注於機器學習公平工作的正確平台。這使她加入了DAIR,她與Gebru致力於通過保留和資助當地專家來賦能歷史上被科技產業邊緣化的社區。

DAIR的AI研究

2018年,Moorosi、Gebru和DAIR研究員Raesetje Sefala開始了一個分析南非鄉鎮衛星影像的項目,這些鄉鎮是歷史上由黑人居民組成的工人階級社區。他們的目標是了解種族隔離結束後這些地區的變遷。他們編制了一個數據集,以評估鄉鎮居民的生活質量是否隨時間改善。

南非鄉鎮位於城市郊區,通常發展不足,生活條件比富裕郊區差。政府的普查數據傾向於較富裕地區,使得鄉鎮數據幾乎不可見,延續了空間上的種族隔離,並限制了醫療、教育和綠地等基本服務的獲取。

DAIR的研究因現有南非AI模型的局限性而面臨挑戰,這些模型難以區分鄉鎮和郊區。為克服這一問題,研究人員利用數百萬衛星影像和地理空間數據來訓練機器學習模型。這些模型成功將區域分類為富裕、非富裕和非住宅建築群,包括空地或工業區。

儘管如此,DAIR在試圖發表研究結果時遇到了阻力。以白人為主的西方學術機構批評該研究僅是地理研究,而非機器學習研究。Moorosi表達了她的沮喪:「我們使用了相同的指標、演算法和溝通方式,包括圖表等一切。當時許多玩具數據集被使用,但我們擁有這個關於實際事物的數據集,卻被認為太小眾。」

然而,Moorosi強調了研究的相關性:「這種追蹤歷史隔離如何影響我們生活的方式在許多前英國殖民地中存在。它在奈洛比、拉各斯都存在。在殖民地,白人住在那裡,黑人住在那裡,資源分配在這兩者之間是不同的。」

她強調,研究的內容而非其質量,似乎在西方主導的產業中削弱了其認可度。

為服務不足的社區提供支援

Lesan AI的共同創辦人兼技術長、DAIR研究員Asmelash Teka Hadgu進一步強調了這一點。他談到了Lesan,一個為非洲原住民語言翻譯和轉錄的工具。與美國科技巨頭不同,Lesan AI專注於低資源語言,如阿姆哈拉語和提格里尼亞語。Hadgu與這些語言的個人聯繫使他能夠利用當地報紙和廣播內容重新整理,構建強大的數據集。

在非洲背景下,來自OpenAI和Anthropic等科技巨頭的流行語言模型無法充分代表大陸多樣的語言景觀。根據Wei Rui Chen的論文《Fumbling in Babel: An Investigation into ChatGPT's Language Identification Ability》,非洲語言獲得的支持最少。Hadgu指出:「OpenAI的ChatGPT完全失靈,不是稍微錯誤,而是在阿姆哈拉語和提格里尼亞語等語言中產生亂碼。然而,他們仍然堅持以英語為中心的舊思維模式,假設其他語言會跟上。」

Lesan旨在通過為數百萬用戶提供準確的翻譯來彌合這一差距,為這些社區開放網絡內容。Hadgu強調,這些語言不是附加品:「我們不會將95%的資源花費在少數語言上,然後再去處理他們所謂的長尾語言。」

西方AI公司在充分代表低資源語言方面遇到困難,因為這些語言在線上數據抓取中較少,特別是與英語主導的內容相比。根據Data Provenance Initiative的研究,用於訓練AI模型的數據主要來自歐洲和北美,來自非洲的數據僅佔一小部分。

Hadgu批評了Facebook的No Language Left Behind等項目的方法,他稱其依賴於「便利」數據抓取和自動化方法。他指出,非洲語言獲得的資金與專注於英語的項目相比微乎其微。彭博社報導,Orange SA與OpenAI和Meta Platforms Inc.合作,通過培訓Woolof、Pulaar和Bambara等非洲語言的AI程序來解決這一問題。

然而,許多非洲語言依賴於音調系統和口頭傳統,這些往往被西方大型語言模型(LLMs)忽視。Hadgu強調了讓長者和社區成員參與的重要性,以確保當地情境的準確代表。

即使大型科技公司與小型AI初創公司合作開發特定語言模型,它們也常常利用開源工作來獲取創意和資源。新加坡AI領導中心的Georg Zoeller指出這一問題:「通過開源AI的基本工具,大型企業使初創公司能夠在該領域構建產品,並用它們取代內部團隊作為產品研發的主要來源。」

迦納NLP的共同創辦人Paul Azunre博士分享了大公司未經補償盜用數據的經歷。在Facebook使用他們的數據建立開源模型後,他們聯繫了迦納NLP尋求資金提案。Azunre回憶說:「Facebook在發布了一個基於我們數據的開源模型後來找我們,說:『為什麼不提交一份資金提案?』我們說:『你們已經在使用我們的成果了。』『我們還需要向你們證明什麼?直接付錢給我們吧。』」

迦納NLP專注於填補Google Translate等軟體產品的空白,開發語音識別、文字轉語音和語音轉文字的翻譯,涵蓋Twi、Ewe、Yoruba、Fante和Ga等當地語言,並計劃擴展到鄰國。Azunre強調優先考慮當地社區的重要性:「作為試圖製作自持續產品的開發者,我能理解為什麼某些產品或項目以某種方式優先。我們首先推出Twi,因為在迦納有3000萬Twi使用者……但我們與科技巨頭的區別在於,對我們來說,指導原則是當地人優先。」

他強調了在知識提取的社區內保留工作和數據控制的必要性,主張社區數據主權和建立當地數據源,以賦能非洲社區並在AI解決方案中保留其語言和文化身份。

非洲AI的未來

科技治理研究員Chinasa T. Okolo指出,幾個非洲政府正在制定AI治理框架,以對抗跨國公司的影響。七個非洲國家已起草國家AI策略,儘管尚未實施正式的AI監管策略。南非政府發布了國家AI政策框架,以確保AI技術的公平訪問,特別是在服務不足和農村地區。此外,36個非洲國家已建立數據保護法規,為更全面的AI監管框架鋪平道路。

與此同時,西方AI公司開始專注於特定地區的大型語言模型(LLMs),如Mistral為中東和北非阿拉伯語國家的模型,以及Meta擴展Meta AI以支持阿拉伯語用戶。然而,殖民掠奪與當前AI發展趨勢之間的相似性日益明顯。MIT科技評論的Karen Hao指出:「雖然說AI產業正在重複殖民暴力的確切模式會減輕過去創傷的深度,但它現在正以其他更隱秘的方式,極大地犧牲窮人來豐富富人和強者。」

相關文章
夏威夷海灘逃亡之旅:新的結合與驚奇的轉折 夏威夷海灘逃亡之旅:新的結合與驚奇的轉折 想像自己置身於純淨的夏威夷海灘,陽光溫暖您的肌膚,海浪撫平您的悸動。對 Josh 來說,經過多年的努力,這個願景終於成為現實。從寧靜的逍遙遠行開始,很快就演變成一段驚心動魄的旅程,當中有新的友誼和無法預料的轉折。在夏威夷迷人的海岸線上,讓自己沉浸在這個關於人際關係、海灘樂趣和意想不到的變化的迷人故事中。重點介紹Josh 來到夏威夷,完成多年來的夢想。與 Selin 的意外相遇,在海灘上燃起
Ozzy Osbourne 的「Crazy Train」動畫影片:深入探討其藝術與影響力 Ozzy Osbourne 的「Crazy Train」動畫影片:深入探討其藝術與影響力 Ozzy Osbourne 的《Crazy Train》超越了其重金屬經典的地位,體現了文化的里程碑。其動畫音樂視頻提供了一個引人注目的視覺旅程,放大了歌曲的原始能量和主題深度。本文將探討影片的藝術選擇、核心訊息以及持久的影響力。重點介紹Crazy Train》MV 採用大膽的黑白素描風格動畫。它探討了精神錯亂、社會恐懼和戰爭徒勞無功的主題。Ozzy Osbourne 的個人形象透過生動
EleutherAI 發布用於AI訓練的大規模許可文本數據集 EleutherAI 發布用於AI訓練的大規模許可文本數據集 EleutherAI,一個領先的AI研究團體,推出了一個用於AI模型訓練的最大許可和開放領域文本集合之一。名為Common Pile v0.1,此8太字节數據集由AI初創公司Poolside、Hugging Face以及多家學術機構合作開發,歷時兩年。它被用於訓練EleutherAI的兩個新模型,Comma v0.1-1T和Comma v0.1-2T,該組織聲稱這些模型的性能與使用未經許可的版權數
評論 (42)
0/200
WillieJohnson
WillieJohnson 2025-08-26 13:25:25

AI's global reach sounds grand, but it’s mostly a Western party. Cool to see researchers poking at Big Tech's blind spots—hope they dig deeper! 🌍

DavidLewis
DavidLewis 2025-08-04 14:01:00

It's wild how AI like ChatGPT seems so universal but mostly caters to Western vibes. Kinda makes you wonder if the 'global' tag is just marketing fluff. Are we ever gonna see AI that truly gets the rest of the world? 🤔

JustinJackson
JustinJackson 2025-04-24 02:47:47

AI para o mundo ou só para o Ocidente? É legal que a AI esteja em todos os lugares agora, mas por que parece sempre feita para americanos e europeus? Queria que focassem mais em torná-la realmente global. Ainda assim, é um passo na direção certa! 🌍👀

WilliamAllen
WilliamAllen 2025-04-23 03:37:38

AI for the world? More like AI for the West! It's cool that AI is everywhere now, but why does it always seem tailored for American and European folks? I wish there was more focus on making it truly global. Still, it's a step in the right direction! 🌍👀

CharlesWhite
CharlesWhite 2025-04-22 10:11:35

¡Lectura interesante sobre el impacto global de la IA! Es genial ver a los investigadores abordando las brechas en la tecnología, pero es frustrante ver tanto enfoque aún en Occidente. Necesitamos más herramientas diseñadas para todos, no solo para los sospechosos habituales. ¡Sigan empujando por una IA verdaderamente global, chicos! 🌍

JackPerez
JackPerez 2025-04-22 02:15:34

Leitura interessante sobre o impacto global da IA! É ótimo ver pesquisadores abordando as lacunas na tecnologia, mas é frustrante ver tanto foco ainda no Ocidente. Precisamos de mais ferramentas projetadas para todos, não apenas para os suspeitos habituais. Continuem empurrando por uma IA verdadeiramente global, pessoal! 🌍

回到頂部
OR