選項
首頁
新聞
芝麻揭開病毒虛擬助手瑪雅背後的基礎AI模型

芝麻揭開病毒虛擬助手瑪雅背後的基礎AI模型

2025-04-23
120

芝麻揭開病毒虛擬助手瑪雅背後的基礎AI模型

Sesame,這家創新的 AI 公司,推出了令人驚嘆的逼真語音助手 Maya,近日通過釋出驅動其功能的基礎模型掀起波瀾。該模型名為 CSM-1B,擁有 10 億個參數,這一術語指的是構成模型的各個組成部分。該模型以 Apache 2.0 許可證釋出,適用於商業用途且限制極少,如 AI 開發平台 Hugging Face 上所宣佈。

CSM-1B 通過將文字和音頻輸入轉換為「RVQ 音頻代碼」來運作。RVQ 代表「殞地向量量化」,這是一種將音頻轉換為離散符號或代碼的方法。此技術也被其他尖端 AI 音頻技術所採用,例如 Google 的 SoundStream 和 Meta 的 Encodec。CSM-1B 的核心利用了 Meta 的 Llama 家族模型,結合了一個音頻「解碼器」組件。Sesame 表示,經過微調的 CSM-1B 特殊版本為 Maya 的語音提供了動力。

Sesame 在其 Hugging Face 和 GitHub 儲存庫中將該模型描述為「基礎生成模型」,指出它設計用於生成多種聲音,但尚未針對任何特定聲音進行優化。由於訓練數據集中的「數據污染」,該模型具備一定程度的非英語語言處理能力,但其在此方面的表現可能不佳。有趣的是,Sesame 對訓練數據的細節保密,讓人好奇這個模型的構建過程。

一個引人注目的問題是缺乏強大的防護措施。Sesame 採用誠信制度,僅鼓勵使用者和開發者避免未經許可複製某人的聲音、製作假新聞等誤導性內容,或參與任何「有害」或「惡意」的活動。我親自測試了 Hugging Face 上的演示,僅一分鐘內就複製了我的聲音。生成關於任何主題的語音非常簡單,甚至包括選舉和俄羅斯宣傳等敏感話題。

《消費者報告》最近指出,許多 AI 驅動的語音複製工具缺乏「有意義的」防護措施,這可能導致潛在的詐騙或濫用。Sesame 由 Oculus 共同創辦人 Brendan Iribe 共同創立,在二月底以其幾乎擺脫恐怖谷效應的助手技術吸引了公眾的目光。Maya 和 Sesame 的另一個助手 Miles 展現出逼真的人類特徵,例如呼吸、語帶瑕疵,以及在講話中可被打斷,類似於 OpenAI 的語音模式。

在財務方面,Sesame 獲得了 Andreessen Horowitz、Spark Capital 和 Matrix Partners 等重量級投資者的未公開資金支持。除了語音助手外,該公司還在探索原型 AI 眼鏡,計劃全天佩戴並搭載其定制模型。這一舉動顯示了 Sesame 將 AI 技術進一步推向我們日常生活的雄心。

相關文章
"探索 AI 安全與道德:Databricks 和 ElevenLabs 專家的見解" 隨著創造性人工智能的價格越來越低廉,普及程度越來越高,道德考量和安全措施也成為了中心議題。ElevenLabs 的 AI 安全主管 Artemis Seaford 和 Databricks 的共同創造者 Ion Stoica 參與了 TechCrunch 的 AI 記者 Kyle Wiggers 的深入對談,探討當今 AI 領域中迫切的倫理困境。他們的對談探討了從合成媒體驗證到道德實踐準則
Truth Social 的新 AI 搜尋引擎在搜尋結果中非常傾向於福克斯新聞 Truth Social 的新 AI 搜尋引擎在搜尋結果中非常傾向於福克斯新聞 川普的社交媒體平台推出 AI 驅動的搜尋功能,明顯傾向保守媒體獨家推出 AI 搜尋功能Truth Social 是唐納德-川普 (Donald Trump) 所創立的社交媒體平台,該平台已推出新的人工智慧搜尋工具,稱為 Truth Search AI。這項功能是與 AI 創業公司 Perplexity 合作開發,目前在網頁版上運作,並計劃在不久後整合行動應用程式。保守派媒體的主導地位獨立測試顯示,
ChatGPT 新增 Google Drive 和 Dropbox 整合功能以存取檔案 ChatGPT 新增 Google Drive 和 Dropbox 整合功能以存取檔案 ChatGPT 利用新的企業功能增強生產力OpenAI 發表了兩項強大的新功能,將 ChatGPT 轉型為全面的企業生產力工具:自動化會議記錄和無縫雲儲存整合。革命性的錄音功能新推出的 「記錄模式 」可自動轉錄和分析以下內容:重要的商務會議有創意的腦力激盪會議 個人思考過程此優質功能目前為 ChatGPT 團隊訂閱者專屬 (每位使用者每月 $25),可提供:精確、有時
評論 (8)
0/200
PaulYoung
PaulYoung 2025-08-14 05:00:59

C'est incroyable ce que Sesame a fait avec Maya ! Un modèle à 1 milliard de paramètres, ça doit être une sacrée bête. Mais franchement, ça donne quoi en termes d'éthique ? On va tous finir avec des assistants trop parfaits ? 😅

AnthonyMartinez
AnthonyMartinez 2025-07-31 09:41:20

Wow, Sesame's CSM-1B sounds like a game-changer! A billion parameters for Maya’s lifelike voice? That’s some serious tech flex. Curious how it stacks up against other models in real-world use. 😎

RoySmith
RoySmith 2025-07-28 09:18:39

Whoa, a 1B parameter model powering Maya? That's some serious brainpower! Curious how Sesame's CSM-1B stacks up against other AI giants. Excited to see where this tech takes us! 🚀

EricPerez
EricPerez 2025-04-25 06:42:49

Sesame's base AI model for Maya is mind-blowing! 1 billion parameters? That's insane! Maya's voice is so lifelike, it's like talking to a real person. But sometimes she gets a bit too chatty, which can be annoying. Still, a fantastic piece of tech! 🤯

GeorgeMiller
GeorgeMiller 2025-04-24 21:04:42

¡El modelo base de IA de Sesame para Maya es alucinante! ¿1 billón de parámetros? ¡Eso es una locura! La voz de Maya es tan realista, parece que estoy hablando con una persona real. Pero a veces se pone un poco parlanchina, lo que puede ser molesto. Aún así, una tecnología fantástica! 🤯

JonathanMiller
JonathanMiller 2025-04-24 20:11:38

Das Basis-AI-Modell von Sesame für Maya ist umwerfend! 1 Milliarde Parameter? Das ist verrückt! Mayas Stimme ist so lebensecht, es fühlt sich an, als würde man mit einer echten Person sprechen. Aber manchmal wird sie ein bisschen zu gesprächig, was nervig sein kann. Trotzdem, eine fantastische Technologie! 🤯

回到頂部
OR