選項
首頁
新聞
芝麻揭開病毒虛擬助手瑪雅背後的基礎AI模型

芝麻揭開病毒虛擬助手瑪雅背後的基礎AI模型

2025-04-23
103

芝麻揭開病毒虛擬助手瑪雅背後的基礎AI模型

芝麻(Sesame)是一家創新的人工智能公司,這家栩栩如生的語音助手瑪雅(Maya)剛剛通過釋放了推動她能力的基礎模型來引起轟動。該模型被稱為CSM-1B,其大小為10億個參數,該術語是指組成模型的單個組件。根據AI Development Platform Hugging Face宣布的,它是在Apache 2.0許可下發布的,供商業用途,並最少。

CSM-1B通過將文本和音頻輸入轉換為“ RVQ音頻代碼”來函數。 RVQ代表“殘留向量量化”,該方法將音頻轉換為離散令牌或代碼。該技術還用於其他尖端AI音頻技術,例如Google的Soundtream和Meta的Eccodec。 CSM-1B從本質上講,利用了Meta的Llama家族的模型,並結合了音頻“解碼器”組件。根據芝麻的說法,經過微調,CSM-1B的專門版本為瑪雅人的聲音提供了動力。

芝麻將模型描述為其擁抱面和Github存儲庫中的“基本生成模型”,指出它旨在產生各種聲音,但沒有針對任何特定的聲音進行完善。儘管由於其訓練集中的“數據污染”,它具有某種能力處理非英語語言的能力,但其在該領域的表現可能不足。有趣的是,芝麻將培訓數據的細節保留在包裹中,使我們對建立該模型的原因感到好奇。

引起眉毛的一個方面是缺乏強大的保障措施。芝麻在榮譽系統上運行,只是鼓勵用戶和開發人員避免使用模型在未經許可的情況下複製某人的聲音,產生諸如假新聞之類的誤導性內容,或參加任何“有害”或“惡意”活動。我親自測試了演示,以擁抱臉,在一分鐘之內,我克隆了自己的聲音。在任何話題上發表演講,甚至是敏感的選舉和俄羅斯宣傳,這都是輕而易舉的。

最近,消費者的報告強調了許多AI驅動的語音克隆工具中缺乏“有意義的”保障措施,這可能導致潛在的欺詐或濫用。由Oculus共同創造者Brendan Iribe共同創立的芝麻在2月下旬與其助理技術吸引了公眾的眼球,該技術幾乎逃脫了不可思議的山谷。瑪雅人和芝麻的另一個助手邁爾斯都表現出現實的人類般的特徵,例如呼吸,散發出反彈性和可中斷的言論中的中斷,類似於Openai的語音模式。

從財務上講,芝麻從Andreessen Horowitz,Spark Capital和Matrix Partners等重量級人物那裡獲得了未公開的資金。除了語音助手之外,該公司還冒險使用適用於全天服裝的原型AI眼鏡,配備了定制型號。此舉表明芝麻的野心將AI技術的界限進一步推向了我們的日常生活。

相關文章
阿里巴巴推出Wan2.1-VACE:開源AI視頻解決方案 阿里巴巴推出Wan2.1-VACE:開源AI視頻解決方案 阿里巴巴推出了Wan2.1-VACE,一款開源AI模型,旨在改變視頻創作與編輯流程。VACE是阿里巴巴Wan2.1視頻AI模型系列的關鍵組成部分,公司宣稱這是「業界首個為多樣化視頻生成與編輯任務提供全面解決方案的開源模型」。如果阿里巴巴能夠簡化視頻製作流程,將多種工具整合到單一平台,可能會重新定義行業標準。VACE能做什麼?它可以從多種輸入生成視頻,例如文字提示、靜態圖像或短視頻片段。除了視頻創作
IBM Power11 提升企業AI,實現不間斷性能 IBM Power11 提升企業AI,實現不間斷性能 IBM的Power11企業伺服器解決了企業運算中的一個關鍵問題:在部署AI工作負載的同時,保持關鍵任務應用程式所需的強大可靠性。Power11於2025年7月8日推出,突顯了IBM專注於統一解決方案,擺脫許多組織目前所面臨的專業AI硬體與傳統伺服器的分散組合。核心創新揭曉Power11伺服器旨在確保企業無停機時間。它們擁有驚人的“99.9999%正常運行時間”,相當於每年不到32秒的意外停機時間。
AI驅動的零售實驗在Anthropic慘敗 AI驅動的零售實驗在Anthropic慘敗 想像一下,將一家小商店交給人工智慧,委託它處理從定價到客戶互動的一切。會出什麼問題呢?Anthropic最近的一項研究於週五發布,回答了這個問題:幾乎所有事情都出了問題。他們的AI助手Claude在舊金山辦公室經營了一個月的小商店,結果就像是為商學院學生寫下的警示故事,由一個毫無現實經驗的人撰寫——在這次實驗中,確實如此。Anthropic辦公室的「商店」是一個裝滿飲料和零食的小冰箱,搭配一個用於
評論 (7)
0/200
AnthonyMartinez
AnthonyMartinez 2025-07-31 09:41:20

Wow, Sesame's CSM-1B sounds like a game-changer! A billion parameters for Maya’s lifelike voice? That’s some serious tech flex. Curious how it stacks up against other models in real-world use. 😎

RoySmith
RoySmith 2025-07-28 09:18:39

Whoa, a 1B parameter model powering Maya? That's some serious brainpower! Curious how Sesame's CSM-1B stacks up against other AI giants. Excited to see where this tech takes us! 🚀

EricPerez
EricPerez 2025-04-25 06:42:49

Sesame's base AI model for Maya is mind-blowing! 1 billion parameters? That's insane! Maya's voice is so lifelike, it's like talking to a real person. But sometimes she gets a bit too chatty, which can be annoying. Still, a fantastic piece of tech! 🤯

GeorgeMiller
GeorgeMiller 2025-04-24 21:04:42

¡El modelo base de IA de Sesame para Maya es alucinante! ¿1 billón de parámetros? ¡Eso es una locura! La voz de Maya es tan realista, parece que estoy hablando con una persona real. Pero a veces se pone un poco parlanchina, lo que puede ser molesto. Aún así, una tecnología fantástica! 🤯

JonathanMiller
JonathanMiller 2025-04-24 20:11:38

Das Basis-AI-Modell von Sesame für Maya ist umwerfend! 1 Milliarde Parameter? Das ist verrückt! Mayas Stimme ist so lebensecht, es fühlt sich an, als würde man mit einer echten Person sprechen. Aber manchmal wird sie ein bisschen zu gesprächig, was nervig sein kann. Trotzdem, eine fantastische Technologie! 🤯

TimothyMitchell
TimothyMitchell 2025-04-24 15:25:54

SesameのMayaの基礎AIモデルは驚異的!10億のパラメータ?それは狂ってる!Mayaの声は本当にリアルで、まるで本物の人と話しているみたい。ただ、時々彼女がちょっとおしゃべりすぎてうざい時がある。それでも、素晴らしい技術だよ!🤯

回到頂部
OR