Sarvam AI 推出全新開源模型,展現戰略佈局
印度人工智慧研究實驗室 Sarvam 週二推出新一代大型語言模型,押注於更小巧、更高效的開源人工智慧,以期從美國和中國大型競爭對手提供的昂貴系統中搶佔市場份額。
這項於新德里「印度人工智慧影響力峰會」上宣布的發布,支持了政府旨在減少對外國人工智慧平台依賴、並開發適合當地語言與應用場景模型的倡議。
Sarvam表示,新產品陣容包含參數規模為300億與1050億的模型;一款文字轉語音模型;一款語音轉文字模型;以及一款用於文件解析的視覺模型。這相較於該公司於2024年10月發布的20億參數Sarvam 1模型,代表著一次重大升級。
這兩個參數規模分別為300億與1050億的模型採用了「專家混合」架構,該架構僅會同時啟用總參數中的一部分,從而大幅降低運算成本。300億參數的模型支援32,000個標記的上下文視窗,以實現即時對話;而較大型的模型則提供128,000個標記的視窗,用於處理複雜的多步驟推理任務。

Sarvam 的 300 億參數模型已與 Google 的 Gemma 27B 及 OpenAI 的 GPT-OSS-20B 等模型進行了基準測試。圖片來源:Sarvam Sarvam 說明,這些新 AI 模型是從頭開始訓練的,並非基於現有開源系統進行微調。30B 模型是利用約 16 兆個文字 token 進行預訓練,而 105B 模型則是在涵蓋多種印度語言的數兆個 token 上進行訓練。
該新創公司補充說明,這些模型專為驅動即時應用而設計,包括印度語系的語音助理及聊天系統。

Sarvam 的 1050 億參數模型旨在與 OpenAI 的 GPT-OSS-120B 及阿里巴巴的 Qwen-3-Next-80B 等系統競爭。圖片來源:Sarvam 該新創公司指出,這些模型是利用政府支持的「印度AI任務(IndiaAI Mission)」提供的運算資源進行訓練,並獲得資料中心營運商 Yotta 的基礎設施支援以及 Nvidia 的技術支援。
TechCrunch 活動TechCrunch 創辦人峰會 2026:門票開售
6月23日於波士頓,超過1,100位創辦人將齊聚TechCrunch 2026創辦人峰會,共度一整天,聚焦於成長、執行與實際規模化。 向塑造產業格局的創辦人與投資者取經。與處於相似成長階段的同行建立聯繫。帶回可立即應用的
實戰策略。購買通行證最高可省 300 美元,或透過四人以上團隊的團體票享最高 30% 折扣。
TechCrunch 創辦人峰會:門票開售
6月23日,波士頓將迎來超過1,100位創辦人齊聚TechCrunch 2026創辦人峰會,共度一整天,聚焦於成長、執行與實際規模擴展。 向塑造產業格局的創辦人與投資者學習。與處於相似成長階段的同儕交流。帶回可立即運用的
實戰策略。購票最高可省 $300,或透過四人以上團隊團體票享最高 30% 折扣。
麻薩諸塞州波士頓 | 2026年6月23日 立即註冊Sarvam高層表示,公司計劃採取審慎的策略來擴展其模型,優先考慮實際應用而非單純追求規模。
「我們希望在擴展過程中保持審慎,」Sarvam 共同創辦人 Pratyush Kumar 在發布會上表示。「我們不希望盲目擴展。我們的目標是理解哪些任務在規模化後真正重要,並針對這些任務進行專項開發。」
Sarvam 計劃將 300 億和 1050 億參數的模型開源,但未明確說明是否會同步公開訓練資料或完整的訓練程式碼。
該公司還概述了開發專業化 AI 系統的計畫,包括專注於程式編寫的模型,以及名為「Sarvam for Work」的產品線下的企業工具,此外還有一個名為 Samvaad 的對話式 AI 代理平台。
Sarvam 成立於 2023 年,已從 Lightspeed Venture Partners、Khosla Ventures 及 Peak XV Partners(前身為紅杉資本印度)等投資者處籌集超過 5,000 萬美元資金。
相關文章
印度的AI雄心與創作者經濟的廣告收入困境產生衝突
正在載入播放器……創作者經濟正快速演變,僅靠廣告收入已無法滿足需求。YouTuber 們紛紛推出產品線、收購新創公司,並建立起真正的商業帝國。事實上,MrBeast 的公司收購了金融科技新創 Step,而他的巧克力事業營收已超越其媒體部門。這不僅是某位創作者的策略,對許多人而言,這已成為新的行動指南。在本集 TechCrunch《Equity》播客中,主持人 Kirsten Korosec、Ant
G42 與 Cerebras 結盟,將超級運算能力導入印度
在紐德里的「印度人工智慧影響力峰會」上,總部位於阿聯酋的科技公司 G42 與美國晶片製造商 Cerebras 宣布建立合作夥伴關係,將在印度部署一套 8 艾佛洛普級的超級電腦系統。該系統將部署於印度境內,並遵守所有當地數據駐留、安全及合規法規。其目標是為大學、政府機構及中小企業提供人工智慧運算資源。「主權人工智慧基礎設施現已成為國家競爭力的關鍵組成部分。這項計畫將大規模地為印度提供這項能力,賦能當
General Catalyst 向印度市場投資 50 億美元
管理資產超過 430 億美元的矽谷風險投資公司 General Catalyst 宣布,計劃在未來五年內向印度投資 50 億美元。此舉大幅擴大了該公司在印度新創生態系統中的參與度,距離其與當地公司 Venture Highway 合併還不到兩年。這項於新德里「印度人工智慧影響力峰會」上宣布的計畫,將鎖定人工智慧、醫療保健、國防科技、金融科技及消費科技領域的新創企業。此項承諾遠超過該公司先前為印度市
相關專題推薦
評論 (0)
0/500
印度人工智慧研究實驗室 Sarvam 週二推出新一代大型語言模型,押注於更小巧、更高效的開源人工智慧,以期從美國和中國大型競爭對手提供的昂貴系統中搶佔市場份額。
這項於新德里「印度人工智慧影響力峰會」上宣布的發布,支持了政府旨在減少對外國人工智慧平台依賴、並開發適合當地語言與應用場景模型的倡議。
Sarvam表示,新產品陣容包含參數規模為300億與1050億的模型;一款文字轉語音模型;一款語音轉文字模型;以及一款用於文件解析的視覺模型。這相較於該公司於2024年10月發布的20億參數Sarvam 1模型,代表著一次重大升級。
這兩個參數規模分別為300億與1050億的模型採用了「專家混合」架構,該架構僅會同時啟用總參數中的一部分,從而大幅降低運算成本。300億參數的模型支援32,000個標記的上下文視窗,以實現即時對話;而較大型的模型則提供128,000個標記的視窗,用於處理複雜的多步驟推理任務。

Sarvam 說明,這些新 AI 模型是從頭開始訓練的,並非基於現有開源系統進行微調。30B 模型是利用約 16 兆個文字 token 進行預訓練,而 105B 模型則是在涵蓋多種印度語言的數兆個 token 上進行訓練。
該新創公司補充說明,這些模型專為驅動即時應用而設計,包括印度語系的語音助理及聊天系統。

該新創公司指出,這些模型是利用政府支持的「印度AI任務(IndiaAI Mission)」提供的運算資源進行訓練,並獲得資料中心營運商 Yotta 的基礎設施支援以及 Nvidia 的技術支援。
TechCrunch 活動TechCrunch 創辦人峰會 2026:門票開售
6月23日於波士頓,超過1,100位創辦人將齊聚TechCrunch 2026創辦人峰會,共度一整天,聚焦於成長、執行與實際規模化。 向塑造產業格局的創辦人與投資者取經。與處於相似成長階段的同行建立聯繫。帶回可立即應用的
實戰策略。購買通行證最高可省 300 美元,或透過四人以上團隊的團體票享最高 30% 折扣。
TechCrunch 創辦人峰會:門票開售
6月23日,波士頓將迎來超過1,100位創辦人齊聚TechCrunch 2026創辦人峰會,共度一整天,聚焦於成長、執行與實際規模擴展。 向塑造產業格局的創辦人與投資者學習。與處於相似成長階段的同儕交流。帶回可立即運用的
實戰策略。購票最高可省 $300,或透過四人以上團隊團體票享最高 30% 折扣。
麻薩諸塞州波士頓 | 2026年6月23日 立即註冊Sarvam高層表示,公司計劃採取審慎的策略來擴展其模型,優先考慮實際應用而非單純追求規模。
「我們希望在擴展過程中保持審慎,」Sarvam 共同創辦人 Pratyush Kumar 在發布會上表示。「我們不希望盲目擴展。我們的目標是理解哪些任務在規模化後真正重要,並針對這些任務進行專項開發。」
Sarvam 計劃將 300 億和 1050 億參數的模型開源,但未明確說明是否會同步公開訓練資料或完整的訓練程式碼。
該公司還概述了開發專業化 AI 系統的計畫,包括專注於程式編寫的模型,以及名為「Sarvam for Work」的產品線下的企業工具,此外還有一個名為 Samvaad 的對話式 AI 代理平台。
Sarvam 成立於 2023 年,已從 Lightspeed Venture Partners、Khosla Ventures 及 Peak XV Partners(前身為紅杉資本印度)等投資者處籌集超過 5,000 萬美元資金。
印度的AI雄心與創作者經濟的廣告收入困境產生衝突
正在載入播放器……創作者經濟正快速演變,僅靠廣告收入已無法滿足需求。YouTuber 們紛紛推出產品線、收購新創公司,並建立起真正的商業帝國。事實上,MrBeast 的公司收購了金融科技新創 Step,而他的巧克力事業營收已超越其媒體部門。這不僅是某位創作者的策略,對許多人而言,這已成為新的行動指南。在本集 TechCrunch《Equity》播客中,主持人 Kirsten Korosec、Ant
G42 與 Cerebras 結盟,將超級運算能力導入印度
在紐德里的「印度人工智慧影響力峰會」上,總部位於阿聯酋的科技公司 G42 與美國晶片製造商 Cerebras 宣布建立合作夥伴關係,將在印度部署一套 8 艾佛洛普級的超級電腦系統。該系統將部署於印度境內,並遵守所有當地數據駐留、安全及合規法規。其目標是為大學、政府機構及中小企業提供人工智慧運算資源。「主權人工智慧基礎設施現已成為國家競爭力的關鍵組成部分。這項計畫將大規模地為印度提供這項能力,賦能當
General Catalyst 向印度市場投資 50 億美元
管理資產超過 430 億美元的矽谷風險投資公司 General Catalyst 宣布,計劃在未來五年內向印度投資 50 億美元。此舉大幅擴大了該公司在印度新創生態系統中的參與度,距離其與當地公司 Venture Highway 合併還不到兩年。這項於新德里「印度人工智慧影響力峰會」上宣布的計畫,將鎖定人工智慧、醫療保健、國防科技、金融科技及消費科技領域的新創企業。此項承諾遠超過該公司先前為印度市





首頁






