Sarvam AI 发布全新开源模型,布局战略布局
印度人工智能研究实验室Sarvam于周二推出新一代大型语言模型,旨在通过更小巧、更高效的开源人工智能,从美国和中国大型竞争对手提供的昂贵系统中抢占市场份额。
此次发布于新德里举行的“印度人工智能影响力峰会”上,旨在支持政府减少对外国人工智能平台依赖、开发适合本地语言和应用场景的模型的倡议。
Sarvam表示,新产品线包括参数规模分别为300亿和1050亿的模型;一个文本转语音模型;一个语音转文本模型;以及一个用于文档解析的视觉模型。这相较于该公司2024年10月发布的20亿参数Sarvam 1模型,是一次重大升级。
这两种参数规模分别为300亿和1050亿的模型采用了混合专家架构,该架构每次仅激活总参数中的一部分,从而大幅降低了计算成本。300亿参数模型支持32,000令牌的上下文窗口,可实现实时对话;而更大规模的模型则提供128,000令牌的窗口,适用于复杂的多步骤推理任务。

Sarvam的300亿参数模型已与谷歌的Gemma 27B和OpenAI的GPT-OSS-20B等模型进行了性能对比。图片来源:Sarvam Sarvam 解释称,这些新 AI 模型是从零开始训练的,而非基于现有开源系统进行微调。30B 模型在约 16 万亿个文本令牌上进行了预训练,而 105B 模型则在涵盖多种印度语言的数万亿个令牌上进行了训练。
该初创公司补充道,这些模型旨在支持实时应用,包括基于语音的助手和印度语聊天系统。

Sarvam的1050亿参数模型旨在与OpenAI的GPT-OSS-120B和阿里巴巴的Qwen-3-Next-80B等系统竞争。图片来源:Sarvam 该初创公司指出,这些模型利用了政府支持的“印度AI计划”(IndiaAI Mission)提供的计算资源进行训练,并获得了数据中心运营商Yotta的基础设施支持以及英伟达(Nvidia)的技术支持。
TechCrunch活动TechCrunch 2026创始人峰会:门票开售
6月23日,波士顿将迎来TechCrunch 2026创始人峰会,逾1,100位创始人齐聚一堂,共同探讨增长、执行与实际规模化发展。 向塑造了整个行业的创始人与投资者取经。与处于相似成长阶段的同行建立联系。带走可立即付诸实践
的策略。购买个人通行证立省高达300美元,四人及以上团队购买团体票可享最高30%的折扣。
TechCrunch创始人峰会:门票开售
6月23日,波士顿将迎来TechCrunch 2026创始人峰会,届时将有超过1,100位创始人齐聚一堂,共同度过这一专注于增长、执行与实际规模化发展的全天盛会。 向塑造了整个行业的创始人与投资者取经。与处于相似成长阶段的同行建立联系。带走可立即付诸实践
的策略。购买通行证最高可节省 $300,四人及以上团队购买团体票最高可享 30% 折扣。
马萨诸塞州波士顿 | 2026年6月23日 立即注册Sarvam高管表示,公司计划采取稳健策略来扩展其模型,优先考虑实际应用而非单纯追求规模。
“我们希望在扩展过程中保持审慎,”Sarvam联合创始人Pratyush Kumar在发布会上表示,“我们不希望盲目扩展。我们的目标是理解哪些任务在规模化后真正重要,并针对这些任务进行专门构建。”
Sarvam计划将300亿和1050亿参数的模型开源,但未明确说明是否会同时公开训练数据或完整的训练代码。
该公司还概述了开发专用AI系统的计划,包括专注于编程的模型和名为“Sarvam for Work”的产品下的企业工具,以及一个名为Samvaad的对话式AI代理平台。
Sarvam成立于2023年,已从包括光速创投(Lightspeed Venture Partners)、科斯拉创投(Khosla Ventures)和Peak XV Partners(前身为红杉资本印度)在内的投资者处筹集了超过5000万美元的资金。
相关文章
印度的AI雄心与创作者经济在广告收入方面的困境产生冲突
正在加载播放器……创作者经济正在快速演变,仅靠广告收入已难以维系。YouTube创作者们正推出自有产品线、收购初创公司,并打造真正的商业帝国。事实上,MrBeast的公司收购了金融科技初创公司Step,而他的巧克力业务收入已超过其媒体业务。这不仅仅是一个创作者的策略,对许多人来说,这已成为新的行动指南。在本期TechCrunch的《Equity》播客中,主持人Kirsten Korosec、Ant
G42与Cerebras达成合作,将在印度部署超级计算能力
在新德里举行的印度人工智能影响力峰会上,总部位于阿联酋的科技公司G42与美国芯片制造商Cerebras宣布达成合作,将在印度部署一套8艾佛洛普级超级计算机系统。该系统将部署于印度境内,并严格遵守当地所有数据驻留、安全及合规法规。其目标是为大学、政府机构及中小企业提供人工智能计算资源。“主权AI基础设施现已成为国家竞争力的关键组成部分。该计划将这一能力大规模引入印度,赋能当地研究人员、创新者和企业原
General Catalyst向印度市场投资50亿美元
硅谷风投公司General Catalyst(管理资产规模超过430亿美元)近日宣布,计划在未来五年内向印度投资50亿美元。此举大幅扩大了该公司在印度初创企业生态系统中的参与度,距离其与当地公司Venture Highway合并还不到两年。该计划在新德里举行的“印度人工智能影响力峰会”上宣布,投资将主要瞄准人工智能、医疗健康、国防技术、金融科技及消费科技领域的初创企业。这一承诺远超该公司此前为印度
相关专题推荐
评论 (0)
0/500
印度人工智能研究实验室Sarvam于周二推出新一代大型语言模型,旨在通过更小巧、更高效的开源人工智能,从美国和中国大型竞争对手提供的昂贵系统中抢占市场份额。
此次发布于新德里举行的“印度人工智能影响力峰会”上,旨在支持政府减少对外国人工智能平台依赖、开发适合本地语言和应用场景的模型的倡议。
Sarvam表示,新产品线包括参数规模分别为300亿和1050亿的模型;一个文本转语音模型;一个语音转文本模型;以及一个用于文档解析的视觉模型。这相较于该公司2024年10月发布的20亿参数Sarvam 1模型,是一次重大升级。
这两种参数规模分别为300亿和1050亿的模型采用了混合专家架构,该架构每次仅激活总参数中的一部分,从而大幅降低了计算成本。300亿参数模型支持32,000令牌的上下文窗口,可实现实时对话;而更大规模的模型则提供128,000令牌的窗口,适用于复杂的多步骤推理任务。

Sarvam 解释称,这些新 AI 模型是从零开始训练的,而非基于现有开源系统进行微调。30B 模型在约 16 万亿个文本令牌上进行了预训练,而 105B 模型则在涵盖多种印度语言的数万亿个令牌上进行了训练。
该初创公司补充道,这些模型旨在支持实时应用,包括基于语音的助手和印度语聊天系统。

该初创公司指出,这些模型利用了政府支持的“印度AI计划”(IndiaAI Mission)提供的计算资源进行训练,并获得了数据中心运营商Yotta的基础设施支持以及英伟达(Nvidia)的技术支持。
TechCrunch活动TechCrunch 2026创始人峰会:门票开售
6月23日,波士顿将迎来TechCrunch 2026创始人峰会,逾1,100位创始人齐聚一堂,共同探讨增长、执行与实际规模化发展。 向塑造了整个行业的创始人与投资者取经。与处于相似成长阶段的同行建立联系。带走可立即付诸实践
的策略。购买个人通行证立省高达300美元,四人及以上团队购买团体票可享最高30%的折扣。
TechCrunch创始人峰会:门票开售
6月23日,波士顿将迎来TechCrunch 2026创始人峰会,届时将有超过1,100位创始人齐聚一堂,共同度过这一专注于增长、执行与实际规模化发展的全天盛会。 向塑造了整个行业的创始人与投资者取经。与处于相似成长阶段的同行建立联系。带走可立即付诸实践
的策略。购买通行证最高可节省 $300,四人及以上团队购买团体票最高可享 30% 折扣。
马萨诸塞州波士顿 | 2026年6月23日 立即注册Sarvam高管表示,公司计划采取稳健策略来扩展其模型,优先考虑实际应用而非单纯追求规模。
“我们希望在扩展过程中保持审慎,”Sarvam联合创始人Pratyush Kumar在发布会上表示,“我们不希望盲目扩展。我们的目标是理解哪些任务在规模化后真正重要,并针对这些任务进行专门构建。”
Sarvam计划将300亿和1050亿参数的模型开源,但未明确说明是否会同时公开训练数据或完整的训练代码。
该公司还概述了开发专用AI系统的计划,包括专注于编程的模型和名为“Sarvam for Work”的产品下的企业工具,以及一个名为Samvaad的对话式AI代理平台。
Sarvam成立于2023年,已从包括光速创投(Lightspeed Venture Partners)、科斯拉创投(Khosla Ventures)和Peak XV Partners(前身为红杉资本印度)在内的投资者处筹集了超过5000万美元的资金。
印度的AI雄心与创作者经济在广告收入方面的困境产生冲突
正在加载播放器……创作者经济正在快速演变,仅靠广告收入已难以维系。YouTube创作者们正推出自有产品线、收购初创公司,并打造真正的商业帝国。事实上,MrBeast的公司收购了金融科技初创公司Step,而他的巧克力业务收入已超过其媒体业务。这不仅仅是一个创作者的策略,对许多人来说,这已成为新的行动指南。在本期TechCrunch的《Equity》播客中,主持人Kirsten Korosec、Ant
G42与Cerebras达成合作,将在印度部署超级计算能力
在新德里举行的印度人工智能影响力峰会上,总部位于阿联酋的科技公司G42与美国芯片制造商Cerebras宣布达成合作,将在印度部署一套8艾佛洛普级超级计算机系统。该系统将部署于印度境内,并严格遵守当地所有数据驻留、安全及合规法规。其目标是为大学、政府机构及中小企业提供人工智能计算资源。“主权AI基础设施现已成为国家竞争力的关键组成部分。该计划将这一能力大规模引入印度,赋能当地研究人员、创新者和企业原
General Catalyst向印度市场投资50亿美元
硅谷风投公司General Catalyst(管理资产规模超过430亿美元)近日宣布,计划在未来五年内向印度投资50亿美元。此举大幅扩大了该公司在印度初创企业生态系统中的参与度,距离其与当地公司Venture Highway合并还不到两年。该计划在新德里举行的“印度人工智能影响力峰会”上宣布,投资将主要瞄准人工智能、医疗健康、国防技术、金融科技及消费科技领域的初创企业。这一承诺远超该公司此前为印度





首页






