多宇宙计算推动压缩型AI模型走向主流
随着私营企业违约率高达9.2%——创下数年来的最高纪录——风投公司Lux Capital近日建议依赖人工智能的企业,务必就其计算能力获取书面承诺。随着金融动荡在人工智能供应链中蔓延,Lux警告称,仅靠口头协议已不再足够。
但还有一种截然不同的选择:彻底摆脱对外部计算基础设施的依赖。那些直接在用户设备上运行的小型AI模型——无需数据中心、无需云服务商、且不存在交易对手风险——其性能已足够强大,值得认真考虑。而Multiverse Computing正挺身而出。
与某些竞争对手相比,这家西班牙初创公司此前一直保持着相对低调的姿态,但随着对AI效率需求的激增,这种局面正在改变。在对OpenAI、Meta、DeepSeek和Mistral AI等主要AI实验室的模型进行压缩后,该公司发布了两款产品:一款展示其压缩模型能力的应用程序,以及一个API门户——供开发者访问并基于这些模型进行开发的入口——从而使这些模型得以更广泛地应用。
CompactifAI应用(其名称源自Multiverse受量子技术启发的压缩技术)是一款类似于ChatGPT或Mistral的Le Chat的AI聊天工具。用户提出问题,模型便会作出回应。不同之处在于,据该公司称,Multiverse已将Gilda嵌入其中——这是一个极其紧凑的模型,可在本地离线运行。

对于终端用户而言,这让他们得以体验边缘AI:数据始终留在设备上,且无需网络连接。但这有一个前提:用户的移动设备必须具备足够的内存和存储空间。若设备不满足条件(许多旧款iPhone便无法满足),应用将通过API切换至基于云端的模型。 本地与云端处理之间的切换由Multiverse称为“Ash Nazg”的系统自动处理——托尔金粉丝会认出这个名字,它源自《指环王》中“至尊魔戒”的铭文。但当应用切换到云端处理时,其主要的隐私优势便不复存在。
这些限制表明,CompactifAI 尚未准备好被广大消费者广泛采用,尽管这可能从来就不是其初衷。据 Sensor Tower 数据显示,该应用在过去一个月内的下载量不足 5,000 次。
真正的重点在于企业市场。今天,Multiverse 推出了一款自助式 API 门户,让开发者和企业能够直接访问其压缩模型——无需通过 AWS Marketplace。
“CompactifAI API门户[现已]让开发者能够直接获取压缩模型,并具备在生产环境中运行模型所需的透明度和控制权,”CEO恩里克·利萨索(Enrique Lizaso)在声明中表示。
实时使用监控是该API的关键功能,这绝非偶然。除了边缘部署的潜在优势外,更低的计算成本也是企业探索将小型模型作为大型语言模型(LLMs)替代方案的主要原因。
此外,小型模型如今的限制远比以往少得多。本周早些时候,Mistral 通过发布 Mistral Small 4 更新了其小型模型产品线,据称该模型针对通用聊天、编程、代理任务和推理进行了优化。这家法国公司还推出了 Forge 系统,允许企业构建自定义模型,包括小型模型,用户可以在其中选择最适合其用例的权衡方案。
Multiverse的最新成果也表明,其与大型语言模型(LLMs)的差距正在缩小。其最新的压缩模型HyperNova 60B 2602基于gpt-oss-120b构建——这是一款底层代码公开的OpenAI模型。 该公司声称,该模型在成本更低的情况下能提供比原始模型更快的响应速度,这一优势对于代理式编码工作流尤为重要——在此类场景中,AI会自主处理复杂的多步骤编程任务。
在保持实用性的同时将模型压缩到足以在移动设备上运行,是一项重大挑战。Apple Intelligence通过结合本地模型与云端模型来规避这一难题。Multiverse的CompactifAI应用也可通过API将请求路由至gpt-oss-120b,但其主要目标是证明像Gilda及其未来继任者这样的本地模型,不仅能节省成本,还具备其他优势。
对于关键领域的工作人员而言,无需云连接即可本地运行的模型能提供更强的隐私保护和系统韧性。但更大的价值在于其赋能的商业应用场景——例如将AI嵌入无人机、卫星及其他无法保证稳定连接的环境中。
该公司目前已服务于全球100多家客户,包括加拿大银行、博世和伊维德罗拉,但扩大客户群将有助于其获得更多融资。继去年完成2.15亿美元B轮融资后,据报道该公司目前正以超过15亿欧元的估值进行新一轮5亿欧元的融资。
相关文章
Cohere 发布开源多语言 AI 模型系列
企业级人工智能公司Cohere在正在举行的印度人工智能峰会上发布了一款名为Tiny Aya的新型多语言模型系列。这些开放权重模型——即其核心代码可供公众使用和修改——支持70多种语言,且无需联网即可在笔记本电脑等日常设备上运行。该模型由Cohere的研究部门Cohere Labs开发,支持孟加拉语、印地语、旁遮普语、乌尔都语、古吉拉特语、泰米尔语、泰卢固语和马拉地语等南亚语言。基础模型拥有33.5
Multiverse Computing推出免费压缩生成式AI模型
大型语言模型面临着一个重大挑战:其庞大的体量。西班牙初创公司Multiverse Computing正通过创建压缩模型来解决这一问题,旨在弥合尖端人工智能能力与企业实际可负担实施能力之间的差距。其核心创新在于CompactifAI压缩技术——这项受量子计算原理启发的技术已被这家巴斯克公司用于优化OpenAI的模型。从今天起,开发者可在Hugging Face平台免费获取Multiverse增强版H
Meta AI 现已在 Facebook Marketplace 上回复买家消息
Facebook周四宣布,Facebook Marketplace推出了新的Meta AI功能,包括对买家咨询的自动回复。该平台还利用AI加速商品上架、总结卖家资料,并允许卖家在商品列表中提供配送服务。鉴于卖家通常会收到大量买家咨询,Facebook正通过由Meta AI驱动的自动回复功能简化这一流程。当买家询问商品库存情况时,卖家可利用Meta AI根据商品详情(如描述、库存、自提地点和价格)自
相关专题推荐
评论 (0)
0/500
随着私营企业违约率高达9.2%——创下数年来的最高纪录——风投公司Lux Capital近日建议依赖人工智能的企业,务必就其计算能力获取书面承诺。随着金融动荡在人工智能供应链中蔓延,Lux警告称,仅靠口头协议已不再足够。
但还有一种截然不同的选择:彻底摆脱对外部计算基础设施的依赖。那些直接在用户设备上运行的小型AI模型——无需数据中心、无需云服务商、且不存在交易对手风险——其性能已足够强大,值得认真考虑。而Multiverse Computing正挺身而出。
与某些竞争对手相比,这家西班牙初创公司此前一直保持着相对低调的姿态,但随着对AI效率需求的激增,这种局面正在改变。在对OpenAI、Meta、DeepSeek和Mistral AI等主要AI实验室的模型进行压缩后,该公司发布了两款产品:一款展示其压缩模型能力的应用程序,以及一个API门户——供开发者访问并基于这些模型进行开发的入口——从而使这些模型得以更广泛地应用。
CompactifAI应用(其名称源自Multiverse受量子技术启发的压缩技术)是一款类似于ChatGPT或Mistral的Le Chat的AI聊天工具。用户提出问题,模型便会作出回应。不同之处在于,据该公司称,Multiverse已将Gilda嵌入其中——这是一个极其紧凑的模型,可在本地离线运行。

对于终端用户而言,这让他们得以体验边缘AI:数据始终留在设备上,且无需网络连接。但这有一个前提:用户的移动设备必须具备足够的内存和存储空间。若设备不满足条件(许多旧款iPhone便无法满足),应用将通过API切换至基于云端的模型。 本地与云端处理之间的切换由Multiverse称为“Ash Nazg”的系统自动处理——托尔金粉丝会认出这个名字,它源自《指环王》中“至尊魔戒”的铭文。但当应用切换到云端处理时,其主要的隐私优势便不复存在。
这些限制表明,CompactifAI 尚未准备好被广大消费者广泛采用,尽管这可能从来就不是其初衷。据 Sensor Tower 数据显示,该应用在过去一个月内的下载量不足 5,000 次。
真正的重点在于企业市场。今天,Multiverse 推出了一款自助式 API 门户,让开发者和企业能够直接访问其压缩模型——无需通过 AWS Marketplace。
“CompactifAI API门户[现已]让开发者能够直接获取压缩模型,并具备在生产环境中运行模型所需的透明度和控制权,”CEO恩里克·利萨索(Enrique Lizaso)在声明中表示。
实时使用监控是该API的关键功能,这绝非偶然。除了边缘部署的潜在优势外,更低的计算成本也是企业探索将小型模型作为大型语言模型(LLMs)替代方案的主要原因。
此外,小型模型如今的限制远比以往少得多。本周早些时候,Mistral 通过发布 Mistral Small 4 更新了其小型模型产品线,据称该模型针对通用聊天、编程、代理任务和推理进行了优化。这家法国公司还推出了 Forge 系统,允许企业构建自定义模型,包括小型模型,用户可以在其中选择最适合其用例的权衡方案。
Multiverse的最新成果也表明,其与大型语言模型(LLMs)的差距正在缩小。其最新的压缩模型HyperNova 60B 2602基于gpt-oss-120b构建——这是一款底层代码公开的OpenAI模型。 该公司声称,该模型在成本更低的情况下能提供比原始模型更快的响应速度,这一优势对于代理式编码工作流尤为重要——在此类场景中,AI会自主处理复杂的多步骤编程任务。
在保持实用性的同时将模型压缩到足以在移动设备上运行,是一项重大挑战。Apple Intelligence通过结合本地模型与云端模型来规避这一难题。Multiverse的CompactifAI应用也可通过API将请求路由至gpt-oss-120b,但其主要目标是证明像Gilda及其未来继任者这样的本地模型,不仅能节省成本,还具备其他优势。
对于关键领域的工作人员而言,无需云连接即可本地运行的模型能提供更强的隐私保护和系统韧性。但更大的价值在于其赋能的商业应用场景——例如将AI嵌入无人机、卫星及其他无法保证稳定连接的环境中。
该公司目前已服务于全球100多家客户,包括加拿大银行、博世和伊维德罗拉,但扩大客户群将有助于其获得更多融资。继去年完成2.15亿美元B轮融资后,据报道该公司目前正以超过15亿欧元的估值进行新一轮5亿欧元的融资。
Cohere 发布开源多语言 AI 模型系列
企业级人工智能公司Cohere在正在举行的印度人工智能峰会上发布了一款名为Tiny Aya的新型多语言模型系列。这些开放权重模型——即其核心代码可供公众使用和修改——支持70多种语言,且无需联网即可在笔记本电脑等日常设备上运行。该模型由Cohere的研究部门Cohere Labs开发,支持孟加拉语、印地语、旁遮普语、乌尔都语、古吉拉特语、泰米尔语、泰卢固语和马拉地语等南亚语言。基础模型拥有33.5
Multiverse Computing推出免费压缩生成式AI模型
大型语言模型面临着一个重大挑战:其庞大的体量。西班牙初创公司Multiverse Computing正通过创建压缩模型来解决这一问题,旨在弥合尖端人工智能能力与企业实际可负担实施能力之间的差距。其核心创新在于CompactifAI压缩技术——这项受量子计算原理启发的技术已被这家巴斯克公司用于优化OpenAI的模型。从今天起,开发者可在Hugging Face平台免费获取Multiverse增强版H
Meta AI 现已在 Facebook Marketplace 上回复买家消息
Facebook周四宣布,Facebook Marketplace推出了新的Meta AI功能,包括对买家咨询的自动回复。该平台还利用AI加速商品上架、总结卖家资料,并允许卖家在商品列表中提供配送服务。鉴于卖家通常会收到大量买家咨询,Facebook正通过由Meta AI驱动的自动回复功能简化这一流程。当买家询问商品库存情况时,卖家可利用Meta AI根据商品详情(如描述、库存、自提地点和价格)自





首页






