深度认知发布开源AI模型,已名列前茅

深度思睿推出革命性AI模型
旧金山一家尖端的人工智能研究初创公司深度思睿(Deep Cogito),在其发展历程中迈出了开创性的一步,正式推出了其首条开源大型语言模型(LLMs)系列,命名为Cogito v1。这些模型经过Meta的Llama 3.2微调,具备混合推理能力,既能快速响应,也能进行内省思考——这一特性让人联想到OpenAI的“o”系列和DeepSeek R1。
深度思睿致力于通过在其模型中促进迭代式自我提升,将人工智能推向超越传统人类监督约束的领域。他们的终极目标是开发超智能——一种在所有领域都超越人类能力的人工智能。然而,公司保证所有模型都将保持开源。
深度思睿的首席执行官兼联合创始人德里尚·阿拉(Drishan Arora)曾是谷歌的高级软件工程师,负责领导谷歌生成式搜索产品的大型语言模型开发。他在X平台上自信地表示,这些模型是其规模范围内最强的开源模型之一,优于竞争对手如LLaMA、DeepSeek和Qwen。
模型阵容
首发产品包括五个基础大小的模型——30亿、80亿、140亿、320亿和700亿参数,并已在Hugging Face、Ollama以及Fireworks和Together AI提供的API上可用。这些模型遵循Llama许可条款,在每月用户数不超过7亿的情况下允许商业使用,超过此数量则需从Meta获得付费许可。
深度思睿计划在未来推出更大的模型,潜在参数规模可达6710亿。
训练方法:迭代蒸馏与放大(IDA)
阿拉介绍了IDA,这是一种与传统强化学习从人类反馈(RLHF)或教师模型蒸馏不同的新颖方法。IDA专注于分配额外的计算资源以生成更优解决方案,随后将这种增强的推理嵌入模型本身——这是一个旨在提升能力的持续反馈循环。这种方法类似于谷歌AlphaGo适应自然语言处理的自玩策略。
基准测试与评估
深度思睿展示了全面的评估结果,比较了Cogito模型与开源同行在一般知识、数学推理和多语言任务等领域的表现。主要发现包括:
- Cogito 3B(标准版): 在MMLU上比Llama 3.2 3B高出6.7个百分点(65.4% vs. 58.7%),在Hellaswag上高出18.8个百分点(81.1% vs. 62.3%)。
- Cogito 3B(推理模式): MMLU得分72.6%,ARC得分84.2%。
- Cogito 8B(标准版): MMLU得分80.5%,比Llama 3.1 8B高出12.8个百分点。
- Cogito 8B(推理模式): MMLU得分83.1%,ARC得分92.0%。
- Cogito 70B(标准版): 在MMLU上领先Llama 3.3 70B 6.4个百分点(91.7% vs. 85.3%),并在综合基准测试中超越Llama 4 Scout 109B(54.5% vs. 53.3%)。
尽管Cogito模型在推理模式下表现出色,但在数学任务上存在某些权衡。
本地工具调用
深度思睿还评估了其模型的本地工具调用性能,这对代理和API集成系统至关重要。
- Cogito 3B: 支持四种工具调用任务,并在简单和多重工具调用方面表现出色。
- Cogito 8B: 在所有工具调用类型中表现强劲,显著优于Llama 3.1 8B。
未来计划
展望未来,深度思睿计划推出更大规模的模型,包括参数规模分别为1090亿、4000亿和6710亿的专家混合模型,同时对现有检查点进行持续更新。该公司认为IDA是实现可扩展自我改进的可持续路径,减少对人类或静态教师模型的依赖。
阿拉强调,现实世界的实用性和适应性是成功的最终衡量标准,这仅仅是充满希望旅程的开端。深度思睿与Hugging Face、RunPod、Fireworks AI、Together AI和Ollama等知名实体合作,确保所有模型保持开源且免费访问。
相关文章
谷歌发布面向生产环境的Gemini 2.5 AI模型,挑战企业市场中的OpenAI
谷歌周一加码其AI战略,推出面向企业使用的先进Gemini 2.5模型,并引入成本效益更高的变体,以在价格和性能上展开竞争。这家隶属于Alphabet的公司将其旗舰AI模型——Gemini 2.5 Pro和Gemini 2.5 Flash——从测试阶段提升至全面可用,展示其在关键业务应用中的准备就绪。同时,谷歌推出了Gemini 2.5 Flash-Lite,定位为高容量任务中最具预算友好性的选择
Meta 增强人工智能安全,推出高级 Llama 工具
Meta 发布了新的 Llama 安全工具,以加强人工智能开发并防御新兴威胁。这些升级的 Llama 人工智能模型安全工具与 Meta 的新资源相结合,旨在增强网络安全团队利用人工智能进行防御的能力,提升所有人工智能利益相关者的安全性。使用 Llama 模型的开发者现在可以直接在 Meta 的 Llama Protections 页面、Hugging Face 和 GitHub 上访问增强的工具。
NotebookLM推出顶级出版物和专家精选笔记本
谷歌正在增强其人工智能驱动的研究和笔记工具NotebookLM,使其成为一个综合知识中心。周一,该公司推出了一套由知名作者、出版物、研究人员和非营利组织精心策划的笔记本集合,使用户能够探索健康、旅行、财务等多样化主题。首批内容包括《经济学人》、《大西洋月刊》、知名教授、作者以及莎士比亚作品的贡献,展示了NotebookLM在深入主题探索中的实际应用。谷歌解释说,用户可以访问原始资料,提出问题,深入
评论 (7)
0/200
EricMartin
2025-07-28 09:20:21
Wow, Deep Cogito’s models are killing it! Beating the charts right out the gate is wild. Curious how they stack up against Grok in real-world tasks. 🚀
0
WilliamRamirez
2025-07-28 09:19:30
Wow, Deep Cogito’s open-source models are killing it! Fine-tuning Llama 3.2 to top the charts is no small feat. I’m curious how they’ll stack up against the big players in real-world apps. Exciting times for AI! 🚀
0
BrianWalker
2025-06-07 21:03:53
Wow, Deep Cogito's models are already topping the charts? That's insane! 🤯 I love how open-source AI is advancing so quickly. Can't wait to try these out for some personal projects. Hope they keep up the good work! #AIFuture
0
WalterWalker
2025-06-07 19:30:11
Deep Cogitoのモデルがもうチャートトップとは...速すぎる!🔥 オープンソースの進化が楽しみです。自分でも試してみたいな~。これからも応援してます! #AI革命
0
RaymondBaker
2025-06-07 15:25:31
Deep Cogitos Modelle schon an der Spitze? Wahnsinn! 🤩 Open-Source-IA entwickelt sich rasend schnell. Bin gespannt, was als Nächstes kommt. Weiter so! #KIZukunft
0
JonathanKing
2025-06-07 11:19:30
¡Increíble que los modelos de Deep Cogito ya estén liderando! 🚀 El código abierto está cambiando el juego en IA. Ojalá puedan mantener este ritmo. ¡A ver qué más nos sorprenderán! #IAForAll
0
深度思睿推出革命性AI模型
旧金山一家尖端的人工智能研究初创公司深度思睿(Deep Cogito),在其发展历程中迈出了开创性的一步,正式推出了其首条开源大型语言模型(LLMs)系列,命名为Cogito v1。这些模型经过Meta的Llama 3.2微调,具备混合推理能力,既能快速响应,也能进行内省思考——这一特性让人联想到OpenAI的“o”系列和DeepSeek R1。
深度思睿致力于通过在其模型中促进迭代式自我提升,将人工智能推向超越传统人类监督约束的领域。他们的终极目标是开发超智能——一种在所有领域都超越人类能力的人工智能。然而,公司保证所有模型都将保持开源。
深度思睿的首席执行官兼联合创始人德里尚·阿拉(Drishan Arora)曾是谷歌的高级软件工程师,负责领导谷歌生成式搜索产品的大型语言模型开发。他在X平台上自信地表示,这些模型是其规模范围内最强的开源模型之一,优于竞争对手如LLaMA、DeepSeek和Qwen。
模型阵容
首发产品包括五个基础大小的模型——30亿、80亿、140亿、320亿和700亿参数,并已在Hugging Face、Ollama以及Fireworks和Together AI提供的API上可用。这些模型遵循Llama许可条款,在每月用户数不超过7亿的情况下允许商业使用,超过此数量则需从Meta获得付费许可。
深度思睿计划在未来推出更大的模型,潜在参数规模可达6710亿。
训练方法:迭代蒸馏与放大(IDA)
阿拉介绍了IDA,这是一种与传统强化学习从人类反馈(RLHF)或教师模型蒸馏不同的新颖方法。IDA专注于分配额外的计算资源以生成更优解决方案,随后将这种增强的推理嵌入模型本身——这是一个旨在提升能力的持续反馈循环。这种方法类似于谷歌AlphaGo适应自然语言处理的自玩策略。
基准测试与评估
深度思睿展示了全面的评估结果,比较了Cogito模型与开源同行在一般知识、数学推理和多语言任务等领域的表现。主要发现包括:
- Cogito 3B(标准版): 在MMLU上比Llama 3.2 3B高出6.7个百分点(65.4% vs. 58.7%),在Hellaswag上高出18.8个百分点(81.1% vs. 62.3%)。
- Cogito 3B(推理模式): MMLU得分72.6%,ARC得分84.2%。
- Cogito 8B(标准版): MMLU得分80.5%,比Llama 3.1 8B高出12.8个百分点。
- Cogito 8B(推理模式): MMLU得分83.1%,ARC得分92.0%。
- Cogito 70B(标准版): 在MMLU上领先Llama 3.3 70B 6.4个百分点(91.7% vs. 85.3%),并在综合基准测试中超越Llama 4 Scout 109B(54.5% vs. 53.3%)。
尽管Cogito模型在推理模式下表现出色,但在数学任务上存在某些权衡。
本地工具调用
深度思睿还评估了其模型的本地工具调用性能,这对代理和API集成系统至关重要。
- Cogito 3B: 支持四种工具调用任务,并在简单和多重工具调用方面表现出色。
- Cogito 8B: 在所有工具调用类型中表现强劲,显著优于Llama 3.1 8B。
未来计划
展望未来,深度思睿计划推出更大规模的模型,包括参数规模分别为1090亿、4000亿和6710亿的专家混合模型,同时对现有检查点进行持续更新。该公司认为IDA是实现可扩展自我改进的可持续路径,减少对人类或静态教师模型的依赖。
阿拉强调,现实世界的实用性和适应性是成功的最终衡量标准,这仅仅是充满希望旅程的开端。深度思睿与Hugging Face、RunPod、Fireworks AI、Together AI和Ollama等知名实体合作,确保所有模型保持开源且免费访问。


Wow, Deep Cogito’s models are killing it! Beating the charts right out the gate is wild. Curious how they stack up against Grok in real-world tasks. 🚀




Wow, Deep Cogito’s open-source models are killing it! Fine-tuning Llama 3.2 to top the charts is no small feat. I’m curious how they’ll stack up against the big players in real-world apps. Exciting times for AI! 🚀




Wow, Deep Cogito's models are already topping the charts? That's insane! 🤯 I love how open-source AI is advancing so quickly. Can't wait to try these out for some personal projects. Hope they keep up the good work! #AIFuture




Deep Cogitoのモデルがもうチャートトップとは...速すぎる!🔥 オープンソースの進化が楽しみです。自分でも試してみたいな~。これからも応援してます! #AI革命




Deep Cogitos Modelle schon an der Spitze? Wahnsinn! 🤩 Open-Source-IA entwickelt sich rasend schnell. Bin gespannt, was als Nächstes kommt. Weiter so! #KIZukunft




¡Increíble que los modelos de Deep Cogito ya estén liderando! 🚀 El código abierto está cambiando el juego en IA. Ojalá puedan mantener este ritmo. ¡A ver qué más nos sorprenderán! #IAForAll












