深度认知发布开源AI模型,已名列前茅

深度Cogito推出革命性AI模型
深度Cogito,一家位于旧金山的尖端AI研究初创公司,正式发布了其首款开源大型语言模型(LLMs),命名为Cogito v1。这些模型基于Meta的Llama 3.2进行微调,具备混合推理能力,可快速响应或进行内省思考,类似于OpenAI的“o”系列和DeepSeek R1。
深度Cogito致力于推动AI超越传统人类监督限制,通过模型内部的迭代自我改进实现。其终极目标?开发超级智能——在所有领域超越人类能力的AI。公司承诺所有模型将保持开源。
深度Cogito首席执行官兼联合创始人Drishan Arora曾任Google高级软件工程师,领导Google生成搜索产品的LLM开发。他在X上自信表示,这些模型在其规模上是最强的开源模型,超越LLaMA、DeepSeek和Qwen等竞争对手。
模型阵容
初始产品包括五种基本规模——30亿、80亿、140亿、320亿和700亿参数,现已可在Hugging Face、Ollama及通过Fireworks和Together AI的API等平台访问。这些模型遵循Llama许可条款,允许高达7亿月活跃用户的商业使用,超出需从Meta获得付费许可。
深度Cogito计划在不久的将来推出更大规模的模型,可能达到6710亿参数。
训练方法:迭代蒸馏与放大(IDA)
Arora介绍了IDA,一种区别于传统人类反馈强化学习(RLHF)或教师模型蒸馏的新方法。IDA专注于分配额外计算资源以生成更优解决方案,随后将增强的推理能力嵌入模型本身,形成持续反馈循环以提升能力。这种方法类似于Google AlphaGo的自我对弈策略,适用于自然语言处理。
基准测试与评估
深度Cogito展示了Cogito模型与开源模型在通用知识、数学推理和多语言任务等领域的全面评估结果。主要发现包括:
- Cogito 3B(标准版): 在MMLU上比LLaMA 3.2 3B高6.7个百分点(65.4% vs. 58.7%),在Hellaswag上高18.8个百分点(81.1% vs. 62.3%)。
- Cogito 3B(推理模式): 在MMLU上得分72.6%,在ARC上得分84.2%。
- Cogito 8B(标准版): 在MMLU上达到80.5%,比LLaMA 3.1 8B高12.8个百分点。
- Cogito 8B(推理模式): 在MMLU上得分83.1%,在ARC上得分92.0%。
- Cogito 70B(标准版): 在MMLU上比LLaMA 3.3 70B高6.4个百分点(91.7% vs. 85.3%),在综合基准测试上超越LLaMA 4 Scout 109B(54.5% vs. 53.3%)。
尽管Cogito模型在推理模式下表现出色,但在数学任务中存在一定权衡。
原生工具调用
深度Cogito还评估了其模型的原生工具调用性能,这对代理和API集成系统至关重要。
- Cogito 3B: 支持四种工具调用任务,在简单和多工具调用中表现优异。
- Cogito 8B: 在所有工具调用类型中表现强劲,显著超越LLaMA 3.1 8B。
未来计划
展望未来,深度Cogito计划推出更大模型,包括1090亿、4000亿和6710亿参数的专家混合变体,同时持续更新现有检查点。公司将IDA视为可扩展自我改进的可持续路径,减少对人类或静态教师模型的依赖。
Arora强调,现实世界的实用性和适应性是成功的终极衡量标准,这只是一个充满希望的旅程的开始。深度Cogito与Hugging Face、RunPod、Fireworks AI、Together AI和Ollama等知名实体合作,确保所有模型保持开源和免费访问。
相关文章
特朗普优先考虑人工智能发展而非监管,力争超越中国
特朗普政府周三公布了具有里程碑意义的《人工智能行动计划》,标志着与拜登政府规避风险的人工智能政策的决裂。这份雄心勃勃的蓝图将积极的基础设施建设、全面的监管改革、强化的国家安全措施以及与中国在人工智能领域的战略竞争列为优先事项。这一政策转变可能会对经济和社会产生广泛影响,尤其是在能源使用和环境监管方面。政府建议扩大数据中心的建设,包括在联邦土地上的建设,同时可能在能源需求高峰期放宽对环境的保护--这
YouTube 将 Veo 3 人工智能视频工具直接整合到短片平台中
今年夏天,YouTube 短片将采用 Veo 3 人工智能视频模式YouTube 首席执行官尼尔-莫汉(Neal Mohan)在戛纳国际电影节主题演讲中透露,该平台最先进的 Veo 3 人工智能视频生成技术将于今年夏天晚些时候在 YouTube Shorts 上首次亮相。此前,艾利森-约翰逊(Allison Johnson)在评论中将 Veo 3 描述为人工智能辅助内容创作的革命。目前,短片创作者
顶级人工智能实验室警告人类正在失去理解人工智能系统的能力
来自 OpenAI、谷歌 DeepMind、Anthropic 和 Meta 的研究人员前所未有地团结起来,搁置竞争分歧,就负责任的人工智能发展发出集体警告。来自这些通常相互竞争的组织的 40 多名顶尖科学家共同撰写了一篇开创性的研究论文,强调确保人工智能决策过程透明度的窗口正在迅速关闭。这次合作的重点是现代人工智能系统的一个关键发展--它们在生成最终输出之前,能够以人类可读的语言阐明推理过程的新
评论 (8)
0/200
AlbertGonzalez
2025-09-10 00:30:52
Deep Cogito這麼快就衝上榜單也太強了吧!看來開源模型真的越來越厲害了,不過這樣會不會讓LLM市場更競爭啊?🤔 我還是擔心小公司以後根本玩不起...
0
EricMartin
2025-07-28 09:20:21
Wow, Deep Cogito’s models are killing it! Beating the charts right out the gate is wild. Curious how they stack up against Grok in real-world tasks. 🚀
0
WilliamRamirez
2025-07-28 09:19:30
Wow, Deep Cogito’s open-source models are killing it! Fine-tuning Llama 3.2 to top the charts is no small feat. I’m curious how they’ll stack up against the big players in real-world apps. Exciting times for AI! 🚀
0
BrianWalker
2025-06-07 21:03:53
Wow, Deep Cogito's models are already topping the charts? That's insane! 🤯 I love how open-source AI is advancing so quickly. Can't wait to try these out for some personal projects. Hope they keep up the good work! #AIFuture
0
WalterWalker
2025-06-07 19:30:11
Deep Cogitoのモデルがもうチャートトップとは...速すぎる!🔥 オープンソースの進化が楽しみです。自分でも試してみたいな~。これからも応援してます! #AI革命
0
RaymondBaker
2025-06-07 15:25:31
Deep Cogitos Modelle schon an der Spitze? Wahnsinn! 🤩 Open-Source-IA entwickelt sich rasend schnell. Bin gespannt, was als Nächstes kommt. Weiter so! #KIZukunft
0
深度Cogito推出革命性AI模型
深度Cogito,一家位于旧金山的尖端AI研究初创公司,正式发布了其首款开源大型语言模型(LLMs),命名为Cogito v1。这些模型基于Meta的Llama 3.2进行微调,具备混合推理能力,可快速响应或进行内省思考,类似于OpenAI的“o”系列和DeepSeek R1。
深度Cogito致力于推动AI超越传统人类监督限制,通过模型内部的迭代自我改进实现。其终极目标?开发超级智能——在所有领域超越人类能力的AI。公司承诺所有模型将保持开源。
深度Cogito首席执行官兼联合创始人Drishan Arora曾任Google高级软件工程师,领导Google生成搜索产品的LLM开发。他在X上自信表示,这些模型在其规模上是最强的开源模型,超越LLaMA、DeepSeek和Qwen等竞争对手。
模型阵容
初始产品包括五种基本规模——30亿、80亿、140亿、320亿和700亿参数,现已可在Hugging Face、Ollama及通过Fireworks和Together AI的API等平台访问。这些模型遵循Llama许可条款,允许高达7亿月活跃用户的商业使用,超出需从Meta获得付费许可。
深度Cogito计划在不久的将来推出更大规模的模型,可能达到6710亿参数。
训练方法:迭代蒸馏与放大(IDA)
Arora介绍了IDA,一种区别于传统人类反馈强化学习(RLHF)或教师模型蒸馏的新方法。IDA专注于分配额外计算资源以生成更优解决方案,随后将增强的推理能力嵌入模型本身,形成持续反馈循环以提升能力。这种方法类似于Google AlphaGo的自我对弈策略,适用于自然语言处理。
基准测试与评估
深度Cogito展示了Cogito模型与开源模型在通用知识、数学推理和多语言任务等领域的全面评估结果。主要发现包括:
- Cogito 3B(标准版): 在MMLU上比LLaMA 3.2 3B高6.7个百分点(65.4% vs. 58.7%),在Hellaswag上高18.8个百分点(81.1% vs. 62.3%)。
- Cogito 3B(推理模式): 在MMLU上得分72.6%,在ARC上得分84.2%。
- Cogito 8B(标准版): 在MMLU上达到80.5%,比LLaMA 3.1 8B高12.8个百分点。
- Cogito 8B(推理模式): 在MMLU上得分83.1%,在ARC上得分92.0%。
- Cogito 70B(标准版): 在MMLU上比LLaMA 3.3 70B高6.4个百分点(91.7% vs. 85.3%),在综合基准测试上超越LLaMA 4 Scout 109B(54.5% vs. 53.3%)。
尽管Cogito模型在推理模式下表现出色,但在数学任务中存在一定权衡。
原生工具调用
深度Cogito还评估了其模型的原生工具调用性能,这对代理和API集成系统至关重要。
- Cogito 3B: 支持四种工具调用任务,在简单和多工具调用中表现优异。
- Cogito 8B: 在所有工具调用类型中表现强劲,显著超越LLaMA 3.1 8B。
未来计划
展望未来,深度Cogito计划推出更大模型,包括1090亿、4000亿和6710亿参数的专家混合变体,同时持续更新现有检查点。公司将IDA视为可扩展自我改进的可持续路径,减少对人类或静态教师模型的依赖。
Arora强调,现实世界的实用性和适应性是成功的终极衡量标准,这只是一个充满希望的旅程的开始。深度Cogito与Hugging Face、RunPod、Fireworks AI、Together AI和Ollama等知名实体合作,确保所有模型保持开源和免费访问。




Deep Cogito這麼快就衝上榜單也太強了吧!看來開源模型真的越來越厲害了,不過這樣會不會讓LLM市場更競爭啊?🤔 我還是擔心小公司以後根本玩不起...




Wow, Deep Cogito’s models are killing it! Beating the charts right out the gate is wild. Curious how they stack up against Grok in real-world tasks. 🚀




Wow, Deep Cogito’s open-source models are killing it! Fine-tuning Llama 3.2 to top the charts is no small feat. I’m curious how they’ll stack up against the big players in real-world apps. Exciting times for AI! 🚀




Wow, Deep Cogito's models are already topping the charts? That's insane! 🤯 I love how open-source AI is advancing so quickly. Can't wait to try these out for some personal projects. Hope they keep up the good work! #AIFuture




Deep Cogitoのモデルがもうチャートトップとは...速すぎる!🔥 オープンソースの進化が楽しみです。自分でも試してみたいな~。これからも応援してます! #AI革命




Deep Cogitos Modelle schon an der Spitze? Wahnsinn! 🤩 Open-Source-IA entwickelt sich rasend schnell. Bin gespannt, was als Nächstes kommt. Weiter so! #KIZukunft












