选项
首页
新闻
深度认知发布开源AI模型,已名列前茅

深度认知发布开源AI模型,已名列前茅

2025-06-06
124

深度认知发布开源AI模型,已名列前茅

深度Cogito推出革命性AI模型

深度Cogito,一家位于旧金山的尖端AI研究初创公司,正式发布了其首款开源大型语言模型(LLMs),命名为Cogito v1。这些模型基于Meta的Llama 3.2进行微调,具备混合推理能力,可快速响应或进行内省思考,类似于OpenAI的“o”系列和DeepSeek R1。

深度Cogito致力于推动AI超越传统人类监督限制,通过模型内部的迭代自我改进实现。其终极目标?开发超级智能——在所有领域超越人类能力的AI。公司承诺所有模型将保持开源。

深度Cogito首席执行官兼联合创始人Drishan Arora曾任Google高级软件工程师,领导Google生成搜索产品的LLM开发。他在X上自信表示,这些模型在其规模上是最强的开源模型,超越LLaMA、DeepSeek和Qwen等竞争对手。

模型阵容

初始产品包括五种基本规模——30亿、80亿、140亿、320亿和700亿参数,现已可在Hugging Face、Ollama及通过Fireworks和Together AI的API等平台访问。这些模型遵循Llama许可条款,允许高达7亿月活跃用户的商业使用,超出需从Meta获得付费许可。

深度Cogito计划在不久的将来推出更大规模的模型,可能达到6710亿参数。

训练方法:迭代蒸馏与放大(IDA)

Arora介绍了IDA,一种区别于传统人类反馈强化学习(RLHF)或教师模型蒸馏的新方法。IDA专注于分配额外计算资源以生成更优解决方案,随后将增强的推理能力嵌入模型本身,形成持续反馈循环以提升能力。这种方法类似于Google AlphaGo的自我对弈策略,适用于自然语言处理。

基准测试与评估

深度Cogito展示了Cogito模型与开源模型在通用知识、数学推理和多语言任务等领域的全面评估结果。主要发现包括:

  • Cogito 3B(标准版): 在MMLU上比LLaMA 3.2 3B高6.7个百分点(65.4% vs. 58.7%),在Hellaswag上高18.8个百分点(81.1% vs. 62.3%)。
  • Cogito 3B(推理模式): 在MMLU上得分72.6%,在ARC上得分84.2%。
  • Cogito 8B(标准版): 在MMLU上达到80.5%,比LLaMA 3.1 8B高12.8个百分点。
  • Cogito 8B(推理模式): 在MMLU上得分83.1%,在ARC上得分92.0%。
  • Cogito 70B(标准版): 在MMLU上比LLaMA 3.3 70B高6.4个百分点(91.7% vs. 85.3%),在综合基准测试上超越LLaMA 4 Scout 109B(54.5% vs. 53.3%)。

尽管Cogito模型在推理模式下表现出色,但在数学任务中存在一定权衡。

原生工具调用

深度Cogito还评估了其模型的原生工具调用性能,这对代理和API集成系统至关重要。

  • Cogito 3B: 支持四种工具调用任务,在简单和多工具调用中表现优异。
  • Cogito 8B: 在所有工具调用类型中表现强劲,显著超越LLaMA 3.1 8B。

未来计划

展望未来,深度Cogito计划推出更大模型,包括1090亿、4000亿和6710亿参数的专家混合变体,同时持续更新现有检查点。公司将IDA视为可扩展自我改进的可持续路径,减少对人类或静态教师模型的依赖。

Arora强调,现实世界的实用性和适应性是成功的终极衡量标准,这只是一个充满希望的旅程的开始。深度Cogito与Hugging Face、RunPod、Fireworks AI、Together AI和Ollama等知名实体合作,确保所有模型保持开源和免费访问。

相关文章
Notion 将其工作区转变为人工智能代理的枢纽 Notion 将其工作区转变为人工智能代理的枢纽 生产力软件公司 Notion 正迈入智能代理时代。在周三的一场直播产品发布会上,以协作式笔记应用而闻名的 Notion 推出了一款全新的开发者平台。该平台不仅扩展了其定制 AI 代理的功能,还能与外部代理连接,并允许团队构建能够从任何数据库提取数据的自动化多步骤工作流。通过构建一个编排层——即一个能在多个工具和数据源之间协调AI工作的系统——Notion将自身定位为不仅仅是一款具备AI功能的笔记应
ElevenLabs宣布黑石集团、杰米·福克斯和伊娃·朗格利亚成为新投资者 ElevenLabs宣布黑石集团、杰米·福克斯和伊娃·朗格利亚成为新投资者 语音人工智能公司ElevenLabs披露了其5亿美元D轮融资的更多投资者名单,该轮融资最初于2月宣布。 其中包括贝莱德(BlackRock)、威灵顿(Wellington)、D.E. Shaw和施罗德(Schroders)等机构投资者;英伟达(NVIDIA)、Salesforce、桑坦德银行(Santander)、KPN和德国电信(Deutsche Telekom)等企业;以及杰米·福克斯(Jam
Google I/O 2026 发布 Gmail 收件箱语音交互功能 Google I/O 2026 发布 Gmail 收件箱语音交互功能 谷歌正持续将人工智能融入用户的收件箱。在周二举行的IO 2026开发者大会上,该公司通过对话式人工智能扩展了Gmail的“AI收件箱”功能,让用户能够针对收件箱内容提出问题,而不再仅依赖搜索关键词。据谷歌介绍,这款由Gemini AI驱动的工具名为Gmail Live,可帮助用户快速定位收件箱中被埋没的信息。图片来源:谷歌例如,您可能需要查询即将出发的航班详情、牙医预约时间、爱彼迎(Airbnb)
相关专题推荐
写作 最佳免费且无法被识别的AI写作工具:将生硬的草稿转化为自然流畅、宛如人类撰写的文字
最佳免费且无法被识别的AI写作工具:将生硬的草稿转化为自然流畅、宛如人类撰写的文字

在 XIX.AI 探索 2026 年最佳免费且难以被察觉的 AI 写作工具。我们精心筛选的顶级推荐清单,助您将生硬的草稿转化为自然流畅、宛如人类撰写的文字。通过实际测试和每周更新的排行榜,对比免费与付费选项。立即解锁您的 AI 写作优势。

10 个工具
xix.ai
图像编辑 用于短剧故事板的AI艺术生成工具:幻想与都市浪漫题材的角色设计
用于短剧故事板的AI艺术生成工具:幻想与都市浪漫题材的角色设计

2026最新推荐:探索最适合用于短剧故事板制作的AI艺术生成工具。我们精心挑选了众多顶级工具,帮助您创作出引人入胜的幻想角色和都市浪漫角色。您可以对比免费与付费选项,查看实际测试结果,从而找到最适合自己的创意工具。XIX.AI还会每周更新排名并提供专家分析,让您立即开始将故事可视化呈现吧!

10 个工具
xix.ai
写作 最适合广播和播客使用的AI脚本编写工具:帮助您创作引人入胜的音频广告
最适合广播和播客使用的AI脚本编写工具:帮助您创作引人入胜的音频广告

在XIX.AI上,发现2026年最适合用于广播和播客制作的AI脚本工具。我们精心挑选的这些高评分工具能够提供强大的功能,帮助您快速制作出引人入胜的音频广告。通过实际测试和每周更新的排名,您可以了解免费选项与付费选项之间的差异。今天就释放您的创造力吧!

10 个工具
xix.ai
商业 最佳 AI 合同审查软件:即时发现法律漏洞与合规风险
最佳 AI 合同审查软件:即时发现法律漏洞与合规风险

在 XIX.AI 上探索 2026 年最佳 AI 合同审查软件。我们精心筛选的顶级榜单汇集了功能强大的工具,能够即时发现法律漏洞和合规风险。通过实际测试和每周更新的排名,对比免费与付费选项。找到能彻底改变游戏规则的解决方案,实现安全、高效的合同分析。立即探索这本权威指南。

10 个工具
xix.ai
动画创作 专为东华设计的AI动漫生成器:可用于创建网络小说角色及漫画头像
专为东华设计的AI动漫生成器:可用于创建网络小说角色及漫画头像

探索2026年最适合制作中文动画的人工智能工具。我们精心挑选的顶级列表中包含了各种强大的工具,能够帮助你创建出令人惊叹的网络小说角色和漫画头像。通过实际测试来对比免费选项和付费选项,找到最适合你的创作工具,今天就在XIX.AI上将你的故事变为现实吧。

10 个工具
xix.ai
漫画创作 漫画领域顶尖的AI自动上色工具:零一致性错误地应用平涂色彩
漫画领域顶尖的AI自动上色工具:零一致性错误地应用平涂色彩

立即访问 XIX.AI,探索 2026 年最优秀的漫画 AI 自动上色工具。我们精心筛选的清单汇集了广受好评、颠覆行业的解决方案,这些工具能以零一致性错误的方式应用平涂色彩,从而大幅提升您的工作效率。通过免费版与付费版的对比分析、实际测试以及每周更新的排行榜,找到最适合您的工具。立即开启您的 AI 优势。

10 个工具
xix.ai
评论 (10)
0/500
LarryAdams
LarryAdams 2026-03-24 10:01:02

Wait, another open-source player topping charts overnight? 🤔 I'll admit the numbers look impressive on paper, but seeing a startup immediately "top the charts" feels a bit... marketing-heavy. Is this sustainable innovation or just great fine-tuning of existing bedrock like Llama 3.2? The field is getting crowded, and I genuinely wonder how many of these new models will actually be around in two years. Still, competition is good for us users! Excited to test it myself and see if it lives up to the hype.

RichardGonzález
RichardGonzález 2025-10-27 02:30:35

Interesting to see another player in the open-source AI field! I have mixed feelings—skeptical about 'revolutionary' claims from new startups, even with impressive initial benchmarks. Hope they can really deliver real-world applications beyond just chart performance. This space is getting crowded 🌱

AlbertGonzalez
AlbertGonzalez 2025-09-10 00:30:52

Deep Cogito這麼快就衝上榜單也太強了吧!看來開源模型真的越來越厲害了,不過這樣會不會讓LLM市場更競爭啊?🤔 我還是擔心小公司以後根本玩不起...

EricMartin
EricMartin 2025-07-28 09:20:21

Wow, Deep Cogito’s models are killing it! Beating the charts right out the gate is wild. Curious how they stack up against Grok in real-world tasks. 🚀

WilliamRamirez
WilliamRamirez 2025-07-28 09:19:30

Wow, Deep Cogito’s open-source models are killing it! Fine-tuning Llama 3.2 to top the charts is no small feat. I’m curious how they’ll stack up against the big players in real-world apps. Exciting times for AI! 🚀

BrianWalker
BrianWalker 2025-06-07 21:03:53

Wow, Deep Cogito's models are already topping the charts? That's insane! 🤯 I love how open-source AI is advancing so quickly. Can't wait to try these out for some personal projects. Hope they keep up the good work! #AIFuture

OR