深度认知发布开源AI模型,已名列前茅

深度Cogito推出革命性AI模型
深度Cogito,一家位于旧金山的尖端AI研究初创公司,正式发布了其首款开源大型语言模型(LLMs),命名为Cogito v1。这些模型基于Meta的Llama 3.2进行微调,具备混合推理能力,可快速响应或进行内省思考,类似于OpenAI的“o”系列和DeepSeek R1。
深度Cogito致力于推动AI超越传统人类监督限制,通过模型内部的迭代自我改进实现。其终极目标?开发超级智能——在所有领域超越人类能力的AI。公司承诺所有模型将保持开源。
深度Cogito首席执行官兼联合创始人Drishan Arora曾任Google高级软件工程师,领导Google生成搜索产品的LLM开发。他在X上自信表示,这些模型在其规模上是最强的开源模型,超越LLaMA、DeepSeek和Qwen等竞争对手。
模型阵容
初始产品包括五种基本规模——30亿、80亿、140亿、320亿和700亿参数,现已可在Hugging Face、Ollama及通过Fireworks和Together AI的API等平台访问。这些模型遵循Llama许可条款,允许高达7亿月活跃用户的商业使用,超出需从Meta获得付费许可。
深度Cogito计划在不久的将来推出更大规模的模型,可能达到6710亿参数。
训练方法:迭代蒸馏与放大(IDA)
Arora介绍了IDA,一种区别于传统人类反馈强化学习(RLHF)或教师模型蒸馏的新方法。IDA专注于分配额外计算资源以生成更优解决方案,随后将增强的推理能力嵌入模型本身,形成持续反馈循环以提升能力。这种方法类似于Google AlphaGo的自我对弈策略,适用于自然语言处理。
基准测试与评估
深度Cogito展示了Cogito模型与开源模型在通用知识、数学推理和多语言任务等领域的全面评估结果。主要发现包括:
- Cogito 3B(标准版): 在MMLU上比LLaMA 3.2 3B高6.7个百分点(65.4% vs. 58.7%),在Hellaswag上高18.8个百分点(81.1% vs. 62.3%)。
- Cogito 3B(推理模式): 在MMLU上得分72.6%,在ARC上得分84.2%。
- Cogito 8B(标准版): 在MMLU上达到80.5%,比LLaMA 3.1 8B高12.8个百分点。
- Cogito 8B(推理模式): 在MMLU上得分83.1%,在ARC上得分92.0%。
- Cogito 70B(标准版): 在MMLU上比LLaMA 3.3 70B高6.4个百分点(91.7% vs. 85.3%),在综合基准测试上超越LLaMA 4 Scout 109B(54.5% vs. 53.3%)。
尽管Cogito模型在推理模式下表现出色,但在数学任务中存在一定权衡。
原生工具调用
深度Cogito还评估了其模型的原生工具调用性能,这对代理和API集成系统至关重要。
- Cogito 3B: 支持四种工具调用任务,在简单和多工具调用中表现优异。
- Cogito 8B: 在所有工具调用类型中表现强劲,显著超越LLaMA 3.1 8B。
未来计划
展望未来,深度Cogito计划推出更大模型,包括1090亿、4000亿和6710亿参数的专家混合变体,同时持续更新现有检查点。公司将IDA视为可扩展自我改进的可持续路径,减少对人类或静态教师模型的依赖。
Arora强调,现实世界的实用性和适应性是成功的终极衡量标准,这只是一个充满希望的旅程的开始。深度Cogito与Hugging Face、RunPod、Fireworks AI、Together AI和Ollama等知名实体合作,确保所有模型保持开源和免费访问。
相关文章
Notion 将其工作区转变为人工智能代理的枢纽
生产力软件公司 Notion 正迈入智能代理时代。在周三的一场直播产品发布会上,以协作式笔记应用而闻名的 Notion 推出了一款全新的开发者平台。该平台不仅扩展了其定制 AI 代理的功能,还能与外部代理连接,并允许团队构建能够从任何数据库提取数据的自动化多步骤工作流。通过构建一个编排层——即一个能在多个工具和数据源之间协调AI工作的系统——Notion将自身定位为不仅仅是一款具备AI功能的笔记应
ElevenLabs宣布黑石集团、杰米·福克斯和伊娃·朗格利亚成为新投资者
语音人工智能公司ElevenLabs披露了其5亿美元D轮融资的更多投资者名单,该轮融资最初于2月宣布。 其中包括贝莱德(BlackRock)、威灵顿(Wellington)、D.E. Shaw和施罗德(Schroders)等机构投资者;英伟达(NVIDIA)、Salesforce、桑坦德银行(Santander)、KPN和德国电信(Deutsche Telekom)等企业;以及杰米·福克斯(Jam
Google I/O 2026 发布 Gmail 收件箱语音交互功能
谷歌正持续将人工智能融入用户的收件箱。在周二举行的IO 2026开发者大会上,该公司通过对话式人工智能扩展了Gmail的“AI收件箱”功能,让用户能够针对收件箱内容提出问题,而不再仅依赖搜索关键词。据谷歌介绍,这款由Gemini AI驱动的工具名为Gmail Live,可帮助用户快速定位收件箱中被埋没的信息。图片来源:谷歌例如,您可能需要查询即将出发的航班详情、牙医预约时间、爱彼迎(Airbnb)
相关专题推荐
评论 (10)
0/500
Wait, another open-source player topping charts overnight? 🤔 I'll admit the numbers look impressive on paper, but seeing a startup immediately "top the charts" feels a bit... marketing-heavy. Is this sustainable innovation or just great fine-tuning of existing bedrock like Llama 3.2? The field is getting crowded, and I genuinely wonder how many of these new models will actually be around in two years. Still, competition is good for us users! Excited to test it myself and see if it lives up to the hype.
Interesting to see another player in the open-source AI field! I have mixed feelings—skeptical about 'revolutionary' claims from new startups, even with impressive initial benchmarks. Hope they can really deliver real-world applications beyond just chart performance. This space is getting crowded 🌱
Wow, Deep Cogito’s models are killing it! Beating the charts right out the gate is wild. Curious how they stack up against Grok in real-world tasks. 🚀
Wow, Deep Cogito’s open-source models are killing it! Fine-tuning Llama 3.2 to top the charts is no small feat. I’m curious how they’ll stack up against the big players in real-world apps. Exciting times for AI! 🚀

深度Cogito推出革命性AI模型
深度Cogito,一家位于旧金山的尖端AI研究初创公司,正式发布了其首款开源大型语言模型(LLMs),命名为Cogito v1。这些模型基于Meta的Llama 3.2进行微调,具备混合推理能力,可快速响应或进行内省思考,类似于OpenAI的“o”系列和DeepSeek R1。
深度Cogito致力于推动AI超越传统人类监督限制,通过模型内部的迭代自我改进实现。其终极目标?开发超级智能——在所有领域超越人类能力的AI。公司承诺所有模型将保持开源。
深度Cogito首席执行官兼联合创始人Drishan Arora曾任Google高级软件工程师,领导Google生成搜索产品的LLM开发。他在X上自信表示,这些模型在其规模上是最强的开源模型,超越LLaMA、DeepSeek和Qwen等竞争对手。
模型阵容
初始产品包括五种基本规模——30亿、80亿、140亿、320亿和700亿参数,现已可在Hugging Face、Ollama及通过Fireworks和Together AI的API等平台访问。这些模型遵循Llama许可条款,允许高达7亿月活跃用户的商业使用,超出需从Meta获得付费许可。
深度Cogito计划在不久的将来推出更大规模的模型,可能达到6710亿参数。
训练方法:迭代蒸馏与放大(IDA)
Arora介绍了IDA,一种区别于传统人类反馈强化学习(RLHF)或教师模型蒸馏的新方法。IDA专注于分配额外计算资源以生成更优解决方案,随后将增强的推理能力嵌入模型本身,形成持续反馈循环以提升能力。这种方法类似于Google AlphaGo的自我对弈策略,适用于自然语言处理。
基准测试与评估
深度Cogito展示了Cogito模型与开源模型在通用知识、数学推理和多语言任务等领域的全面评估结果。主要发现包括:
- Cogito 3B(标准版): 在MMLU上比LLaMA 3.2 3B高6.7个百分点(65.4% vs. 58.7%),在Hellaswag上高18.8个百分点(81.1% vs. 62.3%)。
- Cogito 3B(推理模式): 在MMLU上得分72.6%,在ARC上得分84.2%。
- Cogito 8B(标准版): 在MMLU上达到80.5%,比LLaMA 3.1 8B高12.8个百分点。
- Cogito 8B(推理模式): 在MMLU上得分83.1%,在ARC上得分92.0%。
- Cogito 70B(标准版): 在MMLU上比LLaMA 3.3 70B高6.4个百分点(91.7% vs. 85.3%),在综合基准测试上超越LLaMA 4 Scout 109B(54.5% vs. 53.3%)。
尽管Cogito模型在推理模式下表现出色,但在数学任务中存在一定权衡。
原生工具调用
深度Cogito还评估了其模型的原生工具调用性能,这对代理和API集成系统至关重要。
- Cogito 3B: 支持四种工具调用任务,在简单和多工具调用中表现优异。
- Cogito 8B: 在所有工具调用类型中表现强劲,显著超越LLaMA 3.1 8B。
未来计划
展望未来,深度Cogito计划推出更大模型,包括1090亿、4000亿和6710亿参数的专家混合变体,同时持续更新现有检查点。公司将IDA视为可扩展自我改进的可持续路径,减少对人类或静态教师模型的依赖。
Arora强调,现实世界的实用性和适应性是成功的终极衡量标准,这只是一个充满希望的旅程的开始。深度Cogito与Hugging Face、RunPod、Fireworks AI、Together AI和Ollama等知名实体合作,确保所有模型保持开源和免费访问。
Notion 将其工作区转变为人工智能代理的枢纽
生产力软件公司 Notion 正迈入智能代理时代。在周三的一场直播产品发布会上,以协作式笔记应用而闻名的 Notion 推出了一款全新的开发者平台。该平台不仅扩展了其定制 AI 代理的功能,还能与外部代理连接,并允许团队构建能够从任何数据库提取数据的自动化多步骤工作流。通过构建一个编排层——即一个能在多个工具和数据源之间协调AI工作的系统——Notion将自身定位为不仅仅是一款具备AI功能的笔记应
ElevenLabs宣布黑石集团、杰米·福克斯和伊娃·朗格利亚成为新投资者
语音人工智能公司ElevenLabs披露了其5亿美元D轮融资的更多投资者名单,该轮融资最初于2月宣布。 其中包括贝莱德(BlackRock)、威灵顿(Wellington)、D.E. Shaw和施罗德(Schroders)等机构投资者;英伟达(NVIDIA)、Salesforce、桑坦德银行(Santander)、KPN和德国电信(Deutsche Telekom)等企业;以及杰米·福克斯(Jam
Google I/O 2026 发布 Gmail 收件箱语音交互功能
谷歌正持续将人工智能融入用户的收件箱。在周二举行的IO 2026开发者大会上,该公司通过对话式人工智能扩展了Gmail的“AI收件箱”功能,让用户能够针对收件箱内容提出问题,而不再仅依赖搜索关键词。据谷歌介绍,这款由Gemini AI驱动的工具名为Gmail Live,可帮助用户快速定位收件箱中被埋没的信息。图片来源:谷歌例如,您可能需要查询即将出发的航班详情、牙医预约时间、爱彼迎(Airbnb)
Wait, another open-source player topping charts overnight? 🤔 I'll admit the numbers look impressive on paper, but seeing a startup immediately "top the charts" feels a bit... marketing-heavy. Is this sustainable innovation or just great fine-tuning of existing bedrock like Llama 3.2? The field is getting crowded, and I genuinely wonder how many of these new models will actually be around in two years. Still, competition is good for us users! Excited to test it myself and see if it lives up to the hype.
Interesting to see another player in the open-source AI field! I have mixed feelings—skeptical about 'revolutionary' claims from new startups, even with impressive initial benchmarks. Hope they can really deliver real-world applications beyond just chart performance. This space is getting crowded 🌱
Wow, Deep Cogito’s models are killing it! Beating the charts right out the gate is wild. Curious how they stack up against Grok in real-world tasks. 🚀
Wow, Deep Cogito’s open-source models are killing it! Fine-tuning Llama 3.2 to top the charts is no small feat. I’m curious how they’ll stack up against the big players in real-world apps. Exciting times for AI! 🚀





首页






