深度认知发布开源AI模型,已名列前茅

深度思睿推出革命性AI模型
旧金山一家尖端的人工智能研究初创公司深度思睿(Deep Cogito),在其发展历程中迈出了开创性的一步,正式推出了其首条开源大型语言模型(LLMs)系列,命名为Cogito v1。这些模型经过Meta的Llama 3.2微调,具备混合推理能力,既能快速响应,也能进行内省思考——这一特性让人联想到OpenAI的“o”系列和DeepSeek R1。
深度思睿致力于通过在其模型中促进迭代式自我提升,将人工智能推向超越传统人类监督约束的领域。他们的终极目标是开发超智能——一种在所有领域都超越人类能力的人工智能。然而,公司保证所有模型都将保持开源。
深度思睿的首席执行官兼联合创始人德里尚·阿拉(Drishan Arora)曾是谷歌的高级软件工程师,负责领导谷歌生成式搜索产品的大型语言模型开发。他在X平台上自信地表示,这些模型是其规模范围内最强的开源模型之一,优于竞争对手如LLaMA、DeepSeek和Qwen。
模型阵容
首发产品包括五个基础大小的模型——30亿、80亿、140亿、320亿和700亿参数,并已在Hugging Face、Ollama以及Fireworks和Together AI提供的API上可用。这些模型遵循Llama许可条款,在每月用户数不超过7亿的情况下允许商业使用,超过此数量则需从Meta获得付费许可。
深度思睿计划在未来推出更大的模型,潜在参数规模可达6710亿。
训练方法:迭代蒸馏与放大(IDA)
阿拉介绍了IDA,这是一种与传统强化学习从人类反馈(RLHF)或教师模型蒸馏不同的新颖方法。IDA专注于分配额外的计算资源以生成更优解决方案,随后将这种增强的推理嵌入模型本身——这是一个旨在提升能力的持续反馈循环。这种方法类似于谷歌AlphaGo适应自然语言处理的自玩策略。
基准测试与评估
深度思睿展示了全面的评估结果,比较了Cogito模型与开源同行在一般知识、数学推理和多语言任务等领域的表现。主要发现包括:
- Cogito 3B(标准版): 在MMLU上比Llama 3.2 3B高出6.7个百分点(65.4% vs. 58.7%),在Hellaswag上高出18.8个百分点(81.1% vs. 62.3%)。
- Cogito 3B(推理模式): MMLU得分72.6%,ARC得分84.2%。
- Cogito 8B(标准版): MMLU得分80.5%,比Llama 3.1 8B高出12.8个百分点。
- Cogito 8B(推理模式): MMLU得分83.1%,ARC得分92.0%。
- Cogito 70B(标准版): 在MMLU上领先Llama 3.3 70B 6.4个百分点(91.7% vs. 85.3%),并在综合基准测试中超越Llama 4 Scout 109B(54.5% vs. 53.3%)。
尽管Cogito模型在推理模式下表现出色,但在数学任务上存在某些权衡。
本地工具调用
深度思睿还评估了其模型的本地工具调用性能,这对代理和API集成系统至关重要。
- Cogito 3B: 支持四种工具调用任务,并在简单和多重工具调用方面表现出色。
- Cogito 8B: 在所有工具调用类型中表现强劲,显著优于Llama 3.1 8B。
未来计划
展望未来,深度思睿计划推出更大规模的模型,包括参数规模分别为1090亿、4000亿和6710亿的专家混合模型,同时对现有检查点进行持续更新。该公司认为IDA是实现可扩展自我改进的可持续路径,减少对人类或静态教师模型的依赖。
阿拉强调,现实世界的实用性和适应性是成功的最终衡量标准,这仅仅是充满希望旅程的开端。深度思睿与Hugging Face、RunPod、Fireworks AI、Together AI和Ollama等知名实体合作,确保所有模型保持开源且免费访问。
相关文章
Фонд будущего ИИ Google, возможно, должен действовать осторожно
Инвестиционная инициатива Google в области ИИ: стратегический поворот на фоне регуляторного вниманияОбъявление Google о создании фонда AI Futures Fund является смелым шагом в стрем
Внутри скачка ИИ Google: Gemini 2.5 думает глубже, говорит умнее и кодирует быстрее
Google приближается к своей цели создания универсального ассистента на основе ИИНа мероприятии Google I/O этого года компания представила значительные обновления серии Gemini 2.5,
Oura добавляет трекинг уровня глюкозы и журнал питания на основе ИИ
Oura укрепляет своё обязательство в области метаболического здоровья двумя захватывающими новыми функциями.Oura повышает ставки в мире метаболического здоровья с двумя передовыми,
评论 (0)
0/200
深度思睿推出革命性AI模型
旧金山一家尖端的人工智能研究初创公司深度思睿(Deep Cogito),在其发展历程中迈出了开创性的一步,正式推出了其首条开源大型语言模型(LLMs)系列,命名为Cogito v1。这些模型经过Meta的Llama 3.2微调,具备混合推理能力,既能快速响应,也能进行内省思考——这一特性让人联想到OpenAI的“o”系列和DeepSeek R1。
深度思睿致力于通过在其模型中促进迭代式自我提升,将人工智能推向超越传统人类监督约束的领域。他们的终极目标是开发超智能——一种在所有领域都超越人类能力的人工智能。然而,公司保证所有模型都将保持开源。
深度思睿的首席执行官兼联合创始人德里尚·阿拉(Drishan Arora)曾是谷歌的高级软件工程师,负责领导谷歌生成式搜索产品的大型语言模型开发。他在X平台上自信地表示,这些模型是其规模范围内最强的开源模型之一,优于竞争对手如LLaMA、DeepSeek和Qwen。
模型阵容
首发产品包括五个基础大小的模型——30亿、80亿、140亿、320亿和700亿参数,并已在Hugging Face、Ollama以及Fireworks和Together AI提供的API上可用。这些模型遵循Llama许可条款,在每月用户数不超过7亿的情况下允许商业使用,超过此数量则需从Meta获得付费许可。
深度思睿计划在未来推出更大的模型,潜在参数规模可达6710亿。
训练方法:迭代蒸馏与放大(IDA)
阿拉介绍了IDA,这是一种与传统强化学习从人类反馈(RLHF)或教师模型蒸馏不同的新颖方法。IDA专注于分配额外的计算资源以生成更优解决方案,随后将这种增强的推理嵌入模型本身——这是一个旨在提升能力的持续反馈循环。这种方法类似于谷歌AlphaGo适应自然语言处理的自玩策略。
基准测试与评估
深度思睿展示了全面的评估结果,比较了Cogito模型与开源同行在一般知识、数学推理和多语言任务等领域的表现。主要发现包括:
- Cogito 3B(标准版): 在MMLU上比Llama 3.2 3B高出6.7个百分点(65.4% vs. 58.7%),在Hellaswag上高出18.8个百分点(81.1% vs. 62.3%)。
- Cogito 3B(推理模式): MMLU得分72.6%,ARC得分84.2%。
- Cogito 8B(标准版): MMLU得分80.5%,比Llama 3.1 8B高出12.8个百分点。
- Cogito 8B(推理模式): MMLU得分83.1%,ARC得分92.0%。
- Cogito 70B(标准版): 在MMLU上领先Llama 3.3 70B 6.4个百分点(91.7% vs. 85.3%),并在综合基准测试中超越Llama 4 Scout 109B(54.5% vs. 53.3%)。
尽管Cogito模型在推理模式下表现出色,但在数学任务上存在某些权衡。
本地工具调用
深度思睿还评估了其模型的本地工具调用性能,这对代理和API集成系统至关重要。
- Cogito 3B: 支持四种工具调用任务,并在简单和多重工具调用方面表现出色。
- Cogito 8B: 在所有工具调用类型中表现强劲,显著优于Llama 3.1 8B。
未来计划
展望未来,深度思睿计划推出更大规模的模型,包括参数规模分别为1090亿、4000亿和6710亿的专家混合模型,同时对现有检查点进行持续更新。该公司认为IDA是实现可扩展自我改进的可持续路径,减少对人类或静态教师模型的依赖。
阿拉强调,现实世界的实用性和适应性是成功的最终衡量标准,这仅仅是充满希望旅程的开端。深度思睿与Hugging Face、RunPod、Fireworks AI、Together AI和Ollama等知名实体合作,确保所有模型保持开源且免费访问。











