Deep Cogito 推出具有高级推理能力的混合人工智能模型

首页

新闻

2025-08-26

MateoAdams

Deep Cogito 是一家新的人工智能创新公司，它推出了一系列可公开访问的人工智能模型，这些模型可在推理和非推理模式之间无缝切换。

推理模型（如 OpenAI 的 o1）通过一步步有条不紊地验证解决方案，在数学和物理等领域表现出色。然而，这种精确性需要更多的计算资源和时间。为了解决这个问题，Anthropic 等公司正在开发混合架构，将推理与标准组件融合在一起，既能快速响应简单查询，又能深入分析复杂查询。

Deep Cogito 的模型名为 Cogito 1，全部采用混合设计。该公司声称，它们超越了同等规模的顶级开放模型，包括 Meta 和 DeepSeek 的模型。

"Deep Cogito 在一篇博文中表示："每个模型都能立即做出反应，或在回答前进行思考，模仿推理模型。"它们是由一个精干的团队在短短 75 天内制作完成的"。

Cogito 1模型的参数范围从30亿到700亿，计划在不久的将来将模型参数提高到6710亿。参数越多，模型解决问题的能力就越强。

Cogito 1 以 Meta 的 Llama 和阿里巴巴的 Qwen 模型为基础，Deep Cogito 采用创新的训练技术来提高性能，实现可切换推理。

内部基准测试表明，启用推理功能的最大模型 Cogito 70B 在部分数学和语言任务上的表现优于 DeepSeek 的 R1。在不进行推理的情况下，它在LiveBench（一项广泛的人工智能评估）上也超过了Meta的Llama 4 Scout。

所有 Cogito 1 模型都可以在 Fireworks AI 和 Together AI 云平台上下载或通过 API 访问。

Cogito 1的性能与其他流行的公开人工智能模型相比图片来源：Deep Cogito

"Deep Cogito 在其博客中指出："我们仍处于扩展之旅的初期，仅使用了通常分配给大型语言模型训练的计算量的一小部分。"我们正在探索新的训练后自我改进方法"。

根据加州提交的文件，Deep Cogito 于 2024 年 6 月在旧金山成立，创始人是前谷歌高级软件工程师 Drishan Arora 和 Dhruv Malhotra，Dhruv Malhotra 此前是谷歌 DeepMind 的产品经理，主要负责生成式搜索。

据 PitchBook 报道，Deep Cogito 公司得到了 South Park Commons 的支持，其目标是开创 "通用超级智能"--超越大多数人类的人工智能，并释放出前所未有的能力。

英国各政府部门就人工智能数据中心的能源需求问题发生争执英国政府正面临一项重大挑战：在推动清洁能源发展的同时，力争成为人工智能领域的全球领导者。然而，负责实现这些目标的各部门之间却存在严重分歧。科学、创新与技术部（DSIT）与能源安全与净零部（DESNZ）对人工智能数据中心的未来电力需求做出了截然不同的预测。DSIT预测，到2030年，人工智能数据中心将需要6吉瓦的电力，而DESNZ的估计则不到这一数字的十分之一。这一差距引起了非营利组织Foxgl

中国网络空间管理局要求对人工智能生成和虚构的短视频进行标注中国国家互联网信息办公室出台了一项全面计划，旨在规范短视频内容标注，要求各平台提供六项必备标签——包括“AI生成内容”——这标志着短视频治理进入了一个强制透明化的新时代。为解决内容来源不明、难以区分真伪等问题，监管部门在此前与抖音、快手、腾讯、百度等主要平台开展试点的基础上，现已将内容标注作为短视频发布流程中的强制性环节。发布者必须从六种选项中选择其一：“虚构演绎”、“AI生成”、“含营销信息”

以文本翻译著称的DeepL，如今将目光投向了语音翻译以文本翻译工具闻名的翻译公司DeepL今日推出了一套语音到语音翻译解决方案，通过定制应用程序，为一线工作人员在会议、移动端和网页对话以及小组讨论等场景中提供支持。该公司还推出了一款API，允许外部开发者和企业基于DeepL的技术构建定制化解决方案，例如呼叫中心应用。“在专注于文本翻译多年后，语音翻译对我们来说是水到渠成的下一步，”DeepL首席执行官Jarek Kutylowski在接受Tech

相关专题推荐

写作