Deep Cogito 推出具有高级推理能力的混合人工智能模型
Deep Cogito 是一家新的人工智能创新公司,它推出了一系列可公开访问的人工智能模型,这些模型可在推理和非推理模式之间无缝切换。
推理模型(如 OpenAI 的 o1)通过一步步有条不紊地验证解决方案,在数学和物理等领域表现出色。然而,这种精确性需要更多的计算资源和时间。为了解决这个问题,Anthropic 等公司正在开发混合架构,将推理与标准组件融合在一起,既能快速响应简单查询,又能深入分析复杂查询。
Deep Cogito 的模型名为 Cogito 1,全部采用混合设计。该公司声称,它们超越了同等规模的顶级开放模型,包括 Meta 和 DeepSeek 的模型。
"Deep Cogito 在一篇博文中表示:"每个模型都能立即做出反应,或在回答前进行思考,模仿推理模型。"它们是由一个精干的团队在短短 75 天内制作完成的"。
Cogito 1模型的参数范围从30亿到700亿,计划在不久的将来将模型参数提高到6710亿。参数越多,模型解决问题的能力就越强。
Cogito 1 以 Meta 的 Llama 和阿里巴巴的 Qwen 模型为基础,Deep Cogito 采用创新的训练技术来提高性能,实现可切换推理。
内部基准测试表明,启用推理功能的最大模型 Cogito 70B 在部分数学和语言任务上的表现优于 DeepSeek 的 R1。在不进行推理的情况下,它在LiveBench(一项广泛的人工智能评估)上也超过了Meta的Llama 4 Scout。
所有 Cogito 1 模型都可以在 Fireworks AI 和 Together AI 云平台上下载或通过 API 访问。

Cogito 1的性能与其他流行的公开人工智能模型相比图片来源:Deep Cogito "Deep Cogito 在其博客中指出:"我们仍处于扩展之旅的初期,仅使用了通常分配给大型语言模型训练的计算量的一小部分。"我们正在探索新的训练后自我改进方法"。
根据加州提交的文件,Deep Cogito 于 2024 年 6 月在旧金山成立,创始人是前谷歌高级软件工程师 Drishan Arora 和 Dhruv Malhotra,Dhruv Malhotra 此前是谷歌 DeepMind 的产品经理,主要负责生成式搜索。
据 PitchBook 报道,Deep Cogito 公司得到了 South Park Commons 的支持,其目标是开创 "通用超级智能"--超越大多数人类的人工智能,并释放出前所未有的能力。
相关文章
英国各政府部门就人工智能数据中心的能源需求问题发生争执
英国政府正面临一项重大挑战:在推动清洁能源发展的同时,力争成为人工智能领域的全球领导者。然而,负责实现这些目标的各部门之间却存在严重分歧。 科学、创新与技术部(DSIT)与能源安全与净零部(DESNZ)对人工智能数据中心的未来电力需求做出了截然不同的预测。DSIT预测,到2030年,人工智能数据中心将需要6吉瓦的电力,而DESNZ的估计则不到这一数字的十分之一。 这一差距引起了非营利组织Foxgl
中国网络空间管理局要求对人工智能生成和虚构的短视频进行标注
中国国家互联网信息办公室出台了一项全面计划,旨在规范短视频内容标注,要求各平台提供六项必备标签——包括“AI生成内容”——这标志着短视频治理进入了一个强制透明化的新时代。为解决内容来源不明、难以区分真伪等问题,监管部门在此前与抖音、快手、腾讯、百度等主要平台开展试点的基础上,现已将内容标注作为短视频发布流程中的强制性环节。 发布者必须从六种选项中选择其一:“虚构演绎”、“AI生成”、“含营销信息”
以文本翻译著称的DeepL,如今将目光投向了语音翻译
以文本翻译工具闻名的翻译公司DeepL今日推出了一套语音到语音翻译解决方案,通过定制应用程序,为一线工作人员在会议、移动端和网页对话以及小组讨论等场景中提供支持。 该公司还推出了一款API,允许外部开发者和企业基于DeepL的技术构建定制化解决方案,例如呼叫中心应用。“在专注于文本翻译多年后,语音翻译对我们来说是水到渠成的下一步,”DeepL首席执行官Jarek Kutylowski在接受Tech
相关专题推荐
评论 (0)
0/500
Deep Cogito 是一家新的人工智能创新公司,它推出了一系列可公开访问的人工智能模型,这些模型可在推理和非推理模式之间无缝切换。
推理模型(如 OpenAI 的 o1)通过一步步有条不紊地验证解决方案,在数学和物理等领域表现出色。然而,这种精确性需要更多的计算资源和时间。为了解决这个问题,Anthropic 等公司正在开发混合架构,将推理与标准组件融合在一起,既能快速响应简单查询,又能深入分析复杂查询。
Deep Cogito 的模型名为 Cogito 1,全部采用混合设计。该公司声称,它们超越了同等规模的顶级开放模型,包括 Meta 和 DeepSeek 的模型。
"Deep Cogito 在一篇博文中表示:"每个模型都能立即做出反应,或在回答前进行思考,模仿推理模型。"它们是由一个精干的团队在短短 75 天内制作完成的"。
Cogito 1模型的参数范围从30亿到700亿,计划在不久的将来将模型参数提高到6710亿。参数越多,模型解决问题的能力就越强。
Cogito 1 以 Meta 的 Llama 和阿里巴巴的 Qwen 模型为基础,Deep Cogito 采用创新的训练技术来提高性能,实现可切换推理。
内部基准测试表明,启用推理功能的最大模型 Cogito 70B 在部分数学和语言任务上的表现优于 DeepSeek 的 R1。在不进行推理的情况下,它在LiveBench(一项广泛的人工智能评估)上也超过了Meta的Llama 4 Scout。
所有 Cogito 1 模型都可以在 Fireworks AI 和 Together AI 云平台上下载或通过 API 访问。

"Deep Cogito 在其博客中指出:"我们仍处于扩展之旅的初期,仅使用了通常分配给大型语言模型训练的计算量的一小部分。"我们正在探索新的训练后自我改进方法"。
根据加州提交的文件,Deep Cogito 于 2024 年 6 月在旧金山成立,创始人是前谷歌高级软件工程师 Drishan Arora 和 Dhruv Malhotra,Dhruv Malhotra 此前是谷歌 DeepMind 的产品经理,主要负责生成式搜索。
据 PitchBook 报道,Deep Cogito 公司得到了 South Park Commons 的支持,其目标是开创 "通用超级智能"--超越大多数人类的人工智能,并释放出前所未有的能力。
英国各政府部门就人工智能数据中心的能源需求问题发生争执
英国政府正面临一项重大挑战:在推动清洁能源发展的同时,力争成为人工智能领域的全球领导者。然而,负责实现这些目标的各部门之间却存在严重分歧。 科学、创新与技术部(DSIT)与能源安全与净零部(DESNZ)对人工智能数据中心的未来电力需求做出了截然不同的预测。DSIT预测,到2030年,人工智能数据中心将需要6吉瓦的电力,而DESNZ的估计则不到这一数字的十分之一。 这一差距引起了非营利组织Foxgl
中国网络空间管理局要求对人工智能生成和虚构的短视频进行标注
中国国家互联网信息办公室出台了一项全面计划,旨在规范短视频内容标注,要求各平台提供六项必备标签——包括“AI生成内容”——这标志着短视频治理进入了一个强制透明化的新时代。为解决内容来源不明、难以区分真伪等问题,监管部门在此前与抖音、快手、腾讯、百度等主要平台开展试点的基础上,现已将内容标注作为短视频发布流程中的强制性环节。 发布者必须从六种选项中选择其一:“虚构演绎”、“AI生成”、“含营销信息”
以文本翻译著称的DeepL,如今将目光投向了语音翻译
以文本翻译工具闻名的翻译公司DeepL今日推出了一套语音到语音翻译解决方案,通过定制应用程序,为一线工作人员在会议、移动端和网页对话以及小组讨论等场景中提供支持。 该公司还推出了一款API,允许外部开发者和企业基于DeepL的技术构建定制化解决方案,例如呼叫中心应用。“在专注于文本翻译多年后,语音翻译对我们来说是水到渠成的下一步,”DeepL首席执行官Jarek Kutylowski在接受Tech





首页






