深度認知發布開源AI模型，已名列前茅

首頁

新聞

深度認知發布開源AI模型，已名列前茅

2025-06-06

RobertMartin

# ai # Google # LLMs # nlp

深度認知發布開源AI模型，已名列前茅

深度Cogito推出革命性AI模型

在一個突破性的舉動中，位於舊金山的尖端AI研究初創公司Deep Cogito正式推出了其首款開源大型語言模型（LLMs），命名為Cogito v1。這些模型基於Meta的Llama 3.2進行微調，擁有混合推理能力，能夠快速響應或進行內省思考——這一功能類似於OpenAI的“o”系列和DeepSeek R1。

Deep Cogito希望通過促進模型內的迭代自我改進，推動AI超越傳統的人類監督限制。他們的最終目標？開發超級智能——在所有領域超越人類能力的AI。然而，該公司保證所有模型將保持開源。

Deep Cogito的首席執行官兼聯合創始人Drishan Arora此前在Google擔任高級軟件工程師，領導Google生成式搜索產品的LLM開發。他在X上自信地表示，這些模型在其規模上是表現最強的開源模型，超越了LLaMA、DeepSeek和Qwen等競爭對手。

模型陣容

初始產品包括五種基礎規模——30億、80億、140億、320億和700億參數——現已可在Hugging Face、Ollama以及通過Fireworks和Together AI的API等平台訪問。這些模型遵循Llama許可條款，允許商業使用，每月最多支持7億用戶，超過此數量需從Meta獲得付費許可。

Deep Cogito計劃在不久的將來推出更大的模型，參數可能達到6710億。

訓練方法：迭代蒸餾與放大（IDA）

Arora介紹了IDA，這是一種不同於傳統強化學習（RLHF）或教師模型蒸餾的新方法。IDA專注於分配額外的計算資源來生成更優的解決方案，隨後將這種增強的推理嵌入模型本身——形成一個旨在提升能力的持續反饋循環。這種方法類似於Google AlphaGo的自對弈策略，適應於自然語言處理。

基準測試與評估

Deep Cogito展示了對Cogito模型與開源競爭對手的全面評估結果，涵蓋一般知識、數學推理和多語言任務等領域。主要發現包括：

Cogito 3B（標準版）： 在MMLU上超越LLaMA 3.2 3B 6.7個百分點（65.4% vs. 58.7%），在Hellaswag上領先18.8個百分點（81.1% vs. 62.3%）。
Cogito 3B（推理模式）： 在MMLU上得分72.6%，在ARC上得分84.2%。
Cogito 8B（標準版）： 在MMLU上達到80.5%，比LLaMA 3.1 8B高12.8個百分點。
Cogito 8B（推理模式）： 在MMLU上得分83.1%，在ARC上得分92.0%。
Cogito 70B（標準版）： 在MMLU上領先LLaMA 3.3 70B 6.4個百分點（91.7% vs. 85.3%），並在總體基準測試中超越LLaMA 4 Scout 109B（54.5% vs. 53.3%）。

雖然Cogito模型在推理模式下表現出色，但在數學任務中存在一些權衡。

原生工具調用

Deep Cogito還評估了其模型的原生工具調用性能，這是代理和API集成系統的關鍵方面。

Cogito 3B： 支持四種工具調用任務，在簡單和多重工具調用中表現出色。
Cogito 8B： 在所有工具調用類型中表現強勁，顯著超越LLaMA 3.1 8B。

未來計劃

展望未來，Deep Cogito計劃推出更大的模型，包括1090億、4000億和6710億參數的專家混合變體，同時對現有檢查點進行持續更新。該公司將IDA視為實現可擴展自我改進的可持續途徑，減少對人類或靜態教師模型的依賴。

Arora強調，現實世界的實用性和適應性是成功的終極衡量標準，並表示這僅僅是一個充滿希望的旅程的開始。Deep Cogito與Hugging Face、RunPod、Fireworks AI、Together AI和Ollama等知名實體合作，確保所有模型保持開源且可自由訪問。

YouTube 將 Veo 3 AI 視訊工具直接整合至短片平台 YouTube Shorts 今年夏天將採用 Veo 3 AI 視訊模型YouTube 執行長 Neal Mohan 在坎城獅子獎主題演講中透露，該平台最尖端的 Veo 3 AI 影片生成技術將於今年夏天稍後在 YouTube Shorts 上亮相。在此之前，Allison Johnson 曾發表評論，將 Veo 3 描述為 AI 輔助內容創作的革命。目前，Shorts 製作人員透過 Dream

頂尖 AI 實驗室警告人類正在失去理解 AI 系統的能力來自 OpenAI、Google DeepMind、Anthropic 和 Meta 的研究人員，史無前例地展現團結，擱置競爭分歧，就負責任的 AI 開發發出集體警告。來自這些典型競爭組織的 40 多位頂尖科學家共同撰寫了一份突破性的研究論文，強調確保 AI 決策過程透明化的窗口正在快速關閉。此次合作的重點在於現代人工智能系統的一項關鍵發展 - 在產生最終輸出之前，以人類可讀的語言闡明推理過程的新

Google Cloud 為科學研究與發現的突破提供動力數位革命正透過前所未有的計算能力改變科學方法。尖端技術現在可增強理論框架和實驗室實驗，透過精密模擬和大數據分析，推動各學科的突破。透過策略性地投資於基礎研究、可擴充的雲端架構和人工智慧開發，我們建立了一個加速科學進步的生態系統。我們的貢獻橫跨醫藥研究、氣候建模和奈米技術等領域的突破性創新，並輔以世界級的運算基礎架構、雲端原生軟體解決方案和新一代的生成式人工智慧平台。Google DeepMind

評論 (8)

0/200

提交

AlbertGonzalez

2025-09-10 00:30:52

Deep Cogito這麼快就衝上榜單也太強了吧！看來開源模型真的越來越厲害了，不過這樣會不會讓LLM市場更競爭啊？🤔 我還是擔心小公司以後根本玩不起...

EricMartin

2025-07-28 09:20:21

Wow, Deep Cogito’s models are killing it! Beating the charts right out the gate is wild. Curious how they stack up against Grok in real-world tasks. 🚀

WilliamRamirez

2025-07-28 09:19:30

Wow, Deep Cogito’s open-source models are killing it! Fine-tuning Llama 3.2 to top the charts is no small feat. I’m curious how they’ll stack up against the big players in real-world apps. Exciting times for AI! 🚀

BrianWalker

2025-06-07 21:03:53

Wow, Deep Cogito's models are already topping the charts? That's insane! 🤯 I love how open-source AI is advancing so quickly. Can't wait to try these out for some personal projects. Hope they keep up the good work! #AIFuture

WalterWalker

2025-06-07 19:30:11

Deep Cogitoのモデルがもうチャートトップとは...速すぎる！🔥 オープンソースの進化が楽しみです。自分でも試してみたいな～。これからも応援してます！ #AI革命

RaymondBaker

2025-06-07 15:25:31

Deep Cogitos Modelle schon an der Spitze? Wahnsinn! 🤩 Open-Source-IA entwickelt sich rasend schnell. Bin gespannt, was als Nächstes kommt. Weiter so! #KIZukunft

頭號新聞

Gemini 2.5 Pro現在比Claude，GPT-4O更便宜，更便宜 2025頂級AI影片生成器：Pika Labs與其他對比 AI配音：真實聲音創作終極指南 Cambium的AI將垃圾木頭變成木材 Openai增強了AI語音助手以進行更好的聊天如何確保您的數據值得信賴AI集成 NotebookLM在全球範圍內擴展，添加幻燈片並增強了事實檢查對美國數據中心的調整可以解鎖76 GW的新電源容量 Google利用AI暫停了超過3900萬的廣告帳戶，以涉嫌欺詐 AI語音克隆：掌握語音轉換的終極指南

精選