選項
首頁
新聞
深度認知發布開源AI模型,已名列前茅

深度認知發布開源AI模型,已名列前茅

2025-06-06
124

深度認知發布開源AI模型,已名列前茅

深度Cogito推出革命性AI模型

在一個突破性的舉動中,位於舊金山的尖端AI研究初創公司Deep Cogito正式推出了其首款開源大型語言模型(LLMs),命名為Cogito v1。這些模型基於Meta的Llama 3.2進行微調,擁有混合推理能力,能夠快速響應或進行內省思考——這一功能類似於OpenAI的“o”系列和DeepSeek R1。

Deep Cogito希望通過促進模型內的迭代自我改進,推動AI超越傳統的人類監督限制。他們的最終目標?開發超級智能——在所有領域超越人類能力的AI。然而,該公司保證所有模型將保持開源。

Deep Cogito的首席執行官兼聯合創始人Drishan Arora此前在Google擔任高級軟件工程師,領導Google生成式搜索產品的LLM開發。他在X上自信地表示,這些模型在其規模上是表現最強的開源模型,超越了LLaMA、DeepSeek和Qwen等競爭對手。

模型陣容

初始產品包括五種基礎規模——30億、80億、140億、320億和700億參數——現已可在Hugging Face、Ollama以及通過Fireworks和Together AI的API等平台訪問。這些模型遵循Llama許可條款,允許商業使用,每月最多支持7億用戶,超過此數量需從Meta獲得付費許可。

Deep Cogito計劃在不久的將來推出更大的模型,參數可能達到6710億。

訓練方法:迭代蒸餾與放大(IDA)

Arora介紹了IDA,這是一種不同於傳統強化學習(RLHF)或教師模型蒸餾的新方法。IDA專注於分配額外的計算資源來生成更優的解決方案,隨後將這種增強的推理嵌入模型本身——形成一個旨在提升能力的持續反饋循環。這種方法類似於Google AlphaGo的自對弈策略,適應於自然語言處理。

基準測試與評估

Deep Cogito展示了對Cogito模型與開源競爭對手的全面評估結果,涵蓋一般知識、數學推理和多語言任務等領域。主要發現包括:

  • Cogito 3B(標準版): 在MMLU上超越LLaMA 3.2 3B 6.7個百分點(65.4% vs. 58.7%),在Hellaswag上領先18.8個百分點(81.1% vs. 62.3%)。
  • Cogito 3B(推理模式): 在MMLU上得分72.6%,在ARC上得分84.2%。
  • Cogito 8B(標準版): 在MMLU上達到80.5%,比LLaMA 3.1 8B高12.8個百分點。
  • Cogito 8B(推理模式): 在MMLU上得分83.1%,在ARC上得分92.0%。
  • Cogito 70B(標準版): 在MMLU上領先LLaMA 3.3 70B 6.4個百分點(91.7% vs. 85.3%),並在總體基準測試中超越LLaMA 4 Scout 109B(54.5% vs. 53.3%)。

雖然Cogito模型在推理模式下表現出色,但在數學任務中存在一些權衡。

原生工具調用

Deep Cogito還評估了其模型的原生工具調用性能,這是代理和API集成系統的關鍵方面。

  • Cogito 3B: 支持四種工具調用任務,在簡單和多重工具調用中表現出色。
  • Cogito 8B: 在所有工具調用類型中表現強勁,顯著超越LLaMA 3.1 8B。

未來計劃

展望未來,Deep Cogito計劃推出更大的模型,包括1090億、4000億和6710億參數的專家混合變體,同時對現有檢查點進行持續更新。該公司將IDA視為實現可擴展自我改進的可持續途徑,減少對人類或靜態教師模型的依賴。

Arora強調,現實世界的實用性和適應性是成功的終極衡量標準,並表示這僅僅是一個充滿希望的旅程的開始。Deep Cogito與Hugging Face、RunPod、Fireworks AI、Together AI和Ollama等知名實體合作,確保所有模型保持開源且可自由訪問。

相關文章
Notion 將其工作區轉變為人工智慧代理的樞紐 Notion 將其工作區轉變為人工智慧代理的樞紐 生產力軟體公司 Notion 正邁入「代理時代」。在週三的直播產品發布會上,以協作式筆記應用程式聞名的 Notion 揭曉了一套全新的開發者平台,該平台不僅擴展了其自訂 AI 代理程式的能力,還能與外部代理程式串接,並讓團隊建立自動化多步驟工作流程,從任何資料庫中擷取資料。透過建立一個「協調層」——一個能在多個工具和資料來源之間協調 AI 工作的系統——Notion 將自身定位為不僅僅是一款具備
ElevenLabs 宣布 BlackRock、傑米·福克斯與伊娃·朗格莉亞成為新投資人 ElevenLabs 宣布 BlackRock、傑米·福克斯與伊娃·朗格莉亞成為新投資人 語音人工智慧公司 ElevenLabs 已公布其 5 億美元 D 輪融資的更多投資者名單,該輪融資最初於二月宣布。 投資者陣容包括黑石集團(BlackRock)、威靈頓管理(Wellington)、D.E. Shaw及施羅德(Schroders)等機構投資者;NVIDIA、Salesforce、桑坦德銀行(Santander)、KPN及德國電信(Deutsche Telekom)等企業;以及傑米·
Google I/O 2026 發表了與 Gmail 收件匣的語音互動功能 Google I/O 2026 發表了與 Gmail 收件匣的語音互動功能 Google 持續將人工智慧整合至您的收件匣中。在週二舉行的 IO 2026 開發者大會上,該公司透過對話式人工智慧擴充了 Gmail 的「AI 收件匣」功能,讓使用者能針對收件匣內容提出問題,而非僅依賴搜尋關鍵字。據 Google 表示,這項由 Gemini AI 驅動的工具名為「Gmail Live」,能協助使用者快速找出埋藏在收件匣中的資訊。圖片來源:Google舉例來說,您可能需要查詢即將
相關專題推薦
漫畫創作 AI角色建立工具:為漫畫主角生成詳細的背景故事及視覺參考資料
AI角色建立工具:為漫畫主角生成詳細的背景故事及視覺參考資料

2026年最新最佳AI角色建立工具:發現那些備受好評的工具,它們能夠幫助你為漫畫角色生成詳細的背景故事和視覺素材。我們精心整理的這份每週更新的列表會根據實際測試結果,對比免費與付費選項的優劣。找到這些強大且能改變創作流程的工具,幫助你塑造引人入勝的角色,提升創作效率。立即訪問XIX.AI檢視排名,找到最適合你的故事創作助手吧。

10 個工具
xix.ai
健康與養生 AI 孕期輔助系統:生成安全且按孕期分階段的運動與營養計畫
AI 孕期輔助系統:生成安全且按孕期分階段的運動與營養計畫

探索 2026 年最佳 AI 孕期輔助工具,為您量身打造安全且針對各孕期的運動與營養計畫。獲取精選的高評分推薦,包含免費與付費方案的比較,以及實用經驗分享。透過 XIX.AI 的專家指南,開啟您最健康的孕期旅程。立即探索。

10 個工具
xix.ai
寫作 最佳免費且無法被偵測的 AI 寫手:將機械化的草稿轉化為自然、類人化的散文
最佳免費且無法被偵測的 AI 寫手:將機械化的草稿轉化為自然、類人化的散文

立即前往 XIX.AI,探索 2026 年最頂尖的免費且難以被察覺的 AI 寫手。我們精心篩選的頂級清單,能協助您將生硬的草稿轉化為自然流暢、宛如人類撰寫的文字。透過實際測試與每週更新的排行榜,比較免費與付費選項的優劣。立即解鎖您的 AI 寫作優勢。

10 個工具
xix.ai
圖像編輯 用於短劇故事板的AI藝術生成工具:幻想與都市浪漫題材的角色設計
用於短劇故事板的AI藝術生成工具:幻想與都市浪漫題材的角色設計

2026最新推薦:探索最適合用於短劇故事板製作的AI藝術生成工具。我們精心挑選了眾多頂級工具,幫助您創作出引人入勝的幻想角色和都市浪漫角色。您可以對比免費與付費選項,檢視實際測試結果,從而找到最適合自己的創意工具。XIX.AI還會每週更新排名並提供專家分析,讓您立即開始將故事視覺化呈現吧!

10 個工具
xix.ai
寫作 最適合廣播和播客使用的AI指令碼編寫工具:幫助您創作引人入勝的音訊廣告
最適合廣播和播客使用的AI指令碼編寫工具:幫助您創作引人入勝的音訊廣告

在XIX.AI上,發現2026年最適合用於廣播和播客製作的AI指令碼工具。我們精心挑選的這些高評分工具能夠提供強大的功能,幫助您快速製作出引人入勝的音訊廣告。透過實際測試和每週更新的排名,您可以瞭解免費選項與付費選項之間的差異。今天就釋放您的創造力吧!

10 個工具
xix.ai
商業 最佳 AI 合約審查軟體:即時發現法律漏洞與合規風險
最佳 AI 合約審查軟體:即時發現法律漏洞與合規風險

立即在 XIX.AI 探索 2026 年最佳 AI 合約審查軟體。我們精心挑選的頂級清單收錄了多款強大工具,能即時偵測法律漏洞與合規風險。透過實際測試與每週更新的排行榜,比較免費與付費方案的差異。為您找到能徹底改變遊戲規則的解決方案,實現安全且高效的合約分析。立即探索這份權威指南。

10 個工具
xix.ai
評論 (10)
0/500
LarryAdams
LarryAdams 2026-03-24 10:01:02

Wait, another open-source player topping charts overnight? 🤔 I'll admit the numbers look impressive on paper, but seeing a startup immediately "top the charts" feels a bit... marketing-heavy. Is this sustainable innovation or just great fine-tuning of existing bedrock like Llama 3.2? The field is getting crowded, and I genuinely wonder how many of these new models will actually be around in two years. Still, competition is good for us users! Excited to test it myself and see if it lives up to the hype.

RichardGonzález
RichardGonzález 2025-10-27 02:30:35

Interesting to see another player in the open-source AI field! I have mixed feelings—skeptical about 'revolutionary' claims from new startups, even with impressive initial benchmarks. Hope they can really deliver real-world applications beyond just chart performance. This space is getting crowded 🌱

AlbertGonzalez
AlbertGonzalez 2025-09-10 00:30:52

Deep Cogito這麼快就衝上榜單也太強了吧!看來開源模型真的越來越厲害了,不過這樣會不會讓LLM市場更競爭啊?🤔 我還是擔心小公司以後根本玩不起...

EricMartin
EricMartin 2025-07-28 09:20:21

Wow, Deep Cogito’s models are killing it! Beating the charts right out the gate is wild. Curious how they stack up against Grok in real-world tasks. 🚀

WilliamRamirez
WilliamRamirez 2025-07-28 09:19:30

Wow, Deep Cogito’s open-source models are killing it! Fine-tuning Llama 3.2 to top the charts is no small feat. I’m curious how they’ll stack up against the big players in real-world apps. Exciting times for AI! 🚀

BrianWalker
BrianWalker 2025-06-07 21:03:53

Wow, Deep Cogito's models are already topping the charts? That's insane! 🤯 I love how open-source AI is advancing so quickly. Can't wait to try these out for some personal projects. Hope they keep up the good work! #AIFuture

OR