Deep Cogito 推出具備先進推理能力的混合人工智慧模型
Deep Cogito 是一家新的 AI 創新公司,已推出一系列可公開存取的 AI 模型,可在推理與非推理模式之間無縫切換。
推理模型,例如 OpenAI 的 o1,透過有條不紊地逐步驗證解決方案,在數學與物理等領域表現優異。然而,這種精準度需要更多的計算資源與時間。為了解決這個問題,Anthropic 等公司正在開發混合架構,將推理與標準元件相結合,以便快速回應簡單的查詢,並深入分析複雜的查詢。
Deep Cogito 的模型命名為 Cogito 1,全部都是混合設計。該公司宣稱,它們超越了同等規模的頂級開放式模型,包括 Meta 和 DeepSeek 的模型。
"Deep Cogito 在一篇部落格文章中表示:「每個模型都能立即回應,或在回答前思考,模仿推理模型。「它們是由一個精簡的團隊在短短 75 天內製作完成的」。
Cogito 1 模型的參數範圍從 30 億到 700 億不等,並計劃在不久的將來提供高達 6,710 億參數的模型。更多的參數通常可以增強模型解決問題的能力。
Cogito 1 以 Meta 的 Llama 和阿里巴巴的 Qwen 模型為基礎,Deep Cogito 應用創新的訓練技術來提升效能,並實現可切換的推理。
內部基準測試顯示,最大的模型 Cogito 70B 在啟用推理功能後,在特定數學和語言任務上的表現優於 DeepSeek 的 R1。在不啟用推理功能的情況下,它在 LiveBench(一項廣泛的人工智能評估)上也超越了 Meta 的 Llama 4 Scout。
所有 Cogito 1 模型都可在 Fireworks AI 和 Together AI 雲端平台下載,或透過 API 進行存取。

Cogito 1 的性能與其他流行的公開 AI 模型相比圖片來源:Deep Cogito "Deep Cogito 在其部落格中指出:「我們仍處於擴充之旅的早期階段,只使用通常分配給大型語言模型訓練的一小部分運算。「我們正在探索新的訓練後自我改進方法」。
根據加州的文件顯示,Deep Cogito 於 2024 年 6 月在舊金山成立,由前 Google 資深軟體工程師 Drishan Arora 與 Dhruv Malhotra 共同創立,Dhruv Malhotra 之前是 Google DeepMind 的產品經理,專門負責產生式搜尋。
根據 PitchBook 的報導,Deep Cogito 獲得 South Park Commons 的支持,其目標是開創「一般超級智慧」(general superintelligence)- 超越大多數人類的人工智能,並釋放前所未有的能力。
相關文章
ElevenLabs 宣布 BlackRock、傑米·福克斯與伊娃·朗格莉亞成為新投資人
語音人工智慧公司 ElevenLabs 已公布其 5 億美元 D 輪融資的更多投資者名單,該輪融資最初於二月宣布。 投資者陣容包括黑石集團(BlackRock)、威靈頓管理(Wellington)、D.E. Shaw及施羅德(Schroders)等機構投資者;NVIDIA、Salesforce、桑坦德銀行(Santander)、KPN及德國電信(Deutsche Telekom)等企業;以及傑米·
OpenAI 執行長阿爾特曼抨擊 Anthropic 採取恐慌式行銷策略
人工智慧領域的兩大龍頭 OpenAI 與 Anthropic 之間的公開爭執持續升溫。OpenAI 執行長山姆·奧特曼(Sam Altman)近日在一檔播客節目中,對競爭對手的最新安全模型提出質疑。奧特曼主張,Anthropic 利用大眾對科技的恐懼,誇大了其產品的實際能力。他認為這種做法更像是行銷手段,而非真正的安全措施。僅限精英階層使用引發「築起技術壁壘」的指控這場爭議源於Anthropic本
在獲得 SpaceX 的大筆投資後,人工智慧編程新創公司 Cursor 將在亞太地區招聘 200 名員工
人工智慧編碼新創公司 Cursor 宣布了一項重大的全球擴張計畫,預計在未來六個月內於亞太地區招聘 200 名員工。主要職位包括行銷工程師、現場工程師及人工智慧部署工程師。此舉彰顯了這家總部位於舊金山的獨角獸企業,正積極將其核心技術推向國際市場。目前,Cursor 已在新加坡設立辦公室,由資深技術高管 Simon Green 領軍,招聘範圍將涵蓋日本、雪梨、墨爾本及印度等關鍵市場。除了亞太地區的
相關專題推薦
評論 (0)
0/500
Deep Cogito 是一家新的 AI 創新公司,已推出一系列可公開存取的 AI 模型,可在推理與非推理模式之間無縫切換。
推理模型,例如 OpenAI 的 o1,透過有條不紊地逐步驗證解決方案,在數學與物理等領域表現優異。然而,這種精準度需要更多的計算資源與時間。為了解決這個問題,Anthropic 等公司正在開發混合架構,將推理與標準元件相結合,以便快速回應簡單的查詢,並深入分析複雜的查詢。
Deep Cogito 的模型命名為 Cogito 1,全部都是混合設計。該公司宣稱,它們超越了同等規模的頂級開放式模型,包括 Meta 和 DeepSeek 的模型。
"Deep Cogito 在一篇部落格文章中表示:「每個模型都能立即回應,或在回答前思考,模仿推理模型。「它們是由一個精簡的團隊在短短 75 天內製作完成的」。
Cogito 1 模型的參數範圍從 30 億到 700 億不等,並計劃在不久的將來提供高達 6,710 億參數的模型。更多的參數通常可以增強模型解決問題的能力。
Cogito 1 以 Meta 的 Llama 和阿里巴巴的 Qwen 模型為基礎,Deep Cogito 應用創新的訓練技術來提升效能,並實現可切換的推理。
內部基準測試顯示,最大的模型 Cogito 70B 在啟用推理功能後,在特定數學和語言任務上的表現優於 DeepSeek 的 R1。在不啟用推理功能的情況下,它在 LiveBench(一項廣泛的人工智能評估)上也超越了 Meta 的 Llama 4 Scout。
所有 Cogito 1 模型都可在 Fireworks AI 和 Together AI 雲端平台下載,或透過 API 進行存取。

"Deep Cogito 在其部落格中指出:「我們仍處於擴充之旅的早期階段,只使用通常分配給大型語言模型訓練的一小部分運算。「我們正在探索新的訓練後自我改進方法」。
根據加州的文件顯示,Deep Cogito 於 2024 年 6 月在舊金山成立,由前 Google 資深軟體工程師 Drishan Arora 與 Dhruv Malhotra 共同創立,Dhruv Malhotra 之前是 Google DeepMind 的產品經理,專門負責產生式搜尋。
根據 PitchBook 的報導,Deep Cogito 獲得 South Park Commons 的支持,其目標是開創「一般超級智慧」(general superintelligence)- 超越大多數人類的人工智能,並釋放前所未有的能力。
ElevenLabs 宣布 BlackRock、傑米·福克斯與伊娃·朗格莉亞成為新投資人
語音人工智慧公司 ElevenLabs 已公布其 5 億美元 D 輪融資的更多投資者名單,該輪融資最初於二月宣布。 投資者陣容包括黑石集團(BlackRock)、威靈頓管理(Wellington)、D.E. Shaw及施羅德(Schroders)等機構投資者;NVIDIA、Salesforce、桑坦德銀行(Santander)、KPN及德國電信(Deutsche Telekom)等企業;以及傑米·
OpenAI 執行長阿爾特曼抨擊 Anthropic 採取恐慌式行銷策略
人工智慧領域的兩大龍頭 OpenAI 與 Anthropic 之間的公開爭執持續升溫。OpenAI 執行長山姆·奧特曼(Sam Altman)近日在一檔播客節目中,對競爭對手的最新安全模型提出質疑。奧特曼主張,Anthropic 利用大眾對科技的恐懼,誇大了其產品的實際能力。他認為這種做法更像是行銷手段,而非真正的安全措施。僅限精英階層使用引發「築起技術壁壘」的指控這場爭議源於Anthropic本
在獲得 SpaceX 的大筆投資後,人工智慧編程新創公司 Cursor 將在亞太地區招聘 200 名員工
人工智慧編碼新創公司 Cursor 宣布了一項重大的全球擴張計畫,預計在未來六個月內於亞太地區招聘 200 名員工。主要職位包括行銷工程師、現場工程師及人工智慧部署工程師。此舉彰顯了這家總部位於舊金山的獨角獸企業,正積極將其核心技術推向國際市場。目前,Cursor 已在新加坡設立辦公室,由資深技術高管 Simon Green 領軍,招聘範圍將涵蓋日本、雪梨、墨爾本及印度等關鍵市場。除了亞太地區的





首頁






