Openai的深入研究現在更實惠,為您節省了數小時的工作

深度研究也在人類最後考試中大放異彩,這是由Scale AI與AI安全中心推出的人工智慧基準測試。其26.6%的準確率不僅超越了GPT-4o,還勝過其他重量級對手,如Grok-2、Claude 3.5 Sonnet、Gemini Thinking、o1及o3-mini high。Sam Altman親自在推文中提到這一令人印象深刻的性能飛躍。
早在星期五,「人類最後考試」的最高分是o3-mini-high的13%。
現在到了星期日,深度研究獲得26.6%。
— Sam Altman (@sama) 2025年2月3日
OpenAI的內外部評估進一步證實了深度研究的卓越表現,在GAIA基準測試及跨多個領域的專家級任務中均取得最高分。
替代方案
不願意每月花費200美元購買ChatGPT Pro?沒問題。Google為其Google One AI Premium用戶提供了一個名為深度研究的類似工具,僅需每月20美元。Sam Altman甚至暗示,OpenAI的深度研究是為了回應Google的功能而打造的。
與此同時,xAI的DeepSearch是另一個競爭者,適用於X Premium及Premium+用戶。別忘了Microsoft的Think Deeper,它使用OpenAI的O1模型進行增強推理,儘管缺乏網路存取和代理功能。最好的是?它是免費的!
相關文章
WordPress.com 現已允許 AI 代理程式撰寫並發布文章,還有更多功能
廣受歡迎的網站託管與發佈平台 WordPress.com 現正積極導入 AI 代理程式——此舉可能重塑網路的樣貌與使用體驗。該公司於週五宣布,將允許 AI 代理程式在客戶網站上起草、編輯及發佈內容,同時也能管理留言、更新與修正元資料,並透過標籤和分類來整理內容。所有這些操作皆透過一個介面進行控制,網站擁有者只需使用自然語言指令說明其需求即可。憑藉這些新功能,網站幾乎可以完全由人工指導的 AI 代理
Anthropic 的實驗性 AI「Claude」在電子商務測試中完成了談判與交易
隨著人工智慧的快速發展,Anthropic 上週五悄悄推出了一項名為「Project Deal」的內部實驗,展現了人工智慧在電子商務領域的潛力。該實驗讓其人工智慧模型 Claude 在封閉的市場環境中自主處理買賣及價格協商,並涉及真實的金融交易。實驗的核心是一個建構於 Slack 平台上的內部市場,Claude 在其中同時擔任買方與賣方的談判代表。它首先訪談了 69 名員工,以收集他們的買賣意圖及
DeepSeek Code 即將推出
隨著人工智慧技術的加速發展,DeepSeek 正處於一個令人振奮的轉捩點。這家人工智慧公司最近透露,已獲得超過 700 億元的資金。管理層強調,公司致力於突破性的人工智慧研究,而非追求眼前的商業利益。這一戰略轉向表明 DeepSeek 將全力投入新產品的開發,尤其是眾人矚目的 DeepSeek Code。DeepSeek Code 的規劃已逐漸成形,該公司職缺頁面已發布數個相關職位,例如「Agen
相關專題推薦
評論 (17)
0/500
This is a game-changer for my workflow! Finally, a tool that actually understands what 'deep research' means and doesn't just spit out the first three search results. The time-saving potential is huge, especially for academic projects. Curious about the cost structure though—hope it stays accessible for individual users and not just big corporations. 🤔
Ça fait des économies mais aussi gagner du temps, ça parait idéal pour mes études ! Mais c'est juste accélérer la recherche, ou ça risque de remplacer notre propre réflexion à la longue ? 😕
Честно, такая функция для чата GPT выглядит супер удобно для студентов! 😄 Но интересно, как поисковики вроде Google отреагируют? Или это в итоге приведёт к ещё большему инфоперегрузу и проблемам с проверкой данных...
This Deep Research feature sounds like a dream for anyone drowning in data! I love how it cuts hours of work, but I’m curious—can it really dig up obscure sources as well as a human researcher? 🤔 Excited to try it out for my next project!
This Deep Research thing sounds like a total game-changer! I’m curious if it can dig up obscure stuff as fast as it claims. Anyone tried it yet? 🤔

深度研究也在人類最後考試中大放異彩,這是由Scale AI與AI安全中心推出的人工智慧基準測試。其26.6%的準確率不僅超越了GPT-4o,還勝過其他重量級對手,如Grok-2、Claude 3.5 Sonnet、Gemini Thinking、o1及o3-mini high。Sam Altman親自在推文中提到這一令人印象深刻的性能飛躍。
早在星期五,「人類最後考試」的最高分是o3-mini-high的13%。
現在到了星期日,深度研究獲得26.6%。
— Sam Altman (@sama) 2025年2月3日
OpenAI的內外部評估進一步證實了深度研究的卓越表現,在GAIA基準測試及跨多個領域的專家級任務中均取得最高分。
替代方案
不願意每月花費200美元購買ChatGPT Pro?沒問題。Google為其Google One AI Premium用戶提供了一個名為深度研究的類似工具,僅需每月20美元。Sam Altman甚至暗示,OpenAI的深度研究是為了回應Google的功能而打造的。
與此同時,xAI的DeepSearch是另一個競爭者,適用於X Premium及Premium+用戶。別忘了Microsoft的Think Deeper,它使用OpenAI的O1模型進行增強推理,儘管缺乏網路存取和代理功能。最好的是?它是免費的!
WordPress.com 現已允許 AI 代理程式撰寫並發布文章,還有更多功能
廣受歡迎的網站託管與發佈平台 WordPress.com 現正積極導入 AI 代理程式——此舉可能重塑網路的樣貌與使用體驗。該公司於週五宣布,將允許 AI 代理程式在客戶網站上起草、編輯及發佈內容,同時也能管理留言、更新與修正元資料,並透過標籤和分類來整理內容。所有這些操作皆透過一個介面進行控制,網站擁有者只需使用自然語言指令說明其需求即可。憑藉這些新功能,網站幾乎可以完全由人工指導的 AI 代理
Anthropic 的實驗性 AI「Claude」在電子商務測試中完成了談判與交易
隨著人工智慧的快速發展,Anthropic 上週五悄悄推出了一項名為「Project Deal」的內部實驗,展現了人工智慧在電子商務領域的潛力。該實驗讓其人工智慧模型 Claude 在封閉的市場環境中自主處理買賣及價格協商,並涉及真實的金融交易。實驗的核心是一個建構於 Slack 平台上的內部市場,Claude 在其中同時擔任買方與賣方的談判代表。它首先訪談了 69 名員工,以收集他們的買賣意圖及
DeepSeek Code 即將推出
隨著人工智慧技術的加速發展,DeepSeek 正處於一個令人振奮的轉捩點。這家人工智慧公司最近透露,已獲得超過 700 億元的資金。管理層強調,公司致力於突破性的人工智慧研究,而非追求眼前的商業利益。這一戰略轉向表明 DeepSeek 將全力投入新產品的開發,尤其是眾人矚目的 DeepSeek Code。DeepSeek Code 的規劃已逐漸成形,該公司職缺頁面已發布數個相關職位,例如「Agen
This is a game-changer for my workflow! Finally, a tool that actually understands what 'deep research' means and doesn't just spit out the first three search results. The time-saving potential is huge, especially for academic projects. Curious about the cost structure though—hope it stays accessible for individual users and not just big corporations. 🤔
Ça fait des économies mais aussi gagner du temps, ça parait idéal pour mes études ! Mais c'est juste accélérer la recherche, ou ça risque de remplacer notre propre réflexion à la longue ? 😕
Честно, такая функция для чата GPT выглядит супер удобно для студентов! 😄 Но интересно, как поисковики вроде Google отреагируют? Или это в итоге приведёт к ещё большему инфоперегрузу и проблемам с проверкой данных...
This Deep Research feature sounds like a dream for anyone drowning in data! I love how it cuts hours of work, but I’m curious—can it really dig up obscure sources as well as a human researcher? 🤔 Excited to try it out for my next project!
This Deep Research thing sounds like a total game-changer! I’m curious if it can dig up obscure stuff as fast as it claims. Anyone tried it yet? 🤔





首頁






