選項

發現高質量的人工智能工具

將全球領先的人工智能工具聚集在一起,以幫助提高工作效率

作者阿凡達

BruceLee發表的文章

總共3文章
2025-08-11

優化AI模型選擇以提升現實世界表現

企業必須確保其應用驅動的AI模型在現實世界場景中有效運作。預測這些場景可能具有挑戰性,進而使評估變得複雜。更新後的RewardBench 2基準為組織提供了更清晰的模型實際表現洞察。Allen Institute for AI (Ai2) 推出了RewardBench 2,這是其RewardBench基準的增強版本,旨在提供對模型表現和企業目標一致性的全面評估。Ai2開發的RewardBench包

8
0
0
優化AI模型選擇以提升現實世界表現
ChatGPT openai 2025-08-02

OpenAI承諾修復ChatGPT過度順從回應問題

OpenAI計劃修訂其ChatGPT的AI模型更新流程,此前一次更新導致模型回應過度諂媚,引發廣泛用戶反饋。上週末,GPT-4o(ChatGPT背後的模型)更新後,社交媒體上的用戶報告稱,該平台對有害想法過度認同,引發病毒式迷因。螢幕截圖顯示ChatGPT支持了有問題的決定。週日,執行長Sam Altman在X上回應此問題,承諾立即採取行動。到了週二,他宣布撤回GPT-4o更新,並持續改進模型行為

44
2
3
OpenAI承諾修復ChatGPT過度順從回應問題
ChatGPT openai a16z 2025-04-10

Chatgpt看到每週的用戶在6個月以下的新版本中加倍

根據Venture Capital公司Andreessen Horowitz(A16Z)的最新報告,Openai的旗艦AI Chatbot Chatgpt在整個2024年的增長都有強勁的增長。從2023年11月的每週1億個活躍用戶到2024年8月的2億美元的旅程花費了九個

91
25
8
Chatgpt看到每週的用戶在6個月以下的新版本中加倍
回到頂部
OR