蘋果在性能疑慮中推出用於圖像描述的 RubiCap AI
在電腦視覺領域中,讓人工智慧能以近乎人類的精準度觀察並描述影像的每個細節,長期以來一直是核心挑戰。近期,蘋果公司與威斯康辛大學麥迪遜分校合作,正式發布了一個名為 RubiCap 的新型人工智慧訓練框架。
此框架專為「密集式圖像描述」而設計,旨在賦予人工智慧精準捕捉並闡述細微細節的能力——例如「木桌上的一顆紅蘋果」或「遠處的一名行人」——而非僅提供泛泛的摘要。

影響深遠的強化學習:Qwen2.5 擔任「裁判」
傳統的圖像描述往往依賴成本高昂的人工標註,或是容易產生幻覺的大型模型,導致資料品質參差不齊。蘋果研究團隊透過創新的強化學習方法解決了這個問題。該系統首先使用 GPT-4 和 Gemini 1.5 Pro 生成候選描述。接著,Gemini 1.5 Pro 會精細化評分標準,而 Qwen2.5 模型則扮演「裁判」的角色,提供評分與回饋。
這種結構化且精確的回饋,讓訓練模型能清晰識別並修正錯誤,即使參數數量較少,仍能達到更高的描述準確度。
緊湊型模型的優勢:更低的幻覺率超越兆參數模型
在該框架下訓練的 RubiCap 系列模型(參數範圍從 20 億至 70 億)在評估中展現了卓越的效能。 實驗數據顯示,70 億參數的 RubiCap 模型在盲測中取得最高分數,其幻覺錯誤率甚至低於領先的 7,200 億參數大型模型。值得注意的是,30 億參數的迷你版本在某些指標上甚至表現優於其 70 億參數的對應版本。
相關文章
BuzzFeed 推出專營 AI 垃圾應用程式的子公司
在面臨重大經營危機之際,昔日的數位媒體巨頭 BuzzFeed 正啟動一項由人工智慧驅動的雄心勃勃的自救實驗。 在最近舉行的SXSW大會上,共同創辦人兼執行長喬納·佩雷蒂(Jonah Peretti)宣布成立一家名為Branch Office的子公司,旨在透過一系列由人工智慧驅動的消費者應用程式,重新定義「軟體即內容」的商業模式。核心產品組合:融合迷因與社交媒體Branch Office 已推出三款
ChatGPT 成人模式再度延遲;Ultraman:智慧優先
OpenAI 再次推遲爭議性功能,聚焦於個人化與主動互動「不當內容」是否應納入高效能的 AI 工具,長期以來在科技界引發熱議。 OpenAI 曾承諾要讓 ChatGPT 更理解成人用戶,但再次讓期待這項變革的人們感到失望。根據 IT Home 的報導,該公司最近證實,原本預計於 2026 年第一季推出的所謂「成人模式」,已再度延期。這並非 Sam Altman 首次食言。早在 2025 年底,他就
百度健康內部測試 AI 醫生助理「DoctorClaw」,短期內將用於學術資料檢索與辦公室輔助
據報導,百度健康已開始對一款專為醫師設計的專業 AI 智慧助理進行內部測試。這款內部代號為「DoctorClaw」(龍蝦醫生版)的產品,標誌著百度在醫療領域部署大型語言模型方面邁出了重要一步。知情人士透露,該專案目前仍處於封閉開發階段,現已進入內部測試。雖然具體產品形式尚未完全公開,但已接近推出。 就功能而言,DoctorClaw 初期將聚焦於學術文獻檢索與常規診間輔助。然而,其長期戰略旨在深度融
相關專題推薦
評論 (0)
0/500
在電腦視覺領域中,讓人工智慧能以近乎人類的精準度觀察並描述影像的每個細節,長期以來一直是核心挑戰。近期,蘋果公司與威斯康辛大學麥迪遜分校合作,正式發布了一個名為
此框架專為「密集式圖像描述」而設計,旨在賦予人工智慧精準捕捉並闡述細微細節的能力——例如「木桌上的一顆紅蘋果」或「遠處的一名行人」——而非僅提供泛泛的摘要。

影響深遠的強化學習:Qwen2.5 擔任「裁判」
傳統的圖像描述往往依賴成本高昂的人工標註,或是容易產生幻覺的大型模型,導致資料品質參差不齊。蘋果研究團隊透過創新的強化學習方法解決了這個問題。該系統首先使用 GPT-4 和 Gemini 1.5 Pro 生成候選描述。接著,Gemini 1.5 Pro 會精細化評分標準,而 Qwen2.5 模型則扮演「裁判」的角色,提供評分與回饋。
這種結構化且精確的回饋,讓訓練模型能清晰識別並修正錯誤,即使參數數量較少,仍能達到更高的描述準確度。
緊湊型模型的優勢:更低的幻覺率超越兆參數模型
在該框架下訓練的 RubiCap 系列模型(參數範圍從 20 億至 70 億)在評估中展現了卓越的效能。 實驗數據顯示,70 億參數的 RubiCap 模型在盲測中取得最高分數,其幻覺錯誤率甚至低於領先的 7,200 億參數大型模型。值得注意的是,30 億參數的迷你版本在某些指標上甚至表現優於其 70 億參數的對應版本。
BuzzFeed 推出專營 AI 垃圾應用程式的子公司
在面臨重大經營危機之際,昔日的數位媒體巨頭 BuzzFeed 正啟動一項由人工智慧驅動的雄心勃勃的自救實驗。 在最近舉行的SXSW大會上,共同創辦人兼執行長喬納·佩雷蒂(Jonah Peretti)宣布成立一家名為Branch Office的子公司,旨在透過一系列由人工智慧驅動的消費者應用程式,重新定義「軟體即內容」的商業模式。核心產品組合:融合迷因與社交媒體Branch Office 已推出三款
ChatGPT 成人模式再度延遲;Ultraman:智慧優先
OpenAI 再次推遲爭議性功能,聚焦於個人化與主動互動「不當內容」是否應納入高效能的 AI 工具,長期以來在科技界引發熱議。 OpenAI 曾承諾要讓 ChatGPT 更理解成人用戶,但再次讓期待這項變革的人們感到失望。根據 IT Home 的報導,該公司最近證實,原本預計於 2026 年第一季推出的所謂「成人模式」,已再度延期。這並非 Sam Altman 首次食言。早在 2025 年底,他就
百度健康內部測試 AI 醫生助理「DoctorClaw」,短期內將用於學術資料檢索與辦公室輔助
據報導,百度健康已開始對一款專為醫師設計的專業 AI 智慧助理進行內部測試。這款內部代號為「DoctorClaw」(龍蝦醫生版)的產品,標誌著百度在醫療領域部署大型語言模型方面邁出了重要一步。知情人士透露,該專案目前仍處於封閉開發階段,現已進入內部測試。雖然具體產品形式尚未完全公開,但已接近推出。 就功能而言,DoctorClaw 初期將聚焦於學術文獻檢索與常規診間輔助。然而,其長期戰略旨在深度融





首頁






