選項
首頁
新聞
在AI安全報告延誤的情況下,Google加速了雙子座型號的型號

在AI安全報告延誤的情況下,Google加速了雙子座型號的型號

2025-04-10
141

在AI安全報告延誤的情況下,Google加速了雙子座型號的型號

在被OpenAI的ChatGPT突襲兩年多後,Google已大幅提升競爭力。三月底,他們推出Gemini 2.5 Pro,一款在程式設計與數學基準測試中領先的AI推理模型。就在三個月前,他們還推出了當時表現頂尖的Gemini 2.0 Flash。Google的Gemini產品總監Tulsee Doshi對TechCrunch表示,這種快速發布計劃是為了跟上快速變化的AI世界。

「我們仍在探索最佳的模型發布與回饋收集方式,」Doshi解釋道。但這種快速推出似乎有其缺點。Google尚未為其最新模型(如Gemini 2.5 Pro與Gemini 2.0 Flash)發布安全報告,這讓人擔憂他們過於倉促,缺乏足夠透明度。

如今,像OpenAI、Anthropic和Meta這樣的大型AI實驗室通常會在推出新模型時分享安全測試、性能檢查和使用案例。這些報告,有時被稱為「系統卡」或「模型卡」,多年前由業界與學術界研究人員提出。事實上,Google在2019年的一篇論文中率先提出模型卡,認為這是負責任且透明的機器學習實踐的關鍵。

Doshi對TechCrunch表示,他們尚未為Gemini 2.5 Pro發布模型卡,因為這是「實驗性」發布。計劃是以有限方式推出,收集回饋並改進,然後再全面發布。她說,Google計劃在Gemini 2.5 Pro廣泛可用時發布其模型卡,且已進行了一些安全測試和對抗性紅隊測試。

Google發言人補充說,安全仍是「首要任務」,他們將很快發布更多關於AI模型的資料,包括Gemini 2.0 Flash。儘管Gemini 2.0 Flash已對所有人開放,但仍未有其模型卡。Google最近一次發布的模型卡是超過一年前的Gemini 1.5 Pro。

系統卡和模型卡提供有用資訊,有時是公司可能不願公開的內容。例如,OpenAI的o1模型系統卡顯示其有「謀劃」對抗人類並秘密追求自身目標的傾向。AI社群普遍認為這些報告有助於獨立研究和安全檢查,但最近它們變得更加重要。正如Transformer指出,Google在2023年向美國政府承諾為所有「重大」公開AI模型發布安全報告,並對其他政府做出了類似的透明承諾。

美國聯邦和州級都曾試圖為AI開發者制定安全報告標準,但尚未成功。加州SB 1047法案是一大嘗試,但遭到科技行業強烈反對並被否決。此外,還討論過立法讓美國AI安全研究所制定模型發布指南,但該研究所可能在川普政府下縮減預算。

看來Google在模型測試報告承諾上落後,同時卻比以往更快推出模型。許多專家認為,這為日益先進和強大的模型樹立了不良範例。

相關文章
Google I/O 2026 發表了與 Gmail 收件匣的語音互動功能 Google I/O 2026 發表了與 Gmail 收件匣的語音互動功能 Google 持續將人工智慧整合至您的收件匣中。在週二舉行的 IO 2026 開發者大會上,該公司透過對話式人工智慧擴充了 Gmail 的「AI 收件匣」功能,讓使用者能針對收件匣內容提出問題,而非僅依賴搜尋關鍵字。據 Google 表示,這項由 Gemini AI 驅動的工具名為「Gmail Live」,能協助使用者快速找出埋藏在收件匣中的資訊。圖片來源:Google舉例來說,您可能需要查詢即將
Google 在印度的 Chrome 瀏覽器中推出 Gemini Google 在印度的 Chrome 瀏覽器中推出 Gemini 週三,Google 宣布將把 Chrome 瀏覽器的 Gemini 整合功能擴展至新地區,包括印度、加拿大和新西蘭。此項更新讓桌面版使用者能透過側邊欄存取 Gemini,藉此向 Google 的 AI 聊天機器人詢問螢幕上的內容、從 Gmail、Keep、Drive 和 YouTube 檢索資訊,以及比較不同分頁的內容。隨著此次擴展,Gemini 除英語及近期新增的 Chrome 支援語言外,亦將
YouTube 將 AI 深度偽造偵測功能擴展至政治人物、政府官員及記者 YouTube 將 AI 深度偽造偵測功能擴展至政治人物、政府官員及記者 週二,YouTube 宣布將其深度偽造(deepfake)偵測技術擴展至特定群體,包括政府官員、政治候選人及記者。該工具能識別由人工智慧生成的肖像,並允許試點計畫的參與者要求移除其認為違反 YouTube 政策且未經授權的內容。該偵測系統在經過前期測試階段後,去年首度向約 400 萬名 YouTube 合作夥伴計畫的創作者推出。與 YouTube 現有的版權內容識別系統(Content ID)類似
相關專題推薦
寫作 最適合廣播和播客使用的AI指令碼編寫工具:幫助您創作引人入勝的音訊廣告
最適合廣播和播客使用的AI指令碼編寫工具:幫助您創作引人入勝的音訊廣告

在XIX.AI上,發現2026年最適合用於廣播和播客製作的AI指令碼工具。我們精心挑選的這些高評分工具能夠提供強大的功能,幫助您快速製作出引人入勝的音訊廣告。透過實際測試和每週更新的排名,您可以瞭解免費選項與付費選項之間的差異。今天就釋放您的創造力吧!

10 個工具
xix.ai
商業 最佳 AI 合約審查軟體:即時發現法律漏洞與合規風險
最佳 AI 合約審查軟體:即時發現法律漏洞與合規風險

立即在 XIX.AI 探索 2026 年最佳 AI 合約審查軟體。我們精心挑選的頂級清單收錄了多款強大工具,能即時偵測法律漏洞與合規風險。透過實際測試與每週更新的排行榜,比較免費與付費方案的差異。為您找到能徹底改變遊戲規則的解決方案,實現安全且高效的合約分析。立即探索這份權威指南。

10 個工具
xix.ai
動畫創作 專為東華設計的AI動漫生成器:可用於建立網路小說角色及漫畫頭像
專為東華設計的AI動漫生成器:可用於建立網路小說角色及漫畫頭像

探索2026年最適合製作中文動畫的人工智慧工具。我們精心挑選的頂級列表中包含了各種強大的工具,能夠幫助你建立出令人驚歎的網路小說角色和漫畫頭像。透過實際測試來對比免費選項和付費選項,找到最適合你的創作工具,今天就在XIX.AI上將你的故事變為現實吧。

10 個工具
xix.ai
漫畫創作 漫畫頂尖 AI 自動上色工具:零一致性錯誤地套用平面色彩
漫畫頂尖 AI 自動上色工具:零一致性錯誤地套用平面色彩

立即前往 XIX.AI,探索 2026 年最優秀的漫畫 AI 自動上色工具。我們精心挑選的清單收錄了備受好評、能徹底改變遊戲規則的解決方案,這些工具能以零一致性錯誤的方式套用平面色彩,大幅提升您的工作效率。透過免費與付費版本的比較、實際測試結果,以及每週更新的排行榜,找到最適合您的工具。立即解鎖您的 AI 優勢。

10 個工具
xix.ai
寫作 頂尖 AI 角色設定生成工具:創造一致的角色動機與致命弱點
頂尖 AI 角色設定生成工具:創造一致的角色動機與致命弱點

探索 2026 年最優秀的 AI 角色設定生成工具,打造立體鮮明的角色。XIX.AI 精心整理的清單收錄了備受好評、能徹底改變遊戲規則的工具,這些工具能生成一貫的動機與致命缺陷。透過實際測試,比較免費與付費選項的差異。立即釋放您的說故事潛能。

10 個工具
xix.ai
商業 頂尖 AI 定價優化軟體:追蹤競爭對手並自動調整商店價格
頂尖 AI 定價優化軟體:追蹤競爭對手並自動調整商店價格

立即在 XIX.AI 探索 2026 年最佳 AI 定價優化軟體。我們精心挑選的清單收錄了備受好評、能徹底改變遊戲規則的工具,這些工具不僅能追蹤競爭對手,還能自動調整您的商店價格,以實現利潤最大化。透過實際測試,比較免費與付費方案的差異。立即掌握您的定價優勢。

10 個工具
xix.ai
評論 (62)
0/500
RoyLopez
RoyLopez 2025-10-03 10:30:38

Google이 Gemini 모델 배포를 서두르는 모습이 좀 우습네요. OpenAI한테 뒤쳐지지 않으려고 안간힘을 쓰는 거 같은데...AI 안전성 보고서는 뒤로 미루고 성능 경쟁만 하는 건 아닌지 걱정이 됩니다 😅

AlbertJones
AlbertJones 2025-08-26 13:59:22

Google's pushing hard with Gemini, huh? That 2.5 Pro sounds like a beast for coding and math! 😎 Wonder how it stacks up against ChatGPT in real-world tasks.

FredJones
FredJones 2025-04-24 21:49:30

गूगल के जेमिनी मॉडल वास्तव में सीमाओं को बढ़ा रहे हैं! जेमिनी 2.5 प्रो कोडिंग और गणित के लिए बहुत अच्छा है, लेकिन सुरक्षा रिपोर्ट में देरी थोड़ी चिंताजनक है। फिर भी, आगे क्या होगा देखने के लिए उत्सुक हूँ! 🤓

BrianWalker
BrianWalker 2025-04-24 18:04:20

GoogleのGeminiモデルは素晴らしいですが、安全性レポートの遅れが少し心配です。コーディングや数学のベンチマークは最高ですが、安全性についてもっと透明性が欲しいです。それでも、開発者にとっては強力なツールです。Google、限界を超え続けてください!💪

AnthonyHernández
AnthonyHernández 2025-04-22 16:56:18

구글의 Gemini 2.5 Pro는 인상적이야, 특히 코딩과 수학에서. 하지만 안전성 보고서 지연은 좀 실망스럽네. 복잡한 문제를 다룰 모델이 필요하면, 이거야! 💻

JackCarter
JackCarter 2025-04-21 22:52:23

Google's Gemini 2.5 Pro is impressive, especially with coding and math. But man, the safety report delays are a bit of a buzzkill. Still, if you need a model that can handle complex problems, this is it! 💻

OR