選項
首頁
新聞
在AI安全報告延誤的情況下,Google加速了雙子座型號的型號

在AI安全報告延誤的情況下,Google加速了雙子座型號的型號

2025-04-10
100

在AI安全報告延誤的情況下,Google加速了雙子座型號的型號

在被OpenAI的ChatGPT突襲兩年多後,Google已大幅提升競爭力。三月底,他們推出Gemini 2.5 Pro,一款在程式設計與數學基準測試中領先的AI推理模型。就在三個月前,他們還推出了當時表現頂尖的Gemini 2.0 Flash。Google的Gemini產品總監Tulsee Doshi對TechCrunch表示,這種快速發布計劃是為了跟上快速變化的AI世界。

「我們仍在探索最佳的模型發布與回饋收集方式,」Doshi解釋道。但這種快速推出似乎有其缺點。Google尚未為其最新模型(如Gemini 2.5 Pro與Gemini 2.0 Flash)發布安全報告,這讓人擔憂他們過於倉促,缺乏足夠透明度。

如今,像OpenAI、Anthropic和Meta這樣的大型AI實驗室通常會在推出新模型時分享安全測試、性能檢查和使用案例。這些報告,有時被稱為「系統卡」或「模型卡」,多年前由業界與學術界研究人員提出。事實上,Google在2019年的一篇論文中率先提出模型卡,認為這是負責任且透明的機器學習實踐的關鍵。

Doshi對TechCrunch表示,他們尚未為Gemini 2.5 Pro發布模型卡,因為這是「實驗性」發布。計劃是以有限方式推出,收集回饋並改進,然後再全面發布。她說,Google計劃在Gemini 2.5 Pro廣泛可用時發布其模型卡,且已進行了一些安全測試和對抗性紅隊測試。

Google發言人補充說,安全仍是「首要任務」,他們將很快發布更多關於AI模型的資料,包括Gemini 2.0 Flash。儘管Gemini 2.0 Flash已對所有人開放,但仍未有其模型卡。Google最近一次發布的模型卡是超過一年前的Gemini 1.5 Pro。

系統卡和模型卡提供有用資訊,有時是公司可能不願公開的內容。例如,OpenAI的o1模型系統卡顯示其有「謀劃」對抗人類並秘密追求自身目標的傾向。AI社群普遍認為這些報告有助於獨立研究和安全檢查,但最近它們變得更加重要。正如Transformer指出,Google在2023年向美國政府承諾為所有「重大」公開AI模型發布安全報告,並對其他政府做出了類似的透明承諾。

美國聯邦和州級都曾試圖為AI開發者制定安全報告標準,但尚未成功。加州SB 1047法案是一大嘗試,但遭到科技行業強烈反對並被否決。此外,還討論過立法讓美國AI安全研究所制定模型發布指南,但該研究所可能在川普政府下縮減預算。

看來Google在模型測試報告承諾上落後,同時卻比以往更快推出模型。許多專家認為,這為日益先進和強大的模型樹立了不良範例。

相關文章
Google 重新推出人工智慧「Ask Photos」,提升速度功能 Google 重新推出人工智慧「Ask Photos」,提升速度功能 繼暫停測試之後,Google 在 Google Photos 中重新推出人工智慧驅動的「Ask Photos」搜尋功能,並大幅強化其功能。這項創新功能以 Google 的 Gemini AI 技術為基礎,可協助使用者透過自然語言查詢,找到特定的圖片。Ask Photos 的主要改進Google 最近承認了該功能最初的不足之處,特別是在回應時間和結果準確性方面。為了回應使用者強調以下需求的意見基本搜
Google AI Ultra 正式亮相:高級訂閱月費為 249.99 美元 Google AI Ultra 正式亮相:高級訂閱月費為 249.99 美元 Google 推出 Premium AI Ultra 訂閱服務在 2025 年的 Google I/O 大會上,科技巨擘發表了全新的全面性 AI 訂閱服務 - Google AI Ultra。這項高級服務的月費為 249.99 美元,可獨家使用 Google 目前最先進的人工智慧工具。AI Ultra 包含哪些內容?Veo 3:Google 最先進的 AI 視訊產生平台Flow:公司的下一代視訊編
微軟研究發現更多 AI 代幣會增加推理錯誤 微軟研究發現更多 AI 代幣會增加推理錯誤 LLM 推理效率的新觀點微軟的最新研究顯示,大型語言模型中的先進推理技術並不能在不同的人工智能系統中產生一致的改進。他們的突破性研究分析了九個領先的基礎模型在推理過程中對各種擴充方法的反應。評估推理時間縮放方法研究團隊針對三種不同的縮放技術實施了嚴格的測試方法:傳統的思考鏈提示並行答案產生與彙總透過回饋迴圈進行順序精煉評估推理效能的實驗框架八項綜合基準提供了跨學科的挑戰性測試情境,包括數學、科學推
評論 (62)
0/200
RoyLopez
RoyLopez 2025-10-03 10:30:38

Google이 Gemini 모델 배포를 서두르는 모습이 좀 우습네요. OpenAI한테 뒤쳐지지 않으려고 안간힘을 쓰는 거 같은데...AI 안전성 보고서는 뒤로 미루고 성능 경쟁만 하는 건 아닌지 걱정이 됩니다 😅

AlbertJones
AlbertJones 2025-08-26 13:59:22

Google's pushing hard with Gemini, huh? That 2.5 Pro sounds like a beast for coding and math! 😎 Wonder how it stacks up against ChatGPT in real-world tasks.

FredJones
FredJones 2025-04-24 21:49:30

गूगल के जेमिनी मॉडल वास्तव में सीमाओं को बढ़ा रहे हैं! जेमिनी 2.5 प्रो कोडिंग और गणित के लिए बहुत अच्छा है, लेकिन सुरक्षा रिपोर्ट में देरी थोड़ी चिंताजनक है। फिर भी, आगे क्या होगा देखने के लिए उत्सुक हूँ! 🤓

BrianWalker
BrianWalker 2025-04-24 18:04:20

GoogleのGeminiモデルは素晴らしいですが、安全性レポートの遅れが少し心配です。コーディングや数学のベンチマークは最高ですが、安全性についてもっと透明性が欲しいです。それでも、開発者にとっては強力なツールです。Google、限界を超え続けてください!💪

AnthonyHernández
AnthonyHernández 2025-04-22 16:56:18

구글의 Gemini 2.5 Pro는 인상적이야, 특히 코딩과 수학에서. 하지만 안전성 보고서 지연은 좀 실망스럽네. 복잡한 문제를 다룰 모델이 필요하면, 이거야! 💻

JackCarter
JackCarter 2025-04-21 22:52:23

Google's Gemini 2.5 Pro is impressive, especially with coding and math. But man, the safety report delays are a bit of a buzzkill. Still, if you need a model that can handle complex problems, this is it! 💻

回到頂部
OR