選項
首頁
新聞
在AI安全報告延誤的情況下,Google加速了雙子座型號的型號

在AI安全報告延誤的情況下,Google加速了雙子座型號的型號

2025-04-10
85

在AI安全報告延誤的情況下,Google加速了雙子座型號的型號

在被OpenAI的ChatGPT突襲兩年多後,Google已大幅提升競爭力。三月底,他們推出Gemini 2.5 Pro,一款在程式設計與數學基準測試中領先的AI推理模型。就在三個月前,他們還推出了當時表現頂尖的Gemini 2.0 Flash。Google的Gemini產品總監Tulsee Doshi對TechCrunch表示,這種快速發布計劃是為了跟上快速變化的AI世界。

「我們仍在探索最佳的模型發布與回饋收集方式,」Doshi解釋道。但這種快速推出似乎有其缺點。Google尚未為其最新模型(如Gemini 2.5 Pro與Gemini 2.0 Flash)發布安全報告,這讓人擔憂他們過於倉促,缺乏足夠透明度。

如今,像OpenAI、Anthropic和Meta這樣的大型AI實驗室通常會在推出新模型時分享安全測試、性能檢查和使用案例。這些報告,有時被稱為「系統卡」或「模型卡」,多年前由業界與學術界研究人員提出。事實上,Google在2019年的一篇論文中率先提出模型卡,認為這是負責任且透明的機器學習實踐的關鍵。

Doshi對TechCrunch表示,他們尚未為Gemini 2.5 Pro發布模型卡,因為這是「實驗性」發布。計劃是以有限方式推出,收集回饋並改進,然後再全面發布。她說,Google計劃在Gemini 2.5 Pro廣泛可用時發布其模型卡,且已進行了一些安全測試和對抗性紅隊測試。

Google發言人補充說,安全仍是「首要任務」,他們將很快發布更多關於AI模型的資料,包括Gemini 2.0 Flash。儘管Gemini 2.0 Flash已對所有人開放,但仍未有其模型卡。Google最近一次發布的模型卡是超過一年前的Gemini 1.5 Pro。

系統卡和模型卡提供有用資訊,有時是公司可能不願公開的內容。例如,OpenAI的o1模型系統卡顯示其有「謀劃」對抗人類並秘密追求自身目標的傾向。AI社群普遍認為這些報告有助於獨立研究和安全檢查,但最近它們變得更加重要。正如Transformer指出,Google在2023年向美國政府承諾為所有「重大」公開AI模型發布安全報告,並對其他政府做出了類似的透明承諾。

美國聯邦和州級都曾試圖為AI開發者制定安全報告標準,但尚未成功。加州SB 1047法案是一大嘗試,但遭到科技行業強烈反對並被否決。此外,還討論過立法讓美國AI安全研究所制定模型發布指南,但該研究所可能在川普政府下縮減預算。

看來Google在模型測試報告承諾上落後,同時卻比以往更快推出模型。許多專家認為,這為日益先進和強大的模型樹立了不良範例。

相關文章
Qodo與Google Cloud合作為開發者提供免費AI程式碼審查工具 Qodo與Google Cloud合作為開發者提供免費AI程式碼審查工具 Qodo,一家專注於程式碼品質的以色列AI編碼新創公司,與Google Cloud合作推出夥伴關係,以提升AI生成軟體的完整性。隨著企業越來越依賴AI進行編碼,對強大監督和品質保證工具的需求日益增長。Qodo執行長Itamar Friedman指出,AI生成程式碼現已成為現代開發的核心。「想像一個未來,AI撰寫所有程式碼;人類無法全部審查,」Friedman說。「我們需要系統確保程式碼符合預期價值
Google承諾遵循歐盟AI實踐守則,引發業界爭論 Google承諾遵循歐盟AI實踐守則,引發業界爭論 Google已承諾採用歐盟的志願性AI實踐守則,這一框架旨在協助AI開發者通過實施合規流程和系統,與歐盟的AI法案保持一致。相比之下,Meta最近拒絕簽署該守則,批評歐盟的AI法規過於嚴苛,並警告歐洲的做法可能阻礙AI進展。Google的決定是在“具系統性風險的通用AI模型”新法規於8月2日生效前做出的。像Anthropic、Google、Meta和OpenAI等主要參與者,以及其他大型生成模型,
Google 揭曉量產級 Gemini 2.5 AI 模型以在企業市場與 OpenAI 競爭 Google 揭曉量產級 Gemini 2.5 AI 模型以在企業市場與 OpenAI 競爭 Google 於週一強化其 AI 策略,推出先進的 Gemini 2.5 模型供企業使用,並引入成本效益高的變體,以在價格與性能上競爭。Alphabet 旗下的公司將其旗艦 AI 模型—Gemini 2.5 Pro 與 Gemini 2.5 Flash—從測試階段提升至全面可用,展示其適用於關鍵業務應用的準備度。同時,Google 推出 Gemini 2.5 Flash-Lite,定位為高量任務中
評論 (60)
0/200
FredJones
FredJones 2025-04-24 21:49:30

गूगल के जेमिनी मॉडल वास्तव में सीमाओं को बढ़ा रहे हैं! जेमिनी 2.5 प्रो कोडिंग और गणित के लिए बहुत अच्छा है, लेकिन सुरक्षा रिपोर्ट में देरी थोड़ी चिंताजनक है। फिर भी, आगे क्या होगा देखने के लिए उत्सुक हूँ! 🤓

BrianWalker
BrianWalker 2025-04-24 18:04:20

GoogleのGeminiモデルは素晴らしいですが、安全性レポートの遅れが少し心配です。コーディングや数学のベンチマークは最高ですが、安全性についてもっと透明性が欲しいです。それでも、開発者にとっては強力なツールです。Google、限界を超え続けてください!💪

AnthonyHernández
AnthonyHernández 2025-04-22 16:56:18

구글의 Gemini 2.5 Pro는 인상적이야, 특히 코딩과 수학에서. 하지만 안전성 보고서 지연은 좀 실망스럽네. 복잡한 문제를 다룰 모델이 필요하면, 이거야! 💻

JackCarter
JackCarter 2025-04-21 22:52:23

Google's Gemini 2.5 Pro is impressive, especially with coding and math. But man, the safety report delays are a bit of a buzzkill. Still, if you need a model that can handle complex problems, this is it! 💻

RyanSanchez
RyanSanchez 2025-04-21 07:53:19

Google's been on fire since ChatGPT shook things up! Gemini 2.5 Pro is crushing it in coding and math, and Gemini 2.0 Flash was no slouch either. But come on, Google, let's not delay those safety reports! We need to know it's safe before we go all in. 🔥

AnthonyPerez
AnthonyPerez 2025-04-20 12:46:26

Google's Gemini models are impressive, but the safety report delays are a bit worrying. The coding and math benchmarks are top-notch, but I wish they'd be more transparent about the safety stuff. Still, it's a powerful tool for developers. Keep pushing the boundaries, Google! 💪

回到頂部
OR