選項
首頁
新聞
專家說,Google的最新AI模型報告缺乏關鍵安全細節。

專家說,Google的最新AI模型報告缺乏關鍵安全細節。

2025-04-28
93

週四,Google 在推出其最新且最先進的 AI 模型 Gemini 2.5 Pro 數週後,發布了一份技術報告,詳細說明其內部安全評估結果。然而,專家批評該報告缺乏細節,難以全面了解模型潛在風險。

技術報告在 AI 領域至關重要,提供洞察——即使有時不盡理想——企業通常不會公開分享。AI 社群普遍認為這些報告是促進獨立研究和增強安全評估的真誠努力。

Google 的安全報告方式與部分競爭對手不同。該公司僅在模型超越「實驗」階段後發布技術報告。此外,Google 在這些報告中省略某些「危險能力」評估結果,留待另行審計。

儘管如此,多位專家對 TechCrunch 表示對 Gemini 2.5 Pro 報告失望,指出其對 Google 提出的 Frontier Safety Framework (FSF) 覆蓋不足。Google 去年公布 FSF,旨在識別可能導致「嚴重傷害」的未來 AI 能力。

「這份報告非常簡略,資訊極少,且在模型公開數週後才發布,」AI 政策與策略研究所共同創辦人 Peter Wildeford 對 TechCrunch 說。「無法驗證 Google 是否兌現公開承諾,因此無法評估其模型的安全性和保障。」

Secure AI Project 共同創辦人 Thomas Woodside 承認 Gemini 2.5 Pro 報告的發布,但質疑 Google 提供及時補充安全評估的承諾。他指出,Google 最後一次發布危險能力測試結果是在 2024 年 6 月,針對當年 2 月宣布的模型。

此外,Google 尚未發布 Gemini 2.5 Flash 的報告,這是一款上週宣布的更小、更高效的模型。一位發言人向 TechCrunch 表示,Flash 的報告「即將發布」。

「我希望這是 Google 承諾開始更頻繁更新的訊號,」Woodside 對 TechCrunch 說。「這些更新應包括尚未公開部署模型的評估結果,因為這些模型也可能帶來嚴重風險。」

雖然 Google 是首批提出模型標準化報告的 AI 實驗室之一,但其透明度不足也受到批評。Meta 對其新 Llama 4 開放模型發布了同樣簡短的安全評估,而 OpenAI 則選擇不為其 GPT-4.1 系列發布任何報告。

Google 對監管機構保證維持 AI 安全測試和報告的高標準,增加了壓力。兩年前,Google 向美國政府承諾為所有「重要」公開 AI 模型「範圍內」發布安全報告,隨後對其他國家做出類似承諾,承諾圍繞 AI 產品實現「公開透明」。

民主與技術中心 AI 治理高級顧問 Kevin Bankston 將零星且模糊的報告趨勢描述為 AI 安全的「向下競爭」。

「結合競爭實驗室如 OpenAI 將安全測試時間從數月縮減至數天的報導,Google 頂級 AI 模型的薄弱文件顯示出企業急於將模型推向市場時,AI 安全與透明度的向下競爭令人不安,」他對 TechCrunch 說。

Google 表示,雖然技術報告未詳述,但其在模型發布前進行了安全測試和「對抗性紅隊測試」。

更新於 4/22 下午 12:58 太平洋時間:修改了技術報告中關於 Google FSF 的措辭。

相關文章
Google 最新的 Gemini AI 模型在測試中顯示安全分數下降 Google 最新的 Gemini AI 模型在測試中顯示安全分數下降 Google 的內部測試顯示,其最新 AI 模型的安全規範與先前版本相比,有令人擔憂的效能落差。根據最新公佈的基準,Gemini 2.5 Flash 模型在處理文字和圖像提示時,在關鍵安全指標上的準則違反率高出 4-10%。這家科技巨擘的自動評估結果突顯出令人憂慮的趨勢:當出現邊界測試提示時,Gemini 2.5 Flash 比其前身 Gemini 2.0 更常跨越既定的內容安全線。Google
Google 的 Stitch AI 簡化應用程式設計流程 Google 的 Stitch AI 簡化應用程式設計流程 Google 在 I/O 2025 發表 Stitch AI 設計工具Google 在 I/O 2025 的主題演講中推出了革命性的 AI 介面設計工具 Stitch。此創新解決方案可將自然語言提示或參考圖片轉換為功能完整的 UI 設計,並提供可供生產的 HTML 與 CSS 程式碼。Stitch 的雙機型架構提供 Gemini 2.5 Pro 與 Flash 機型之間的彈性,可滿足不同的設計需求
Google 為 Gmail、Docs 和影片推出 AI 驅動的工具 Google 為 Gmail、Docs 和影片推出 AI 驅動的工具 Google 在 2025 年 I/O 發表 AI Powered Workspace 更新程式在年度開發者大會上,Google 介紹了其 Workspace 套件的變革性 AI 增強功能,從根本上改變使用者與 Gmail、Docs 及 Vids 的互動方式。這些更新的重點在於智慧型自動化和簡化生產力應用程式的工作流程。圖片來源:GoogleGmail 的智慧型生產力功能電子郵件服務將獲得兩項突破
評論 (6)
0/200
MarkSanchez
MarkSanchez 2025-08-01 21:47:34

Google's AI safety report sounds like a half-baked cake – looks good but lacks substance. 😕 Why skimp on the details? Transparency matters when stakes are this high.

WalterKing
WalterKing 2025-04-29 23:19:22

Der Bericht von Google über Gemini 2.5 Pro ist ein bisschen enttäuschend. Ich hatte mehr Details zu den Sicherheitsbewertungen erwartet, aber es scheint, als würden sie Informationen zurückhalten. Ohne die ganze Geschichte ist es schwer, der KI vollständig zu vertrauen. Vielleicht beim nächsten Mal, Google? 🤔

CharlesThomas
CharlesThomas 2025-04-29 09:17:55

ジェミニ2.5プロのレポート、ちょっとがっかりですね。安全評価の詳細をもっと知りたかったのに、情報が少なすぎる。AIを完全に信頼するのは難しいです。次回はもっと詳しくお願いします!😅

AlbertWalker
AlbertWalker 2025-04-29 07:15:07

Google's report on Gemini 2.5 Pro is a bit of a letdown. I was expecting more juicy details about the safety assessments, but it feels like they're holding back. It's hard to trust the AI fully without knowing the full story. Maybe next time, Google? 🤔

JimmyGarcia
JimmyGarcia 2025-04-29 04:01:42

O relatório do Google sobre o Gemini 2.5 Pro é um pouco decepcionante. Esperava mais detalhes sobre as avaliações de segurança, mas parece que eles estão escondendo algo. É difícil confiar totalmente na IA sem saber toda a história. Talvez na próxima, Google? 🤔

BillyThomas
BillyThomas 2025-04-28 07:41:33

El informe de Google sobre Gemini 2.5 Pro es decepcionante. Esperaba más detalles sobre las evaluaciones de seguridad, pero parece que están ocultando información. Es difícil confiar en la IA sin conocer toda la historia. ¿Tal vez la próxima vez, Google? 🤔

回到頂部
OR