專家說,Google的最新AI模型報告缺乏關鍵安全細節。
週四,Google 在推出其最新且最先進的 AI 模型 Gemini 2.5 Pro 數週後,發布了一份技術報告,詳細說明其內部安全評估結果。然而,專家批評該報告缺乏細節,難以全面了解模型潛在風險。
技術報告在 AI 領域至關重要,提供洞察——即使有時不盡理想——企業通常不會公開分享。AI 社群普遍認為這些報告是促進獨立研究和增強安全評估的真誠努力。
Google 的安全報告方式與部分競爭對手不同。該公司僅在模型超越「實驗」階段後發布技術報告。此外,Google 在這些報告中省略某些「危險能力」評估結果,留待另行審計。
儘管如此,多位專家對 TechCrunch 表示對 Gemini 2.5 Pro 報告失望,指出其對 Google 提出的 Frontier Safety Framework (FSF) 覆蓋不足。Google 去年公布 FSF,旨在識別可能導致「嚴重傷害」的未來 AI 能力。
「這份報告非常簡略,資訊極少,且在模型公開數週後才發布,」AI 政策與策略研究所共同創辦人 Peter Wildeford 對 TechCrunch 說。「無法驗證 Google 是否兌現公開承諾,因此無法評估其模型的安全性和保障。」
Secure AI Project 共同創辦人 Thomas Woodside 承認 Gemini 2.5 Pro 報告的發布,但質疑 Google 提供及時補充安全評估的承諾。他指出,Google 最後一次發布危險能力測試結果是在 2024 年 6 月,針對當年 2 月宣布的模型。
此外,Google 尚未發布 Gemini 2.5 Flash 的報告,這是一款上週宣布的更小、更高效的模型。一位發言人向 TechCrunch 表示,Flash 的報告「即將發布」。
「我希望這是 Google 承諾開始更頻繁更新的訊號,」Woodside 對 TechCrunch 說。「這些更新應包括尚未公開部署模型的評估結果,因為這些模型也可能帶來嚴重風險。」
雖然 Google 是首批提出模型標準化報告的 AI 實驗室之一,但其透明度不足也受到批評。Meta 對其新 Llama 4 開放模型發布了同樣簡短的安全評估,而 OpenAI 則選擇不為其 GPT-4.1 系列發布任何報告。
Google 對監管機構保證維持 AI 安全測試和報告的高標準,增加了壓力。兩年前,Google 向美國政府承諾為所有「重要」公開 AI 模型「範圍內」發布安全報告,隨後對其他國家做出類似承諾,承諾圍繞 AI 產品實現「公開透明」。
民主與技術中心 AI 治理高級顧問 Kevin Bankston 將零星且模糊的報告趨勢描述為 AI 安全的「向下競爭」。
「結合競爭實驗室如 OpenAI 將安全測試時間從數月縮減至數天的報導,Google 頂級 AI 模型的薄弱文件顯示出企業急於將模型推向市場時,AI 安全與透明度的向下競爭令人不安,」他對 TechCrunch 說。
Google 表示,雖然技術報告未詳述,但其在模型發布前進行了安全測試和「對抗性紅隊測試」。
更新於 4/22 下午 12:58 太平洋時間:修改了技術報告中關於 Google FSF 的措辭。
相關文章
Google 相片運用人工智慧,讓《窈窕淑女》中那座標誌性的衣櫥栩栩如生
Google Photos 於週三宣布了一項由人工智慧驅動的新功能,這項功能將很快能將您衣物的照片轉化為數位衣櫥,讓您能創造嶄新的穿搭組合,甚至進行虛擬試穿。這個概念顯然是受到電影《窈窕淑女》中 Cher 那座標誌性的虛擬衣櫥啟發,她在片中可以瀏覽眾多服裝組合,同時決定該穿什麼。Google表示,這項功能將運用AI技術,根據您Google相簿圖庫中的衣物,自動建立您的衣櫥數位副本。在應用程式內,您
Google I/O 2026 發表了與 Gmail 收件匣的語音互動功能
Google 持續將人工智慧整合至您的收件匣中。在週二舉行的 IO 2026 開發者大會上,該公司透過對話式人工智慧擴充了 Gmail 的「AI 收件匣」功能,讓使用者能針對收件匣內容提出問題,而非僅依賴搜尋關鍵字。據 Google 表示,這項由 Gemini AI 驅動的工具名為「Gmail Live」,能協助使用者快速找出埋藏在收件匣中的資訊。圖片來源:Google舉例來說,您可能需要查詢即將
Google 在印度的 Chrome 瀏覽器中推出 Gemini
週三,Google 宣布將把 Chrome 瀏覽器的 Gemini 整合功能擴展至新地區,包括印度、加拿大和新西蘭。此項更新讓桌面版使用者能透過側邊欄存取 Gemini,藉此向 Google 的 AI 聊天機器人詢問螢幕上的內容、從 Gmail、Keep、Drive 和 YouTube 檢索資訊,以及比較不同分頁的內容。隨著此次擴展,Gemini 除英語及近期新增的 Chrome 支援語言外,亦將
相關專題推薦
評論 (6)
0/500
Google's AI safety report sounds like a half-baked cake – looks good but lacks substance. 😕 Why skimp on the details? Transparency matters when stakes are this high.
Der Bericht von Google über Gemini 2.5 Pro ist ein bisschen enttäuschend. Ich hatte mehr Details zu den Sicherheitsbewertungen erwartet, aber es scheint, als würden sie Informationen zurückhalten. Ohne die ganze Geschichte ist es schwer, der KI vollständig zu vertrauen. Vielleicht beim nächsten Mal, Google? 🤔
Google's report on Gemini 2.5 Pro is a bit of a letdown. I was expecting more juicy details about the safety assessments, but it feels like they're holding back. It's hard to trust the AI fully without knowing the full story. Maybe next time, Google? 🤔
O relatório do Google sobre o Gemini 2.5 Pro é um pouco decepcionante. Esperava mais detalhes sobre as avaliações de segurança, mas parece que eles estão escondendo algo. É difícil confiar totalmente na IA sem saber toda a história. Talvez na próxima, Google? 🤔
週四,Google 在推出其最新且最先進的 AI 模型 Gemini 2.5 Pro 數週後,發布了一份技術報告,詳細說明其內部安全評估結果。然而,專家批評該報告缺乏細節,難以全面了解模型潛在風險。
技術報告在 AI 領域至關重要,提供洞察——即使有時不盡理想——企業通常不會公開分享。AI 社群普遍認為這些報告是促進獨立研究和增強安全評估的真誠努力。
Google 的安全報告方式與部分競爭對手不同。該公司僅在模型超越「實驗」階段後發布技術報告。此外,Google 在這些報告中省略某些「危險能力」評估結果,留待另行審計。
儘管如此,多位專家對 TechCrunch 表示對 Gemini 2.5 Pro 報告失望,指出其對 Google 提出的 Frontier Safety Framework (FSF) 覆蓋不足。Google 去年公布 FSF,旨在識別可能導致「嚴重傷害」的未來 AI 能力。
「這份報告非常簡略,資訊極少,且在模型公開數週後才發布,」AI 政策與策略研究所共同創辦人 Peter Wildeford 對 TechCrunch 說。「無法驗證 Google 是否兌現公開承諾,因此無法評估其模型的安全性和保障。」
Secure AI Project 共同創辦人 Thomas Woodside 承認 Gemini 2.5 Pro 報告的發布,但質疑 Google 提供及時補充安全評估的承諾。他指出,Google 最後一次發布危險能力測試結果是在 2024 年 6 月,針對當年 2 月宣布的模型。
此外,Google 尚未發布 Gemini 2.5 Flash 的報告,這是一款上週宣布的更小、更高效的模型。一位發言人向 TechCrunch 表示,Flash 的報告「即將發布」。
「我希望這是 Google 承諾開始更頻繁更新的訊號,」Woodside 對 TechCrunch 說。「這些更新應包括尚未公開部署模型的評估結果,因為這些模型也可能帶來嚴重風險。」
雖然 Google 是首批提出模型標準化報告的 AI 實驗室之一,但其透明度不足也受到批評。Meta 對其新 Llama 4 開放模型發布了同樣簡短的安全評估,而 OpenAI 則選擇不為其 GPT-4.1 系列發布任何報告。
Google 對監管機構保證維持 AI 安全測試和報告的高標準,增加了壓力。兩年前,Google 向美國政府承諾為所有「重要」公開 AI 模型「範圍內」發布安全報告,隨後對其他國家做出類似承諾,承諾圍繞 AI 產品實現「公開透明」。
民主與技術中心 AI 治理高級顧問 Kevin Bankston 將零星且模糊的報告趨勢描述為 AI 安全的「向下競爭」。
「結合競爭實驗室如 OpenAI 將安全測試時間從數月縮減至數天的報導,Google 頂級 AI 模型的薄弱文件顯示出企業急於將模型推向市場時,AI 安全與透明度的向下競爭令人不安,」他對 TechCrunch 說。
Google 表示,雖然技術報告未詳述,但其在模型發布前進行了安全測試和「對抗性紅隊測試」。
更新於 4/22 下午 12:58 太平洋時間:修改了技術報告中關於 Google FSF 的措辭。
Google 相片運用人工智慧,讓《窈窕淑女》中那座標誌性的衣櫥栩栩如生
Google Photos 於週三宣布了一項由人工智慧驅動的新功能,這項功能將很快能將您衣物的照片轉化為數位衣櫥,讓您能創造嶄新的穿搭組合,甚至進行虛擬試穿。這個概念顯然是受到電影《窈窕淑女》中 Cher 那座標誌性的虛擬衣櫥啟發,她在片中可以瀏覽眾多服裝組合,同時決定該穿什麼。Google表示,這項功能將運用AI技術,根據您Google相簿圖庫中的衣物,自動建立您的衣櫥數位副本。在應用程式內,您
Google I/O 2026 發表了與 Gmail 收件匣的語音互動功能
Google 持續將人工智慧整合至您的收件匣中。在週二舉行的 IO 2026 開發者大會上,該公司透過對話式人工智慧擴充了 Gmail 的「AI 收件匣」功能,讓使用者能針對收件匣內容提出問題,而非僅依賴搜尋關鍵字。據 Google 表示,這項由 Gemini AI 驅動的工具名為「Gmail Live」,能協助使用者快速找出埋藏在收件匣中的資訊。圖片來源:Google舉例來說,您可能需要查詢即將
Google 在印度的 Chrome 瀏覽器中推出 Gemini
週三,Google 宣布將把 Chrome 瀏覽器的 Gemini 整合功能擴展至新地區,包括印度、加拿大和新西蘭。此項更新讓桌面版使用者能透過側邊欄存取 Gemini,藉此向 Google 的 AI 聊天機器人詢問螢幕上的內容、從 Gmail、Keep、Drive 和 YouTube 檢索資訊,以及比較不同分頁的內容。隨著此次擴展,Gemini 除英語及近期新增的 Chrome 支援語言外,亦將
Google's AI safety report sounds like a half-baked cake – looks good but lacks substance. 😕 Why skimp on the details? Transparency matters when stakes are this high.
Der Bericht von Google über Gemini 2.5 Pro ist ein bisschen enttäuschend. Ich hatte mehr Details zu den Sicherheitsbewertungen erwartet, aber es scheint, als würden sie Informationen zurückhalten. Ohne die ganze Geschichte ist es schwer, der KI vollständig zu vertrauen. Vielleicht beim nächsten Mal, Google? 🤔
Google's report on Gemini 2.5 Pro is a bit of a letdown. I was expecting more juicy details about the safety assessments, but it feels like they're holding back. It's hard to trust the AI fully without knowing the full story. Maybe next time, Google? 🤔
O relatório do Google sobre o Gemini 2.5 Pro é um pouco decepcionante. Esperava mais detalhes sobre as avaliações de segurança, mas parece que eles estão escondendo algo. É difícil confiar totalmente na IA sem saber toda a história. Talvez na próxima, Google? 🤔





首頁






