专家说,Google的最新AI模型报告缺乏关键安全细节。
在周四,谷歌在推出其最新且最先进的AI模型Gemini 2.5 Pro数周后,发布了一份技术报告,详细介绍了其内部安全评估结果。然而,专家们批评该报告缺乏细节,难以完全理解与该模型相关的潜在风险。
技术报告在AI领域至关重要,它们提供了洞察——即便有时这些洞察并不讨喜——企业通常不会公开分享这些信息。这些报告通常被AI社区视为促进独立研究和加强安全评估的真诚努力。
谷歌的安全报告方式与其一些竞争对手不同。该公司仅在模型进入“实验”阶段后才发布技术报告。此外,谷歌在这些报告中省略了某些“危险能力”评估结果,将其留给单独的审计。
尽管如此,多位专家对TechCrunch表示对Gemini 2.5 Pro报告感到失望,指出其对谷歌提出的前沿安全框架(FSF)的覆盖极少。谷歌去年推出了FSF,旨在识别未来可能导致“严重危害”的AI能力。
“这份报告非常简略,包含的信息极少,且在模型公开数周后才发布,”AI政策与战略研究所联合创始人彼得·威尔德福德对TechCrunch表示。“无法验证谷歌是否兑现了其公开承诺,因此也无法评估其模型的安全性和保障性。”
安全AI项目联合创始人托马斯·伍德赛德承认发布了Gemini 2.5 Pro的报告,但质疑谷歌对及时提供补充安全评估的承诺。他指出,谷歌上次发布危险能力测试结果是在2024年6月,针对的是当年2月宣布的模型。
更令人担忧的是,谷歌尚未发布关于上周宣布的更小、更高效的模型Gemini 2.5 Flash的报告。一位发言人告知TechCrunch,Flash的报告“即将发布”。
“我希望这是谷歌开始发布更频繁更新的承诺,”伍德赛德对TechCrunch表示。“这些更新应包括尚未公开部署的模型的评估结果,因为这些模型也可能带来严重风险。”
虽然谷歌是最早提出模型标准化报告的AI实验室之一,但它并非唯一因缺乏透明度而受到批评的公司。Meta为其新款Llama 4开放模型发布了同样简短的安全评估,而OpenAI则选择不为其GPT-4.1系列发布任何报告。
谷歌对监管机构关于保持AI安全测试和报告高标准的保证增加了压力。两年前,谷歌向美国政府承诺为所有“重要”的公开AI模型“在范围内”发布安全报告,随后对其他国家也做出了类似承诺,承诺围绕AI产品实现“公开透明”。
民主与技术中心AI治理高级顾问凯文·班克斯顿将零星且模糊的报告趋势描述为AI安全的“逐底竞争”。
“结合报道称OpenAI等竞争实验室在发布前将安全测试时间从数月缩短到数天,谷歌顶级AI模型的这份简陋文档显示了一个令人不安的故事:企业在急于将模型推向市场时,在AI安全和透明度上展开了逐底竞争,”他对TechCrunch表示。
谷歌表示,尽管其技术报告中未详细说明,但它在模型发布前进行了安全测试和“对抗性红队测试”。
更新于4月22日太平洋时间中午12:58:修改了关于技术报告提及谷歌FSF的措辞。
相关文章
Google I/O 2026 发布 Gmail 收件箱语音交互功能
谷歌正持续将人工智能融入用户的收件箱。在周二举行的IO 2026开发者大会上,该公司通过对话式人工智能扩展了Gmail的“AI收件箱”功能,让用户能够针对收件箱内容提出问题,而不再仅依赖搜索关键词。据谷歌介绍,这款由Gemini AI驱动的工具名为Gmail Live,可帮助用户快速定位收件箱中被埋没的信息。图片来源:谷歌例如,您可能需要查询即将出发的航班详情、牙医预约时间、爱彼迎(Airbnb)
谷歌在印度的Chrome浏览器中推出Gemini
周三,谷歌宣布将把Chrome浏览器中Gemini的集成功能扩展至印度、加拿大和新西兰等新地区。此次更新使桌面端用户能够通过侧边栏访问Gemini,用户可通过该功能向谷歌的AI聊天机器人咨询屏幕上的内容,从Gmail、Keep、Drive和YouTube中检索信息,并比较不同标签页的内容。随着此次扩展,除了英语和近期新增的Chrome支持语言外,Gemini还将支持印地语、孟加拉语、古吉拉特语、卡
YouTube将AI深度伪造检测功能扩展至政界人士、政府官员和记者
周二,YouTube宣布将把其深度伪造(deepfake)检测技术推广至部分政府官员、政治候选人和记者。该工具可识别由人工智能生成的肖像,并允许试点参与者申请删除其认为违反YouTube政策的未经授权内容。该检测系统在经过前期测试阶段后,于去年首次向约400万名YouTube合作伙伴计划的创作者推出。与YouTube现有的用于保护版权内容的Content ID系统类似,该肖像检测功能可识别AI模拟
相关专题推荐
评论 (6)
0/500
Google's AI safety report sounds like a half-baked cake – looks good but lacks substance. 😕 Why skimp on the details? Transparency matters when stakes are this high.
Der Bericht von Google über Gemini 2.5 Pro ist ein bisschen enttäuschend. Ich hatte mehr Details zu den Sicherheitsbewertungen erwartet, aber es scheint, als würden sie Informationen zurückhalten. Ohne die ganze Geschichte ist es schwer, der KI vollständig zu vertrauen. Vielleicht beim nächsten Mal, Google? 🤔
Google's report on Gemini 2.5 Pro is a bit of a letdown. I was expecting more juicy details about the safety assessments, but it feels like they're holding back. It's hard to trust the AI fully without knowing the full story. Maybe next time, Google? 🤔
O relatório do Google sobre o Gemini 2.5 Pro é um pouco decepcionante. Esperava mais detalhes sobre as avaliações de segurança, mas parece que eles estão escondendo algo. É difícil confiar totalmente na IA sem saber toda a história. Talvez na próxima, Google? 🤔
在周四,谷歌在推出其最新且最先进的AI模型Gemini 2.5 Pro数周后,发布了一份技术报告,详细介绍了其内部安全评估结果。然而,专家们批评该报告缺乏细节,难以完全理解与该模型相关的潜在风险。
技术报告在AI领域至关重要,它们提供了洞察——即便有时这些洞察并不讨喜——企业通常不会公开分享这些信息。这些报告通常被AI社区视为促进独立研究和加强安全评估的真诚努力。
谷歌的安全报告方式与其一些竞争对手不同。该公司仅在模型进入“实验”阶段后才发布技术报告。此外,谷歌在这些报告中省略了某些“危险能力”评估结果,将其留给单独的审计。
尽管如此,多位专家对TechCrunch表示对Gemini 2.5 Pro报告感到失望,指出其对谷歌提出的前沿安全框架(FSF)的覆盖极少。谷歌去年推出了FSF,旨在识别未来可能导致“严重危害”的AI能力。
“这份报告非常简略,包含的信息极少,且在模型公开数周后才发布,”AI政策与战略研究所联合创始人彼得·威尔德福德对TechCrunch表示。“无法验证谷歌是否兑现了其公开承诺,因此也无法评估其模型的安全性和保障性。”
安全AI项目联合创始人托马斯·伍德赛德承认发布了Gemini 2.5 Pro的报告,但质疑谷歌对及时提供补充安全评估的承诺。他指出,谷歌上次发布危险能力测试结果是在2024年6月,针对的是当年2月宣布的模型。
更令人担忧的是,谷歌尚未发布关于上周宣布的更小、更高效的模型Gemini 2.5 Flash的报告。一位发言人告知TechCrunch,Flash的报告“即将发布”。
“我希望这是谷歌开始发布更频繁更新的承诺,”伍德赛德对TechCrunch表示。“这些更新应包括尚未公开部署的模型的评估结果,因为这些模型也可能带来严重风险。”
虽然谷歌是最早提出模型标准化报告的AI实验室之一,但它并非唯一因缺乏透明度而受到批评的公司。Meta为其新款Llama 4开放模型发布了同样简短的安全评估,而OpenAI则选择不为其GPT-4.1系列发布任何报告。
谷歌对监管机构关于保持AI安全测试和报告高标准的保证增加了压力。两年前,谷歌向美国政府承诺为所有“重要”的公开AI模型“在范围内”发布安全报告,随后对其他国家也做出了类似承诺,承诺围绕AI产品实现“公开透明”。
民主与技术中心AI治理高级顾问凯文·班克斯顿将零星且模糊的报告趋势描述为AI安全的“逐底竞争”。
“结合报道称OpenAI等竞争实验室在发布前将安全测试时间从数月缩短到数天,谷歌顶级AI模型的这份简陋文档显示了一个令人不安的故事:企业在急于将模型推向市场时,在AI安全和透明度上展开了逐底竞争,”他对TechCrunch表示。
谷歌表示,尽管其技术报告中未详细说明,但它在模型发布前进行了安全测试和“对抗性红队测试”。
更新于4月22日太平洋时间中午12:58:修改了关于技术报告提及谷歌FSF的措辞。
Google I/O 2026 发布 Gmail 收件箱语音交互功能
谷歌正持续将人工智能融入用户的收件箱。在周二举行的IO 2026开发者大会上,该公司通过对话式人工智能扩展了Gmail的“AI收件箱”功能,让用户能够针对收件箱内容提出问题,而不再仅依赖搜索关键词。据谷歌介绍,这款由Gemini AI驱动的工具名为Gmail Live,可帮助用户快速定位收件箱中被埋没的信息。图片来源:谷歌例如,您可能需要查询即将出发的航班详情、牙医预约时间、爱彼迎(Airbnb)
谷歌在印度的Chrome浏览器中推出Gemini
周三,谷歌宣布将把Chrome浏览器中Gemini的集成功能扩展至印度、加拿大和新西兰等新地区。此次更新使桌面端用户能够通过侧边栏访问Gemini,用户可通过该功能向谷歌的AI聊天机器人咨询屏幕上的内容,从Gmail、Keep、Drive和YouTube中检索信息,并比较不同标签页的内容。随着此次扩展,除了英语和近期新增的Chrome支持语言外,Gemini还将支持印地语、孟加拉语、古吉拉特语、卡
YouTube将AI深度伪造检测功能扩展至政界人士、政府官员和记者
周二,YouTube宣布将把其深度伪造(deepfake)检测技术推广至部分政府官员、政治候选人和记者。该工具可识别由人工智能生成的肖像,并允许试点参与者申请删除其认为违反YouTube政策的未经授权内容。该检测系统在经过前期测试阶段后,于去年首次向约400万名YouTube合作伙伴计划的创作者推出。与YouTube现有的用于保护版权内容的Content ID系统类似,该肖像检测功能可识别AI模拟
Google's AI safety report sounds like a half-baked cake – looks good but lacks substance. 😕 Why skimp on the details? Transparency matters when stakes are this high.
Der Bericht von Google über Gemini 2.5 Pro ist ein bisschen enttäuschend. Ich hatte mehr Details zu den Sicherheitsbewertungen erwartet, aber es scheint, als würden sie Informationen zurückhalten. Ohne die ganze Geschichte ist es schwer, der KI vollständig zu vertrauen. Vielleicht beim nächsten Mal, Google? 🤔
Google's report on Gemini 2.5 Pro is a bit of a letdown. I was expecting more juicy details about the safety assessments, but it feels like they're holding back. It's hard to trust the AI fully without knowing the full story. Maybe next time, Google? 🤔
O relatório do Google sobre o Gemini 2.5 Pro é um pouco decepcionante. Esperava mais detalhes sobre as avaliações de segurança, mas parece que eles estão escondendo algo. É difícil confiar totalmente na IA sem saber toda a história. Talvez na próxima, Google? 🤔





首页






