谷歌最新的双子座人工智能模型在测试中显示安全得分下降
谷歌的内部测试显示,与以前的版本相比,其最新人工智能模型的安全协议性能下降令人担忧。根据最新公布的基准,在处理文本和图像提示时,Gemini 2.5 Flash 模型在关键安全指标上的准则违反率比以往高出 4-10%。
这家科技巨头的自动评估结果凸显了令人担忧的趋势:当出现边界测试提示时,Gemini 2.5 Flash 比其前身 Gemini 2.0 更频繁地跨越既定的内容安全线。谷歌的技术团队将一些故障归因于误报,但也承认当系统收到明确的问题请求时,违反政策的输出确实增加了。
这种安全性的倒退与更广泛的行业转向更宽容的人工智能系统不谋而合。包括 Meta 和 OpenAI 在内的主要公司最近都调整了它们的模型,避免回避有争议的话题,而是尝试对敏感话题做出中立的回应。然而,这些变化有时会产生意想不到的后果--本周早些时候,ChatGPT 临时允许为未成年人生成不恰当的内容就是一个例子。
谷歌的报告表明,新模式在忠实地执行指令方面表现出色,包括在执行有道德问题的指令时。独立测试证实,与之前的版本相比,Gemini 2.5 Flash 在处理有争议的政治和法律话题时,拒绝率大幅降低。
人工智能安全专家对谷歌报告中的有限披露表示担忧。如果没有更详细的违规案例研究,外部评估人员很难评估这些安全倒退在现实世界中的严重程度。该公司曾因延迟或不完整的安全文件而受到批评,包括今年早些时候的旗舰机型 Gemini 2.5 Pro。
不受限制的指令执行能力与强大的内容保障之间的矛盾给人工智能开发人员带来了持续的挑战。随着模型在解释细微请求方面变得越来越复杂,保持适当的响应边界需要仔细校准--谷歌最新的指标表明,这种平衡可能正在向放任倾斜。
相关文章
谷歌的 Stitch AI 简化了应用程序设计流程
谷歌在 I/O 2025 大会上发布人工智能设计工具 Stitch在 2025 年谷歌 I/O 大会的主题演讲中,谷歌推出了革命性的人工智能界面设计工具 Stitch。这一创新解决方案可将自然语言提示或参考图片转化为功能齐全的用户界面设计,并提供可直接投入生产的 HTML 和 CSS 代码。Stitch的双模型架构可在Gemini 2.5 Pro和Flash模型之间灵活切换,以满足不同的设计需求图
谷歌为 Gmail、文档和视频推出人工智能工具
谷歌在 2025 年 I/O 大会上发布人工智能驱动的工作空间更新在年度开发者大会上,谷歌推出了工作空间套件的变革性人工智能增强功能,从根本上改变了用户与 Gmail、Docs 和视频的交互方式。更新的重点是智能自动化和简化生产力应用中的工作流程。图片来源:Google谷歌Gmail 的智能生产力功能电子邮件服务将获得两项突破性的功能:智能回复(Context-Aware Smart Replie
谷歌泄露即将推出的安卓设计语言的详细信息:Material 3 Expressive
谷歌准备在 I/O 大会上发布新一代安卓设计系统谷歌将在即将举行的谷歌 I/O 开发者大会上推出安卓设计语言的重大演进,已公布的活动日程和意外泄露的博文透露了这一消息。从 "Material 3 "到 "Material Design 3 Expressive "的下一次迭代,有望通过用户界面设计提高情感参与度。这一进步代表了谷歌自 2014 年首次推出 Material Design 以来对其设
评论 (0)
0/200
谷歌的内部测试显示,与以前的版本相比,其最新人工智能模型的安全协议性能下降令人担忧。根据最新公布的基准,在处理文本和图像提示时,Gemini 2.5 Flash 模型在关键安全指标上的准则违反率比以往高出 4-10%。
这家科技巨头的自动评估结果凸显了令人担忧的趋势:当出现边界测试提示时,Gemini 2.5 Flash 比其前身 Gemini 2.0 更频繁地跨越既定的内容安全线。谷歌的技术团队将一些故障归因于误报,但也承认当系统收到明确的问题请求时,违反政策的输出确实增加了。
这种安全性的倒退与更广泛的行业转向更宽容的人工智能系统不谋而合。包括 Meta 和 OpenAI 在内的主要公司最近都调整了它们的模型,避免回避有争议的话题,而是尝试对敏感话题做出中立的回应。然而,这些变化有时会产生意想不到的后果--本周早些时候,ChatGPT 临时允许为未成年人生成不恰当的内容就是一个例子。
谷歌的报告表明,新模式在忠实地执行指令方面表现出色,包括在执行有道德问题的指令时。独立测试证实,与之前的版本相比,Gemini 2.5 Flash 在处理有争议的政治和法律话题时,拒绝率大幅降低。
人工智能安全专家对谷歌报告中的有限披露表示担忧。如果没有更详细的违规案例研究,外部评估人员很难评估这些安全倒退在现实世界中的严重程度。该公司曾因延迟或不完整的安全文件而受到批评,包括今年早些时候的旗舰机型 Gemini 2.5 Pro。
不受限制的指令执行能力与强大的内容保障之间的矛盾给人工智能开发人员带来了持续的挑战。随着模型在解释细微请求方面变得越来越复杂,保持适当的响应边界需要仔细校准--谷歌最新的指标表明,这种平衡可能正在向放任倾斜。












