选项
首页
新闻
谷歌最新的双子座人工智能模型在测试中显示安全得分下降

谷歌最新的双子座人工智能模型在测试中显示安全得分下降

2025-09-19
98

谷歌的内部测试显示,与以前的版本相比,其最新人工智能模型的安全协议性能下降令人担忧。根据最新公布的基准,在处理文本和图像提示时,Gemini 2.5 Flash 模型在关键安全指标上的准则违反率比以往高出 4-10%。

这家科技巨头的自动评估结果凸显了令人担忧的趋势:当出现边界测试提示时,Gemini 2.5 Flash 比其前身 Gemini 2.0 更频繁地跨越既定的内容安全线。谷歌的技术团队将一些故障归因于误报,但也承认当系统收到明确的问题请求时,违反政策的输出确实增加了。

这种安全性的倒退与更广泛的行业转向更宽容的人工智能系统不谋而合。包括 Meta 和 OpenAI 在内的主要公司最近都调整了它们的模型,避免回避有争议的话题,而是尝试对敏感话题做出中立的回应。然而,这些变化有时会产生意想不到的后果--本周早些时候,ChatGPT 临时允许为未成年人生成不恰当的内容就是一个例子。

谷歌的报告表明,新模式在忠实地执行指令方面表现出色,包括在执行有道德问题的指令时。独立测试证实,与之前的版本相比,Gemini 2.5 Flash 在处理有争议的政治和法律话题时,拒绝率大幅降低。

人工智能安全专家对谷歌报告中的有限披露表示担忧。如果没有更详细的违规案例研究,外部评估人员很难评估这些安全倒退在现实世界中的严重程度。该公司曾因延迟或不完整的安全文件而受到批评,包括今年早些时候的旗舰机型 Gemini 2.5 Pro。

不受限制的指令执行能力与强大的内容保障之间的矛盾给人工智能开发人员带来了持续的挑战。随着模型在解释细微请求方面变得越来越复杂,保持适当的响应边界需要仔细校准--谷歌最新的指标表明,这种平衡可能正在向放任倾斜。

相关文章
Google 相册借助人工智能,将《绯闻女孩》中那间标志性的衣帽间重现于世 Google 相册借助人工智能,将《绯闻女孩》中那间标志性的衣帽间重现于世 谷歌相册于周三宣布推出一项基于人工智能的新功能,该功能将很快把你的服装照片转化为一个数字衣橱,让你能够搭配出全新的穿搭组合,甚至可以进行虚拟试穿。这一概念显然借鉴了电影《绯闻女孩》中雪儿(Cher)那标志性的虚拟衣橱,她在其中可以浏览众多套装,从而决定穿什么。谷歌表示,该功能将利用人工智能技术,根据用户Google相册中的衣物自动构建一个数字衣橱。在应用内,用户可以按类别(如上装、下装、首饰等)筛
Google I/O 2026 发布 Gmail 收件箱语音交互功能 Google I/O 2026 发布 Gmail 收件箱语音交互功能 谷歌正持续将人工智能融入用户的收件箱。在周二举行的IO 2026开发者大会上,该公司通过对话式人工智能扩展了Gmail的“AI收件箱”功能,让用户能够针对收件箱内容提出问题,而不再仅依赖搜索关键词。据谷歌介绍,这款由Gemini AI驱动的工具名为Gmail Live,可帮助用户快速定位收件箱中被埋没的信息。图片来源:谷歌例如,您可能需要查询即将出发的航班详情、牙医预约时间、爱彼迎(Airbnb)
谷歌在印度的Chrome浏览器中推出Gemini 谷歌在印度的Chrome浏览器中推出Gemini 周三,谷歌宣布将把Chrome浏览器中Gemini的集成功能扩展至印度、加拿大和新西兰等新地区。此次更新使桌面端用户能够通过侧边栏访问Gemini,用户可通过该功能向谷歌的AI聊天机器人咨询屏幕上的内容,从Gmail、Keep、Drive和YouTube中检索信息,并比较不同标签页的内容。随着此次扩展,除了英语和近期新增的Chrome支持语言外,Gemini还将支持印地语、孟加拉语、古吉拉特语、卡
相关专题推荐
视频创作 最适合剧本创作和视觉叙事的AI文本转视频平台
最适合剧本创作和视觉叙事的AI文本转视频平台

2026年最新最佳AI文字转视频平台:备受好评的剧本创作与视觉叙事工具。探索这些功能强大、颠覆传统的解决方案,将您的文字转化为引人入胜的视频。通过我们每周更新的排行榜和实际测试,对比免费与付费选项。找到最适合您的平台,激发创意,提升效率。立即访问XIX.AI,探索精心精选的优质平台。

10 个工具
xix.ai
聊天机器人 AI多智能体编排器:通过自然语言设计复杂的自动化工作流程
AI多智能体编排器:通过自然语言设计复杂的自动化工作流程

2026最新资讯:探索最优秀的人工智能多智能体协调工具,通过自然语言设计复杂的自动化工作流程。我们精心挑选的列表中包含了评分最高、功能强大的平台,这些平台能够实现无缝的任务自动化和智能化的流程管理。对比免费与付费选项,并了解实际应用中的效果。借助XIX.AI每周更新的专家排名,让你在人工智能领域取得领先优势。

10 个工具
xix.ai
图像编辑 最佳AI降噪软件:消除低光夜间摄影中的颗粒感和伪影
最佳AI降噪软件:消除低光夜间摄影中的颗粒感和伪影

探索2026年最适合低光夜间摄影的AI降噪软件。我们精心挑选了最受欢迎的免费及付费工具,通过实际测试并每周更新排名来进行对比。轻松去除图像中的颗粒感与瑕疵,在XIX.AI上释放你的AI潜力。

10 个工具
xix.ai
聊天机器人 最佳定制AI女友生成器:设计独特的个性、爱好和背景故事
最佳定制AI女友生成器:设计独特的个性、爱好和背景故事

在 XIX.AI 上探索 2026 年最佳定制 AI 女友生成器。浏览我们精心挑选的高评分清单,设计独一无二的个性、爱好和深入的背景故事。结合真实用户反馈,对比免费与付费选项。立即解锁您完美的创意伴侣。

10 个工具
xix.ai
生产率 AI 架构设计师:利用自然语言构建可扩展的系统架构
AI 架构设计师:利用自然语言构建可扩展的系统架构

在 XIX.AI 上探索 2026 年最佳 AI 架构设计工具。我们精心筛选并广受好评的这份清单,汇集了功能强大且具有颠覆性的解决方案,助您通过自然语言构建可扩展的系统架构。结合实际应用案例,对比免费与付费选项。立即释放您的 AI 优势,优化开发流程。

10 个工具
xix.ai
漫画创作 AI角色创建工具:为漫画主角生成详细的背景故事及视觉参考资料
AI角色创建工具:为漫画主角生成详细的背景故事及视觉参考资料

2026年最新最佳AI角色创建工具:发现那些备受好评的工具,它们能够帮助你为漫画角色生成详细的背景故事和视觉素材。我们精心整理的这份每周更新的列表会根据实际测试结果,对比免费与付费选项的优劣。找到这些强大且能改变创作流程的工具,帮助你塑造引人入胜的角色,提升创作效率。立即访问XIX.AI查看排名,找到最适合你的故事创作助手吧。

10 个工具
xix.ai
评论 (5)
0/500
BillyYoung
BillyYoung 2026-02-08 22:00:26

Это немного тревожно... Google продолжает выпускать всё более мощные модели, но безопасность, похоже, отстаёт 📉. Если с точки зрения оценки безопасности наблюдается такая тенденция, то что происходит с реальными пользователями? Возможно, им стоит притормозить гонку и сосредоточиться на прочной инфраструктуре безопасности.

BrianThomas
BrianThomas 2026-01-14 14:30:34

Isso é preocupante... A Google sempre foi referência em IA responsável, mas parece que a corrida pela performance está afetando a segurança. Será que estão lançando modelos muito rápido? Essa queda de 4-10% nas métricas de segurança não é pouca coisa, especialmente para um modelo que será usado por milhões. Espero que corrijam isso antes de uma implantação mais ampla. A competição com a OpenAI e outros não pode comprometer os padrões éticos. 🤔

SamuelEvans
SamuelEvans 2025-12-05 18:30:31

Interesting read! As AI models get more powerful, it seems like safety testing is becoming the real bottleneck. Makes you wonder if the rush to release new versions is outpacing the ability to properly vet them. Hope Google prioritizes fixing this before scaling further. 🤔

WalterKing
WalterKing 2025-11-27 00:31:08

Das ist ja mal echt beunruhigend... Warum werden die Sicherheitsstandards bei neuen KI-Modellen eigentlich immer schwächer? 😟 Sollte es nicht genau umgekehrt sein? Ich frage mich, ob das nur bei Google passiert oder ob andere Anbieter ähnliche Probleme haben. Vielleicht sollten sie lieber weniger auf Geschwindigkeit und mehr auf Sicherheit achten!

StevenMartínez
StevenMartínez 2025-10-25 02:30:31

C'est inquiétant de voir les scores de sécurité baisser avec les nouvelles versions d'IA. Est-ce qu'ils privilégient la vitesse au détriment de la fiabilité ? J'espère que ce n'est pas le début d'une tendance dangereuse dans le développement de l'IA 🤔

OR