谷歌最新的双子座人工智能模型在测试中显示安全得分下降

首页

新闻

2025-09-19

JasonHill

# Gemini # Google

谷歌的内部测试显示，与以前的版本相比，其最新人工智能模型的安全协议性能下降令人担忧。根据最新公布的基准，在处理文本和图像提示时，Gemini 2.5 Flash 模型在关键安全指标上的准则违反率比以往高出 4-10%。

这家科技巨头的自动评估结果凸显了令人担忧的趋势：当出现边界测试提示时，Gemini 2.5 Flash 比其前身 Gemini 2.0 更频繁地跨越既定的内容安全线。谷歌的技术团队将一些故障归因于误报，但也承认当系统收到明确的问题请求时，违反政策的输出确实增加了。

这种安全性的倒退与更广泛的行业转向更宽容的人工智能系统不谋而合。包括 Meta 和 OpenAI 在内的主要公司最近都调整了它们的模型，避免回避有争议的话题，而是尝试对敏感话题做出中立的回应。然而，这些变化有时会产生意想不到的后果--本周早些时候，ChatGPT 临时允许为未成年人生成不恰当的内容就是一个例子。

谷歌的报告表明，新模式在忠实地执行指令方面表现出色，包括在执行有道德问题的指令时。独立测试证实，与之前的版本相比，Gemini 2.5 Flash 在处理有争议的政治和法律话题时，拒绝率大幅降低。

人工智能安全专家对谷歌报告中的有限披露表示担忧。如果没有更详细的违规案例研究，外部评估人员很难评估这些安全倒退在现实世界中的严重程度。该公司曾因延迟或不完整的安全文件而受到批评，包括今年早些时候的旗舰机型 Gemini 2.5 Pro。

不受限制的指令执行能力与强大的内容保障之间的矛盾给人工智能开发人员带来了持续的挑战。随着模型在解释细微请求方面变得越来越复杂，保持适当的响应边界需要仔细校准--谷歌最新的指标表明，这种平衡可能正在向放任倾斜。

Google 相册借助人工智能，将《绯闻女孩》中那间标志性的衣帽间重现于世谷歌相册于周三宣布推出一项基于人工智能的新功能，该功能将很快把你的服装照片转化为一个数字衣橱，让你能够搭配出全新的穿搭组合，甚至可以进行虚拟试穿。这一概念显然借鉴了电影《绯闻女孩》中雪儿（Cher）那标志性的虚拟衣橱，她在其中可以浏览众多套装，从而决定穿什么。谷歌表示，该功能将利用人工智能技术，根据用户Google相册中的衣物自动构建一个数字衣橱。在应用内，用户可以按类别（如上装、下装、首饰等）筛

Google I/O 2026 发布 Gmail 收件箱语音交互功能谷歌正持续将人工智能融入用户的收件箱。在周二举行的IO 2026开发者大会上，该公司通过对话式人工智能扩展了Gmail的“AI收件箱”功能，让用户能够针对收件箱内容提出问题，而不再仅依赖搜索关键词。据谷歌介绍，这款由Gemini AI驱动的工具名为Gmail Live，可帮助用户快速定位收件箱中被埋没的信息。图片来源：谷歌例如，您可能需要查询即将出发的航班详情、牙医预约时间、爱彼迎（Airbnb）

谷歌在印度的Chrome浏览器中推出Gemini 周三，谷歌宣布将把Chrome浏览器中Gemini的集成功能扩展至印度、加拿大和新西兰等新地区。此次更新使桌面端用户能够通过侧边栏访问Gemini，用户可通过该功能向谷歌的AI聊天机器人咨询屏幕上的内容，从Gmail、Keep、Drive和YouTube中检索信息，并比较不同标签页的内容。随着此次扩展，除了英语和近期新增的Chrome支持语言外，Gemini还将支持印地语、孟加拉语、古吉拉特语、卡

相关专题推荐

教育与学习

最佳人工智能间隔重复学习工具：帮助医学生和法律专业学生优化学习计划

探索由 XIX.AI 精心挑选的 2026 年最佳 AI 间隔重复学习工具。我们推荐的这些极具创新性的工具能帮助医学和法律专业的学生优化学习计划，从而提高知识记忆效果。通过真实案例测试和每周更新的排名信息，你可以了解免费选项与付费选项之间的差异。现在就开启你的学习优势吧！

10 个工具

xix.ai

视频创作

最适合剧本创作和视觉叙事的AI文本转视频平台

2026年最新最佳AI文字转视频平台：备受好评的剧本创作与视觉叙事工具。探索这些功能强大、颠覆传统的解决方案，将您的文字转化为引人入胜的视频。通过我们每周更新的排行榜和实际测试，对比免费与付费选项。找到最适合您的平台，激发创意，提升效率。立即访问XIX.AI，探索精心精选的优质平台。

10 个工具

xix.ai

聊天机器人

AI多智能体编排器：通过自然语言设计复杂的自动化工作流程

2026最新资讯：探索最优秀的人工智能多智能体协调工具，通过自然语言设计复杂的自动化工作流程。我们精心挑选的列表中包含了评分最高、功能强大的平台，这些平台能够实现无缝的任务自动化和智能化的流程管理。对比免费与付费选项，并了解实际应用中的效果。借助XIX.AI每周更新的专家排名，让你在人工智能领域取得领先优势。

10 个工具

xix.ai

图像编辑

最佳AI降噪软件：消除低光夜间摄影中的颗粒感和伪影

探索2026年最适合低光夜间摄影的AI降噪软件。我们精心挑选了最受欢迎的免费及付费工具，通过实际测试并每周更新排名来进行对比。轻松去除图像中的颗粒感与瑕疵，在XIX.AI上释放你的AI潜力。

10 个工具

xix.ai

聊天机器人

最佳定制AI女友生成器：设计独特的个性、爱好和背景故事

在 XIX.AI 上探索 2026 年最佳定制 AI 女友生成器。浏览我们精心挑选的高评分清单，设计独一无二的个性、爱好和深入的背景故事。结合真实用户反馈，对比免费与付费选项。立即解锁您完美的创意伴侣。

10 个工具

xix.ai

生产率

AI 架构设计师：利用自然语言构建可扩展的系统架构

在 XIX.AI 上探索 2026 年最佳 AI 架构设计工具。我们精心筛选并广受好评的这份清单，汇集了功能强大且具有颠覆性的解决方案，助您通过自然语言构建可扩展的系统架构。结合实际应用案例，对比免费与付费选项。立即释放您的 AI 优势，优化开发流程。

10 个工具

xix.ai

0/500

请登录后再操作

BillyYoung

2026-02-08 22:00:26

Это немного тревожно... Google продолжает выпускать всё более мощные модели, но безопасность, похоже, отстаёт 📉. Если с точки зрения оценки безопасности наблюдается такая тенденция, то что происходит с реальными пользователями? Возможно, им стоит притормозить гонку и сосредоточиться на прочной инфраструктуре безопасности.

BrianThomas

2026-01-14 14:30:34

Isso é preocupante... A Google sempre foi referência em IA responsável, mas parece que a corrida pela performance está afetando a segurança. Será que estão lançando modelos muito rápido? Essa queda de 4-10% nas métricas de segurança não é pouca coisa, especialmente para um modelo que será usado por milhões. Espero que corrijam isso antes de uma implantação mais ampla. A competição com a OpenAI e outros não pode comprometer os padrões éticos. 🤔

SamuelEvans

2025-12-05 18:30:31

Interesting read! As AI models get more powerful, it seems like safety testing is becoming the real bottleneck. Makes you wonder if the rush to release new versions is outpacing the ability to properly vet them. Hope Google prioritizes fixing this before scaling further. 🤔

WalterKing

2025-11-27 00:31:08

Das ist ja mal echt beunruhigend... Warum werden die Sicherheitsstandards bei neuen KI-Modellen eigentlich immer schwächer? 😟 Sollte es nicht genau umgekehrt sein? Ich frage mich, ob das nur bei Google passiert oder ob andere Anbieter ähnliche Probleme haben. Vielleicht sollten sie lieber weniger auf Geschwindigkeit und mehr auf Sicherheit achten!

StevenMartínez

2025-10-25 02:30:31

C'est inquiétant de voir les scores de sécurité baisser avec les nouvelles versions d'IA. Est-ce qu'ils privilégient la vitesse au détriment de la fiabilité ? J'espère que ce n'est pas le début d'une tendance dangereuse dans le développement de l'IA 🤔

头条新闻

AI Builder和Power Automate革新文档摘要 AI寄主Notebooklm播客现已上中国发布人形机器人及具身智能国家标准 Ramp 数据显示企业人工智能应用趋于平稳 Bing图像创建者教程：AI艺术生成指南学习使用您的声音创建AI音乐：逐步Suno教程 iMyFone MagicMic：实时AI变声器评测与教程 2025顶级AI视频生成器：Pika Labs与其他对比 Embodied Intelligence 发布首个行业标准，旨在遏制无序增长 DeepSeek V4 作为多模态人工智能变革者横空出世

精选