OpenAI 加强 ChatGPT 安全防护,防范提示符注入攻击
OpenAI 为 ChatGPT 推出了两项新的高级安全功能,以应对日益严峻的提示注入攻击威胁。此类攻击通常发生在 AI 系统与网站及外部应用程序交互时,可能使恶意攻击者操纵 AI 执行有害操作或泄露机密数据。这两项新功能均强化了平台的现有防御机制,包括沙箱环境、URL 数据泄露防护以及其他多层安全协议。

第一项功能是“锁定模式”(Lockdown Mode),这是一种可选的高级设置,专为有严格安全要求(而非普通用户)的用户设计。它通过严格控制 ChatGPT 与外部系统的通信方式,显著降低了数据泄露的风险。该模式会主动禁用或限制可能成为攻击载体的工具。例如,网页浏览功能将仅访问缓存内容,而缺乏强有力安全保障的功能将被完全关闭。
目前,该模式适用于 ChatGPT 企业版、教育版、医疗版和教师版。管理员可通过在仪表板设置中创建特定角色来启用该模式,同时还能在锁定模式激活期间精确定义允许使用的外部应用程序和操作。OpenAI 计划在未来数月内向普通用户开放此模式。此外,“合规 API 日志平台”可协助管理员对应用程序使用情况及数据共享实践进行合规审计。
第二项措施是在 ChatGPT、ChatGPT Atlas 和 Codex 中,对高风险功能统一标注 **“高风险”** 标签,从而规范向用户传达潜在威胁的方式。
OpenAI 解释称,某些联网功能虽能提升 AI 的实用性,但仍存在当前行业防护措施无法完全规避的风险。该标签能清晰揭示这些风险,使用户能够就是否使用相关功能做出明智决策,特别是在涉及敏感信息的情况下。例如,当开发者为 Codex 启用互联网访问时,该标签将显示在界面上,详细说明其带来的变化、潜在危险、适用的使用场景以及降低风险的建议。
相关文章
ChatGPT成人模式再次推迟;奥特曼:优先考虑智能
OpenAI再次推迟推出备受争议的功能,转而专注于个性化和主动交互“不适当内容”是否应成为高效AI工具的一部分,这一问题在科技界早已引发热议。 OpenAI曾承诺让ChatGPT更好地理解成年用户,但再次令期待这一变革的人们失望。据IT之家报道,该公司近日确认,原定于2026年第一季度推出的所谓“成人模式”已再次推迟。这并非萨姆·阿尔特曼(Sam Altman)首次食言。早在2025年底,他就曾宣
百度健康近期内部测试了AI医生助手“DoctorClaw”,用于学术文献检索和日常办公辅助
据报道,百度健康已开始对一款专为医生设计的专业AI智能助手进行内部测试。该产品内部代号为“DoctorClaw”(龙虾医生版),标志着百度在医疗领域部署大型语言模型方面迈出了重要一步。知情人士透露,该项目仍处于封闭开发阶段,目前已进入内部测试。虽然具体的产品形态尚未完全披露,但已接近上线。 在功能方面,DoctorClaw初期将侧重于学术文献检索和常规诊疗辅助。但其长期战略旨在深度融入临床诊断、医
Cursor Composer 2 与 Claude Opus 4.6:基准测试引发新一轮人工智能编程争论
3月19日,Cursor正式发布了其自主研发的编程模型Composer 2。 这一消息在开发者社区中立即引发热议——据 Cursor 称,Composer 2 在 Terminal-Bench 2.0 测试中获得了 61.7% 的得分,在相同的测试条件下,这一成绩显著超过了 Claude Opus 4.6 的 58.0%。Anthropic的旗舰模型竟被自家IDE内置的模型超越?随着消息传开,相关
相关专题推荐
评论 (0)
0/500
OpenAI 为 ChatGPT 推出了两项新的高级安全功能,以应对日益严峻的提示注入攻击威胁。此类攻击通常发生在 AI 系统与网站及外部应用程序交互时,可能使恶意攻击者操纵 AI 执行有害操作或泄露机密数据。这两项新功能均强化了平台的现有防御机制,包括沙箱环境、URL 数据泄露防护以及其他多层安全协议。

第一项功能是“锁定模式”(Lockdown Mode),这是一种可选的高级设置,专为有严格安全要求(而非普通用户)的用户设计。它通过严格控制 ChatGPT 与外部系统的通信方式,显著降低了数据泄露的风险。该模式会主动禁用或限制可能成为攻击载体的工具。例如,网页浏览功能将仅访问缓存内容,而缺乏强有力安全保障的功能将被完全关闭。
目前,该模式适用于 ChatGPT 企业版、教育版、医疗版和教师版。管理员可通过在仪表板设置中创建特定角色来启用该模式,同时还能在锁定模式激活期间精确定义允许使用的外部应用程序和操作。OpenAI 计划在未来数月内向普通用户开放此模式。此外,“合规 API 日志平台”可协助管理员对应用程序使用情况及数据共享实践进行合规审计。
第二项措施是在 ChatGPT、ChatGPT Atlas 和 Codex 中,对高风险功能统一标注 **“高风险”** 标签,从而规范向用户传达潜在威胁的方式。
OpenAI 解释称,某些联网功能虽能提升 AI 的实用性,但仍存在当前行业防护措施无法完全规避的风险。该标签能清晰揭示这些风险,使用户能够就是否使用相关功能做出明智决策,特别是在涉及敏感信息的情况下。例如,当开发者为 Codex 启用互联网访问时,该标签将显示在界面上,详细说明其带来的变化、潜在危险、适用的使用场景以及降低风险的建议。
ChatGPT成人模式再次推迟;奥特曼:优先考虑智能
OpenAI再次推迟推出备受争议的功能,转而专注于个性化和主动交互“不适当内容”是否应成为高效AI工具的一部分,这一问题在科技界早已引发热议。 OpenAI曾承诺让ChatGPT更好地理解成年用户,但再次令期待这一变革的人们失望。据IT之家报道,该公司近日确认,原定于2026年第一季度推出的所谓“成人模式”已再次推迟。这并非萨姆·阿尔特曼(Sam Altman)首次食言。早在2025年底,他就曾宣
百度健康近期内部测试了AI医生助手“DoctorClaw”,用于学术文献检索和日常办公辅助
据报道,百度健康已开始对一款专为医生设计的专业AI智能助手进行内部测试。该产品内部代号为“DoctorClaw”(龙虾医生版),标志着百度在医疗领域部署大型语言模型方面迈出了重要一步。知情人士透露,该项目仍处于封闭开发阶段,目前已进入内部测试。虽然具体的产品形态尚未完全披露,但已接近上线。 在功能方面,DoctorClaw初期将侧重于学术文献检索和常规诊疗辅助。但其长期战略旨在深度融入临床诊断、医
Cursor Composer 2 与 Claude Opus 4.6:基准测试引发新一轮人工智能编程争论
3月19日,Cursor正式发布了其自主研发的编程模型Composer 2。 这一消息在开发者社区中立即引发热议——据 Cursor 称,Composer 2 在 Terminal-Bench 2.0 测试中获得了 61.7% 的得分,在相同的测试条件下,这一成绩显著超过了 Claude Opus 4.6 的 58.0%。Anthropic的旗舰模型竟被自家IDE内置的模型超越?随着消息传开,相关





首页






