OpenAI 将加速发布人工智能安全测试数据

首页

新闻

2025-12-25

WillieMiller

# openai # safety

OpenAI 将加速发布人工智能安全测试数据

OpenAI 正致力于更频繁地公布其内部人工智能模型的安全评估结果，并将此视为向更高透明度迈出的一步。

该公司于本周三推出了 "安全评估中心"（Safety Evaluations Hub），这是一个专门的网页，展示其模型在有害内容生成、越狱敏感性和幻觉倾向等测试中的表现。OpenAI表示，它将利用这个平台定期分享各项指标，并计划在每次重大模型发布时进行更新。

虽然系统卡会在发布时分享安全指标，但作为我们主动交流安全问题的努力的一部分，该中心将定期更新。https://t.co/c8NgmXlC2Y-
OpenAI (@OpenAI) May 14, 2025

"随着人工智能评估科学的发展，我们的目标是分享在开发更多可扩展方法以衡量模型能力和安全性方面取得的进展，"OpenAI 在一篇博文中解释道。"通过公开分享我们的部分安全评估结果，我们旨在让人们更容易跟踪 OpenAI 系统在一段时间内的安全性能，并支持更广泛的社区努力，以提高整个人工智能领域的透明度。"

该公司补充说，未来可能会在该中心加入更多评估类型。

最近，OpenAI 因涉嫌加速某些旗舰机型的安全测试，以及未发布其他机型的技术报告而遭到一些伦理学家的批评。首席执行官山姆-奥特曼（Sam Altman）也被指控在 2023 年 11 月被暂时免职之前，在模型安全性审查方面误导了 OpenAI 的高管。

上个月，OpenAI 不得不撤回对 ChatGPT 的默认模型 GPT-4o 的更新，因为用户反映它的回应过于认同和验证。社交媒体平台 X 上出现了大量截图，显示 ChatGPT 为各种有问题、危险的决定和想法背书。

OpenAI 表示，它将实施几项修复措施来防止类似事件的发生，包括为某些模型引入一个选择性的 "阿尔法阶段"，允许选定的 ChatGPT 用户在更广泛地推出之前进行测试并提供反馈。

TechCrunch 活动

确保您获得参加我们最重要的人工智能行业活动的门票，来自 OpenAI、Anthropic 和 Cohere 的演讲者将为您带来精彩演讲。在有限的时间内，只需 292 美元即可参加全天的专家讲座、研讨会和强大的人际网络。

确保您在 TechCrunch Sessions: AI 上的展览空间：向 1200 多位决策者展示您的创新成果，而无需大笔预算。此优惠截止到 5 月 9 日，售完即止。

加利福尼亚州伯克利 | 6 月 5 日现在注册

萨提亚·纳德拉准备利用与OpenAI的新合作关系周三，一位华尔街分析师直接询问了微软首席执行官萨蒂亚·纳德拉，修订后的OpenAI合作关系将如何影响公司的财务状况。纳德拉将这一新协议描述为对各方都有利的结果。“我们对与OpenAI的合作感到满意。我始终非常重视任何合作关系，并确保它能够实现双赢。只有这样，双方才能保持良好的合作伙伴关系。” 他强调，微软仍然可以使用OpenAI的知识产权，包括其模型和智能体产品，但不再需要为此向OpenAI支付费用。谈到在2032年之前可以免费使用OpenAI最先进的人工智能技术，纳德拉表示：“

OpenAI勾勒出以公共财富基金、机器人税和每周四天工作制为核心的人工智能经济蓝图正当各国政府竭力应对超级智能机器带来的经济影响之际，OpenAI发布了一套政策建议，概述了在“智能时代”财富与工作将如何重塑。这些构想将传统左倾机制——例如公共财富基金和扩大的社会安全网——与根本上属于资本主义、由市场驱动的经济框架相结合。OpenAI的提案本质上是一份愿望清单，这份公开声明旨在帮助民选官员、投资者和公众理解这家市值8520亿美元的公司如何看待人工智能在重塑劳动力和经济过程中带来的

格雷格·布罗克曼揭秘埃隆·马斯克如何离开OpenAI 2017年8月下旬，OpenAI（当时还是一家小型非营利研究实验室）的核心成员召开会议，商讨如何成立一家营利性实体，以实现技术的商业化，并筹集实现通用人工智能（AGI）所需的资金。埃隆·马斯克要求全面掌控公司，并刚刚向每位联合创始人赠送了一辆特斯拉Model 3。首席技术官格雷格·布罗克曼表示，他认为这是马斯克试图收买人心，当时马斯克和萨姆·阿尔特曼正就各自对公司未来愿景的支持展开角逐。 Open

相关专题推荐

文字转语音