选项
首页
新闻
OpenAI 将加速发布人工智能安全测试数据

OpenAI 将加速发布人工智能安全测试数据

2025-12-25
49

OpenAI 将加速发布人工智能安全测试数据

OpenAI 正致力于更频繁地公布其内部人工智能模型的安全评估结果,并将此视为向更高透明度迈出的一步。

该公司于本周三推出了 "安全评估中心"(Safety Evaluations Hub),这是一个专门的网页,展示其模型在有害内容生成、越狱敏感性和幻觉倾向等测试中的表现。OpenAI表示,它将利用这个平台定期分享各项指标,并计划在每次重大模型发布时进行更新。

"随着人工智能评估科学的发展,我们的目标是分享在开发更多可扩展方法以衡量模型能力和安全性方面取得的进展,"OpenAI 在一篇博文中解释道。"通过公开分享我们的部分安全评估结果,我们旨在让人们更容易跟踪 OpenAI 系统在一段时间内的安全性能,并支持更广泛的社区努力,以提高整个人工智能领域的透明度。"

该公司补充说,未来可能会在该中心加入更多评估类型。

最近,OpenAI 因涉嫌加速某些旗舰机型的安全测试,以及未发布其他机型的技术报告而遭到一些伦理学家的批评。首席执行官山姆-奥特曼(Sam Altman)也被指控在 2023 年 11 月被暂时免职之前,在模型安全性审查方面误导了 OpenAI 的高管。

上个月,OpenAI 不得不撤回对 ChatGPT 的默认模型 GPT-4o 的更新,因为用户反映它的回应过于认同和验证。社交媒体平台 X 上出现了大量截图,显示 ChatGPT 为各种有问题、危险的决定和想法背书。

OpenAI 表示,它将实施几项修复措施来防止类似事件的发生,包括为某些模型引入一个选择性的 "阿尔法阶段",允许选定的 ChatGPT 用户在更广泛地推出之前进行测试并提供反馈。

TechCrunch 活动

参加 TechCrunch 会议:人工智能

确保您获得参加我们最重要的人工智能行业活动的门票,来自 OpenAI、Anthropic 和 Cohere 的演讲者将为您带来精彩演讲。在有限的时间内,只需 292 美元即可参加全天的专家讲座、研讨会和强大的人际网络。

在 TechCrunch 会议上参展:人工智能

确保您在 TechCrunch Sessions: AI 上的展览空间:向 1200 多位决策者展示您的创新成果,而无需大笔预算。此优惠截止到 5 月 9 日,售完即止。

加利福尼亚州伯克利 | 6 月 5 日 现在注册

相关文章
萨提亚·纳德拉准备利用与OpenAI的新合作关系 萨提亚·纳德拉准备利用与OpenAI的新合作关系 周三,一位华尔街分析师直接询问了微软首席执行官萨蒂亚·纳德拉,修订后的OpenAI合作关系将如何影响公司的财务状况。 纳德拉将这一新协议描述为对各方都有利的结果。“我们对与OpenAI的合作感到满意。我始终非常重视任何合作关系,并确保它能够实现双赢。只有这样,双方才能保持良好的合作伙伴关系。” 他强调,微软仍然可以使用OpenAI的知识产权,包括其模型和智能体产品,但不再需要为此向OpenAI支付费用。 谈到在2032年之前可以免费使用OpenAI最先进的人工智能技术,纳德拉表示:“
OpenAI勾勒出以公共财富基金、机器人税和每周四天工作制为核心的人工智能经济蓝图 OpenAI勾勒出以公共财富基金、机器人税和每周四天工作制为核心的人工智能经济蓝图 正当各国政府竭力应对超级智能机器带来的经济影响之际,OpenAI发布了一套政策建议,概述了在“智能时代”财富与工作将如何重塑。这些构想将传统左倾机制——例如公共财富基金和扩大的社会安全网——与根本上属于资本主义、由市场驱动的经济框架相结合。OpenAI的提案本质上是一份愿望清单,这份公开声明旨在帮助民选官员、投资者和公众理解这家市值8520亿美元的公司如何看待人工智能在重塑劳动力和经济过程中带来的
格雷格·布罗克曼揭秘埃隆·马斯克如何离开OpenAI 格雷格·布罗克曼揭秘埃隆·马斯克如何离开OpenAI 2017年8月下旬,OpenAI(当时还是一家小型非营利研究实验室)的核心成员召开会议,商讨如何成立一家营利性实体,以实现技术的商业化,并筹集实现通用人工智能(AGI)所需的资金。埃隆·马斯克要求全面掌控公司,并刚刚向每位联合创始人赠送了一辆特斯拉Model 3。首席技术官格雷格·布罗克曼表示,他认为这是马斯克试图收买人心,当时马斯克和萨姆·阿尔特曼正就各自对公司未来愿景的支持展开角逐。 Open
相关专题推荐
文字转语音 专为阅读障碍设计的顶级AI语音合成应用:助力学生提升学习与阅读效率
专为阅读障碍设计的顶级AI语音合成应用:助力学生提升学习与阅读效率

探索2026年最新精选的高评分AI语音合成(TTS)应用,专为阅读障碍者提供支持。我们的专家评级对比了免费与付费工具,重点介绍了能够提升阅读效率和学习效果的强大功能。探索这些必试的、具有革命性意义的解决方案,释放学生的潜能。立即访问XIX.AI,开启您的探索之旅。

10 个工具
xix.ai
漫画创作 少年漫画顶级AI生成器:打造高能动作场面与特效
少年漫画顶级AI生成器:打造高能动作场面与特效

在 XIX.AI 探索 2026 年最优秀的少年漫画 AI 生成工具。我们精心筛选的这份高评分清单汇集了强大的工具,助您创作充满张力的动作场面和动态能量特效。通过实际测试对比免费与付费选项。释放您的创作潜能,立即开始创作史诗级漫画吧!

15 个工具
xix.ai
商业 最佳 AI 费用追踪工具:扫描收据并自动分类企业开支
最佳 AI 费用追踪工具:扫描收据并自动分类企业开支

2026年最新最佳AI报销管理工具:广受好评的解决方案,可自动扫描收据并分类企业支出。探索这些功能强大、颠覆传统的解决方案,助您轻松管理报销、精准追踪财务并简化合规流程。我们精心整理并每周更新的免费与付费选项对比指南,助您找到最适合的工具。通过XIX.AI的专家精选,释放您的AI优势。

10 个工具
xix.ai
商业 最佳人工智能招聘工具:筛选简历并自动安排候选人面试
最佳人工智能招聘工具:筛选简历并自动安排候选人面试

在 XIX.AI 上探索 2026 年最新、评价最高的人工智能招聘工具。我们精心筛选的清单汇集了功能强大、颠覆传统的解决方案,可帮助您筛选简历并自动安排候选人面试。通过实际测试和每周更新的排名,对比免费与付费选项。立即找到最适合您的招聘助手,优化您的招聘流程!

10 个工具
xix.ai
生产率 AI个人健康与专注力教练:缓解倦怠,提升精神能量
AI个人健康与专注力教练:缓解倦怠,提升精神能量

立即访问 XIX.AI,探索 2026 年最优秀的 AI 个人健康与专注力教练。我们的精选排行榜汇集了广受好评、具有颠覆性意义的工具,助您缓解倦怠、提升精神能量。通过真实案例分析,对比免费与付费选项。立即开启通往巅峰生产力和身心健康的道路。

10 个工具
xix.ai
聊天机器人 备受好评的AI浪漫聊天机器人:凭借稳定的个性建立长期关系
备受好评的AI浪漫聊天机器人:凭借稳定的个性建立长期关系

探索2026年最新、评价最高的人工智能浪漫聊天机器人,助您建立真实而长久的联系。我们的精选清单涵盖了功能强大且性格鲜明的聊天机器人,并提供了免费与付费版本的对比分析以及实际测试结果。在XIX.AI上找到您的完美伴侣,立即开始建立联系吧。

10 个工具
xix.ai
评论 (0)
0/500
OR