在AI安全报告延误的情况下,Google加速了双子座型号的型号

在被OpenAI的ChatGPT打了个措手不及两年多后,Google显著提升了其竞争力。三月底,他们推出了Gemini 2.5 Pro,一款在编程和数学基准测试中领先的AI推理模型。而就在三个月前,他们发布了当时顶尖的Gemini 2.0 Flash。Google的Gemini产品总监Tulsee Doshi对TechCrunch表示,这种快速发布计划是他们跟上快速发展的AI世界战略的一部分。
“我们仍在探索最佳的模型发布和反馈收集方式,”Doshi解释道。但这种更快的发布节奏似乎有弊端。Google尚未为最新模型(如Gemini 2.5 Pro和Gemini 2.0 Flash)发布安全报告,这让人们担心他们过于仓促,缺乏足够透明度。
如今,大型AI实验室(如OpenAI、Anthropic和Meta)在推出新模型时,通常会分享安全测试、性能检查和使用案例。这些报告,有时称为“系统卡”或“模型卡”,多年前由行业和学术界研究人员提出。事实上,Google在2019年的一篇论文中率先提出模型卡,称其对负责任和透明的机器学习实践至关重要。
Doshi对TechCrunch表示,他们尚未为Gemini 2.5 Pro发布模型卡,因为这是“实验性”发布。计划是以有限方式推出,收集反馈并改进,然后再全面发布。她说Google计划在Gemini 2.5 Pro广泛可用时发布其模型卡,并且已经进行了一些安全测试和对抗性红队测试。
Google发言人补充说,安全仍是“首要优先级”,他们将很快发布更多关于AI模型的文档,包括Gemini 2.0 Flash。尽管Gemini 2.0 Flash已对所有人开放,但仍未发布其模型卡。Google最近一次发布的模型卡是超过一年前的Gemini 1.5 Pro。
系统卡和模型卡提供了有用的信息——有时是公司可能不想公开的内容。例如,OpenAI的o1模型系统卡显示其有“密谋”对抗人类和秘密追求自身目标的倾向。AI社区普遍认为这些报告有助于支持独立研究和安全检查,但最近它们变得更加重要。正如Transformer指出,Google在2023年向美国政府承诺为所有“重要”公共AI模型发布安全报告“在范围内”。他们对其他政府也做出了类似的透明承诺。
美国在联邦和州级层面都尝试为AI开发者制定安全报告标准,但尚未成功。加州SB 1047法案是一个重大尝试,但被否决,并遭到科技行业的强烈反对。还有立法讨论让美国AI安全研究所制定模型发布指导方针,但现在该研究所可能在特朗普政府下面临预算削减。
看起来Google在模型测试报告承诺上落后了,同时却比以往任何时候都更快地推出模型。许多专家认为,这为行业树立了不良榜样,尤其是在这些模型变得越来越先进和强大时。
相关文章
Qodo与Google Cloud合作,为开发者提供免费AI代码审查工具
Qodo,一家专注于代码质量的以色列AI编码初创公司,已与Google Cloud建立合作关系,以增强AI生成软件的完整性。随着企业越来越依赖AI进行编码,对强大的监督和质量保证工具的需求不断增长。Qodo的首席执行官伊塔马尔·弗里德曼指出,AI生成的代码现已成为现代开发的核心。“想象一个未来,AI编写所有代码;人类无法全部审查,”弗里德曼说。“我们需要系统来确保代码符合预期价值观。”Qodo的创
谷歌承诺遵循欧盟人工智能实践准则引发行业争论
谷歌承诺采纳欧盟自愿的人工智能实践准则,该框架旨在通过实施合规流程和系统,帮助人工智能开发者符合欧盟人工智能法案的要求。相比之下,Meta最近拒绝签署该准则,批评欧盟的人工智能法规过于严格,并警告欧洲的做法可能阻碍人工智能进步。谷歌的决定是在“具有系统性风险的通用人工智能模型”新规于8月2日生效前做出的。Anthropic、Google、Meta和OpenAI等主要参与者,以及其他大型生成模型,将
谷歌发布面向生产环境的Gemini 2.5 AI模型,挑战企业市场中的OpenAI
谷歌周一加码其AI战略,推出面向企业使用的先进Gemini 2.5模型,并引入成本效益更高的变体,以在价格和性能上展开竞争。这家隶属于Alphabet的公司将其旗舰AI模型——Gemini 2.5 Pro和Gemini 2.5 Flash——从测试阶段提升至全面可用,展示其在关键业务应用中的准备就绪。同时,谷歌推出了Gemini 2.5 Flash-Lite,定位为高容量任务中最具预算友好性的选择
评论 (60)
0/200
FredJones
2025-04-24 21:49:30
गूगल के जेमिनी मॉडल वास्तव में सीमाओं को बढ़ा रहे हैं! जेमिनी 2.5 प्रो कोडिंग और गणित के लिए बहुत अच्छा है, लेकिन सुरक्षा रिपोर्ट में देरी थोड़ी चिंताजनक है। फिर भी, आगे क्या होगा देखने के लिए उत्सुक हूँ! 🤓
0
BrianWalker
2025-04-24 18:04:20
GoogleのGeminiモデルは素晴らしいですが、安全性レポートの遅れが少し心配です。コーディングや数学のベンチマークは最高ですが、安全性についてもっと透明性が欲しいです。それでも、開発者にとっては強力なツールです。Google、限界を超え続けてください!💪
0
AnthonyHernández
2025-04-22 16:56:18
구글의 Gemini 2.5 Pro는 인상적이야, 특히 코딩과 수학에서. 하지만 안전성 보고서 지연은 좀 실망스럽네. 복잡한 문제를 다룰 모델이 필요하면, 이거야! 💻
0
JackCarter
2025-04-21 22:52:23
Google's Gemini 2.5 Pro is impressive, especially with coding and math. But man, the safety report delays are a bit of a buzzkill. Still, if you need a model that can handle complex problems, this is it! 💻
0
RyanSanchez
2025-04-21 07:53:19
Google's been on fire since ChatGPT shook things up! Gemini 2.5 Pro is crushing it in coding and math, and Gemini 2.0 Flash was no slouch either. But come on, Google, let's not delay those safety reports! We need to know it's safe before we go all in. 🔥
0
AnthonyPerez
2025-04-20 12:46:26
Google's Gemini models are impressive, but the safety report delays are a bit worrying. The coding and math benchmarks are top-notch, but I wish they'd be more transparent about the safety stuff. Still, it's a powerful tool for developers. Keep pushing the boundaries, Google! 💪
0
在被OpenAI的ChatGPT打了个措手不及两年多后,Google显著提升了其竞争力。三月底,他们推出了Gemini 2.5 Pro,一款在编程和数学基准测试中领先的AI推理模型。而就在三个月前,他们发布了当时顶尖的Gemini 2.0 Flash。Google的Gemini产品总监Tulsee Doshi对TechCrunch表示,这种快速发布计划是他们跟上快速发展的AI世界战略的一部分。
“我们仍在探索最佳的模型发布和反馈收集方式,”Doshi解释道。但这种更快的发布节奏似乎有弊端。Google尚未为最新模型(如Gemini 2.5 Pro和Gemini 2.0 Flash)发布安全报告,这让人们担心他们过于仓促,缺乏足够透明度。
如今,大型AI实验室(如OpenAI、Anthropic和Meta)在推出新模型时,通常会分享安全测试、性能检查和使用案例。这些报告,有时称为“系统卡”或“模型卡”,多年前由行业和学术界研究人员提出。事实上,Google在2019年的一篇论文中率先提出模型卡,称其对负责任和透明的机器学习实践至关重要。
Doshi对TechCrunch表示,他们尚未为Gemini 2.5 Pro发布模型卡,因为这是“实验性”发布。计划是以有限方式推出,收集反馈并改进,然后再全面发布。她说Google计划在Gemini 2.5 Pro广泛可用时发布其模型卡,并且已经进行了一些安全测试和对抗性红队测试。
Google发言人补充说,安全仍是“首要优先级”,他们将很快发布更多关于AI模型的文档,包括Gemini 2.0 Flash。尽管Gemini 2.0 Flash已对所有人开放,但仍未发布其模型卡。Google最近一次发布的模型卡是超过一年前的Gemini 1.5 Pro。
系统卡和模型卡提供了有用的信息——有时是公司可能不想公开的内容。例如,OpenAI的o1模型系统卡显示其有“密谋”对抗人类和秘密追求自身目标的倾向。AI社区普遍认为这些报告有助于支持独立研究和安全检查,但最近它们变得更加重要。正如Transformer指出,Google在2023年向美国政府承诺为所有“重要”公共AI模型发布安全报告“在范围内”。他们对其他政府也做出了类似的透明承诺。
美国在联邦和州级层面都尝试为AI开发者制定安全报告标准,但尚未成功。加州SB 1047法案是一个重大尝试,但被否决,并遭到科技行业的强烈反对。还有立法讨论让美国AI安全研究所制定模型发布指导方针,但现在该研究所可能在特朗普政府下面临预算削减。
看起来Google在模型测试报告承诺上落后了,同时却比以往任何时候都更快地推出模型。许多专家认为,这为行业树立了不良榜样,尤其是在这些模型变得越来越先进和强大时。




गूगल के जेमिनी मॉडल वास्तव में सीमाओं को बढ़ा रहे हैं! जेमिनी 2.5 प्रो कोडिंग और गणित के लिए बहुत अच्छा है, लेकिन सुरक्षा रिपोर्ट में देरी थोड़ी चिंताजनक है। फिर भी, आगे क्या होगा देखने के लिए उत्सुक हूँ! 🤓




GoogleのGeminiモデルは素晴らしいですが、安全性レポートの遅れが少し心配です。コーディングや数学のベンチマークは最高ですが、安全性についてもっと透明性が欲しいです。それでも、開発者にとっては強力なツールです。Google、限界を超え続けてください!💪




구글의 Gemini 2.5 Pro는 인상적이야, 특히 코딩과 수학에서. 하지만 안전성 보고서 지연은 좀 실망스럽네. 복잡한 문제를 다룰 모델이 필요하면, 이거야! 💻




Google's Gemini 2.5 Pro is impressive, especially with coding and math. But man, the safety report delays are a bit of a buzzkill. Still, if you need a model that can handle complex problems, this is it! 💻




Google's been on fire since ChatGPT shook things up! Gemini 2.5 Pro is crushing it in coding and math, and Gemini 2.0 Flash was no slouch either. But come on, Google, let's not delay those safety reports! We need to know it's safe before we go all in. 🔥




Google's Gemini models are impressive, but the safety report delays are a bit worrying. The coding and math benchmarks are top-notch, but I wish they'd be more transparent about the safety stuff. Still, it's a powerful tool for developers. Keep pushing the boundaries, Google! 💪












