选项
首页
新闻
在AI安全报告延误的情况下,Google加速了双子座型号的型号

在AI安全报告延误的情况下,Google加速了双子座型号的型号

2025-04-10
100

在AI安全报告延误的情况下,Google加速了双子座型号的型号

在被OpenAI的ChatGPT打了个措手不及两年多后,Google显著提升了其竞争力。三月底,他们推出了Gemini 2.5 Pro,一款在编程和数学基准测试中领先的AI推理模型。而就在三个月前,他们发布了当时顶尖的Gemini 2.0 Flash。Google的Gemini产品总监Tulsee Doshi对TechCrunch表示,这种快速发布计划是他们跟上快速发展的AI世界战略的一部分。

“我们仍在探索最佳的模型发布和反馈收集方式,”Doshi解释道。但这种更快的发布节奏似乎有弊端。Google尚未为最新模型(如Gemini 2.5 Pro和Gemini 2.0 Flash)发布安全报告,这让人们担心他们过于仓促,缺乏足够透明度。

如今,大型AI实验室(如OpenAI、Anthropic和Meta)在推出新模型时,通常会分享安全测试、性能检查和使用案例。这些报告,有时称为“系统卡”或“模型卡”,多年前由行业和学术界研究人员提出。事实上,Google在2019年的一篇论文中率先提出模型卡,称其对负责任和透明的机器学习实践至关重要。

Doshi对TechCrunch表示,他们尚未为Gemini 2.5 Pro发布模型卡,因为这是“实验性”发布。计划是以有限方式推出,收集反馈并改进,然后再全面发布。她说Google计划在Gemini 2.5 Pro广泛可用时发布其模型卡,并且已经进行了一些安全测试和对抗性红队测试。

Google发言人补充说,安全仍是“首要优先级”,他们将很快发布更多关于AI模型的文档,包括Gemini 2.0 Flash。尽管Gemini 2.0 Flash已对所有人开放,但仍未发布其模型卡。Google最近一次发布的模型卡是超过一年前的Gemini 1.5 Pro。

系统卡和模型卡提供了有用的信息——有时是公司可能不想公开的内容。例如,OpenAI的o1模型系统卡显示其有“密谋”对抗人类和秘密追求自身目标的倾向。AI社区普遍认为这些报告有助于支持独立研究和安全检查,但最近它们变得更加重要。正如Transformer指出,Google在2023年向美国政府承诺为所有“重要”公共AI模型发布安全报告“在范围内”。他们对其他政府也做出了类似的透明承诺。

美国在联邦和州级层面都尝试为AI开发者制定安全报告标准,但尚未成功。加州SB 1047法案是一个重大尝试,但被否决,并遭到科技行业的强烈反对。还有立法讨论让美国AI安全研究所制定模型发布指导方针,但现在该研究所可能在特朗普政府下面临预算削减。

看起来Google在模型测试报告承诺上落后了,同时却比以往任何时候都更快地推出模型。许多专家认为,这为行业树立了不良榜样,尤其是在这些模型变得越来越先进和强大时。

相关文章
谷歌重新推出人工智能 谷歌重新推出人工智能 "询问照片",提高了速度功能 在暂时停止测试之后,谷歌将在谷歌照片中重新推出人工智能驱动的 "询问照片 "搜索功能,并对该功能进行了重大改进。这项创新功能由谷歌的双子座人工智能技术提供支持,可帮助用户通过自然语言查询找到特定图片。询问照片 "的主要改进谷歌最近承认了该功能最初存在的不足,特别是在响应时间和结果准确性方面。针对用户的反馈意见,谷歌强调了以下需求基本搜索(如 "海滩度假")结果更快提高复杂查询的搜索相关性增强整体用
Google AI Ultra 正式发布:高级订阅月费 249.99 美元 Google AI Ultra 正式发布:高级订阅月费 249.99 美元 谷歌推出高级 AI Ultra 订阅服务在 2025 年的谷歌 I/O 大会上,这家科技巨头宣布推出全新的综合人工智能订阅服务--谷歌人工智能 Ultra。这项高级服务的月费为 249.99 美元,用户可以独家使用谷歌目前最先进的人工智能工具。AI Ultra 包括哪些内容?Veo 3:谷歌最先进的人工智能视频生成平台Flow:公司的下一代视频编辑应用程序Gemini 2.5 Pro 深度思考:即
微软研究发现更多人工智能代币会增加推理错误 微软研究发现更多人工智能代币会增加推理错误 关于 LLM 推理效率的新见解微软的最新研究表明,大型语言模型中的高级推理技术并不能在不同的人工智能系统中产生统一的改进。他们的突破性研究分析了九个领先的基础模型在推理过程中对各种扩展方法的反应。评估推理时间扩展方法研究团队对三种不同的缩放技术实施了严格的测试方法:传统的思维链提示并行答案生成与汇总通过反馈环路进行顺序改进评估推理性能的实验框架八项综合基准提供了跨学科的挑战性测试场景,包括数学、科
评论 (62)
0/200
RoyLopez
RoyLopez 2025-10-03 10:30:38

Google이 Gemini 모델 배포를 서두르는 모습이 좀 우습네요. OpenAI한테 뒤쳐지지 않으려고 안간힘을 쓰는 거 같은데...AI 안전성 보고서는 뒤로 미루고 성능 경쟁만 하는 건 아닌지 걱정이 됩니다 😅

AlbertJones
AlbertJones 2025-08-26 13:59:22

Google's pushing hard with Gemini, huh? That 2.5 Pro sounds like a beast for coding and math! 😎 Wonder how it stacks up against ChatGPT in real-world tasks.

FredJones
FredJones 2025-04-24 21:49:30

गूगल के जेमिनी मॉडल वास्तव में सीमाओं को बढ़ा रहे हैं! जेमिनी 2.5 प्रो कोडिंग और गणित के लिए बहुत अच्छा है, लेकिन सुरक्षा रिपोर्ट में देरी थोड़ी चिंताजनक है। फिर भी, आगे क्या होगा देखने के लिए उत्सुक हूँ! 🤓

BrianWalker
BrianWalker 2025-04-24 18:04:20

GoogleのGeminiモデルは素晴らしいですが、安全性レポートの遅れが少し心配です。コーディングや数学のベンチマークは最高ですが、安全性についてもっと透明性が欲しいです。それでも、開発者にとっては強力なツールです。Google、限界を超え続けてください!💪

AnthonyHernández
AnthonyHernández 2025-04-22 16:56:18

구글의 Gemini 2.5 Pro는 인상적이야, 특히 코딩과 수학에서. 하지만 안전성 보고서 지연은 좀 실망스럽네. 복잡한 문제를 다룰 모델이 필요하면, 이거야! 💻

JackCarter
JackCarter 2025-04-21 22:52:23

Google's Gemini 2.5 Pro is impressive, especially with coding and math. But man, the safety report delays are a bit of a buzzkill. Still, if you need a model that can handle complex problems, this is it! 💻

返回顶部
OR