选项
首页
新闻
2024年:AI的增长和创新年份

2024年:AI的增长和创新年份

2025-04-10
79

2024年:AI的增长和创新年份

随着我们进入2025年,反思我们在2024年取得的令人难以置信的步伐,这是令人兴奋的。从为代理时代量身定制的Gemini 2.0型号到赋予创意表达的能力,从设计新颖的蛋白质粘合剂到启用AI-a-ables a-ables a-ables a-ables神经科学和量子计算,我们一直在推动艺术智慧和大胆的艺术智慧的边界。所有这些努力旨在利用AI来实现更大的人类利益。

正如我们在论文中提到的 *为什么我们两年前专注于AI *的原因,我们的AI开发方法源于我们的创始使命,以组织世界信息并使其普遍访问和有用。这项任务推动了我们致力于改善尽可能多的人的生活,这是我们北极星的目标。

在我们2024年的评论中,我们庆祝了Google众多才华横溢的团队的非凡成就,他们不懈地努力促进我们的任务。他们的努力为未来一年更加激动人心的发展奠定了基础。

模型,产品和技术的无情创新

2024年是关于实验,快速部署,并将我们的最新技术交到开发人员手中。 12月,我们推出了GEMINI 2.0实验系列的第一个模型,该系列专门为代理时代设计。我们用Gemini 2.0 Flash(我们的多功能主力)开始了事情,然后是我们的代理研究的尖端原型。其中包括一个更新的Astra项目,探索了通用AI助手的潜力; Project Mariner,一个早期的原型,能够在Chrome中执行动作作为实验扩展;和AI驱动的代码代理Jules。我们渴望将Gemini 2.0的功能集成到我们的旗舰产品中,并且我们已经开始在搜索中的AI概述中进行测试,该搜索中有超过十亿人使用,以探索新类型的问题。

我们还推出了深入的研究,这是Gemini Advanced中的一项新代理功能,通过创建和执行多步计划来回答复杂问题,从而节省了数小时的研究。此外,我们引入了Gemini 2.0 Flash Thinking实验,该模型透明地显示了其思维过程。

在今年早些时候,我们通过将双子座的能力集成到更多的Google产品中,并推出Gemini 1.5 Pro和Gemini 1.5 Flash,取得了长足的进步。由于其紧凑的尺寸和成本效益,后者针对速度和效率进行了优化,成为了开发人员中最受欢迎的模型。

我们还增强了AI Studio,使其可作为可在桌面,iOS和Android上安装的渐进式Web应用程序(PWA)提供,为开发人员提供了一组强大的资源。公众对笔记本电脑中新功能的反应,例如音频概述,非常棒。这些功能可以从上载的原始材料中引起深入的潜水讨论,从而使学习更具吸引力。

语音输入和输出继续在Gemini Live,Project Astra,Journey Voices和YouTube的自动配音等产品中进行完善。

根据我们为开放社区做出贡献的传统,我们从Gemma发行了两种新模型,Gemma是我们最先进的开放模型,建立在与Gemini相同的研究和技术的基础上。在问题回答,推理和编码等领域,Gemma的模型胜过类似大小的模型。我们还发布了Gemma Scope,该工具可帮助研究人员了解Gemma 2的内部工作。

我们在改善模型的事实和减少幻觉方面取得了长足的进步。 12月,我们发布了事实基础,这是与Google Deepmind,Google Research和Kaggle合作开发的基准,以评估大型语言模型在提供的源材料中的响应并避免幻觉。

事实接地数据集(具有1,719个示例)旨在测试以上下文文档为基础的长格式响应。 我们使用事实接地测试了领先的LLM,我们很自豪地报告说,Gemini 2.0 Flash实验,Gemini 1.5 Flash和Gemini 1.5 Pro获得了前三名的事实分数,Gemini-2.0-Flash-Exp得分令人印象深刻,令人印象深刻的83.6%。

我们还通过创新技术(例如块平行解码,基于置信的递延和投机解码)提高了ML效率,从而加快了LLM的推理时间。这些改进有益于Google产品并设定行业标准。

在运动中,我们推出了Tacticai,这是一种用于足球战术的AI系统,可提供战术见解,尤其是在角球上。

我们对研究领导力的承诺仍然很强。 2010-2023 WIPO关于生成AI引用的调查显示,包括Google Research和Google DeepMind在内的Google获得了第二名引用机构的引用的两倍以上。

该WIPO图基于2024年1月的镜头数据,强调了Alphabet在过去十年中对生成AI研究的重要贡献。 最后,我们与Project Starline(我们的“魔术”窗口”技术取得了进步,与HP合作,将其集成到Google Meet and Zoom等视频会议服务中。

通过生成的AI增强创造力

我们认为AI可以解锁创造力的新领域,使创造力更容易获得,并帮助人们实现自己的艺术愿景。 2024年,我们介绍了生成媒体工具的一系列更新,涵盖了图像,音乐和视频。

在今年年初,我们启动了ImageFX和MusicFX,生成的AI工具,这些工具可以从文本提示中创建图像和最高70秒的音频剪辑。在I/O时,我们预览了MusicFX DJ,旨在使现场音乐创作更容易访问。 10月,我们与雅各布·科利尔(Jacob Collier)合作,简化了新的和有抱负的音乐家的音乐FX DJ。我们还更新了音乐AI工具包,音乐AI沙箱,并进化了我们的梦想轨道实验,使我们的创作者可以使用文本对音乐模型在各种流派中生成乐器配乐。

今年晚些时候,我们发布了最新的图像和录像带Imagen 2和Imagen 3。 Imagen 3是我们最高质量的文本到图像模型,生成具有较高细节,照明和较少人工制品的图像。 VEO 2对现实世界的物理和人类运动有了更好的了解,从而增强了现实主义。 VEO 2标志着高质量视频生成的重大进步。

我们继续探索AI在编辑中的潜力,利用它来控制透明度和对象粗糙度等属性。

这些示例展示了AI使用合成数据生成编辑材料属性的能力。

在Audio Generation中,我们改进了视频到ADIO(V2A)技术,从基于屏幕上的动作中产生了文本提示中的动态音景,可以将其与VEO的AI生成的视频配对。

游戏为创意探索和训练体现的代理商提供了理想的操场。 2024年,我们介绍了Genie 2,这是一个基础世界模型,生成了可玩的3D环境,用于训练和评估体现的代理。这是在SIMA的发布之后,该启动可以遵循各种视频游戏设置中的自然语言说明。

智能体系结构:机器人技术,硬件和计算的进步

随着我们的多模型模型变得越来越擅长理解世界的物理学,他们正在为机器人技术带来令人兴奋的进步。我们越来越接近更有能力和有用的机器人的目标。

随着Aloha释放,我们的机器人掌握了诸如绑带鞋带,悬挂衬衫,修理其他机器人,插入齿轮和清洁厨房的任务。

在一年的开始时,我们引入了Autort,Sara-RT和RT-Trajectory,我们的机器人变压器的扩展功能可帮助机器人更好地浏览其环境并做出更快的决策。我们还发布了Aloha释放,教机器人协调两个臂,而Demostart则使用强化学习来改善使用模拟的多指机器人手上的现实世界表现。

机器人变压器2(RT-2)从网络和机器人数据中学习,使其能够执行诸如将草莓放入碗中的任务。 除了机器人技术之外,我们的Alphachip增强学习方法正在彻底改变数据中心和智能手机的芯片平面图。我们发布了一个预先训练的检查站,以促进Alphachip开源版本的外部采用。我们还制造了Trillium,我们的第六代TPU,可用于Google Cloud客户,展示了AI如何增强芯片设计。 Alphachip学会了优化芯片布局,并通过其创建的每种设计来改进。

我们的研究还解决了量子计算机中的误差校正。 11月,我们启动了Alphaqubit,这是一种基于AI的解码器,以高精度识别量子计算错误。 Google DeepMind和Google研究之间的这种合作加速了朝着可靠的量子计算机的进步。在测试中,与相关匹配相比,与张量网络方法相比,αQubit降低了6%,而较低的误差降低了30%。

12月,Google Quantum AI团队推出了我们最新的量子芯片Willow。 Willow可以在不到五分钟的时间内执行基准计算,这将使当今最快的超级计算机10亿年级。使用量子误差校正,Willow将错误率减半,达到了一个被称为“阈值”的里程碑,并获得了年度物理突破奖。

柳树展示量子计算中最先进的性能。

发现新解决方案:科学,生物学和数学的进步

我们继续使用AI,释放工具和论文来加速科学进步,这些工具和论文展示了AI在推进科学和数学方面的力量。以下是一些亮点:

一月份,我们引入了AlphageMementry,这是一种用于解决复杂几何问题的AI系统。我们更新的字母测定法2和字母隔板是一种基于加强手术的正式数学推理系统,在2024年7月的国际数学奥林匹克运动会上实现了银牌得主的性能。

Alphagemementry 2在短短19秒内解决了2024年7月国际数学奥林匹克运动会的问题4,证明蝗虫 +∂xpy等于180°。 我们与同构实验室合作,引入了Alphafold 3,该实验室预测了生命分子的结构和相互作用,旨在改变我们对生物学和药物发现的理解。

Alphafold 3的高级建筑和训练涵盖了从蛋白质到DNA的所有生命分子。 我们还使用Alphaproteo(一种用于创建高强度蛋白质粘合剂的AI系统)在蛋白质设计方面取得了显着步骤,这可能会导致新药和生物传感器。

字母蛋白质可以为各种靶蛋白设计新的蛋白质粘合剂。

通过与哈佛大学的利希特曼实验室(Lichtman Lab)合作,我们制作了纳米级映射的人类大脑,这是其中的第一个,并将其用于研究人员。这是我们十年来连接组学的努力,现在扩展到人脑映射。

这个大脑映射项目揭示了皮层最深层中的镜像细胞簇。

11月下旬,我们与皇家学会共同主持了AI的科学论坛,讨论了诸如蛋白质结构预测,人脑映射以及使用AI进行预测和野火检测之类的关键主题。我们还在论坛上举办了一个诺贝尔奖获得者的问答,可在Google DeepMind播客上获得。

2024年,Demis Hassabis,John Jumper和David Baker也是诺贝尔化学奖,因为他们在Alphafold 2上的工作而获得了诺贝尔化学奖,这也是具有里程碑意义的一年。杰弗里·欣顿(Geoffrey Hinton)与约翰·霍普菲尔德(John Hopfield)一起获得了诺贝尔物理学奖,以通过人工神经网络在机器学习方面的基础工作。

Google还获得了其他荣誉,包括Neurips 2024 Time Paper Awards和Beale测试和Beale(Orchard-hays for Primal-Dual Lineal编程奖(PDLP)(PDLP),现在是Google或工具的一部分,可以通过现实世界应用进行大规模的线性编程。

为了人类的利益,人工智能

今年,我们进行了重大的产品进展,并发表了研究,展示了AI如何直接并立即使医疗保健,灾难准备和教育等领域的人们受益。

在医疗保健中,AI有望使优质护理民主化,特别是在早期发现心血管疾病时。我们的研究表明,一种简单的指尖装置,结合基本元数据,可以预测心脏健康的风险。我们还采用了针对结核病的AI诊断,表明AI如何有效地筛选具有高结核病和HIV率的人群。

Med-Gemini在MEDQA基准上取得了新的最先进得分,超过了我们以前的最佳Med-Palm 2,提高了4.6%。 我们的双子座模型是专业人士的多功能工具,我们正在为特定领域开发微调模型。例如,Med-Gemini结合了对De-Idishified Medical Data的培训和双子座的能力,在MEDQA USMLE风格的问题基准上获得了91.1%的精度。

我们还在探索机器学习如何解决放射学,皮肤病学和病理等领域成像专业知识的短缺。我们发布了DERM Foundation和Path Foundation,用于诊断任务和生物标志物发现,并与Stanford Medicine在皮肤状况图像网络(SCIN)数据集上合作,并发布了医学成像研究的CT CT基金会。

在教育方面,我们介绍了Learnlm,这是一个微调的模型家庭,用于学习,增强搜索,YouTube和Gemini的体验。 Learnlm的表现优于其他领先的AI模型,我们将其提供给AI Studio的开发人员。我们的对话学习伴侣,Learnabout和Audio讨论工具,阐明,进一步丰富学习经验。

在灾难的预测和准备中,我们引入了Gencast,改善天气和极端事件的预测以及能够模拟数千天大气条件的神经GCM。赢得2024 MacRobert奖的Graphcast提供了详细的天气预测。

Graphcast在10天内的预测展示了特定的湿度,表面温度和风速。

我们改善了我们的洪水预测模型,以预测提前7天的洪水,将覆盖范围扩大到100个国家和7亿人。

现在,我们的洪水预测模型涵盖了100多个国家,在无法获得物理仪表的150个国家 /地区的虚拟仪表。 AI还有助于野火检测和缓解。我们的野火边界图现已在22个国家 /地区提供,我们创建了Firesat,这是一个卫星星座,可以在20分钟内检测到小野火。

我们将Google Translate扩展到包括110种新语言,有助于打破6.14亿扬声器的信息和机会的障碍。

Google翻译中的这些新语言占全球人口的8%。

帮助设定负责AI的标准

我们继续在AI安全方面进行行业领先的研究,开发新的工具和技术,并将其整合到我们的最新模型中。我们致力于解决风险。

我们对滥用的研究发现,深层假货和越狱是最常见的问题。 5月,我们介绍了前沿安全框架,以确定高级AI模型中的新兴功能,并启动了我们的AI责任生命周期框架。 10月,我们将负责任的Genai工具包扩展到与任何LLM合作,帮助开发人员负责任地构建AI。

我们发布了一篇有关高级AI助手的道德规范的论文,研究了AI助手的技术和道德格局以及他们所构成的机会和风险。

我们扩展了Synthid的功能,以在Gemini应用程序以及WEO中的Web体验和视频中加水印AI生成的文本。为了提高在线透明度,我们加入了内容出处和真实性联盟(C2PA),并制定了内容凭据标准的新版本。

SynthID调整了预测令牌的概率得分,以确保AI生成的内容中的质量,准确性和创造力。

除了LLM之外,我们还分享了Alphafold 3的生物安全方法,与行业合作伙伴合作启动了Secure AI(COSAI)联盟,并参加了AI Seoul Summit,为国际AI治理做出了贡献。

当我们开发AI代理等新技术时,我们将继续探讨安全,保障和隐私问题。在我们的AI原则的指导下,我们采取了一种故意的,逐步的方法,通过可信赖的测试人员和外部专家进行广泛的研究,安全培训和风险评估。

展望2025年

2024年是AI中令人难以置信的进步和兴奋的一年。我们对2025年即将发生的事情更加兴奋。

随着我们继续在产品,科学,健康和创造力方面的AI研究界限时,我们必须考虑如何以及何时部署这些技术。通过优先考虑负责任的AI实践并促进协作,我们将继续在建立AI受益于人类的未来方面发挥关键作用。

相关文章
新研究揭示大規模語言模型實際記憶的數據量 新研究揭示大規模語言模型實際記憶的數據量 AI模型實際記憶多少?新研究揭示驚人見解我們都知道,像ChatGPT、Claude和Gemini這樣的大規模語言模型(LLMs)是在龐大數據集上訓練的——來自書籍、網站、程式碼,甚至圖像和音頻等多媒體的數兆字詞。但這些數據到底發生了什麼?這些模型真的理解語言,還是僅僅在重複記憶的片段?來自Meta、Google DeepMind、Cornell和NVIDIA的一項突破性新研究終於給出了具體答案——
AI解決英國生產力難題的潛力 AI解決英國生產力難題的潛力 AI可為英國經濟增加4000億英鎊——但前提是工作者願意接受英國正面臨巨大的經濟機遇——4000億英鎊的增長由AI驅動。但關鍵在於:一半的潛力取決於工作者實際採用AI工具。雖然對AI的興趣激增,但許多人尚未利用其改變工作和生產力的能力。AI採用差距:誰被落在後面?目前,三分之二(66%)的英國工作者——特別是年長女性和低社會經濟背景人士——從未在工作中使用生成式AI。在企業方面,中小型企業在AI採
2025年4月最佳9款AI招聘工具 2025年4月最佳9款AI招聘工具 2024年改變招聘的10款最佳AI招聘工具人工智能正在顛覆招聘遊戲——理由充分。淹沒在簡歷和無休止的面試安排中的公司正轉向AI驅動的解決方案,這些方案能大幅縮短招聘時間、消除偏見,並挖掘最佳候選人。從自動篩選到智能面試助手,這些工具正在改變我們對人才招聘的思考方式。以下是我們精心挑選的今年引起轟動的頂尖AI招聘平台清單:1. Mega HR Mega HR不僅僅是另一個申請者追蹤系統——它由Me
评论 (25)
0/200
JustinMartin
JustinMartin 2025-04-12 08:00:00

2024 was a wild ride with AI! From Gemini 2.0 to quantum computing, it's like we're living in a sci-fi movie. Loved seeing all the creative stuff AI can do, but sometimes it felt a bit too much, you know? Can't wait to see what 2025 brings, but maybe slow down a bit, AI?

BillyEvans
BillyEvans 2025-04-12 08:00:00

¡2024 fue increíble con la IA! Desde Gemini 2.0 hasta la computación cuántica, parece que vivimos en una película de ciencia ficción. Me encantó ver todo lo creativo que puede hacer la IA, pero a veces se sintió un poco abrumador, ¿sabes? Espero con ansias lo que 2025 traiga, pero tal vez, ¿puede la IA ralentizar un poco?

WalterWhite
WalterWhite 2025-04-10 08:00:00

2024年はAIがすごかったね!ジェミニ2.0から量子コンピューティングまで、まるでSF映画に住んでいるみたい。AIができるクリエイティブなことが大好きだけど、時々少し多すぎる感じがするんだよね。2025年が楽しみだけど、AI、ちょっとペースを落とそうか?

WillieRodriguez
WillieRodriguez 2025-04-11 08:00:00

2024 war ein wilder Ritt mit KI! Von Gemini 2.0 bis zur Quantencomputing, es fühlt sich an, als lebten wir in einem Sci-Fi-Film. Ich liebe das kreative Zeug, was KI kann, aber manchmal war es ein bisschen zu viel, weißt du? Ich freue mich auf 2025, aber vielleicht sollte die KI ein bisschen langsamer machen?

KeithJones
KeithJones 2025-04-12 08:00:00

Năm 2024 thật tuyệt vời với trí tuệ nhân tạo! Từ Gemini 2.0 đến máy tính lượng tử, cảm giác như chúng ta đang sống trong phim khoa học viễn tưởng. Mình thích những điều sáng tạo mà AI có thể làm, nhưng đôi khi nó hơi quá sức, bạn biết đấy? Mong chờ năm 2025, nhưng có lẽ AI nên chậm lại một chút?

StephenRamirez
StephenRamirez 2025-04-10 08:00:00

2024 was wild! AI's growth was insane, from Gemini 2.0 to protein binders. It's like every week there was something new and mind-blowing. Can't wait to see what 2025 brings, but 2024 set the bar high!

返回顶部
OR