2024年：AI的增長和創新年份

首頁

新聞

2024年：AI的增長和創新年份

2025-04-10

DonaldBrown

188

# ai # research

2024年：AI的增長和創新年份

當我們邁入2025年，回顧2024年所取得的驚人進展令人振奮。從推出專為代理時代打造的Gemini 2.0模型，到賦能創意表達；從設計新穎的蛋白質結合劑，到推進AI驅動的神經科學和量子計算，我們一直在負責任且大膽地推動人工智慧的界限。所有這些努力都旨在利用AI為人類的更大福祉服務。

正如我們兩年前在《為什麼我們專注於AI》這篇論文中所提到的，我們的AI發展方法植根於我們的創始使命：組織全球資訊，使其普遍可及且實用。這一使命驅動我們致力於提升盡可能多人的生活品質，這一目標始終是我們的北極星。

在我們的2024年回顧中，我們慶祝Google眾多才華橫溢的團隊所取得的卓越成就，他們不懈努力以推進我們的使命。他們的努力為來年更激動人心的發展奠定了基礎。

在模型、產品和技術上的不懈創新

2024年是關於實驗、快速部署以及將最新技術交到開發者手中的一年。12月，我們推出了Gemini 2.0實驗系列的首批模型，專為代理時代設計。我們以Gemini 2.0 Flash這款多功能主力模型開啟序幕，隨後推出了來自代理研究的尖端原型，包括更新的Project Astra，探索通用AI助手的潛力；Project Mariner，一款能夠在Chrome中執行操作的早期原型實驗擴展；以及Jules，一款AI驅動的程式碼代理。我們迫切希望將Gemini 2.0的功能整合到我們的旗艦產品中，並已在Search中的AI Overviews中開始測試，超過10億人使用它來探索新型問題。

我們還推出了Deep Research，Gemini Advanced中的一項新代理功能，通過創建和執行多步驟計劃來回答複雜問題，從而節省數小時的研究時間。此外，我們引入了Gemini 2.0 Flash Thinking Experimental，這款模型透明地展示其思考過程。

在今年早些時候，我們通過將Gemini的功能整合到更多Google產品中並推出了Gemini 1.5 Pro和Gemini 1.5 Flash取得了顯著進展。後者因其速度和效率的優化，成為開發者中最受歡迎的模型，得益於其緊湊的尺寸和成本效益。

我們還增強了AI Studio，使其作為可在桌面、iOS和Android上安裝的進階網頁應用程式（PWA），為開發者提供了一套強大的資源。公眾對NotebookLM中新功能的反應非常好，例如Audio Overviews，這些功能可以從上傳的原始資料生成深入討論，使學習更具吸引力。

語音輸入和輸出在Gemini Live、Project Astra、Journey Voices和YouTube的自動配音等產品中持續得到改進，提升了使用者互動。

遵循我們對開源社群的傳統貢獻，我們發布了來自Gemma的兩款新模型，這是基於與Gemini相同研究和技術的尖端開源模型。Gemma在問答、推理和程式設計等領域超越了同等規模的模型。我們還發布了Gemma Scope，一款幫助研究人員理解Gemma 2內部運作的工具。

我們在提高模型事實性和減少幻覺方面取得了進展。12月，我們與Google DeepMind、Google Research和Kaggle合作發布了FACTS Grounding基準，用於評估大型語言模型如何根據提供的原始資料進行回應並避免幻覺。

FACTS Grounding資料集包含1,719個範例，旨在測試基於上下文文件的長篇回應。我們使用FACTS Grounding測試了領先的大型語言模型，並自豪地報告Gemini 2.0 Flash Experimental、Gemini 1.5 Flash和Gemini 1.5 Pro獲得了前三名的事實性得分，其中Gemini-2.0-flash-exp得分高達83.6%。

我們還通過創新的技術如區塊並行解碼、基於信心的延遲和推測解碼提高了機器學習效率，加快了大型語言模型的推理時間。這些改進惠及Google產品並設定了行業標準。

在體育領域，我們推出了TacticAI，一款為足球戰術提供洞察的AI系統，特別是在角球方面。

我們對研究領導力的承諾依然堅定。2010-2023年的WIPO調查顯示，Google（包括Google Research和Google DeepMind）在生成式AI引用方面的引用量是第二高引用機構的兩倍以上。

此WIPO圖表基於2024年1月的The Lens數據，突顯了Alphabet在過去十年對生成式AI研究的重大貢獻。最後，我們在Project Starline這項“魔法窗口”技術上取得進展，與HP合作將其商業化，目標是將其整合到Google Meet和Zoom等視訊會議服務中。

以生成式AI賦能創意願景

我們相信AI可以開啟新的創意領域，使創意表達更易於實現，幫助人們實現其藝術願景。2024年，我們推出了一系列生成式媒體工具更新，涵蓋圖像、音樂和影片。

在年初，我們推出了ImageFX和MusicFX，這些生成式AI工具可根據文字提示生成圖像和最長70秒的音頻片段。在I/O大會上，我們預覽了MusicFX DJ，旨在讓現場音樂創作更易於實現。10月，我們與Jacob Collier合作簡化了MusicFX DJ，適合新手和有志音樂家。我們還更新了音樂AI工具包Music AI Sandbox，並改進了Dream Track實驗，允許美國創作者使用文字轉音樂模型生成各種風格的器樂配樂。

在下半年，我們發布了Veo 2和Imagen 3，這是我們最新的圖像和影片模型。Imagen 3是我們最高品質的文字轉圖像模型，能生成具有卓越細節、照明效果和較少瑕疵的圖像。Veo 2展示了對現實世界物理和人類運動的更好理解，提升了真實感。 Veo 2標誌著高品質影片生成的重要進展。

我們繼續探索AI在編輯中的潛力，利用其控制物體的透明度和粗糙度等屬性。

這些範例展示了AI使用合成資料生成來編輯材料屬性的能力。

在音頻生成方面，我們改進了影片轉音頻（V2A）技術，根據螢幕動作從文字提示生成動態音景，可與來自Veo的AI生成影片配對。

遊戲為創意探索和訓練具身代理提供了完美的遊樂場。2024年，我們推出了Genie 2，一款生成多樣化、可玩3D環境的基礎世界模型，用於訓練和評估具身代理。這是在推出SIMA之後，SIMA能在各種視訊遊戲場景中遵循自然語言指令。

智慧的架構：機器人、硬體和計算的進展

隨著我們的多模態模型越來越擅長理解世界的物理原理，它們正在推動機器人領域的激動人心進展。我們越來越接近實現更具能力且實用的機器人目標。

透過ALOHA Unleashed，我們的機器人掌握了綁鞋帶、掛襯衫、修理其他機器人、插入齒輪和清潔廚房等任務。

在年初，我們推出了AutoRT、SARA-RT和RT-Trajectory，這些是我們的機器人轉換器工作的延伸，幫助機器人更好地導航環境並更快做出決策。我們還發布了ALOHA Unleashed，教導機器人協調雙臂，以及DemoStart，該系統使用強化學習通過模擬提高多指機器人手在現實世界中的表現。

機器人轉換器2（RT-2）從網路和機器人資料中學習，能執行如將草莓放入碗中的任務。在機器人之外，我們的AlphaChip強化學習方法正在革新資料中心和智慧手機的晶片佈局設計。我們發布了預訓練檢查點，以促進AlphaChip開源版本的外部採用。我們還將第六代TPU Trillium提供給Google Cloud客戶，展示AI如何增強晶片設計。 AlphaChip學會優化晶片佈局，隨著每次設計的創建而改進。

我們的研究還涉及量子電腦的錯誤校正。11月，我們推出了AlphaQubit，一款基於AI的解碼器，能高精度識別量子計算錯誤。這項Google DeepMind與Google Research的合作加速了實現可靠量子電腦的進展。在測試中，AlphaQubit比張量網路方法減少了6%的錯誤，比相關匹配減少了30%。

12月，Google Quantum AI團隊推出了最新的量子晶片Willow。Willow能在不到五分鐘內完成當今最快的超級電腦需要10 septillion年才能完成的基準計算。使用量子錯誤校正，Willow將錯誤率減半，實現了稱為“低於閾值”的里程碑，並榮獲年度物理突破獎。

Willow展示了量子計算的尖端性能。

發現新解決方案：科學、生物學和數學的進展

我們繼續以AI加速科學進展，發布展示AI在推進科學和數學方面力量的工具和論文。以下是一些亮點：

1月，我們推出了AlphaGeometry，一款解決複雜幾何問題的AI系統。我們更新的AlphaGeometry 2和AlphaProof，一款基於強化學習的正式數學推理系統，在2024年7月的國際數學奧林匹克中獲得銀牌表現。

AlphaGeometry 2在2024年7月國際數學奧林匹克的問題4中僅用19秒證明了∠KIL + ∠XPY等於180°。與Isomorphic Labs合作，我們推出了AlphaFold 3，預測生命分子的結構和相互作用，旨在改變我們對生物學和藥物發現的理解。AlphaFold 3的先進架構和訓練涵蓋從蛋白質到DNA的所有生命分子。我們還在蛋白質設計方面取得重大進展，推出了AlphaProteo，一款用於創建高強度蛋白質結合劑的AI系統，可能帶來新藥物和生物感測器。AlphaProteo可為各種目標蛋白質設計新的蛋白質結合劑。

與哈佛Lichtman實驗室合作，我們製作了人類大腦的奈米級映射，這是首創之舉，並向研究人員開放。這是我們十年來在連接組學方面的努力，現已擴展到人類大腦映射。

這項大腦映射項目揭示了皮層最深層的鏡像細胞群。

11月末，我們與皇家學會共同舉辦了AI for Science論壇，討論了蛋白質結構預測、人類大腦映射以及使用AI進行預測和野火檢測等關鍵話題。我們還在論壇上與四位諾貝爾獎得主進行了問答，內容可在Google DeepMind播客中獲取。

2024年也是一個里程碑年，Demis Hassabis、John Jumper和David Baker因其在AlphaFold 2上的工作獲得了諾貝爾化學獎，因其革新蛋白質設計而受到表彰。Geoffrey Hinton與John Hopfield因其在機器學習和人工神經網路基礎工作獲得了諾貝爾物理學獎。

Google還獲得了其他榮譽，包括NeurIPS 2024時間檢驗論文獎和Beale—Orchard-Hays獎，用於原對偶線性規劃（PDLP），現為Google OR Tools的一部分，幫助進行具有現實應用的規模化線性規劃。

為人類福祉服務的AI

今年，我們在產品上取得了重大進展，並發布了研究，展示AI如何在醫療、災害準備和教育等領域直接且立即惠及人們。

在醫療領域，AI有望實現優質醫療的民主化，特別是在心血管疾病的早期檢測。我們的研究表明，結合基本元資料的簡單指尖設備可以預測心臟健康風險。我們還推進了AI驅動的結核病診斷，展示AI如何有效篩查高結核病和HIV發病率的人群。

Med-Gemini在MedQA基準上取得了新的最佳成績，超越了我們之前的Med-PaLM 2，準確率提高了4.6%。我們的Gemini模型是專業人士的多功能工具，我們正在開發針對特定領域的微調模型。例如，Med-Gemini結合了去識別化醫療資料的訓練與Gemini的功能，在MedQA USMLE風格問題基準上達到了91.1%的準確率。

我們還在探索機器學習如何解決放射學、皮膚科和病理學等領域的影像專業知識短缺問題。我們發布了Derm Foundation和Path Foundation用於診斷任務和生物標記發現，與Stanford Medicine合作推出了Skin Condition Image Network（SCIN）資料集，並推出了CT Foundation用於醫療影像研究。

在教育領域，我們推出了LearnLM，一系列專為學習微調的模型，增強了Search、YouTube和Gemini的體驗。LearnLM超越了其他領先的AI模型，我們在AI Studio中向開發者提供了它。我們的對話學習夥伴LearnAbout和音頻討論工具Illuminate進一步豐富了學習體驗。

在災害預測和準備方面，我們推出了GenCast，改進了天氣和極端事件預測，以及NeuralGCM，能模擬數千天的大氣條件。GraphCast獲得了2024年MacRobert獎，提供詳細的天氣預測。

GraphCast在10天的預測展示了特定濕度、表面溫度和風速。

我們改進了洪水預測模型，能提前七天預測洪水，擴大覆蓋範圍至100個國家和7億人。

我們的洪水預測模型現已覆蓋超過100個國家，在150個國家使用虛擬量測儀，這些地方缺乏實體量測儀。 AI還幫助進行野火檢測和緩解。我們的Wildfire Boundary Maps現已在22個國家可用，我們創建了FireSat，一個能在20分鐘內檢測小型野火的衛星星座。

我們擴展了Google Translate，新增了110種新語言，幫助為超過6.14億講者打破資訊和機會的障礙。

Google Translate中的這些新語言代表了全球8%的人口。

協助制定負責任AI的標準

我們繼續在AI安全方面進行行業領先的研究，開發新工具和技術，並將其整合到我們的最新模型中。我們致力於合作應對風險。

我們對濫用的研究發現，深度偽造和越獄是最常見的問題。5月，我們推出了The Frontier Safety Framework，以識別我們先進AI模型中的新興能力，並推出了AI Responsibility Lifecycle框架。10月，我們擴展了Responsible GenAI Toolkit，使其適用於任何大型語言模型，幫助開發者負責任地構建AI。

我們發布了一篇關於《先進AI助手的倫理》的論文，探討了AI助手的技術和道德景觀以及其帶來的機會和風險。

我們擴展了SynthID的功能，在Gemini應用程式和網頁體驗中為AI生成文字添加水印，在Veo中為影片添加水印。為增強線上透明度，我們加入了內容來源與真實性聯盟（C2PA），並致力於開發更安全的新版Content Credentials標準。

SynthID調整預測標記的機率分數，以確保AI生成內容的品質、準確性和創造力。

除了大型語言模型外，我們分享了AlphaFold 3的生物安全方法，與行業合作夥伴推出了Coalition for Secure AI（CoSAI），並參加了AI Seoul Summit，為國際AI治理做出貢獻。

隨著我們開發AI代理等新技術，我們將繼續探索安全、保障和隱私問題。在我們的AI原則指導下，我們採取謹慎、漸進的方法，與可信測試者和外部專家進行廣泛的研究、安全訓練和風險評估。

展望2025年

2024年是AI領域取得驚人進展和激動人心的一年。我們對2025年的前景更加興奮。

隨著我們繼續在產品、科學、健康和創意領域推動AI研究的界限，我們必須深思熟慮地考慮如何以及何時部署這些技術。通過優先考慮負責任的AI實踐並促進合作，我們將繼續在構建AI惠及人類的未來中發揮關鍵作用。

Notion 將其工作區轉變為人工智慧代理的樞紐生產力軟體公司 Notion 正邁入「代理時代」。在週三的直播產品發布會上，以協作式筆記應用程式聞名的 Notion 揭曉了一套全新的開發者平台，該平台不僅擴展了其自訂 AI 代理程式的能力，還能與外部代理程式串接，並讓團隊建立自動化多步驟工作流程，從任何資料庫中擷取資料。透過建立一個「協調層」——一個能在多個工具和資料來源之間協調 AI 工作的系統——Notion 將自身定位為不僅僅是一款具備

ElevenLabs 宣布 BlackRock、傑米·福克斯與伊娃·朗格莉亞成為新投資人語音人工智慧公司 ElevenLabs 已公布其 5 億美元 D 輪融資的更多投資者名單，該輪融資最初於二月宣布。投資者陣容包括黑石集團（BlackRock）、威靈頓管理（Wellington）、D.E. Shaw及施羅德（Schroders）等機構投資者；NVIDIA、Salesforce、桑坦德銀行（Santander）、KPN及德國電信（Deutsche Telekom）等企業；以及傑米·

WordPress.com 現已允許 AI 代理程式撰寫並發布文章，還有更多功能廣受歡迎的網站託管與發佈平台 WordPress.com 現正積極導入 AI 代理程式——此舉可能重塑網路的樣貌與使用體驗。該公司於週五宣布，將允許 AI 代理程式在客戶網站上起草、編輯及發佈內容，同時也能管理留言、更新與修正元資料，並透過標籤和分類來整理內容。所有這些操作皆透過一個介面進行控制，網站擁有者只需使用自然語言指令說明其需求即可。憑藉這些新功能，網站幾乎可以完全由人工指導的 AI 代理

相關專題推薦

寫作

最佳免費且無法被偵測的 AI 寫手：將機械化的草稿轉化為自然、類人化的散文

立即前往 XIX.AI，探索 2026 年最頂尖的免費且難以被察覺的 AI 寫手。我們精心篩選的頂級清單，能協助您將生硬的草稿轉化為自然流暢、宛如人類撰寫的文字。透過實際測試與每週更新的排行榜，比較免費與付費選項的優劣。立即解鎖您的 AI 寫作優勢。

10 個工具

xix.ai

圖像編輯

用於短劇故事板的AI藝術生成工具：幻想與都市浪漫題材的角色設計

2026最新推薦：探索最適合用於短劇故事板製作的AI藝術生成工具。我們精心挑選了眾多頂級工具，幫助您創作出引人入勝的幻想角色和都市浪漫角色。您可以對比免費與付費選項，檢視實際測試結果，從而找到最適合自己的創意工具。XIX.AI還會每週更新排名並提供專家分析，讓您立即開始將故事視覺化呈現吧！

10 個工具

xix.ai

寫作

最適合廣播和播客使用的AI指令碼編寫工具：幫助您創作引人入勝的音訊廣告

在XIX.AI上，發現2026年最適合用於廣播和播客製作的AI指令碼工具。我們精心挑選的這些高評分工具能夠提供強大的功能，幫助您快速製作出引人入勝的音訊廣告。透過實際測試和每週更新的排名，您可以瞭解免費選項與付費選項之間的差異。今天就釋放您的創造力吧！

10 個工具

xix.ai

商業

最佳 AI 合約審查軟體：即時發現法律漏洞與合規風險

立即在 XIX.AI 探索 2026 年最佳 AI 合約審查軟體。我們精心挑選的頂級清單收錄了多款強大工具，能即時偵測法律漏洞與合規風險。透過實際測試與每週更新的排行榜，比較免費與付費方案的差異。為您找到能徹底改變遊戲規則的解決方案，實現安全且高效的合約分析。立即探索這份權威指南。

10 個工具

xix.ai

動畫創作

專為東華設計的AI動漫生成器：可用於建立網路小說角色及漫畫頭像

探索2026年最適合製作中文動畫的人工智慧工具。我們精心挑選的頂級列表中包含了各種強大的工具，能夠幫助你建立出令人驚歎的網路小說角色和漫畫頭像。透過實際測試來對比免費選項和付費選項，找到最適合你的創作工具，今天就在XIX.AI上將你的故事變為現實吧。

10 個工具

xix.ai

漫畫創作

漫畫頂尖 AI 自動上色工具：零一致性錯誤地套用平面色彩

立即前往 XIX.AI，探索 2026 年最優秀的漫畫 AI 自動上色工具。我們精心挑選的清單收錄了備受好評、能徹底改變遊戲規則的解決方案，這些工具能以零一致性錯誤的方式套用平面色彩，大幅提升您的工作效率。透過免費與付費版本的比較、實際測試結果，以及每週更新的排行榜，找到最適合您的工具。立即解鎖您的 AI 優勢。

10 個工具

xix.ai

評論 (28)

0/500

請登錄後再操作

GaryBrown

2026-03-08 10:00:50

Читаю про успехи 2024-го и немного тревожит этот тренд 'агентской эры'. Модели становятся слишком самостоятельными? С одной стороны, дизайн белков или нейробиология с ИИ — это прорыв, но где гарантии, что их можно контролировать? Как по мне, инновации должны идти рука об руку с этическим надзором. 😅

KevinRoberts

2025-10-27 04:30:33

Ehrlich gesagt, die letzten Fortschritte bei KI-Proteindesign sind beeindruckend, aber ich frage mich, wie schnell solche Technologien in der Medizin ankommen werden. 🧐 Als Laie verstehe ich nur die Hälfte, aber es klingt nach Science-Fiction!

AlbertSanchez

2025-08-23 13:01:15

Wow, 2024 was a wild ride for AI! Gemini 2.0 sounds like a game-changer for agents. Curious how it stacks up against other models—anybody tested it yet? 🧠

FrankSmith

2025-04-23 09:42:56

¡2024 fue un año increíble para la IA! Desde Gemini 2.0 hasta la computación cuántica, es impresionante. Parece que estamos viviendo en una película de ciencia ficción. ¡No puedo esperar a ver qué nos trae 2025! 🚀

RalphGarcia

2025-04-20 01:10:39

2024年のAIの進歩は本当に驚きでしたね！ジェミニ2.0から量子コンピューティングまで、まるでSF映画みたいです。2025年が楽しみです。🚀

CarlLewis

2025-04-18 19:58:13

2024 was insane with AI! From Gemini 2.0 to quantum computing, it felt like living in a sci-fi movie. The creativity boost was real, but sometimes I felt overwhelmed by the rapid changes. Still, it's exciting to see where AI will take us next! 🚀

頭號新聞

AI Builder和Power Automate革新文件摘要 AI寄主Notebooklm播客現已上中國發布國家級人形機器人與具身智能標準 Ramp 數據顯示，企業對 AI 的採納已進入停滯期 Bing圖像創作者教程：AI藝術生成指南學習使用您的聲音創建AI音樂：逐步Suno教程 iMyFone MagicMic：實時AI變聲器評測與教程 2025頂級AI影片生成器：Pika Labs與其他對比 DeepSeek V4 崛起為多模態人工智慧的變革者 Embodied Intelligence 公布首項業界標準，以遏止無序擴張

精選