2024年:AI的增長和創新年份

當我們邁入2025年,回顧2024年所取得的驚人進展令人振奮。從推出專為代理時代打造的Gemini 2.0模型,到賦能創意表達;從設計新穎的蛋白質結合劑,到推進AI驅動的神經科學和量子計算,我們一直在負責任且大膽地推動人工智慧的界限。所有這些努力都旨在利用AI為人類的更大福祉服務。
正如我們兩年前在《為什麼我們專注於AI》這篇論文中所提到的,我們的AI發展方法植根於我們的創始使命:組織全球資訊,使其普遍可及且實用。這一使命驅動我們致力於提升盡可能多人的生活品質,這一目標始終是我們的北極星。
在我們的2024年回顧中,我們慶祝Google眾多才華橫溢的團隊所取得的卓越成就,他們不懈努力以推進我們的使命。他們的努力為來年更激動人心的發展奠定了基礎。
在模型、產品和技術上的不懈創新
2024年是關於實驗、快速部署以及將最新技術交到開發者手中的一年。12月,我們推出了Gemini 2.0實驗系列的首批模型,專為代理時代設計。我們以Gemini 2.0 Flash這款多功能主力模型開啟序幕,隨後推出了來自代理研究的尖端原型,包括更新的Project Astra,探索通用AI助手的潛力;Project Mariner,一款能夠在Chrome中執行操作的早期原型實驗擴展;以及Jules,一款AI驅動的程式碼代理。我們迫切希望將Gemini 2.0的功能整合到我們的旗艦產品中,並已在Search中的AI Overviews中開始測試,超過10億人使用它來探索新型問題。
我們還推出了Deep Research,Gemini Advanced中的一項新代理功能,通過創建和執行多步驟計劃來回答複雜問題,從而節省數小時的研究時間。此外,我們引入了Gemini 2.0 Flash Thinking Experimental,這款模型透明地展示其思考過程。
在今年早些時候,我們通過將Gemini的功能整合到更多Google產品中並推出了Gemini 1.5 Pro和Gemini 1.5 Flash取得了顯著進展。後者因其速度和效率的優化,成為開發者中最受歡迎的模型,得益於其緊湊的尺寸和成本效益。
我們還增強了AI Studio,使其作為可在桌面、iOS和Android上安裝的進階網頁應用程式(PWA),為開發者提供了一套強大的資源。公眾對NotebookLM中新功能的反應非常好,例如Audio Overviews,這些功能可以從上傳的原始資料生成深入討論,使學習更具吸引力。
語音輸入和輸出在Gemini Live、Project Astra、Journey Voices和YouTube的自動配音等產品中持續得到改進,提升了使用者互動。
遵循我們對開源社群的傳統貢獻,我們發布了來自Gemma的兩款新模型,這是基於與Gemini相同研究和技術的尖端開源模型。Gemma在問答、推理和程式設計等領域超越了同等規模的模型。我們還發布了Gemma Scope,一款幫助研究人員理解Gemma 2內部運作的工具。
我們在提高模型事實性和減少幻覺方面取得了進展。12月,我們與Google DeepMind、Google Research和Kaggle合作發布了FACTS Grounding基準,用於評估大型語言模型如何根據提供的原始資料進行回應並避免幻覺。
FACTS Grounding資料集包含1,719個範例,旨在測試基於上下文文件的長篇回應。
我們使用FACTS Grounding測試了領先的大型語言模型,並自豪地報告Gemini 2.0 Flash Experimental、Gemini 1.5 Flash和Gemini 1.5 Pro獲得了前三名的事實性得分,其中Gemini-2.0-flash-exp得分高達83.6%。
我們還通過創新的技術如區塊並行解碼、基於信心的延遲和推測解碼提高了機器學習效率,加快了大型語言模型的推理時間。這些改進惠及Google產品並設定了行業標準。
在體育領域,我們推出了TacticAI,一款為足球戰術提供洞察的AI系統,特別是在角球方面。
我們對研究領導力的承諾依然堅定。2010-2023年的WIPO調查顯示,Google(包括Google Research和Google DeepMind)在生成式AI引用方面的引用量是第二高引用機構的兩倍以上。
此WIPO圖表基於2024年1月的The Lens數據,突顯了Alphabet在過去十年對生成式AI研究的重大貢獻。
最後,我們在Project Starline這項“魔法窗口”技術上取得進展,與HP合作將其商業化,目標是將其整合到Google Meet和Zoom等視訊會議服務中。
以生成式AI賦能創意願景
我們相信AI可以開啟新的創意領域,使創意表達更易於實現,幫助人們實現其藝術願景。2024年,我們推出了一系列生成式媒體工具更新,涵蓋圖像、音樂和影片。
在年初,我們推出了ImageFX和MusicFX,這些生成式AI工具可根據文字提示生成圖像和最長70秒的音頻片段。在I/O大會上,我們預覽了MusicFX DJ,旨在讓現場音樂創作更易於實現。10月,我們與Jacob Collier合作簡化了MusicFX DJ,適合新手和有志音樂家。我們還更新了音樂AI工具包Music AI Sandbox,並改進了Dream Track實驗,允許美國創作者使用文字轉音樂模型生成各種風格的器樂配樂。
在下半年,我們發布了Veo 2和Imagen 3,這是我們最新的圖像和影片模型。Imagen 3是我們最高品質的文字轉圖像模型,能生成具有卓越細節、照明效果和較少瑕疵的圖像。Veo 2展示了對現實世界物理和人類運動的更好理解,提升了真實感。
Veo 2標誌著高品質影片生成的重要進展。
我們繼續探索AI在編輯中的潛力,利用其控制物體的透明度和粗糙度等屬性。
這些範例展示了AI使用合成資料生成來編輯材料屬性的能力。
在音頻生成方面,我們改進了影片轉音頻(V2A)技術,根據螢幕動作從文字提示生成動態音景,可與來自Veo的AI生成影片配對。
遊戲為創意探索和訓練具身代理提供了完美的遊樂場。2024年,我們推出了Genie 2,一款生成多樣化、可玩3D環境的基礎世界模型,用於訓練和評估具身代理。這是在推出SIMA之後,SIMA能在各種視訊遊戲場景中遵循自然語言指令。
智慧的架構:機器人、硬體和計算的進展
隨著我們的多模態模型越來越擅長理解世界的物理原理,它們正在推動機器人領域的激動人心進展。我們越來越接近實現更具能力且實用的機器人目標。
透過ALOHA Unleashed,我們的機器人掌握了綁鞋帶、掛襯衫、修理其他機器人、插入齒輪和清潔廚房等任務。
在年初,我們推出了AutoRT、SARA-RT和RT-Trajectory,這些是我們的機器人轉換器工作的延伸,幫助機器人更好地導航環境並更快做出決策。我們還發布了ALOHA Unleashed,教導機器人協調雙臂,以及DemoStart,該系統使用強化學習通過模擬提高多指機器人手在現實世界中的表現。
機器人轉換器2(RT-2)從網路和機器人資料中學習,能執行如將草莓放入碗中的任務。
在機器人之外,我們的AlphaChip強化學習方法正在革新資料中心和智慧手機的晶片佈局設計。我們發布了預訓練檢查點,以促進AlphaChip開源版本的外部採用。我們還將第六代TPU Trillium提供給Google Cloud客戶,展示AI如何增強晶片設計。
AlphaChip學會優化晶片佈局,隨著每次設計的創建而改進。
我們的研究還涉及量子電腦的錯誤校正。11月,我們推出了AlphaQubit,一款基於AI的解碼器,能高精度識別量子計算錯誤。這項Google DeepMind與Google Research的合作加速了實現可靠量子電腦的進展。在測試中,AlphaQubit比張量網路方法減少了6%的錯誤,比相關匹配減少了30%。
12月,Google Quantum AI團隊推出了最新的量子晶片Willow。Willow能在不到五分鐘內完成當今最快的超級電腦需要10 septillion年才能完成的基準計算。使用量子錯誤校正,Willow將錯誤率減半,實現了稱為“低於閾值”的里程碑,並榮獲年度物理突破獎。
Willow展示了量子計算的尖端性能。
發現新解決方案:科學、生物學和數學的進展
我們繼續以AI加速科學進展,發布展示AI在推進科學和數學方面力量的工具和論文。以下是一些亮點:
1月,我們推出了AlphaGeometry,一款解決複雜幾何問題的AI系統。我們更新的AlphaGeometry 2和AlphaProof,一款基於強化學習的正式數學推理系統,在2024年7月的國際數學奧林匹克中獲得銀牌表現。
AlphaGeometry 2在2024年7月國際數學奧林匹克的問題4中僅用19秒證明了∠KIL + ∠XPY等於180°。
與Isomorphic Labs合作,我們推出了AlphaFold 3,預測生命分子的結構和相互作用,旨在改變我們對生物學和藥物發現的理解。AlphaFold 3的先進架構和訓練涵蓋從蛋白質到DNA的所有生命分子。
我們還在蛋白質設計方面取得重大進展,推出了AlphaProteo,一款用於創建高強度蛋白質結合劑的AI系統,可能帶來新藥物和生物感測器。AlphaProteo可為各種目標蛋白質設計新的蛋白質結合劑。
與哈佛Lichtman實驗室合作,我們製作了人類大腦的奈米級映射,這是首創之舉,並向研究人員開放。這是我們十年來在連接組學方面的努力,現已擴展到人類大腦映射。
這項大腦映射項目揭示了皮層最深層的鏡像細胞群。
11月末,我們與皇家學會共同舉辦了AI for Science論壇,討論了蛋白質結構預測、人類大腦映射以及使用AI進行預測和野火檢測等關鍵話題。我們還在論壇上與四位諾貝爾獎得主進行了問答,內容可在Google DeepMind播客中獲取。
2024年也是一個里程碑年,Demis Hassabis、John Jumper和David Baker因其在AlphaFold 2上的工作獲得了諾貝爾化學獎,因其革新蛋白質設計而受到表彰。Geoffrey Hinton與John Hopfield因其在機器學習和人工神經網路基礎工作獲得了諾貝爾物理學獎。
Google還獲得了其他榮譽,包括NeurIPS 2024時間檢驗論文獎和Beale—Orchard-Hays獎,用於原對偶線性規劃(PDLP),現為Google OR Tools的一部分,幫助進行具有現實應用的規模化線性規劃。
為人類福祉服務的AI
今年,我們在產品上取得了重大進展,並發布了研究,展示AI如何在醫療、災害準備和教育等領域直接且立即惠及人們。
在醫療領域,AI有望實現優質醫療的民主化,特別是在心血管疾病的早期檢測。我們的研究表明,結合基本元資料的簡單指尖設備可以預測心臟健康風險。我們還推進了AI驅動的結核病診斷,展示AI如何有效篩查高結核病和HIV發病率的人群。
Med-Gemini在MedQA基準上取得了新的最佳成績,超越了我們之前的Med-PaLM 2,準確率提高了4.6%。
我們的Gemini模型是專業人士的多功能工具,我們正在開發針對特定領域的微調模型。例如,Med-Gemini結合了去識別化醫療資料的訓練與Gemini的功能,在MedQA USMLE風格問題基準上達到了91.1%的準確率。我們還在探索機器學習如何解決放射學、皮膚科和病理學等領域的影像專業知識短缺問題。我們發布了Derm Foundation和Path Foundation用於診斷任務和生物標記發現,與Stanford Medicine合作推出了Skin Condition Image Network(SCIN)資料集,並推出了CT Foundation用於醫療影像研究。
在教育領域,我們推出了LearnLM,一系列專為學習微調的模型,增強了Search、YouTube和Gemini的體驗。LearnLM超越了其他領先的AI模型,我們在AI Studio中向開發者提供了它。我們的對話學習夥伴LearnAbout和音頻討論工具Illuminate進一步豐富了學習體驗。
在災害預測和準備方面,我們推出了GenCast,改進了天氣和極端事件預測,以及NeuralGCM,能模擬數千天的大氣條件。GraphCast獲得了2024年MacRobert獎,提供詳細的天氣預測。
GraphCast在10天的預測展示了特定濕度、表面溫度和風速。
我們改進了洪水預測模型,能提前七天預測洪水,擴大覆蓋範圍至100個國家和7億人。
我們的洪水預測模型現已覆蓋超過100個國家,在150個國家使用虛擬量測儀,這些地方缺乏實體量測儀。
AI還幫助進行野火檢測和緩解。我們的Wildfire Boundary Maps現已在22個國家可用,我們創建了FireSat,一個能在20分鐘內檢測小型野火的衛星星座。我們擴展了Google Translate,新增了110種新語言,幫助為超過6.14億講者打破資訊和機會的障礙。
Google Translate中的這些新語言代表了全球8%的人口。
協助制定負責任AI的標準
我們繼續在AI安全方面進行行業領先的研究,開發新工具和技術,並將其整合到我們的最新模型中。我們致力於合作應對風險。
我們對濫用的研究發現,深度偽造和越獄是最常見的問題。5月,我們推出了The Frontier Safety Framework,以識別我們先進AI模型中的新興能力,並推出了AI Responsibility Lifecycle框架。10月,我們擴展了Responsible GenAI Toolkit,使其適用於任何大型語言模型,幫助開發者負責任地構建AI。
我們發布了一篇關於《先進AI助手的倫理》的論文,探討了AI助手的技術和道德景觀以及其帶來的機會和風險。
我們擴展了SynthID的功能,在Gemini應用程式和網頁體驗中為AI生成文字添加水印,在Veo中為影片添加水印。為增強線上透明度,我們加入了內容來源與真實性聯盟(C2PA),並致力於開發更安全的新版Content Credentials標準。
SynthID調整預測標記的機率分數,以確保AI生成內容的品質、準確性和創造力。
除了大型語言模型外,我們分享了AlphaFold 3的生物安全方法,與行業合作夥伴推出了Coalition for Secure AI(CoSAI),並參加了AI Seoul Summit,為國際AI治理做出貢獻。
隨著我們開發AI代理等新技術,我們將繼續探索安全、保障和隱私問題。在我們的AI原則指導下,我們採取謹慎、漸進的方法,與可信測試者和外部專家進行廣泛的研究、安全訓練和風險評估。
展望2025年
2024年是AI領域取得驚人進展和激動人心的一年。我們對2025年的前景更加興奮。
隨著我們繼續在產品、科學、健康和創意領域推動AI研究的界限,我們必須深思熟慮地考慮如何以及何時部署這些技術。通過優先考慮負責任的AI實踐並促進合作,我們將繼續在構建AI惠及人類的未來中發揮關鍵作用。
相關文章
Salesforce 揭曉 Slack 中 AI 數位隊友以對抗 Microsoft Copilot
Salesforce 推出全新工作場所 AI 策略,於週一宣布在 Slack 對話中引入專屬的「數位隊友」。全新工具 Agentforce in Slack 讓企業能夠創建並部署針對特定任務的 AI 代理,這些代理可搜尋工作場所聊天記錄、存取公司資料,並在員工日常工作的訊息平台內執行操作。「正如專業員工協作解決問題,我們的客戶需要 AI 代理共同合作,為客戶和員工解決問題,」Salesforce
甲骨文40億美元Nvidia晶片投資推動德州AI數據中心
據《金融時報》報導,甲骨文計劃投資約40億美元於Nvidia晶片,為OpenAI在德州開發的大型新數據中心提供動力。這筆交易是迄今為止最大的晶片收購之一,凸顯了對AI運算資源的激增需求。該設施位於德州阿比林,是美國首個「星門」數據中心。由OpenAI和軟銀支持,屬於建設大規模AI基礎設施的更廣泛計劃的一部分。該德州中心預計明年完工,將提供1.2吉瓦的運算能力,位列全球最大之列。甲骨文計劃採購約40
Meta AI應用程式將推出高級訂閱與廣告
Meta的AI應用程式即將推出付費訂閱服務,類似於OpenAI、Google和Microsoft等競爭對手的產品。在2025年第一季財報電話會議中,Meta首席執行官馬克·祖克柏格概述了高級服務的計劃,讓用戶能夠使用更強大的運算能力或Meta AI的額外功能。為了與ChatGPT競爭,Meta本週推出了一款獨立的AI應用程式,允許用戶直接與聊天機器人互動並進行圖像生成。該聊天機器人目前擁有近10億
評論 (25)
0/200
FrankSmith
2025-04-23 09:42:56
¡2024 fue un año increíble para la IA! Desde Gemini 2.0 hasta la computación cuántica, es impresionante. Parece que estamos viviendo en una película de ciencia ficción. ¡No puedo esperar a ver qué nos trae 2025! 🚀
0
RalphGarcia
2025-04-20 01:10:39
2024年のAIの進歩は本当に驚きでしたね!ジェミニ2.0から量子コンピューティングまで、まるでSF映画みたいです。2025年が楽しみです。🚀
0
CarlLewis
2025-04-18 19:58:13
2024 was insane with AI! From Gemini 2.0 to quantum computing, it felt like living in a sci-fi movie. The creativity boost was real, but sometimes I felt overwhelmed by the rapid changes. Still, it's exciting to see where AI will take us next! 🚀
0
RogerRoberts
2025-04-15 06:22:16
¡2024 fue una locura con la IA! Desde Gemini 2.0 hasta la computación cuántica, parecía estar viviendo en una película de ciencia ficción. El impulso de creatividad fue real, pero a veces me sentí abrumado por los cambios rápidos. Aún así, ¡es emocionante ver a dónde nos llevará la IA a continuación! 🚀
0
RobertMartin
2025-04-13 18:55:17
2024年のAIの進歩は本当に驚きだった!ジェミニ2.0から量子コンピューティングまで、まるでSF映画にいるようだった。創造性の向上は確かにあったけど、急速な変化に圧倒されることもあった。それでも、AIが次にどこへ導いてくれるのか楽しみだよ!🚀
0
JimmyGarcia
2025-04-13 14:54:46
2024 foi louco com IA! Do Gemini 2.0 ao computador quântico, parecia estar vivendo em um filme de ficção científica. O aumento da criatividade foi real, mas às vezes me senti sobrecarregado com as mudanças rápidas. Ainda assim, é emocionante ver para onde a IA nos levará em seguida! 🚀
0
當我們邁入2025年,回顧2024年所取得的驚人進展令人振奮。從推出專為代理時代打造的Gemini 2.0模型,到賦能創意表達;從設計新穎的蛋白質結合劑,到推進AI驅動的神經科學和量子計算,我們一直在負責任且大膽地推動人工智慧的界限。所有這些努力都旨在利用AI為人類的更大福祉服務。
正如我們兩年前在《為什麼我們專注於AI》這篇論文中所提到的,我們的AI發展方法植根於我們的創始使命:組織全球資訊,使其普遍可及且實用。這一使命驅動我們致力於提升盡可能多人的生活品質,這一目標始終是我們的北極星。
在我們的2024年回顧中,我們慶祝Google眾多才華橫溢的團隊所取得的卓越成就,他們不懈努力以推進我們的使命。他們的努力為來年更激動人心的發展奠定了基礎。
在模型、產品和技術上的不懈創新
2024年是關於實驗、快速部署以及將最新技術交到開發者手中的一年。12月,我們推出了Gemini 2.0實驗系列的首批模型,專為代理時代設計。我們以Gemini 2.0 Flash這款多功能主力模型開啟序幕,隨後推出了來自代理研究的尖端原型,包括更新的Project Astra,探索通用AI助手的潛力;Project Mariner,一款能夠在Chrome中執行操作的早期原型實驗擴展;以及Jules,一款AI驅動的程式碼代理。我們迫切希望將Gemini 2.0的功能整合到我們的旗艦產品中,並已在Search中的AI Overviews中開始測試,超過10億人使用它來探索新型問題。
在今年早些時候,我們通過將Gemini的功能整合到更多Google產品中並推出了Gemini 1.5 Pro和Gemini 1.5 Flash取得了顯著進展。後者因其速度和效率的優化,成為開發者中最受歡迎的模型,得益於其緊湊的尺寸和成本效益。
我們還增強了AI Studio,使其作為可在桌面、iOS和Android上安裝的進階網頁應用程式(PWA),為開發者提供了一套強大的資源。公眾對NotebookLM中新功能的反應非常好,例如Audio Overviews,這些功能可以從上傳的原始資料生成深入討論,使學習更具吸引力。
語音輸入和輸出在Gemini Live、Project Astra、Journey Voices和YouTube的自動配音等產品中持續得到改進,提升了使用者互動。
遵循我們對開源社群的傳統貢獻,我們發布了來自Gemma的兩款新模型,這是基於與Gemini相同研究和技術的尖端開源模型。Gemma在問答、推理和程式設計等領域超越了同等規模的模型。我們還發布了Gemma Scope,一款幫助研究人員理解Gemma 2內部運作的工具。
我們在提高模型事實性和減少幻覺方面取得了進展。12月,我們與Google DeepMind、Google Research和Kaggle合作發布了FACTS Grounding基準,用於評估大型語言模型如何根據提供的原始資料進行回應並避免幻覺。
我們還通過創新的技術如區塊並行解碼、基於信心的延遲和推測解碼提高了機器學習效率,加快了大型語言模型的推理時間。這些改進惠及Google產品並設定了行業標準。
在體育領域,我們推出了TacticAI,一款為足球戰術提供洞察的AI系統,特別是在角球方面。
我們對研究領導力的承諾依然堅定。2010-2023年的WIPO調查顯示,Google(包括Google Research和Google DeepMind)在生成式AI引用方面的引用量是第二高引用機構的兩倍以上。
以生成式AI賦能創意願景
我們相信AI可以開啟新的創意領域,使創意表達更易於實現,幫助人們實現其藝術願景。2024年,我們推出了一系列生成式媒體工具更新,涵蓋圖像、音樂和影片。
在年初,我們推出了ImageFX和MusicFX,這些生成式AI工具可根據文字提示生成圖像和最長70秒的音頻片段。在I/O大會上,我們預覽了MusicFX DJ,旨在讓現場音樂創作更易於實現。10月,我們與Jacob Collier合作簡化了MusicFX DJ,適合新手和有志音樂家。我們還更新了音樂AI工具包Music AI Sandbox,並改進了Dream Track實驗,允許美國創作者使用文字轉音樂模型生成各種風格的器樂配樂。
我們繼續探索AI在編輯中的潛力,利用其控制物體的透明度和粗糙度等屬性。
在音頻生成方面,我們改進了影片轉音頻(V2A)技術,根據螢幕動作從文字提示生成動態音景,可與來自Veo的AI生成影片配對。
遊戲為創意探索和訓練具身代理提供了完美的遊樂場。2024年,我們推出了Genie 2,一款生成多樣化、可玩3D環境的基礎世界模型,用於訓練和評估具身代理。這是在推出SIMA之後,SIMA能在各種視訊遊戲場景中遵循自然語言指令。
智慧的架構:機器人、硬體和計算的進展
隨著我們的多模態模型越來越擅長理解世界的物理原理,它們正在推動機器人領域的激動人心進展。我們越來越接近實現更具能力且實用的機器人目標。
在年初,我們推出了AutoRT、SARA-RT和RT-Trajectory,這些是我們的機器人轉換器工作的延伸,幫助機器人更好地導航環境並更快做出決策。我們還發布了ALOHA Unleashed,教導機器人協調雙臂,以及DemoStart,該系統使用強化學習通過模擬提高多指機器人手在現實世界中的表現。
我們的研究還涉及量子電腦的錯誤校正。11月,我們推出了AlphaQubit,一款基於AI的解碼器,能高精度識別量子計算錯誤。這項Google DeepMind與Google Research的合作加速了實現可靠量子電腦的進展。在測試中,AlphaQubit比張量網路方法減少了6%的錯誤,比相關匹配減少了30%。
12月,Google Quantum AI團隊推出了最新的量子晶片Willow。Willow能在不到五分鐘內完成當今最快的超級電腦需要10 septillion年才能完成的基準計算。使用量子錯誤校正,Willow將錯誤率減半,實現了稱為“低於閾值”的里程碑,並榮獲年度物理突破獎。
發現新解決方案:科學、生物學和數學的進展
我們繼續以AI加速科學進展,發布展示AI在推進科學和數學方面力量的工具和論文。以下是一些亮點:
1月,我們推出了AlphaGeometry,一款解決複雜幾何問題的AI系統。我們更新的AlphaGeometry 2和AlphaProof,一款基於強化學習的正式數學推理系統,在2024年7月的國際數學奧林匹克中獲得銀牌表現。
與哈佛Lichtman實驗室合作,我們製作了人類大腦的奈米級映射,這是首創之舉,並向研究人員開放。這是我們十年來在連接組學方面的努力,現已擴展到人類大腦映射。
11月末,我們與皇家學會共同舉辦了AI for Science論壇,討論了蛋白質結構預測、人類大腦映射以及使用AI進行預測和野火檢測等關鍵話題。我們還在論壇上與四位諾貝爾獎得主進行了問答,內容可在Google DeepMind播客中獲取。
2024年也是一個里程碑年,Demis Hassabis、John Jumper和David Baker因其在AlphaFold 2上的工作獲得了諾貝爾化學獎,因其革新蛋白質設計而受到表彰。Geoffrey Hinton與John Hopfield因其在機器學習和人工神經網路基礎工作獲得了諾貝爾物理學獎。
Google還獲得了其他榮譽,包括NeurIPS 2024時間檢驗論文獎和Beale—Orchard-Hays獎,用於原對偶線性規劃(PDLP),現為Google OR Tools的一部分,幫助進行具有現實應用的規模化線性規劃。
為人類福祉服務的AI
今年,我們在產品上取得了重大進展,並發布了研究,展示AI如何在醫療、災害準備和教育等領域直接且立即惠及人們。
在醫療領域,AI有望實現優質醫療的民主化,特別是在心血管疾病的早期檢測。我們的研究表明,結合基本元資料的簡單指尖設備可以預測心臟健康風險。我們還推進了AI驅動的結核病診斷,展示AI如何有效篩查高結核病和HIV發病率的人群。
我們還在探索機器學習如何解決放射學、皮膚科和病理學等領域的影像專業知識短缺問題。我們發布了Derm Foundation和Path Foundation用於診斷任務和生物標記發現,與Stanford Medicine合作推出了Skin Condition Image Network(SCIN)資料集,並推出了CT Foundation用於醫療影像研究。
在教育領域,我們推出了LearnLM,一系列專為學習微調的模型,增強了Search、YouTube和Gemini的體驗。LearnLM超越了其他領先的AI模型,我們在AI Studio中向開發者提供了它。我們的對話學習夥伴LearnAbout和音頻討論工具Illuminate進一步豐富了學習體驗。
在災害預測和準備方面,我們推出了GenCast,改進了天氣和極端事件預測,以及NeuralGCM,能模擬數千天的大氣條件。GraphCast獲得了2024年MacRobert獎,提供詳細的天氣預測。
我們改進了洪水預測模型,能提前七天預測洪水,擴大覆蓋範圍至100個國家和7億人。
我們擴展了Google Translate,新增了110種新語言,幫助為超過6.14億講者打破資訊和機會的障礙。
協助制定負責任AI的標準
我們繼續在AI安全方面進行行業領先的研究,開發新工具和技術,並將其整合到我們的最新模型中。我們致力於合作應對風險。
我們對濫用的研究發現,深度偽造和越獄是最常見的問題。5月,我們推出了The Frontier Safety Framework,以識別我們先進AI模型中的新興能力,並推出了AI Responsibility Lifecycle框架。10月,我們擴展了Responsible GenAI Toolkit,使其適用於任何大型語言模型,幫助開發者負責任地構建AI。
我們發布了一篇關於《先進AI助手的倫理》的論文,探討了AI助手的技術和道德景觀以及其帶來的機會和風險。
我們擴展了SynthID的功能,在Gemini應用程式和網頁體驗中為AI生成文字添加水印,在Veo中為影片添加水印。為增強線上透明度,我們加入了內容來源與真實性聯盟(C2PA),並致力於開發更安全的新版Content Credentials標準。
除了大型語言模型外,我們分享了AlphaFold 3的生物安全方法,與行業合作夥伴推出了Coalition for Secure AI(CoSAI),並參加了AI Seoul Summit,為國際AI治理做出貢獻。
隨著我們開發AI代理等新技術,我們將繼續探索安全、保障和隱私問題。在我們的AI原則指導下,我們採取謹慎、漸進的方法,與可信測試者和外部專家進行廣泛的研究、安全訓練和風險評估。
展望2025年
2024年是AI領域取得驚人進展和激動人心的一年。我們對2025年的前景更加興奮。
隨著我們繼續在產品、科學、健康和創意領域推動AI研究的界限,我們必須深思熟慮地考慮如何以及何時部署這些技術。通過優先考慮負責任的AI實踐並促進合作,我們將繼續在構建AI惠及人類的未來中發揮關鍵作用。



¡2024 fue un año increíble para la IA! Desde Gemini 2.0 hasta la computación cuántica, es impresionante. Parece que estamos viviendo en una película de ciencia ficción. ¡No puedo esperar a ver qué nos trae 2025! 🚀




2024年のAIの進歩は本当に驚きでしたね!ジェミニ2.0から量子コンピューティングまで、まるでSF映画みたいです。2025年が楽しみです。🚀




2024 was insane with AI! From Gemini 2.0 to quantum computing, it felt like living in a sci-fi movie. The creativity boost was real, but sometimes I felt overwhelmed by the rapid changes. Still, it's exciting to see where AI will take us next! 🚀




¡2024 fue una locura con la IA! Desde Gemini 2.0 hasta la computación cuántica, parecía estar viviendo en una película de ciencia ficción. El impulso de creatividad fue real, pero a veces me sentí abrumado por los cambios rápidos. Aún así, ¡es emocionante ver a dónde nos llevará la IA a continuación! 🚀




2024年のAIの進歩は本当に驚きだった!ジェミニ2.0から量子コンピューティングまで、まるでSF映画にいるようだった。創造性の向上は確かにあったけど、急速な変化に圧倒されることもあった。それでも、AIが次にどこへ導いてくれるのか楽しみだよ!🚀




2024 foi louco com IA! Do Gemini 2.0 ao computador quântico, parecia estar vivendo em um filme de ficção científica. O aumento da criatividade foi real, mas às vezes me senti sobrecarregado com as mudanças rápidas. Ainda assim, é emocionante ver para onde a IA nos levará em seguida! 🚀












