選項
首頁
消息
2024年:AI的增長和創新年份

2024年:AI的增長和創新年份

2025-04-10
79

2024年:AI的增長和創新年份

隨著我們進入2025年,反思我們在2024年取得的令人難以置信的步伐,這是令人興奮的。從為代理時代量身定制的Gemini 2.0型號到賦予創意表達的能力,從設計新穎的蛋白質粘合劑到啟用AI-a-ables a-ables a-ables a-ables神經科學和量子計算,我們一直在推動藝術智慧和大膽的藝術智慧的邊界。所有這些努力旨在利用AI來實現更大的人類利益。

正如我們在論文中提到的 *為什麼我們兩年前專注於AI *的原因,我們的AI開發方法源於我們的創始使命,以組織世界信息並使其普遍訪問和有用。這項任務推動了我們致力於改善盡可能多的人的生活,這是我們北極星的目標。

在我們2024年的評論中,我們慶祝了Google眾多才華橫溢的團隊的非凡成就,他們不懈地努力促進我們的任務。他們的努力為未來一年更加激動人心的發展奠定了基礎。

模型,產品和技術的無情創新

2024年是關於實驗,快速部署,並將我們的最新技術交到開發人員手中。 12月,我們推出了GEMINI 2.0實驗系列的第一個模型,該系列專門為代理時代設計。我們用Gemini 2.0 Flash(我們的多功能主力)開始了事情,然後是我們的代理研究的尖端原型。其中包括一個更新的Astra項目,探索了通用AI助手的潛力; Project Mariner,一個早期的原型,能夠在Chrome中執行動作作為實驗擴展;和AI驅動的代碼代理Jules。我們渴望將Gemini 2.0的功能集成到我們的旗艦產品中,並且我們已經開始在搜索中的AI概述中進行測試,該搜索中有超過十億人使用,以探索新類型的問題。

我們還推出了深入的研究,這是Gemini Advanced中的一項新代理功能,通過創建和執行多步計劃來回答複雜問題,從而節省了數小時的研究。此外,我們引入了Gemini 2.0 Flash Thinking實驗,該模型透明地顯示了其思維過程。

在今年早些時候,我們通過將雙子座的能力集成到更多的Google產品中,並推出Gemini 1.5 Pro和Gemini 1.5 Flash,取得了長足的進步。由於其緊湊的尺寸和成本效益,後者針對速度和效率進行了優化,成為了開發人員中最受歡迎的模型。

我們還增強了AI Studio,使其可作為可在桌面,iOS和Android上安裝的漸進式Web應用程序(PWA)提供,為開發人員提供了一組強大的資源。公眾對筆記本電腦中新功能的反應,例如音頻概述,非常棒。這些功能可以從上載的原始材料中引起深入的潛水討論,從而使學習更具吸引力。

語音輸入和輸出繼續在Gemini Live,Project Astra,Journey Voices和YouTube的自動配音等產品中進行完善。

根據我們為開放社區做出貢獻的傳統,我們從Gemma發行了兩種新模型,Gemma是我們最先進的開放模型,建立在與Gemini相同的研究和技術的基礎上。在問題回答,推理和編碼等領域,Gemma的模型勝過類似大小的模型。我們還發布了Gemma Scope,該工具可幫助研究人員了解Gemma 2的內部工作。

我們在改善模型的事實和減少幻覺方面取得了長足的進步。 12月,我們發布了事實基礎,這是與Google Deepmind,Google Research和Kaggle合作開發的基準,以評估大型語言模型在提供的源材料中的響應並避免幻覺。

事實接地數據集(具有1,719個示例)旨在測試以上下文文檔為基礎的長格式響應。 我們使用事實接地測試了領先的LLM,我們很自豪地報告說,Gemini 2.0 Flash實驗,Gemini 1.5 Flash和Gemini 1.5 Pro獲得了前三名的事實分數,Gemini-2.0-Flash-Exp得分令人印象深刻,令人印象深刻的83.6%。

我們還通過創新技術(例如塊平行解碼,基於置信的遞延和投機解碼)提高了ML效率,從而加快了LLM的推理時間。這些改進有益於Google產品並設定行業標準。

在運動中,我們推出了Tacticai,這是一種用於足球戰術的AI系統,可提供戰術見解,尤其是在角球上。

我們對研究領導力的承諾仍然很強。 2010-2023 WIPO關於生成AI引用的調查顯示,包括Google Research和Google DeepMind在內的Google獲得了第二名引用機構的引用的兩倍以上。

該WIPO圖基於2024年1月的鏡頭數據,強調了Alphabet在過去十年中對生成AI研究的重要貢獻。 最後,我們與Project Starline(我們的“魔術”窗口”技術取得了進步,與HP合作,將其集成到Google Meet and Zoom等視頻會議服務中。

通過生成的AI增強創造力

我們認為AI可以解鎖創造力的新領域,使創造力更容易獲得,並幫助人們實現自己的藝術願景。 2024年,我們介紹了生成媒體工具的一系列更新,涵蓋了圖像,音樂和視頻。

在今年年初,我們啟動了ImageFX和MusicFX,生成的AI工具,這些工具可以從文本提示中創建圖像和最高70秒的音頻剪輯。在I/O時,我們預覽了MusicFX DJ,旨在使現場音樂創作更容易訪問。 10月,我們與雅各布·科利爾(Jacob Collier)合作,簡化了新的和有抱負的音樂家的音樂FX DJ。我們還更新了音樂AI工具包,音樂AI沙箱,並進化了我們的夢想軌道實驗,使我們的創作者可以使用文本對音樂模型在各種流派中生成樂器配樂。

今年晚些時候,我們發布了最新的圖像和錄像帶Imagen 2和Imagen 3。 Imagen 3是我們最高質量的文本到圖像模型,生成具有較高細節,照明和較少人工製品的圖像。 VEO 2對現實世界的物理和人類運動有了更好的了解,從而增強了現實主義。 VEO 2標誌著高質量視頻生成的重大進步。

我們繼續探索AI在編輯中的潛力,利用它來控制透明度和對象粗糙度等屬性。

這些示例展示了AI使用合成數據生成編輯材料屬性的能力。

在Audio Generation中,我們改進了視頻到ADIO(V2A)技術,從基於屏幕上的動作中產生了文本提示中的動態音景,可以將其與VEO的AI生成的視頻配對。

遊戲為創意探索和訓練體現的代理商提供了理想的操場。 2024年,我們介紹了Genie 2,這是一個基礎世界模型,生成了可玩的3D環境,用於訓練和評估體現的代理。這是在SIMA的發布之後,該啟動可以遵循各種視頻遊戲設置中的自然語言說明。

智能體系結構:機器人技術,硬件和計算的進步

隨著我們的多模型模型變得越來越擅長理解世界的物理學,他們正在為機器人技術帶來令人興奮的進步。我們越來越接近更有能力和有用的機器人的目標。

隨著Aloha釋放,我們的機器人掌握了諸如綁帶鞋帶,懸掛襯衫,修理其他機器人,插入齒輪和清潔廚房的任務。

在一年的開始時,我們引入了Autort,Sara-RT和RT-Trajectory,我們的機器人變壓器的擴展功能可幫助機器人更好地瀏覽其環境並做出更快的決策。我們還發布了Aloha釋放,教機器人協調兩個臂,而Demostart則使用強化學習來改善使用模擬的多指機器人手上的現實世界表現。

機器人變壓器2(RT-2)從網絡和機器人數據中學習,使其能夠執行諸如將草莓放入碗中的任務。 除了機器人技術之外,我們的Alphachip增強學習方法正在徹底改變數據中心和智能手機的芯片平面圖。我們發布了一個預先訓練的檢查站,以促進Alphachip開源版本的外部採用。我們還製造了Trillium,我們的第六代TPU,可用於Google Cloud客戶,展示了AI如何增強芯片設計。 Alphachip學會了優化芯片佈局,並通過其創建的每種設計來改進。

我們的研究還解決了量子計算機中的誤差校正。 11月,我們啟動了Alphaqubit,這是一種基於AI的解碼器,以高精度識別量子計算錯誤。 Google DeepMind和Google研究之間的這種合作加速了朝著可靠的量子計算機的進步。在測試中,與相關匹配相比,與張量網絡方法相比,αQubit降低了6%,而較低的誤差降低了30%。

12月,Google Quantum AI團隊推出了我們最新的量子芯片Willow。 Willow可以在不到五分鐘的時間內執行基準計算,這將使當今最快的超級計算機10億年級。使用量子誤差校正,Willow將錯誤率減半,達到了一個被稱為“閾值”的里程碑,並獲得了年度物理突破獎。

柳樹展示量子計算中最先進的性能。

發現新解決方案:科學,生物學和數學的進步

我們繼續使用AI,釋放工具和論文來加速科學進步,這些工具和論文展示了AI在推進科學和數學方面的力量。以下是一些亮點:

一月份,我們引入了AlphageMementry,這是一種用於解決複雜幾何問題的AI系統。我們更新的字母測定法2和字母隔板是一種基於加強手術的正式數學推理系統,在2024年7月的國際數學奧林匹克運動會上實現了銀牌得主的性能。

Alphagemementry 2在短短19秒內解決了2024年7月國際數學奧林匹克運動會的問題4,證明蝗蟲 +∂xpy等於180°。 我們與同構實驗室合作,引入了Alphafold 3,該實驗室預測了生命分子的結構和相互作用,旨在改變我們對生物學和藥物發現的理解。

Alphafold 3的高級建築和訓練涵蓋了從蛋白質到DNA的所有生命分子。 我們還使用Alphaproteo(一種用於創建高強度蛋白質粘合劑的AI系統)在蛋白質設計方面取得了顯著步驟,這可能會導致新藥和生物傳感器。

字母蛋白質可以為各種靶蛋白設計新的蛋白質粘合劑。

通過與哈佛大學的利希特曼實驗室(Lichtman Lab)合作,我們製作了納米級映射的人類大腦,這是其中的第一個,並將其用於研究人員。這是我們十年來連接組學的努力,現在擴展到人腦映射。

這個大腦映射項目揭示了皮層最深層中的鏡像細胞簇。

11月下旬,我們與皇家學會共同主持了AI的科學論壇,討論了諸如蛋白質結構預測,人腦映射以及使用AI進行預測和野火檢測之類的關鍵主題。我們還在論壇上舉辦了一個諾貝爾獎獲得者的問答,可在Google DeepMind播客上獲得。

2024年,Demis Hassabis,John Jumper和David Baker也是諾貝爾化學獎,因為他們在Alphafold 2上的工作而獲得了諾貝爾化學獎,這也是具有里程碑意義的一年。杰弗裡·欣頓(Geoffrey Hinton)與約翰·霍普菲爾德(John Hopfield)一起獲得了諾貝爾物理學獎,以通過人工神經網絡在機器學習方面的基礎工作。

Google還獲得了其他榮譽,包括Neurips 2024 Time Paper Awards和Beale測試和Beale(Orchard-hays for Primal-Dual Lineal編程獎(PDLP)(PDLP),現在是Google或工具的一部分,可以通過現實世界應用進行大規模的線性編程。

為了人類的利益,人工智能

今年,我們進行了重大的產品進展,並發表了研究,展示了AI如何直接並立即使醫療保健,災難準備和教育等領域的人們受益。

在醫療保健中,AI有望使優質護理民主化,特別是在早期發現心血管疾病時。我們的研究表明,一種簡單的指尖裝置,結合基本元數據,可以預測心臟健康的風險。我們還採用了針對結核病的AI診斷,表明AI如何有效地篩選具有高結核病和HIV率的人群。

Med-Gemini在MEDQA基准上取得了新的最先進得分,超過了我們以前的最佳Med-Palm 2,提高了4.6%。 我們的雙子座模型是專業人士的多功能工具,我們正在為特定領域開發微調模型。例如,Med-Gemini結合了對De-Idishified Medical Data的培訓和雙子座的能力,在MEDQA USMLE風格的問題基准上獲得了91.1%的精度。

我們還在探索機器學習如何解決放射學,皮膚病學和病理等領域成像專業知識的短缺。我們發布了DERM Foundation和Path Foundation,用於診斷任務和生物標誌物發現,並與Stanford Medicine在皮膚狀況圖像網絡(SCIN)數據集上合作,並發布了醫學成像研究的CT CT基金會。

在教育方面,我們介紹了Learnlm,這是一個微調的模型家庭,用於學習,增強搜索,YouTube和Gemini的體驗。 Learnlm的表現優於其他領先的AI模型,我們將其提供給AI Studio的開發人員。我們的對話學習伴侶,Learnabout和Audio討論工具,闡明,進一步豐富學習經驗。

在災難的預測和準備中,我們引入了Gencast,改善天氣和極端事件的預測以及能夠模擬數千天大氣條件的神經GCM。贏得2024 MacRobert獎的Graphcast提供了詳細的天氣預測。

Graphcast在10天內的預測展示了特定的濕度,表面溫度和風速。

我們改善了我們的洪水預測模型,以預測提前7天的洪水,將覆蓋範圍擴大到100個國家和7億人。

現在,我們的洪水預測模型涵蓋了100多個國家,在無法獲得物理儀表的150個國家 /地區的虛擬儀表。 AI還有助於野火檢測和緩解。我們的野火邊界圖現已在22個國家 /地區提供,我們創建了Firesat,這是一個衛星星座,可以在20分鐘內檢測到小野火。

我們將Google Translate擴展到包括110種新語言,有助於打破6.14億揚聲器的信息和機會的障礙。

Google翻譯中的這些新語言佔全球人口的8%。

幫助設定負責AI的標準

我們繼續在AI安全方面進行行業領先的研究,開發新的工具和技術,並將其整合到我們的最新模型中。我們致力於解決風險。

我們對濫用的研究發現,深層假貨和越獄是最常見的問題。 5月,我們介紹了前沿安全框架,以確定高級AI模型中的新興功能,並啟動了我們的AI責任生命週期框架。 10月,我們將負責任的Genai工具包擴展到與任何LLM合作,幫助開發人員負責任地構建AI。

我們發布了一篇有關高級AI助手的道德規範的論文,研究了AI助手的技術和道德格局以及他們所構成的機會和風險。

我們擴展了Synthid的功能,以在Gemini應用程序以及WEO中的Web體驗和視頻中加水印AI生成的文本。為了提高在線透明度,我們加入了內容出處和真實性聯盟(C2PA),並製定了內容憑據標準的新版本。

SynthID調整了預測令牌的概率得分,以確保AI生成的內容中的質量,準確性和創造力。

除了LLM之外,我們還分享了Alphafold 3的生物安全方法,與行業合作夥伴合作啟動了Secure AI(COSAI)聯盟,並參加了AI Seoul Summit,為國際AI治理做出了貢獻。

當我們開發AI代理等新技術時,我們將繼續探討安全,保障和隱私問題。在我們的AI原則的指導下,我們採取了一種故意的,逐步的方法,通過可信賴的測試人員和外部專家進行廣泛的研究,安全培訓和風險評估。

展望2025年

2024年是AI中令人難以置信的進步和興奮的一年。我們對2025年即將發生的事情更加興奮。

隨著我們繼續在產品,科學,健康和創造力方面的AI研究界限時,我們必須考慮如何以及何時部署這些技術。通過優先考慮負責任的AI實踐並促進協作,我們將繼續在建立AI受益於人類的未來方面發揮關鍵作用。

相關文章
新研究揭示大規模語言模型實際記憶的數據量 新研究揭示大規模語言模型實際記憶的數據量 AI模型實際記憶多少?新研究揭示驚人見解我們都知道,像ChatGPT、Claude和Gemini這樣的大規模語言模型(LLMs)是在龐大數據集上訓練的——來自書籍、網站、程式碼,甚至圖像和音頻等多媒體的數兆字詞。但這些數據到底發生了什麼?這些模型真的理解語言,還是僅僅在重複記憶的片段?來自Meta、Google DeepMind、Cornell和NVIDIA的一項突破性新研究終於給出了具體答案——
AI解決英國生產力難題的潛力 AI解決英國生產力難題的潛力 AI可為英國經濟增加4000億英鎊——但前提是工作者願意接受英國正面臨巨大的經濟機遇——4000億英鎊的增長由AI驅動。但關鍵在於:一半的潛力取決於工作者實際採用AI工具。雖然對AI的興趣激增,但許多人尚未利用其改變工作和生產力的能力。AI採用差距:誰被落在後面?目前,三分之二(66%)的英國工作者——特別是年長女性和低社會經濟背景人士——從未在工作中使用生成式AI。在企業方面,中小型企業在AI採
2025年4月最佳9款AI招聘工具 2025年4月最佳9款AI招聘工具 2024年改變招聘的10款最佳AI招聘工具人工智能正在顛覆招聘遊戲——理由充分。淹沒在簡歷和無休止的面試安排中的公司正轉向AI驅動的解決方案,這些方案能大幅縮短招聘時間、消除偏見,並挖掘最佳候選人。從自動篩選到智能面試助手,這些工具正在改變我們對人才招聘的思考方式。以下是我們精心挑選的今年引起轟動的頂尖AI招聘平台清單:1. Mega HR Mega HR不僅僅是另一個申請者追蹤系統——它由Me
評論 (25)
0/200
JustinMartin
JustinMartin 2025-04-12 08:00:00

2024 was a wild ride with AI! From Gemini 2.0 to quantum computing, it's like we're living in a sci-fi movie. Loved seeing all the creative stuff AI can do, but sometimes it felt a bit too much, you know? Can't wait to see what 2025 brings, but maybe slow down a bit, AI?

BillyEvans
BillyEvans 2025-04-12 08:00:00

¡2024 fue increíble con la IA! Desde Gemini 2.0 hasta la computación cuántica, parece que vivimos en una película de ciencia ficción. Me encantó ver todo lo creativo que puede hacer la IA, pero a veces se sintió un poco abrumador, ¿sabes? Espero con ansias lo que 2025 traiga, pero tal vez, ¿puede la IA ralentizar un poco?

WalterWhite
WalterWhite 2025-04-10 08:00:00

2024年はAIがすごかったね!ジェミニ2.0から量子コンピューティングまで、まるでSF映画に住んでいるみたい。AIができるクリエイティブなことが大好きだけど、時々少し多すぎる感じがするんだよね。2025年が楽しみだけど、AI、ちょっとペースを落とそうか?

WillieRodriguez
WillieRodriguez 2025-04-11 08:00:00

2024 war ein wilder Ritt mit KI! Von Gemini 2.0 bis zur Quantencomputing, es fühlt sich an, als lebten wir in einem Sci-Fi-Film. Ich liebe das kreative Zeug, was KI kann, aber manchmal war es ein bisschen zu viel, weißt du? Ich freue mich auf 2025, aber vielleicht sollte die KI ein bisschen langsamer machen?

KeithJones
KeithJones 2025-04-12 08:00:00

Năm 2024 thật tuyệt vời với trí tuệ nhân tạo! Từ Gemini 2.0 đến máy tính lượng tử, cảm giác như chúng ta đang sống trong phim khoa học viễn tưởng. Mình thích những điều sáng tạo mà AI có thể làm, nhưng đôi khi nó hơi quá sức, bạn biết đấy? Mong chờ năm 2025, nhưng có lẽ AI nên chậm lại một chút?

StephenRamirez
StephenRamirez 2025-04-10 08:00:00

2024 was wild! AI's growth was insane, from Gemini 2.0 to protein binders. It's like every week there was something new and mind-blowing. Can't wait to see what 2025 brings, but 2024 set the bar high!

回到頂部
OR