2024年:AIの驚くべき成長と革新の年

2025年に足を踏み入れるにつれて、2024年に行った信じられないほどの進歩を振り返ることはスリリングです。エージェントの時代に合わせたGemini 2.0モデルの立ち上げから、創造的な表現に力を与えることまで、新規タンパク質バインダーの設計からAIが有効な神経科学と量子コンピューティングの前進まで、人工知能の責任を補完して大胆に推進しています。これらの努力はすべて、人類の利益のためにAIを利用することを目的としています。
2年前にAI *に焦点を当てた理由で述べたように、AI開発へのアプローチは、世界の情報を整理し、普遍的にアクセスしやすく有用にするための設立ミッションに根ざしています。このミッションは、できるだけ多くの人々の生活を強化するという私たちのコミットメントを駆り立てます。これは、私たちの北の星のままである目標です。
2024年の年間レビューでは、私たちの使命を進めるためにたゆまぬ努力をしたGoogleの多くの才能あるチームの驚くべき成果を祝います。彼らの努力は、今後1年間でさらにエキサイティングな開発の舞台となっています。
モデル、製品、テクノロジーの容赦ない革新
2024年は、実験、迅速な展開、そして最新のテクノロジーを開発者の手に委ねることに関するものでした。 12月に、エージェント時代向けに設計されたGemini 2.0実験シリーズの最初のモデルを発表しました。私たちは、多才な主力であるGemini 2.0 Flashで物事を追い出し、その後、エージェント研究から最先端のプロトタイプが続きました。これらには、普遍的なAIアシスタントの可能性を調査する更新されたプロジェクトAstraが含まれます。 Project Mariner、実験的拡張としてChromeでアクションを実行できる初期のプロトタイプ。 AI搭載のコードエージェントであるジュール。 Gemini 2.0の機能をフラッグシップ製品に統合したいと思っています。また、新しい種類の質問を探索するために10億人以上が使用する検索内のAI概要でのテストをすでに開始しています。
また、Gemini Advancedの新しいエージェント機能であるDeep Researchを展開しました。さらに、Gemini 2.0 Flash Thinking Experimentalを導入しました。これは、思考プロセスを透過的に表示するモデルです。今年の初めに、Geminiの機能をより多くのGoogle製品に統合し、Gemini 1.5 ProとGemini 1.5 Flashを発売することにより、大きな進歩を遂げました。後者は、速度と効率のために最適化されており、そのコンパクトなサイズと費用対効果のおかげで、開発者の中で最も人気のあるモデルになりました。
また、AI Studioを強化し、デスクトップ、iOS、Androidにインストール可能なプログレッシブWebアプリ(PWA)として利用できるようにし、開発者に堅牢なリソースセットを提供しました。オーディオの概要など、Notebooklmの新機能に対する一般の対応は素晴らしいものでした。これらの機能は、アップロードされたソース素材からディープダイブディスカッションを生成し、学習をより魅力的にします。
スピーチの入力と出力は、Gemini Live、Project Astra、Journey Voices、YouTubeの自動ダビングなどの製品で引き続き洗練され、ユーザーの相互作用が強化されています。
オープンコミュニティに貢献するという伝統に沿って、私たちはジェミニと同じ研究と技術に基づいて構築された、最先端のオープンモデルであるジェマから2つの新しいモデルをリリースしました。 Gemmaは、質問の回答、推論、コーディングなどの分野で同様にサイズのモデルを上回りました。また、Gemma 2の内側の仕組みを研究者が理解できるようにするためのツールであるGemma Scopeもリリースしました。
私たちは、モデルの事実を改善し、幻覚を減らすことに進みました。 12月に、Google Deepmind、Google Research、およびKaggleと協力して開発されたベンチマークであるFacts Groundingを発表し、提供されたソース素材での反応をどの程度うまく接地し、幻覚を回避します。
1,719の例を備えたファクトの接地データセットは、コンテキストドキュメントに基づいた長い形式の応答をテストするように設計されています。 事実の接地を使用して主要なLLMSをテストしました。Gemini2.0Flash Expermisureal、Gemini 1.5 Flash、およびGemini 1.5 Proが、Gemini-2.0-Flash-Expが印象的な83.6%を獲得して、上位3つの事実上のスコアを達成したことを報告できることを誇りに思います。また、LLMSの推論時間を高速化するブロックワイズパラレルデコード、信頼ベースの延期、投機的デコードなどの革新的な技術を通じてML効率を改善しました。これらの改善は、Google製品に利益をもたらし、業界標準を設定します。
スポーツでは、特にコーナーキックで戦術的な洞察を提供するサッカー戦術のためのAIシステムであるTacticaiを立ち上げました。
研究のリーダーシップへの私たちのコミットメントは依然として強力です。生成AIの引用に関する2010-2023のWIPO調査では、Google ResearchやGoogle Deepmindを含むGoogleが2番目に引用された機関の引用の2倍以上を受け取ったことが示されました。
2024年1月のレンズからのデータに基づいたこのWIPOグラフは、過去10年間の生成AI研究に対するアルファベットの重要な貢献を強調しています。 最後に、HPと提携してGoogle MeetやZoomなどのビデオ会議サービスに統合することを目指して、HPと提携して、「マジックウィンドウ」テクノロジーであるProject Starlineで進歩しました。生成AIで創造的なビジョンを強化します
AIは創造性の新しい領域のロックを解除し、創造的な表現をよりアクセスしやすくし、人々が芸術的なビジョンを実現するのを助けることができると考えています。 2024年に、画像、音楽、ビデオをカバーする生成メディアツールに一連の更新を紹介しました。
今年の初めに、画像を作成する生成AIツールと、テキストプロンプトから最大の70秒のオーディオクリップを作成するImageFXとMusicFXを起動しました。 I/Oでは、ライブミュージック作成をよりアクセスしやすくするように設計されたMusicFX DJをプレビューしました。 10月に、私たちはJacob Collierと協力して、新しく意欲的なミュージシャンのMusicFX DJを簡素化しました。また、Music AI Toolkit、Music AI Sandboxを更新し、ドリームトラックの実験を進化させ、クリエイターがテキストから音楽モデルを使用してさまざまなジャンルで楽器のサウンドトラックを生成できるようにしました。
今年の後半に、最新の画像モデルとビデオモデルであるVeo 2とImagen 3をリリースしました。最高品質のテキストからイメージモデルであるImagen 3は、優れたディテール、照明、およびより少ないアーティファクトを備えた画像を生成します。 VEO 2は、現実世界の物理学と人間の動きをよりよく理解し、リアリズムを高めました。 VEO 2は、高品質のビデオ生成において大きな進歩を示しています。編集におけるAIの可能性を調査し続け、それを使用して、オブジェクトの透明性や粗さなどの属性を制御しました。
これらの例は、合成データ生成を使用して材料プロパティを編集するAIの能力を示しています。オーディオ生成では、ビデオからオーディオ(V2A)テクノロジーを改善し、画面上のアクションに基づいてテキストプロンプトから動的なサウンドスケープを生成しました。
ゲームは、創造的な探索とトレーニングの具体化されたエージェントに最適な遊び場を提供します。 2024年に、具体化されたエージェントのトレーニングと評価のために多様で再生可能な3D環境を生成するファンデーションの世界モデルであるGenie 2を導入しました。これは、さまざまなビデオゲーム設定で自然言語の指示に従うことができるSIMAの発売に続きました。
インテリジェンスのアーキテクチャ:ロボット工学、ハードウェア、コンピューティングの進歩
マルチモーダルモデルが世界の物理学を理解するのに熟達するにつれて、ロボット工学のエキサイティングな進歩を可能にしています。私たちは、より有能で有益なロボットの目標に近づいています。
Aloha Unleashedを使用すると、ロボットは靴ひもを結ぶ、シャツをぶら下げ、他のロボットの修理、ギアの挿入、キッチンの掃除などのタスクを習得しました。今年の開始時に、Autort、Sara-RT、およびRT-Tramjectoryを導入しました。ロボット工学トランスの拡張機能は、ロボットが環境をより適切にナビゲートし、より迅速な決定を下すのに役立ちます。また、Aloha Unleashedをリリースし、ロボットに2つのアームを調整するためにロボットを教え、Demostartは、シミュレーションを使用してマルチフィンガーのロボットハンドの実世界のパフォーマンスを改善するために補強学習を使用します。
Robotic Transformer 2(RT-2)は、WebとRoboticsの両方のデータから学習し、ボウルにイチゴを置くなどのタスクを実行できるようにします。 ロボットを超えて、当社のAlphachip Renection Learning Methodは、データセンターとスマートフォンのチップフロアプランニングに革命をもたらしています。 Alphachipのオープンソースリリースの外部採用を促進するために、事前に訓練されたチェックポイントをリリースしました。また、Google Cloudの顧客が利用できる第6世代のTPUであるTrilliumを作成し、AIがチップ設計を強化する方法を紹介しました。 Alphachipは、チップレイアウトを最適化することを学び、作成する各デザインで改善します。私たちの研究は、量子コンピューターのエラー修正にも取り組みました。 11月に、ALPhaqubitを発売しました。これは、高精度で量子コンピューティングエラーを識別するAIベースのデコーダーです。 Google DeepmindとGoogle Researchの間のこのコラボレーションは、信頼できる量子コンピューターへの進歩を加速させました。テストでは、Alphaqubitはテンソルネットワーク法と比較してエラーを6%減らし、相関マッチングと比較して30%減少しました。
12月、Google Quantum AIチームは、最新の量子チップであるWillowを発表しました。 Willowは、5分未満でベンチマーク計算を実行でき、今日の最速のスーパーコンピューターは10敗年になります。量子エラー補正を使用して、ウィローはエラー率を半分にし、「以下のしきい値」と呼ばれるマイルストーンを達成し、今年の物理ブレークスルー賞を獲得しました。
Willowは、量子コンピューティングの最先端のパフォーマンスを紹介しています。新しいソリューションの発見:科学、生物学、数学の進歩
私たちはAIとの科学的進歩を加速し続け、科学と数学の進歩におけるAIの力を示すツールと論文をリリースしました。ここにいくつかのハイライトがあります:
1月に、複雑な幾何学の問題を解決するためのAIシステムであるAlphageometryを導入しました。私たちの更新されたアルファージ測定2と、正式な数学の推論のための強化学習ベースのシステムであるアルファプルーフは、2024年7月の国際数学オリンピアードで銀メダリストのパフォーマンスを達成しました。
Alphageometry 2は、2024年7月の国際数学的オリンピアードの問題4をわずか19秒で解決し、kil +Δxpyが180°に等しいことを証明しました。 同型ラボと協力して、AlphaFold 3を導入しました。これは、生物学と創薬の理解を変えることを目指して、生命の分子の構造と相互作用を予測します。 Alphafold 3の高度なアーキテクチャとトレーニングは、タンパク質からDNAまで、すべての生命の分子をカバーしています。 また、高強度タンパク質バインダーを作成するためのAIシステムであるAlphaproteoを使用して、タンパク質設計に大きな進歩を遂げました。これは、新薬やバイオセンサーにつながる可能性があります。 アルファポテオは、さまざまな標的タンパク質向けに新しいタンパク質バインダーを設計できます。 HarvardのLichtman Labと共同で、最初の人間の脳のナノスケールマッピングを作成し、研究者が利用できるようにしました。これは、コネクマクでの10年にわたる努力に続き、現在は人間の脳マッピングに拡張されています。
この脳のマッピングプロジェクトは、皮質の最も深い層のミラーイメージセルクラスターを明らかにします。 11月下旬に、科学フォーラムのAIを王立協会と共催し、タンパク質構造の予測、人間の脳マッピング、予測や山火事の検出のためにAIを使用する重要なトピックについて議論しました。また、Google Deepmind Podcastで入手できるフォーラムで4人のノーベル賞受賞者を備えたQ&Aもホストしました。
2024年は、デミス・ハッサビス、ジョン・ジャンパー、デビッド・ベイカーがタンパク質設計の革新で認められたAlphafold 2での作業でノーベル化学賞を受賞したため、ランドマーク年でもありました。 Geoffrey Hintonは、John Hopfieldとともに、人工ニューラルネットワークを使用した機械学習における基礎作業でノーベル物理学の賞を受賞しました。
Googleはまた、Neurips 2024 Test of Time Paper AwardsやBeale-The Beale-Hays for Primal-Dual Linear Programming(PDLP)を含む追加の称賛を受けました。
人類の利益のためにAI
今年、私たちは大幅な製品の進歩を行い、AIがヘルスケア、災害準備、教育などの分野で人々が直接かつ即座に利益をもたらす方法を示す研究を発表しました。
ヘルスケアでは、AIは、特に心血管疾患の早期発見において、質の高いケアを民主化することを約束しています。私たちの研究は、基本的なメタデータと組み合わされた単純な指先デバイスが心臓の健康リスクを予測できることを示しました。また、結核のAI対応診断を進め、AIが高い結核とHIV率の集団を効果的にスクリーニングする方法を示しました。
Med-Geminiは、Medqaベンチマークで新しい最先端のスコアを達成し、以前のベストであるMed-Palm 2を4.6%上回りました。 Geminiモデルは、専門家向けの多用途ツールであり、特定のドメイン向けに微調整されたモデルを開発しています。たとえば、Med-Geminiは、識別された医療データのトレーニングとGeminiの能力を組み合わせて、MedQA USMLEスタイルの質問ベンチマークの91.1%の精度を達成しています。また、機械学習が放射線学、皮膚科、病理学などの分野でのイメージングの専門知識における不足に対処する方法を調査しています。 Derm Foundation and Path Foundation for Diagnostic Tasks and Biomarker Discoveryをリリースし、Stanford Medicine on the Skin Condition Image Network(SCIN)データセットと協力し、医療画像研究のためのCT Foundationを発表しました。
教育では、学習のために微調整されたモデルのファミリーであるLearnLMを紹介し、Search、YouTube、およびGeminiの体験を強化しました。 LearnLMは他の主要なAIモデルを上回り、AI Studioの開発者が利用できるようにしました。私たちの会話学習コンパニオン、LearnAbout、およびオーディオディスカッションツールは、照らし、学習体験をさらに豊かにします。
災害の予測と準備では、数千日間の大気条件をシミュレートできるように、Gencast、天気と極端なイベント予測、およびNeuralGCMの改善を導入しました。 2024 Macrobert Awardを受賞したGraphcastは、詳細な気象予測を提供します。
10日間のグラフキャストの予測は、特定の湿度、表面温度、風速を示しています。洪水予測モデルを改善して、7日前に洪水を予測し、100か国と7億人にカバレッジを拡大しました。
当社の洪水予測モデルは現在、100か国以上をカバーしており、物理ゲージが利用できない150か国に仮想ゲージがあります。 AIはまた、山火事の検出と緩和を支援します。私たちの山火事の境界マップは22か国で利用可能になり、20分以内に小さな山火事を検出できる衛星星座であるFiresatを作成しました。 Google Translateを110の新しい言語を含めるように拡張し、6億1,400万人以上のスピーカーの情報と機会への障壁を打ち破るのに役立ちました。
Google翻訳のこれらの新しい言語は、世界の人口の8%を表しています。責任あるAIの標準を設定するのを支援します
AIの安全性に関する業界をリードする研究を続け、新しいツールとテクニックを開発し、これらを最新のモデルに統合しました。リスクに対処するために協力することに取り組んでいます。
誤用に関する私たちの研究は、深い偽物と脱獄が最も一般的な問題であることを発見しました。 5月に、Frontier Safety Frameworkを導入して、高度なAIモデルの新しい機能を特定し、AI責任ライフサイクルフレームワークを開始しました。 10月に、責任あるGenai Toolkitを拡張して、あらゆるLLMと連携し、開発者が責任を持ってAIを構築するのを支援しました。
高度なAIアシスタントの倫理に関する論文をリリースし、AIアシスタントの技術的および道徳的な状況と、それらがもたらす機会とリスクを調べました。
SynthIDの機能をGeminiアプリのAIに透けて生成されたテキストに拡張し、VEOのWebエクスペリエンスとビデオを拡張しました。オンラインの透明性を高めるために、コンテンツの起源と信頼性のための連合(C2PA)に参加し、Content Scordentials Standardの新しいより安全なバージョンに取り組みました。
SynthIDは、AIが生成されたコンテンツの品質、精度、および創造性を確保するために、予測されるトークンの確率スコアを調整します。 LLMSを超えて、AlphaFold 3のバイオセキュリティアプローチを共有し、業界パートナーと協力してSecure AI(COSAI)の連合を立ち上げ、AI Seoul Summitに参加して国際AIガバナンスに貢献しました。
AIエージェントのような新しいテクノロジーを開発するにつれて、安全性、セキュリティ、プライバシーの質問を引き続き検討します。私たちのAIの原則に導かれて、私たちは意図的で漸進的なアプローチを採用しており、信頼できるテスターと外部の専門家との広範な研究、安全訓練、リスク評価を実施しています。
2025年を楽しみにしています
2024年は、AIの信じられないほどの進歩と興奮の年でした。 2025年に何が来るのかについてさらに興奮しています。
製品、科学、健康、創造性のAI研究の境界を押し広げ続けているため、これらのテクノロジーをいつどのように展開するかを慎重に検討する必要があります。責任あるAIプラクティスに優先順位を付け、コラボレーションを促進することにより、AIが人類に利益をもたらす未来を築く上で重要な役割を果たし続けます。
関連記事
新研究揭示大規模語言模型實際記憶的數據量
AI模型實際記憶多少?新研究揭示驚人見解我們都知道,像ChatGPT、Claude和Gemini這樣的大規模語言模型(LLMs)是在龐大數據集上訓練的——來自書籍、網站、程式碼,甚至圖像和音頻等多媒體的數兆字詞。但這些數據到底發生了什麼?這些模型真的理解語言,還是僅僅在重複記憶的片段?來自Meta、Google DeepMind、Cornell和NVIDIA的一項突破性新研究終於給出了具體答案——
AI解決英國生產力難題的潛力
AI可為英國經濟增加4000億英鎊——但前提是工作者願意接受英國正面臨巨大的經濟機遇——4000億英鎊的增長由AI驅動。但關鍵在於:一半的潛力取決於工作者實際採用AI工具。雖然對AI的興趣激增,但許多人尚未利用其改變工作和生產力的能力。AI採用差距:誰被落在後面?目前,三分之二(66%)的英國工作者——特別是年長女性和低社會經濟背景人士——從未在工作中使用生成式AI。在企業方面,中小型企業在AI採
2025年4月最佳9款AI招聘工具
2024年改變招聘的10款最佳AI招聘工具人工智能正在顛覆招聘遊戲——理由充分。淹沒在簡歷和無休止的面試安排中的公司正轉向AI驅動的解決方案,這些方案能大幅縮短招聘時間、消除偏見,並挖掘最佳候選人。從自動篩選到智能面試助手,這些工具正在改變我們對人才招聘的思考方式。以下是我們精心挑選的今年引起轟動的頂尖AI招聘平台清單:1. Mega HR Mega HR不僅僅是另一個申請者追蹤系統——它由Me
コメント (25)
0/200
JustinMartin
2025年4月12日 0:00:00 GMT
2024 was a wild ride with AI! From Gemini 2.0 to quantum computing, it's like we're living in a sci-fi movie. Loved seeing all the creative stuff AI can do, but sometimes it felt a bit too much, you know? Can't wait to see what 2025 brings, but maybe slow down a bit, AI?
0
BillyEvans
2025年4月12日 0:00:00 GMT
¡2024 fue increíble con la IA! Desde Gemini 2.0 hasta la computación cuántica, parece que vivimos en una película de ciencia ficción. Me encantó ver todo lo creativo que puede hacer la IA, pero a veces se sintió un poco abrumador, ¿sabes? Espero con ansias lo que 2025 traiga, pero tal vez, ¿puede la IA ralentizar un poco?
0
WalterWhite
2025年4月10日 0:00:00 GMT
2024年はAIがすごかったね!ジェミニ2.0から量子コンピューティングまで、まるでSF映画に住んでいるみたい。AIができるクリエイティブなことが大好きだけど、時々少し多すぎる感じがするんだよね。2025年が楽しみだけど、AI、ちょっとペースを落とそうか?
0
WillieRodriguez
2025年4月11日 0:00:00 GMT
2024 war ein wilder Ritt mit KI! Von Gemini 2.0 bis zur Quantencomputing, es fühlt sich an, als lebten wir in einem Sci-Fi-Film. Ich liebe das kreative Zeug, was KI kann, aber manchmal war es ein bisschen zu viel, weißt du? Ich freue mich auf 2025, aber vielleicht sollte die KI ein bisschen langsamer machen?
0
KeithJones
2025年4月12日 0:00:00 GMT
Năm 2024 thật tuyệt vời với trí tuệ nhân tạo! Từ Gemini 2.0 đến máy tính lượng tử, cảm giác như chúng ta đang sống trong phim khoa học viễn tưởng. Mình thích những điều sáng tạo mà AI có thể làm, nhưng đôi khi nó hơi quá sức, bạn biết đấy? Mong chờ năm 2025, nhưng có lẽ AI nên chậm lại một chút?
0
StephenRamirez
2025年4月10日 0:00:00 GMT
2024 was wild! AI's growth was insane, from Gemini 2.0 to protein binders. It's like every week there was something new and mind-blowing. Can't wait to see what 2025 brings, but 2024 set the bar high!
0
2025年に足を踏み入れるにつれて、2024年に行った信じられないほどの進歩を振り返ることはスリリングです。エージェントの時代に合わせたGemini 2.0モデルの立ち上げから、創造的な表現に力を与えることまで、新規タンパク質バインダーの設計からAIが有効な神経科学と量子コンピューティングの前進まで、人工知能の責任を補完して大胆に推進しています。これらの努力はすべて、人類の利益のためにAIを利用することを目的としています。
2年前にAI *に焦点を当てた理由で述べたように、AI開発へのアプローチは、世界の情報を整理し、普遍的にアクセスしやすく有用にするための設立ミッションに根ざしています。このミッションは、できるだけ多くの人々の生活を強化するという私たちのコミットメントを駆り立てます。これは、私たちの北の星のままである目標です。
2024年の年間レビューでは、私たちの使命を進めるためにたゆまぬ努力をしたGoogleの多くの才能あるチームの驚くべき成果を祝います。彼らの努力は、今後1年間でさらにエキサイティングな開発の舞台となっています。
モデル、製品、テクノロジーの容赦ない革新
2024年は、実験、迅速な展開、そして最新のテクノロジーを開発者の手に委ねることに関するものでした。 12月に、エージェント時代向けに設計されたGemini 2.0実験シリーズの最初のモデルを発表しました。私たちは、多才な主力であるGemini 2.0 Flashで物事を追い出し、その後、エージェント研究から最先端のプロトタイプが続きました。これらには、普遍的なAIアシスタントの可能性を調査する更新されたプロジェクトAstraが含まれます。 Project Mariner、実験的拡張としてChromeでアクションを実行できる初期のプロトタイプ。 AI搭載のコードエージェントであるジュール。 Gemini 2.0の機能をフラッグシップ製品に統合したいと思っています。また、新しい種類の質問を探索するために10億人以上が使用する検索内のAI概要でのテストをすでに開始しています。
今年の初めに、Geminiの機能をより多くのGoogle製品に統合し、Gemini 1.5 ProとGemini 1.5 Flashを発売することにより、大きな進歩を遂げました。後者は、速度と効率のために最適化されており、そのコンパクトなサイズと費用対効果のおかげで、開発者の中で最も人気のあるモデルになりました。
また、AI Studioを強化し、デスクトップ、iOS、Androidにインストール可能なプログレッシブWebアプリ(PWA)として利用できるようにし、開発者に堅牢なリソースセットを提供しました。オーディオの概要など、Notebooklmの新機能に対する一般の対応は素晴らしいものでした。これらの機能は、アップロードされたソース素材からディープダイブディスカッションを生成し、学習をより魅力的にします。
スピーチの入力と出力は、Gemini Live、Project Astra、Journey Voices、YouTubeの自動ダビングなどの製品で引き続き洗練され、ユーザーの相互作用が強化されています。
オープンコミュニティに貢献するという伝統に沿って、私たちはジェミニと同じ研究と技術に基づいて構築された、最先端のオープンモデルであるジェマから2つの新しいモデルをリリースしました。 Gemmaは、質問の回答、推論、コーディングなどの分野で同様にサイズのモデルを上回りました。また、Gemma 2の内側の仕組みを研究者が理解できるようにするためのツールであるGemma Scopeもリリースしました。
私たちは、モデルの事実を改善し、幻覚を減らすことに進みました。 12月に、Google Deepmind、Google Research、およびKaggleと協力して開発されたベンチマークであるFacts Groundingを発表し、提供されたソース素材での反応をどの程度うまく接地し、幻覚を回避します。
また、LLMSの推論時間を高速化するブロックワイズパラレルデコード、信頼ベースの延期、投機的デコードなどの革新的な技術を通じてML効率を改善しました。これらの改善は、Google製品に利益をもたらし、業界標準を設定します。
スポーツでは、特にコーナーキックで戦術的な洞察を提供するサッカー戦術のためのAIシステムであるTacticaiを立ち上げました。
研究のリーダーシップへの私たちのコミットメントは依然として強力です。生成AIの引用に関する2010-2023のWIPO調査では、Google ResearchやGoogle Deepmindを含むGoogleが2番目に引用された機関の引用の2倍以上を受け取ったことが示されました。
生成AIで創造的なビジョンを強化します
AIは創造性の新しい領域のロックを解除し、創造的な表現をよりアクセスしやすくし、人々が芸術的なビジョンを実現するのを助けることができると考えています。 2024年に、画像、音楽、ビデオをカバーする生成メディアツールに一連の更新を紹介しました。
今年の初めに、画像を作成する生成AIツールと、テキストプロンプトから最大の70秒のオーディオクリップを作成するImageFXとMusicFXを起動しました。 I/Oでは、ライブミュージック作成をよりアクセスしやすくするように設計されたMusicFX DJをプレビューしました。 10月に、私たちはJacob Collierと協力して、新しく意欲的なミュージシャンのMusicFX DJを簡素化しました。また、Music AI Toolkit、Music AI Sandboxを更新し、ドリームトラックの実験を進化させ、クリエイターがテキストから音楽モデルを使用してさまざまなジャンルで楽器のサウンドトラックを生成できるようにしました。
編集におけるAIの可能性を調査し続け、それを使用して、オブジェクトの透明性や粗さなどの属性を制御しました。
オーディオ生成では、ビデオからオーディオ(V2A)テクノロジーを改善し、画面上のアクションに基づいてテキストプロンプトから動的なサウンドスケープを生成しました。
ゲームは、創造的な探索とトレーニングの具体化されたエージェントに最適な遊び場を提供します。 2024年に、具体化されたエージェントのトレーニングと評価のために多様で再生可能な3D環境を生成するファンデーションの世界モデルであるGenie 2を導入しました。これは、さまざまなビデオゲーム設定で自然言語の指示に従うことができるSIMAの発売に続きました。
インテリジェンスのアーキテクチャ:ロボット工学、ハードウェア、コンピューティングの進歩
マルチモーダルモデルが世界の物理学を理解するのに熟達するにつれて、ロボット工学のエキサイティングな進歩を可能にしています。私たちは、より有能で有益なロボットの目標に近づいています。
今年の開始時に、Autort、Sara-RT、およびRT-Tramjectoryを導入しました。ロボット工学トランスの拡張機能は、ロボットが環境をより適切にナビゲートし、より迅速な決定を下すのに役立ちます。また、Aloha Unleashedをリリースし、ロボットに2つのアームを調整するためにロボットを教え、Demostartは、シミュレーションを使用してマルチフィンガーのロボットハンドの実世界のパフォーマンスを改善するために補強学習を使用します。
私たちの研究は、量子コンピューターのエラー修正にも取り組みました。 11月に、ALPhaqubitを発売しました。これは、高精度で量子コンピューティングエラーを識別するAIベースのデコーダーです。 Google DeepmindとGoogle Researchの間のこのコラボレーションは、信頼できる量子コンピューターへの進歩を加速させました。テストでは、Alphaqubitはテンソルネットワーク法と比較してエラーを6%減らし、相関マッチングと比較して30%減少しました。
12月、Google Quantum AIチームは、最新の量子チップであるWillowを発表しました。 Willowは、5分未満でベンチマーク計算を実行でき、今日の最速のスーパーコンピューターは10敗年になります。量子エラー補正を使用して、ウィローはエラー率を半分にし、「以下のしきい値」と呼ばれるマイルストーンを達成し、今年の物理ブレークスルー賞を獲得しました。
新しいソリューションの発見:科学、生物学、数学の進歩
私たちはAIとの科学的進歩を加速し続け、科学と数学の進歩におけるAIの力を示すツールと論文をリリースしました。ここにいくつかのハイライトがあります:
1月に、複雑な幾何学の問題を解決するためのAIシステムであるAlphageometryを導入しました。私たちの更新されたアルファージ測定2と、正式な数学の推論のための強化学習ベースのシステムであるアルファプルーフは、2024年7月の国際数学オリンピアードで銀メダリストのパフォーマンスを達成しました。
HarvardのLichtman Labと共同で、最初の人間の脳のナノスケールマッピングを作成し、研究者が利用できるようにしました。これは、コネクマクでの10年にわたる努力に続き、現在は人間の脳マッピングに拡張されています。
11月下旬に、科学フォーラムのAIを王立協会と共催し、タンパク質構造の予測、人間の脳マッピング、予測や山火事の検出のためにAIを使用する重要なトピックについて議論しました。また、Google Deepmind Podcastで入手できるフォーラムで4人のノーベル賞受賞者を備えたQ&Aもホストしました。
2024年は、デミス・ハッサビス、ジョン・ジャンパー、デビッド・ベイカーがタンパク質設計の革新で認められたAlphafold 2での作業でノーベル化学賞を受賞したため、ランドマーク年でもありました。 Geoffrey Hintonは、John Hopfieldとともに、人工ニューラルネットワークを使用した機械学習における基礎作業でノーベル物理学の賞を受賞しました。
Googleはまた、Neurips 2024 Test of Time Paper AwardsやBeale-The Beale-Hays for Primal-Dual Linear Programming(PDLP)を含む追加の称賛を受けました。
人類の利益のためにAI
今年、私たちは大幅な製品の進歩を行い、AIがヘルスケア、災害準備、教育などの分野で人々が直接かつ即座に利益をもたらす方法を示す研究を発表しました。
ヘルスケアでは、AIは、特に心血管疾患の早期発見において、質の高いケアを民主化することを約束しています。私たちの研究は、基本的なメタデータと組み合わされた単純な指先デバイスが心臓の健康リスクを予測できることを示しました。また、結核のAI対応診断を進め、AIが高い結核とHIV率の集団を効果的にスクリーニングする方法を示しました。
また、機械学習が放射線学、皮膚科、病理学などの分野でのイメージングの専門知識における不足に対処する方法を調査しています。 Derm Foundation and Path Foundation for Diagnostic Tasks and Biomarker Discoveryをリリースし、Stanford Medicine on the Skin Condition Image Network(SCIN)データセットと協力し、医療画像研究のためのCT Foundationを発表しました。
教育では、学習のために微調整されたモデルのファミリーであるLearnLMを紹介し、Search、YouTube、およびGeminiの体験を強化しました。 LearnLMは他の主要なAIモデルを上回り、AI Studioの開発者が利用できるようにしました。私たちの会話学習コンパニオン、LearnAbout、およびオーディオディスカッションツールは、照らし、学習体験をさらに豊かにします。
災害の予測と準備では、数千日間の大気条件をシミュレートできるように、Gencast、天気と極端なイベント予測、およびNeuralGCMの改善を導入しました。 2024 Macrobert Awardを受賞したGraphcastは、詳細な気象予測を提供します。
洪水予測モデルを改善して、7日前に洪水を予測し、100か国と7億人にカバレッジを拡大しました。
Google Translateを110の新しい言語を含めるように拡張し、6億1,400万人以上のスピーカーの情報と機会への障壁を打ち破るのに役立ちました。
責任あるAIの標準を設定するのを支援します
AIの安全性に関する業界をリードする研究を続け、新しいツールとテクニックを開発し、これらを最新のモデルに統合しました。リスクに対処するために協力することに取り組んでいます。
誤用に関する私たちの研究は、深い偽物と脱獄が最も一般的な問題であることを発見しました。 5月に、Frontier Safety Frameworkを導入して、高度なAIモデルの新しい機能を特定し、AI責任ライフサイクルフレームワークを開始しました。 10月に、責任あるGenai Toolkitを拡張して、あらゆるLLMと連携し、開発者が責任を持ってAIを構築するのを支援しました。
高度なAIアシスタントの倫理に関する論文をリリースし、AIアシスタントの技術的および道徳的な状況と、それらがもたらす機会とリスクを調べました。
SynthIDの機能をGeminiアプリのAIに透けて生成されたテキストに拡張し、VEOのWebエクスペリエンスとビデオを拡張しました。オンラインの透明性を高めるために、コンテンツの起源と信頼性のための連合(C2PA)に参加し、Content Scordentials Standardの新しいより安全なバージョンに取り組みました。
LLMSを超えて、AlphaFold 3のバイオセキュリティアプローチを共有し、業界パートナーと協力してSecure AI(COSAI)の連合を立ち上げ、AI Seoul Summitに参加して国際AIガバナンスに貢献しました。
AIエージェントのような新しいテクノロジーを開発するにつれて、安全性、セキュリティ、プライバシーの質問を引き続き検討します。私たちのAIの原則に導かれて、私たちは意図的で漸進的なアプローチを採用しており、信頼できるテスターと外部の専門家との広範な研究、安全訓練、リスク評価を実施しています。
2025年を楽しみにしています
2024年は、AIの信じられないほどの進歩と興奮の年でした。 2025年に何が来るのかについてさらに興奮しています。
製品、科学、健康、創造性のAI研究の境界を押し広げ続けているため、これらのテクノロジーをいつどのように展開するかを慎重に検討する必要があります。責任あるAIプラクティスに優先順位を付け、コラボレーションを促進することにより、AIが人類に利益をもたらす未来を築く上で重要な役割を果たし続けます。




2024 was a wild ride with AI! From Gemini 2.0 to quantum computing, it's like we're living in a sci-fi movie. Loved seeing all the creative stuff AI can do, but sometimes it felt a bit too much, you know? Can't wait to see what 2025 brings, but maybe slow down a bit, AI?




¡2024 fue increíble con la IA! Desde Gemini 2.0 hasta la computación cuántica, parece que vivimos en una película de ciencia ficción. Me encantó ver todo lo creativo que puede hacer la IA, pero a veces se sintió un poco abrumador, ¿sabes? Espero con ansias lo que 2025 traiga, pero tal vez, ¿puede la IA ralentizar un poco?




2024年はAIがすごかったね!ジェミニ2.0から量子コンピューティングまで、まるでSF映画に住んでいるみたい。AIができるクリエイティブなことが大好きだけど、時々少し多すぎる感じがするんだよね。2025年が楽しみだけど、AI、ちょっとペースを落とそうか?




2024 war ein wilder Ritt mit KI! Von Gemini 2.0 bis zur Quantencomputing, es fühlt sich an, als lebten wir in einem Sci-Fi-Film. Ich liebe das kreative Zeug, was KI kann, aber manchmal war es ein bisschen zu viel, weißt du? Ich freue mich auf 2025, aber vielleicht sollte die KI ein bisschen langsamer machen?




Năm 2024 thật tuyệt vời với trí tuệ nhân tạo! Từ Gemini 2.0 đến máy tính lượng tử, cảm giác như chúng ta đang sống trong phim khoa học viễn tưởng. Mình thích những điều sáng tạo mà AI có thể làm, nhưng đôi khi nó hơi quá sức, bạn biết đấy? Mong chờ năm 2025, nhưng có lẽ AI nên chậm lại một chút?




2024 was wild! AI's growth was insane, from Gemini 2.0 to protein binders. It's like every week there was something new and mind-blowing. Can't wait to see what 2025 brings, but 2024 set the bar high!












