2024年：AIの驚くべき成長と革新の年

家

ニュース

2025年4月10日

DonaldBrown

101

# ai # research

2024年：AIの驚くべき成長と革新の年

2025年に突入するにあたり、2024年に達成した驚くべき進歩を振り返るのはワクワクする瞬間です。エージェント時代向けにカスタマイズされたGemini 2.0モデルのリリースから、創造的表現の強化、斬新なタンパク質バインダーの設計、AIを活用した神経科学や量子コンピューティングの進展まで、私たちは人工知能の限界を責任を持って大胆に押し広げてきました。これらすべての取り組みは、AIを人類のより大きな利益のために活用することを目指しています。

2年前のエッセイ「なぜ我々がAIに注力するのか」で述べたように、AI開発への私たちのアプローチは、設立当初のミッションである「世界の情報を整理し、誰もがアクセスでき、役立つものにする」に根ざしています。このミッションは、できるだけ多くの人々の生活を向上させるという私たちのコミットメントを推進し、それが私たちの北極星であり続けます。

2024年のYear-in-Reviewでは、Googleの多くの才能あるチームが私たちのミッションを推進するためにたゆまぬ努力を続けてきた素晴らしい成果を祝います。彼らの努力は、来年さらにエキサイティングな展開の舞台を整えました。

モデル、製品、技術における絶え間ない革新

2024年は実験、迅速な展開、そして最新技術を開発者の手に届けることに注力した年でした。12月には、エージェント時代向けに特別に設計されたGemini 2.0実験シリーズの最初のモデルを発表しました。まず、汎用性の高い主力モデルであるGemini 2.0 Flashをリリースし、次にエージェント研究からの最先端のプロトタイプを公開しました。これには、ユニバーサルAIアシスタントの可能性を探るアップデートされたProject Astra、実験的な拡張機能としてChromeでアクションを実行できる初期プロトタイプのProject Mariner、そしてAI搭載のコードエージェントであるJulesが含まれます。私たちはGemini 2.0の機能をフラッグシップ製品に統合することに意欲的で、すでに10億人以上が新しいタイプの質問を探求するために使用しているSearch内のAI Overviewsでのテストを開始しています。

私たちはまた、Gemini Advancedに新しいエージェント機能であるDeep Researchを導入し、複雑な質問に答えるための多段階の計画を作成し実行することで、研究時間を大幅に節約します。さらに、思考プロセスを透明に表示するモデル、Gemini 2.0 Flash Thinking Experimentalを導入しました。

年始には、Geminiの機能をさらに多くのGoogle製品に統合し、Gemini 1.5 ProおよびGemini 1.5 Flashをリリースすることで大きな進歩を遂げました。後者は、スピードと効率性のために最適化され、コンパクトなサイズとコスト効率の良さから開発者の間で最も人気のあるモデルとなりました。

また、AI Studioを強化し、デスクトップ、iOS、Androidにインストール可能なプログレッシブウェブアプリ（PWA）として提供し、開発者に堅牢なリソースセットを提供しました。NotebookLMの新機能、例えばAudio Overviewsに対する一般の反応は素晴らしく、アップロードされたソース素材から深い議論を生成し、学習をより魅力的にしています。

音声入出力は、Gemini Live、Project Astra、Journey Voices、YouTubeの自動ダビングなどの製品で引き続き改良され、ユーザーインタラクションを向上させています。

オープンコミュニティへの貢献の伝統に則り、Geminiと同じ研究と技術に基づく最先端のオープンモデルであるGemmaから2つの新モデルをリリースしました。Gemmaは、質問応答、推論、コーディングなどの分野で同等サイズのモデルを上回りました。また、研究者がGemma 2の内部動作を理解するのに役立つツール、Gemma Scopeもリリースしました。

モデルの事実性の向上とハルシネーションの削減にも進展がありました。12月には、Google DeepMind、Google Research、Kaggleと共同で開発したベンチマークであるFACTS Groundingを公開し、大規模言語モデルが提供されたソース素材に基づいて応答をどの程度適切に根拠づけ、ハルシネーションを回避するかを評価しました。

FACTS Groundingデータセットは、1,719の例を含み、コンテキストドキュメントに基づく長編の応答をテストするために設計されています。 FACTS Groundingを使用して主要なLLMをテストした結果、Gemini 2.0 Flash Experimental、Gemini 1.5 Flash、Gemini 1.5 Proが事実性スコアのトップ3を獲得し、Gemini-2.0-flash-expは印象的な83.6%を記録しました。

また、ブロックワイズ並列デコーディング、信頼度に基づく遅延、投機的デコーディングなどの革新的な技術を通じて、MLの効率性を向上させ、LLMの推論時間を高速化しました。これらの改善はGoogle製品に利益をもたらし、業界標準を確立します。

スポーツでは、コーナーキックにおける戦術的洞察を提供するAIシステム、TacticAIをリリースしました。

研究リーダーシップへのコミットメントは依然として強く、2010-2023年のWIPO調査では、Google（Google ResearchおよびGoogle DeepMindを含む）が生成AIの引用数で2位の機関の2倍以上の引用を受けました。

2024年1月のThe Lensのデータに基づくこのWIPOグラフは、過去10年間の生成AI研究に対するAlphabetの重要な貢献を強調しています。最後に、HPと提携して「魔法の窓」技術であるProject Starlineを商用化し、Google MeetやZoomなどのビデオ会議サービスに統合することを目指して進展しました。

生成AIによる創造的ビジョンの強化

私たちは、AIが創造性の新しい領域を開き、創造的表現をよりアクセスしやすくし、人々が芸術的ビジョンを実現するのを助けられると信じています。2024年には、画像、音楽、ビデオをカバーする生成メディアツールの一連のアップデートを導入しました。

年初に、テキストプロンプトから画像や最長70秒のオーディオクリップを生成する生成AIツール、ImageFXとMusicFXをリリースしました。I/Oでは、ライブ音楽作成をよりアクセスしやすくするMusicFX DJをプレビューしました。10月には、Jacob Collierと協力して、新規および志望するミュージシャン向けにMusicFX DJを簡素化しました。また、音楽AIツールキットであるMusic AI Sandboxをアップデートし、テキストから音楽モデルを使用してさまざまなジャンルのインストゥルメンタルサウンドトラックを生成するDream Track実験を進化させました。

年後半には、最新の画像およびビデオモデルであるVeo 2とImagen 3をリリースしました。Imagen 3は、最高品質のテキストから画像モデルで、優れたディテール、照明、少ないアーティファクトで画像を生成します。Veo 2は、現実世界の物理学や人間の動きをより良く理解し、リアリズムを高めました。 Veo 2は、高品質のビデオ生成における大きな進歩を示します。

編集におけるAIの可能性を探り続け、透明度やオブジェクトの粗さなどの属性を制御するために使用しました。

これらの例は、合成データ生成を使用して素材の特性を編集するAIの能力を示しています。

オーディオ生成では、ビデオからオーディオ（V2A）技術を改良し、画面上のアクションに基づくテキストプロンプトからダイナミックなサウンドスケープを生成し、Veoから生成されたAIビデオと組み合わせることができます。

ゲームは、創造的探求と身体化エージェントのトレーニングのための完璧な遊び場を提供します。2024年には、身体化エージェントのトレーニングと評価のために多様なプレイ可能な3D環境を生成する基礎世界モデルであるGenie 2を導入しました。これは、自然言語の指示をさまざまなビデオゲーム設定で実行できるSIMAのリリースに続くものです。

知能の構造：ロボティクス、ハードウェア、コンピューティングの進歩

マルチモーダルモデルが世界の物理学を理解する能力を高めるにつれて、ロボティクスのエキサイティングな進歩が可能になっています。より能力が高く、役立つロボットの目標に近づいています。

ALOHA Unleashedにより、私たちのロボットは靴ひもを結ぶ、シャツを掛ける、他のロボットを修理する、ギアを挿入する、キッチンを掃除するなどのタスクを習得しました。

年始に、AutoRT、SARA-RT、RT-Trajectoryを導入し、ロボットが環境をより良くナビゲートし、迅速な意思決定を行うのを助けるRobotics Transformersの拡張を行いました。また、2つの腕を協調させるALOHA Unleashedや、シミュレーションを使用して多指ロボットハンドの実世界でのパフォーマンスを向上させる強化学習を使用したDemoStartをリリースしました。

Robotic Transformer 2（RT-2）は、ウェブとロボティクスデータから学び、イチゴをボウルに入れるなどのタスクを実行できます。ロボティクスを超えて、AlphaChip強化学習メソッドは、データセンターやスマートフォンのチップ配置を革新しています。AlphaChipのオープンソースリリースの外部採用を促進するために、事前トレーニング済みのチェックポイントをリリースしました。また、第六世代のTPUであるTrilliumをGoogle Cloudの顧客に提供し、AIがチップ設計を強化する方法を示しました。 AlphaChipは、チップレイアウトを最適化することを学び、作成する各デザインで改善します。

研究では、量子コンピュータのエラー訂正にも取り組みました。11月に、量子コンピューティングエラーを高精度で特定するAIベースのデコーダーであるAlphaQubitをリリースしました。Google DeepMindとGoogle Researchの協力により、信頼性の高い量子コンピュータへの進展が加速しました。テストでは、AlphaQubitはテンソルネットワーク法と比較してエラーを6％、相関マッチングと比較して30％削減しました。

12月には、Google Quantum AIチームが最新の量子チップであるWillowを発表しました。Willowは、今日の最速のスーパーコンピュータが10の24乗年かかるベンチマーク計算を5分未満で実行できます。量子エラー訂正を使用し、Willowはエラー率を半減させ、「閾値以下」というマイルストーンを達成し、Physics Breakthrough of the Year賞を受賞しました。

Willowは、量子コンピューティングにおける最先端のパフォーマンスを示します。

新たな解決策の発見：科学、生物学、数学の進歩

私たちはAIを使用して科学的進歩を加速し続け、科学と数学を進めるAIの力を示すツールや論文をリリースしました。以下は主なハイライトです：

1月には、複雑な幾何学問題を解くAIシステムであるAlphaGeometryを導入しました。アップデートされたAlphaGeometry 2と、正式な数学的推論のための強化学習ベースのシステムであるAlphaProofは、2024年7月の国際数学オリンピアードで銀メダリストのパフォーマンスを達成しました。

AlphaGeometry 2は、2024年7月の国際数学オリンピアードの問題4をわずか19秒で解き、∠KIL + ∠XPYが180°であることを証明しました。 Isomorphic Labsとの協力により、生命の分子の構造と相互作用を予測するAlphaFold 3を導入し、生物学と薬物発見の理解を変革することを目指しました。AlphaFold 3の高度なアーキテクチャとトレーニングは、タンパク質からDNAまで、生命のすべての分子をカバーします。また、高強度タンパク質バインダーを作成するAIシステムであるAlphaProteoで、タンパク質設計に大きな進歩を遂げ、新薬やバイオセンサーの開発につながる可能性があります。AlphaProteoは、さまざまなターゲットタンパク質に対して新しいタンパク質バインダーを設計できます。

ハーバードのLichtman Labと協力して、人間の脳の一部のナノスケールマッピングを初めて作成し、研究者に提供しました。これは、ヒトの脳マッピングにまで拡張された、10年にわたるコネクトミクスの取り組みに続くものです。

この脳マッピングプロジェクトは、皮質の最も深い層にある鏡像細胞クラスターを明らかにします。

11月末には、Royal Societyと共同でAI for Science Forumを開催し、タンパク質構造予測、ヒトの脳マッピング、AIを使用した予報や山火事検知などの主要なトピックについて議論しました。また、フォーラムでは4人のノーベル賞受賞者とのQ&Aを開催し、Google DeepMindポッドキャストで公開しました。

2024年は、Demis Hassabis、John Jumper、David BakerがAlphaFold 2の研究でノーベル化学賞を受賞し、タンパク質設計を革命化したことが認められた画期的な年でした。Geoffrey Hintonは、John Hopfieldとともに人工ニューラルネットワークによる機械学習の基礎研究でノーベル物理学賞を受賞しました。

Googleはさらに、NeurIPS 2024 Test of Time Paper Awardsや、Google OR Toolsの一部であるPrimal-Dual Linear Programming（PDLP）のBeale—Orchard-Hays Prizeを受賞し、現実世界のアプリケーションで大規模な線形プログラミングを支援しました。

人類の利益のためのAI

今年、私たちは製品の大きな進歩を遂げ、医療、災害準備、教育などの分野でAIが直接的かつ即時に人々に利益をもたらす方法を示す研究を発表しました。

医療では、AIが特に心血管疾患の早期発見において質の高いケアを民主化することを約束します。私たちの研究は、簡単な指先デバイスと基本的なメタデータを組み合わせることで、心臓の健康リスクを予測できることを示しました。また、結核のAIを活用した診断を進め、TBとHIVの高い地域で効果的に人口をスクリーニングできることを示しました。

Med-Geminiは、MedQAベンチマークで新たな最高スコアを達成し、以前の最高記録であるMed-PaLM 2を4.6％上回りました。 Geminiモデルはプロフェッショナル向けの多目的ツールであり、特定の領域向けに微調整されたモデルを開発しています。たとえば、Med-Geminiは、匿名化された医療データでのトレーニングとGeminiの機能を組み合わせ、MedQA USMLEスタイルの質問ベンチマークで91.1％の精度を達成しました。

放射線学、皮膚科、病理学などの分野での画像診断の専門知識不足に対処する方法として、機械学習の活用も探っています。診断タスクやバイオマーカー発見のためにDerm FoundationとPath Foundationをリリースし、Stanford Medicineと協力してSkin Condition Image Network（SCIN）データセットを構築し、医療画像研究のためのCT Foundationを公開しました。

教育では、学習用に微調整されたモデルファミリーであるLearnLMを導入し、Search、YouTube、Geminiでの体験を向上させました。LearnLMは他の主要なAIモデルを上回り、AI Studioで開発者に提供しました。会話型学習コンパニオンであるLearnAboutや、オーディオディスカッションツールであるIlluminateは、学習体験をさらに豊かにします。

災害予報と準備では、天候や極端なイベントの予報を改善するGenCastや、数千日の大気条件をシミュレートできるNeuralGCMを導入しました。2024年のMacRobert Awardを受賞したGraphCastは、詳細な天気予報を提供します。

GraphCastの10日間の予測は、特定湿度、表面温度、風速を示します。

洪水予報モデルを改良し、7日前の洪水予測を可能にし、100カ国、7億人のカバレッジを拡大しました。

洪水予報モデルは、物理的なゲージがない150カ国で仮想ゲージを使用し、100カ国以上をカバーしています。 AIは山火事の検出と軽減にも役立ちます。Wildfire Boundary Mapsは現在22カ国で利用可能で、20分以内に小さな山火事を検出できる衛星コンステレーションであるFireSatを作成しました。

Google Translateを110の新言語に拡張し、6億1400万人以上の話者の情報と機会の障壁を取り除くのに役立ちました。

Google Translateの新しい言語は、世界人口の8％を代表します。

責任あるAIの標準設定を支援

私たちはAI安全性の業界をリードする研究を続け、新しいツールや技術を開発し、これらを最新モデルに統合しました。リスクに対処するために協力することにコミットしています。

誤使用に関する研究では、ディープフェイクやジェイルブレイクが最も一般的な問題であることがわかりました。5月には、先進AIモデルの新たな能力を特定するためのFrontier Safety Frameworkを導入し、AI Responsibility Lifecycleフレームワークを立ち上げました。10月には、Responsible GenAI Toolkitを任意のLLMで動作するように拡張し、開発者が責任あるAIを構築するのを支援しました。

先進AIアシスタントの倫理に関する論文を発表し、AIアシスタントの技術的および道徳的景観とその機会とリスクを検討しました。

SynthIDの機能を拡張し、Geminiアプリとウェブ体験でのAI生成テキストや、Veoでのビデオにウォーターマークを施しました。オンラインの透明性を高めるために、Content Provenance and Authenticity（C2PA）に参加し、Content Credentials標準のより安全な新バージョンの開発に取り組みました。

SynthIDは、予測トークンの確率スコアを調整して、AI生成コンテンツの品質、正確性、創造性を確保します。

LLMを超えて、AlphaFold 3のバイオセキュリティアプローチを共有し、業界のパートナーと協力してCoalition for Secure AI（CoSAI）を立ち上げ、AIソウルサミットに参加して国際的なAIガバナンスに貢献しました。

AIエージェントなどの新技術を開発する際、安全性、セキュリティ、プライバシーの問題を探求し続けます。AI Principlesに導かれ、信頼できるテスターや外部の専門家と広範な研究、安全性トレーニング、リスク評価を行い、慎重かつ段階的なアプローチを取ります。

2025年を見据えて

2024年はAIにおける驚くべき進歩と興奮の年でした。2025年に何が来るのか、さらなるワクワクを感じています。

製品、科学、健康、創造性におけるAI研究の限界を押し広げ続ける中で、これらの技術をどのように、いつ展開するかを慎重に考える必要があります。責任あるAIの慣行を優先し、協力を促進することで、AIが人類に利益をもたらす未来を構築する上で重要な役割を果たし続けます。

"ドットAIコンパニオンアプリが閉鎖を発表、パーソナライズドサービスを中止" 個人的な友人や親友として機能するように設計されたAIコンパニオン・アプリケーションであるDotが、金曜日の開発者からの発表によると、運営を終了する。Dotを開発したスタートアップのNew Computer社は、10月5日までサービスを提供し、ユーザーが個人データをエクスポートできるようにするとウェブサイトで述べている。このアプリは、共同設立者であるサム・ホイットモアと元アップルのデザイン・スペシャ

Anthropic、AIが作成した書籍の著作権侵害をめぐる訴訟を解決 Anthropic社は、米国の著作者との重要な著作権紛争で解決に達し、高額になる可能性のある裁判を回避する集団訴訟の和解案に合意した。今週火曜日に裁判所文書に提出されたこの合意は、AI企業が海賊版の文学作品を使ってクロードモデルを訓練したという申し立てに起因する。和解の詳細は非公開だが、この訴訟は作家のアンドレア・バーツ、チャールズ・グレイバー、カーク・ウォレス・ジョンソンの主張に端を発している。

Figma、AIを搭載したアプリビルダー・ツールを全ユーザーに公開今年初めに発表された革新的なプロンプト・トゥ・アプリ開発プラットフォームであるFigma Makeが、正式にベータ版を終了し、全ユーザーにロールアウトしました。この画期的なツールは、グーグルのジェミニ・コード・アシストやマイクロソフトのギットハブ・コパイロットのようなAIを搭載したコーディング・アシスタントの仲間入りをし、クリエイターが従来のプログラミングの専門知識がなくても、自然言語の記述を機能

コメント (26)

0/200

提出する

AlbertSanchez

2025年8月23日 14:01:15 JST

Wow, 2024 was a wild ride for AI! Gemini 2.0 sounds like a game-changer for agents. Curious how it stacks up against other models—anybody tested it yet? 🧠

FrankSmith

2025年4月23日 10:42:56 JST

¡2024 fue un año increíble para la IA! Desde Gemini 2.0 hasta la computación cuántica, es impresionante. Parece que estamos viviendo en una película de ciencia ficción. ¡No puedo esperar a ver qué nos trae 2025! 🚀

RalphGarcia

2025年4月20日 2:10:39 JST

2024年のAIの進歩は本当に驚きでしたね！ジェミニ2.0から量子コンピューティングまで、まるでSF映画みたいです。2025年が楽しみです。🚀

CarlLewis

2025年4月18日 20:58:13 JST

2024 was insane with AI! From Gemini 2.0 to quantum computing, it felt like living in a sci-fi movie. The creativity boost was real, but sometimes I felt overwhelmed by the rapid changes. Still, it's exciting to see where AI will take us next! 🚀

RogerRoberts

2025年4月15日 7:22:16 JST

¡2024 fue una locura con la IA! Desde Gemini 2.0 hasta la computación cuántica, parecía estar viviendo en una película de ciencia ficción. El impulso de creatividad fue real, pero a veces me sentí abrumado por los cambios rápidos. Aún así, ¡es emocionante ver a dónde nos llevará la IA a continuación! 🚀

RobertMartin

2025年4月13日 19:55:17 JST

2024年のAIの進歩は本当に驚きだった！ジェミニ2.0から量子コンピューティングまで、まるでSF映画にいるようだった。創造性の向上は確かにあったけど、急速な変化に圧倒されることもあった。それでも、AIが次にどこへ導いてくれるのか楽しみだよ！🚀

トップニュース

2025年トップAIビデオジェネレーター：Pika Labs vs 代替案 Gemini 2.5 ProはClaudeよりも無制限で安価で、GPT-4O AIボイスオーバー：リアルな声制作究極ガイドカンビウムのAIは、廃棄物を木材に変換します AI BuilderとPower Automateがドキュメントの要約を革新 Openaiは、より良いチャットのためにAIの音声アシスタントを強化します AI統合のためにデータが信頼できることを確認する方法 Notebooklmはグローバルに拡張し、スライドを追加し、ファクトチェックを強化します米国のデータセンターへの微調整は、76 GWの新しい電源容量のロックを解除できます GoogleはAIを利用して、詐欺の疑いのために3900万を超える広告アカウントを一時停止します

もっと

特集