長いコンテキストウィンドウの理解：重要な洞察

家

ニュース

2025年4月10日

PatrickGonzález

153

# ai

昨日、私たちはAI技術における最新のブレークスルーであるGemini 1.5モデルを発表しました。この新しいバージョンは、速度と効率において大幅な改善をもたらしますが、真のゲームチェンジャーはその革新的なロングコンテキストウィンドウです。この機能により、モデルは前例のない数のトークン—単語、画像、またはビデオを構成する基本単位—を一度に処理できます。この進歩について詳しく知るため、Google DeepMindプロジェクトチームにロングコンテキストウィンドウとは何か、そしてそれが開発者の作業方法をどのように革命化できるかについて話を聞きました。

ロングコンテキストウィンドウの理解は重要です。なぜなら、それによってAIモデルはセッション全体を通じて情報を保持し、思い出すことができるからです。会話で名前が言われてから数分後にその名前を思い出そうとしたり、電話番号を忘れる前に急いで書き留めようとしたりする状況を想像してください。AIモデルも同様の課題に直面し、数回のやり取り後に詳細を「忘れる」ことがよくあります。ロングコンテキストウィンドウは、モデルがより多くの情報を「記憶」に保持できるようにすることでこの問題を解決します。

以前のGeminiモデルは最大32,000トークンを同時に処理できました。しかし、1.5 Proの早期テスト向けリリースにより、私たちはその限界を驚異的な100万トークンに押し上げました—これまでで最大規模の基盤モデルのコンテキストウィンドウです。私たちの研究はさらにその先へ進み、最大1,000万トークンのテストに成功しました。コンテキストウィンドウが大きければ大きいほど、モデルが処理できるデータ—テキスト、画像、音声、コード、またはビデオ—の多様性と範囲が広がります。

Google DeepMindの研究科学者であり、ロングコンテキストプロジェクトのリーダーの一人であるNikolay Savinovは、次のように述べています。「私たちの当初の目標は128,000トークンに到達することでしたが、もっと高みを目指すことが有益だと考え、100万トークンを提案しました。そして今、私たちの研究はその10倍を超えています。」

この飛躍を達成するためには、一連の深層学習の革新が必要でした。Pranav Shyamの初期の探求は、私たちの研究を導く重要な洞察を提供しました。Google DeepMindのエンジニアであるDenis Teplyashinは、「各ブレークスルーが次のブレークスルーを生み、新しい可能性を開きました。これらの革新が組み合わさったとき、128,000トークンから512,000トークン、そして100万トークン、最近では内部研究で1,000万トークンにスケールアップした結果に驚きました。」と説明しました。

1.5 Proの拡張された容量は、刺激的な新しいアプリケーションを開拓します。たとえば、数十ページのドキュメントを要約する代わりに、1.5 Proは数千ページのドキュメントを処理できます。以前のモデルが数千行のコードを分析できたのに対し、1.5 Proは一度に数万行のコードを処理できます。

Google DeepMindの研究科学者であるMachel Reidは、興味深いテスト結果を共有しました。「あるテストでは、コードベース全体をモデルに入力し、包括的なドキュメントを生成しました。これは驚くべきことでした。別のテストでは、1924年の映画Sherlock Jr.を45分間「視聴」した後、正確に質問に答えました。」

1.5 Proは、プロンプト内のデータにわたる推論にも優れています。Machelは、世界中で200人未満しか話さない希少言語Kalamangを例に挙げました。「モデルは単独でKalamangに翻訳することはできませんが、ロングコンテキストウィンドウにより、文法マニュアル全体と例文を含めることができました。モデルは同じ資料から学ぶ人と同等のレベルで、英語からKalamangへの翻訳を学びました。」

Gemini 1.5 Proには標準の128Kトークンのコンテキストウィンドウが付属していますが、選択された開発者や企業顧客は、AI StudioおよびVertex AIを通じてプライベートプレビューで100万トークンのコンテキストウィンドウにアクセスできます。このような大規模なコンテキストウィンドウの管理は計算負荷が高く、私たちはスケールアップする際に遅延を減らすための最適化に積極的に取り組んでいます。

今後、チームはモデルの高速化と効率化に焦点を当て、安全性を優先しています。また、ロングコンテキストウィンドウのさらなる拡張、基盤アーキテクチャの強化、新しいハードウェアの改良の活用方法も探っています。Nikolayは、「一度に1,000万トークンは、テンサープロセッシングユニットの熱限界に近づいています。限界がどこにあるかはまだわかりませんが、ハードウェアが進化するにつれてモデルはさらに多くのことができる可能性があります。」と述べました。

チームは、開発者やより広いコミュニティがこれらの新しい機能でどのような革新的なアプリケーションを生み出すのかを楽しみにしています。Machelは、「初めて100万トークンのコンテキストを見たとき、『これは何に使うんだ？』と思いました。でも今、人々の想像力が広がり、これらの新しい機能のより創造的な活用方法が生まれると信じています。」と振り返りました。

[ttpp][yyxx]

"ドットAIコンパニオンアプリが閉鎖を発表、パーソナライズドサービスを中止" 個人的な友人や親友として機能するように設計されたAIコンパニオン・アプリケーションであるDotが、金曜日の開発者からの発表によると、運営を終了する。Dotを開発したスタートアップのNew Computer社は、10月5日までサービスを提供し、ユーザーが個人データをエクスポートできるようにするとウェブサイトで述べている。このアプリは、共同設立者であるサム・ホイットモアと元アップルのデザイン・スペシャ

Anthropic、AIが作成した書籍の著作権侵害をめぐる訴訟を解決 Anthropic社は、米国の著作者との重要な著作権紛争で解決に達し、高額になる可能性のある裁判を回避する集団訴訟の和解案に合意した。今週火曜日に裁判所文書に提出されたこの合意は、AI企業が海賊版の文学作品を使ってクロードモデルを訓練したという申し立てに起因する。和解の詳細は非公開だが、この訴訟は作家のアンドレア・バーツ、チャールズ・グレイバー、カーク・ウォレス・ジョンソンの主張に端を発している。

Figma、AIを搭載したアプリビルダー・ツールを全ユーザーに公開今年初めに発表された革新的なプロンプト・トゥ・アプリ開発プラットフォームであるFigma Makeが、正式にベータ版を終了し、全ユーザーにロールアウトしました。この画期的なツールは、グーグルのジェミニ・コード・アシストやマイクロソフトのギットハブ・コパイロットのようなAIを搭載したコーディング・アシスタントの仲間入りをし、クリエイターが従来のプログラミングの専門知識がなくても、自然言語の記述を機能

コメント (28)

0/200

提出する

KeithSmith

2025年8月17日 16:00:59 JST

Super cool to see Gemini 1.5's long context window in action! 😎 Makes me wonder how it'll handle massive datasets compared to older models.

RobertSanchez

2025年7月31日 10:41:19 JST

Wow, the long context window in Gemini 1.5 sounds like a game-changer! I'm curious how it'll handle massive datasets in real-world apps. Excited to see where this takes AI! 🚀

DavidGonzález

2025年7月28日 10:19:30 JST

The long context window in Gemini 1.5 sounds like a game-changer! I'm curious how it'll handle massive datasets in real-world apps. Any cool examples out there yet? 🤔

RobertRoberts

2025年4月17日 8:56:25 JST

Cửa sổ ngữ cảnh dài của Gemini 1.5 thực sự là một bước tiến lớn! Thật đáng kinh ngạc khi nó có thể xử lý nhiều hơn so với các mô hình cũ. Chỉ mong nó nhanh hơn một chút. Tuy nhiên, đây là một bước tiến lớn! 💪

MatthewGonzalez

2025年4月17日 0:41:59 JST

A janela de contexto longo do Gemini 1.5 é revolucionária, sem dúvida! Mas às vezes parece que está tentando fazer muito de uma vez, o que pode atrasar as coisas. Ainda assim, para processar grandes quantidades de dados, é imbatível. Vale a pena conferir! 🚀

NicholasRoberts

2025年4月15日 7:59:46 JST

Gemini 1.5's long context window is a game-changer, no doubt! But sometimes it feels like it's trying to do too much at once, which can slow things down. Still, for processing huge chunks of data, it's unbeatable. Worth checking out! 🚀

トップニュース

2025年トップAIビデオジェネレーター：Pika Labs vs 代替案 Gemini 2.5 ProはClaudeよりも無制限で安価で、GPT-4O AIボイスオーバー：リアルな声制作究極ガイドカンビウムのAIは、廃棄物を木材に変換します AI BuilderとPower Automateがドキュメントの要約を革新 Openaiは、より良いチャットのためにAIの音声アシスタントを強化します AI統合のためにデータが信頼できることを確認する方法 Notebooklmはグローバルに拡張し、スライドを追加し、ファクトチェックを強化します米国のデータセンターへの微調整は、76 GWの新しい電源容量のロックを解除できます GoogleはAIを利用して、詐欺の疑いのために3900万を超える広告アカウントを一時停止します

もっと

特集