オプション
ニュース
人類の主張は、AIが失速しておらず、ベンチマークを抜いています

人類の主張は、AIが失速しておらず、ベンチマークを抜いています

2025年4月17日
108

人類の主張は、AIが失速しておらず、ベンチマークを抜いています

大規模言語モデル(LLM)やその他の生成AI技術は、自己修正において大きな進歩を遂げており、これが「エージェントAI」と呼ばれる新しいアプリケーションへの道を開いていると、主要なAIモデル開発企業であるAnthropicの副社長、マイケル・ガーステンハーバー氏は述べています。

「自己修正や自己推論が非常に優れてきています」と、AnthropicでAPI技術をリードするガーステンハーバー氏は、ニューヨークでのブルームバーグ・インテリジェンスのアヌラグ・ラナ氏とのインタビューで語りました。ClaudeファミリーのLLMを開発したAnthropicは、OpenAIのGPTモデルと直接競合しています。「数か月ごとに新しいモデルをリリースし、LLMの能力を拡張しています」と彼は付け加え、モデル改訂ごとに新たな可能性が開かれる業界のダイナミックな性質を強調しました。

AIモデルの新たな能力

Anthropicの最新モデルは、タスク計画などの能力を導入し、人間がコンピュータ上で行うようなタスク、例えばオンラインでピザを注文することなどを可能にしています。「昨日は実現不可能だった中間ステップの計画が、今では手の届くところにあります」とガーステンハーバー氏は、このステップごとのタスク実行について述べました。

この議論には、AIスタートアップScale AIの主任技術者ビジェイ・カルナムルティ氏も参加し、ブルームバーグ・インテリジェンスが主催する「生成AI:生産性の約束を果たせるか?」という一日会議の一部でした。

AI懐疑論への挑戦

ガーステンハーバー氏の洞察は、生成AIやより広範なAI分野が「壁にぶつかっている」と主張し、各モデルの反復で収益が減少していると考えるAI懐疑論者への挑戦です。例えば、AI学者のゲイリー・マーカス氏は2022年以来、AIモデル(パラメータの増加)の規模を大きくするだけでは性能が比例して向上しないと警告しています。

しかし、ガーステンハーバー氏は、Anthropicが現在のAIベンチマークで測定できる範囲を超えて限界を押し広げていると主張します。「一部の領域で進歩が遅れているように見えても、それは私たちが全く新しい機能を開拓しているからであり、ベンチマークや古いタスクの実行能力が飽和しているだけです」と彼は説明しました。これにより、現在の生成AIモデルが達成できることの全貌を測ることがますます難しくなっています。

スケーリングと学習

ガーステンハーバー氏とカルナムルティ氏は、生成AIモデルのスケーリングが自己修正能力を高めるために重要であると強調しました。「私たちは確実に知能のスケーリングがますます進んでいるのを見ています」とガーステンハーバー氏は述べました。カルナムルティ氏は、「計画や推論で壁にぶつかっていないと信じる理由の一つは、モデルが新しい多様な環境に適応できるようにタスクを構造化する方法をまだ学んでいるからです」と付け加えました。

ガーステンハーバー氏は同意し、「私たちは初期段階にあり、アプリケーション開発者から彼らのニーズやモデルが不足している部分を学び、それを言語モデルに統合しています」と述べました。

リアルタイム学習と適応

ガーステンハーバー氏によると、この進歩の多くは、Anthropicでの基礎研究の急速なペースと、業界からのリアルタイムのフィードバックによる学習によって推進されています。「業界が私たちに必要としていることを適応し、リアルタイムで学んでいます」と彼は述べました。

顧客はしばしば大きなモデルから始め、特定の目的に合わせてよりシンプルなモデルにスケールダウンします。「最初に、モデルがタスクを適切に実行できるほど賢いかどうかを評価し、次にアプリケーションのニーズを満たすほど速いか、そして最後に、可能な限りコスト効率が良いかを評価します」とガーステンハーバー氏は説明しました。

関連記事
HitPaw AI Photo Enhancerで画像を向上させる:包括的ガイド HitPaw AI Photo Enhancerで画像を向上させる:包括的ガイド 写真編集の体験を変えたいですか?最先端の人工知能のおかげで、画像の改善が今や簡単に行えます。この詳細なガイドでは、HitPaw AI Photo Enhancer、画像の品質と解像度を自動的に向上させるオフラインAIツールを探ります。プロの写真家であろうと、個人のスナップショットを磨きたい愛好家であろうと、HitPaw AI Photo Enhancerは驚くべき結果をもたらす強力な機能を提供しま
AI駆動の音楽作成:楽曲とビデオを簡単に制作 AI駆動の音楽作成:楽曲とビデオを簡単に制作 音楽作成は時間、資源、専門知識を必要とする複雑なプロセスです。人工知能はこのプロセスを変革し、シンプルで誰でも利用できるものにしました。このガイドでは、AIがどのようにして誰でも無料でユニークな楽曲やビジュアルを制作できるようにするか、新たな創造的可能性を解き放つ方法を紹介します。直感的で使いやすいインターフェースと先進的なAIを備えたプラットフォームを探索し、音楽のアイデアを高コストなしで現実に
AI駆動の塗り絵ブック作成:包括的ガイド AI駆動の塗り絵ブック作成:包括的ガイド 塗り絵ブックのデザインは、芸術的表現とユーザーのリラックス体験を組み合わせた報われる追求です。しかし、そのプロセスは労働集約的です。幸い、AIツールは高品質で均一な塗り絵ページを簡単に作成できます。このガイドは、AIを使用して一貫したスタイルと最適な効率に焦点を当てた塗り絵ブック作成のステップごとのアプローチを提供します。主なポイントAIプロンプトツールを使用して、詳細で構造化された塗り絵ページの
コメント (8)
0/200
JoseRoberts
JoseRoberts 2025年8月13日 0:00:59 JST

This self-correction stuff is wild! 😮 It's like AI is learning to double-check its own homework. Wonder how far this 'agentic AI' will go—could it outsmart us at our own jobs soon?

WalterAnderson
WalterAnderson 2025年7月31日 20:35:39 JST

It's wild to think AI can now self-correct! 😮 Makes me wonder how soon we'll see these 'agentic AI' systems running our lives—hope they don’t outsmart us too much!

RonaldMartinez
RonaldMartinez 2025年7月22日 16:39:52 JST

This article really opened my eyes to how fast AI is evolving! Self-correcting LLMs sound like a game-changer for agentic AI. Can’t wait to see what new apps come out of this! 😄

WillieJackson
WillieJackson 2025年4月18日 16:00:28 JST

La perspectiva de Anthropic sobre que la IA no se estanca sino que supera los benchmarks es bastante genial. Es como si la IA estuviera jugando ajedrez mientras nosotros aún estamos tratando de entender las damas. Lo de la autocorrección suena prometedor, pero aún estoy un poco escéptico. 🤔

GeorgeWilson
GeorgeWilson 2025年4月18日 2:45:24 JST

Anthropic의 AI가 정체되지 않고 벤치마크를 뛰어넘는다는 생각이 멋지네요. AI는 체스를 하고 있는데, 우리는 아직 체커를 이해하는 단계예요. 자기 교정 이야기는 유망하지만, 아직 조금 회의적이에요. 🤔

NicholasCarter
NicholasCarter 2025年4月17日 20:27:31 JST

Anthropic's take on AI not stalling but outsmarting benchmarks is pretty cool. It's like AI is playing chess while we're still figuring out checkers. The self-correction stuff sounds promising, but I'm still a bit skeptical. 🤔

トップに戻ります
OR