xAI、推論能力を強化し、幻覚生成の抑制において過去最高水準を達成した「Grok 4.20」を発表
2026年3月12日、xAIは次世代大規模言語モデル「Grok 4.20 Beta 」を正式にリリースしました。本モデルは、競争力のある価格を維持しつつ、卓越した事実の正確性において業界の新たな基準を打ち立てました。
Artificial Analysisによる 最新の評価によると、Grok 4.20は推論タスクにおいてインテリジェンス・インデックス(Intelligence Index)スコア48点を記録し、前バージョンから6点向上しました。 総合的なベンチマーク性能では、Gemini 3.1 Pro PreviewやGPT-5.4 (いずれも57点)にはまだ及ばないものの、AA Omniscientテストでの結果は傑出しており、非幻覚率が78%にも達しました。これにより、AIモデルが誤った情報を生成するという一般的な課題が効果的に解決されています。

製品ラインナップと技術仕様に関して、xAIは3つのAPIバージョンを同時にリリースしました。推論機能を備えたバージョン、推論機能のないバージョン、そしてマルチエージェント運用向けに設計されたバージョンです。 このモデルは最大200万トークンのコンテキストウィンドウに対応しており、100万トークンあたり2~6ドルという極めて競争力のある価格戦略を採用しています。これは以前のGrok 4よりも大幅に低価格です。技術的には、Grok 4.20は未知の領域において強い自制心を示し、「分からない」と認める傾向が大幅に高まっており、誤答率は約5分の1となっています。

大規模AIモデル間の世界的な競争は、もはや純粋なスケール重視から、推論の深さと事実の正確さを競う二面的な競争へと進化しています。 Grok 4.20のリリースは、汎用人工知能(AGI)の追求において「誠実さ」と「低い幻覚率」を優先することで、独自の競争優位性を構築するというxAIの戦略を象徴しています。事実の信頼性に対するこの徹底したこだわりは、厳格な業界におけるAIの実用性を高めるだけでなく、将来のマルチエージェントシステムにおける情報の完全性に対して、より信頼できる基盤を築くことにもつながります。
関連記事
Apple初のAIハードウェアが公開:カメラ搭載のAirPodsがDVT段階へ
AppleのAIハードウェアへの野心が、ますます明確になってきている。 著名なテックジャーナリストのマーク・ガーマン氏によると、かねてより期待されていたカメラ内蔵のAirPodsが、開発の重要な最終段階である「デザイン検証テスト(DVT)」に入ったという。これは、製品の工業デザインと主要機能がほぼ確定したことを意味し、このイヤホンはApple初の真のAIウェアラブルデバイスとなる見込みだ。写真撮影
iOS 27で、チャットボット機能を備えた独立型Siriアプリがリリースされる
Appleの2026年ワールドワイド・デベロッパーズ・カンファレンス(WWDC)まであと1ヶ月を切った今、著名なテックジャーナリストのマーク・ガーマン氏が、iOS 27に関する新たな情報を明らかにした。 「Rave」というコードネームが付けられた次期システムでは、Siriが独立したアプリとして復活する。Siriが専用の起動ポイントを取り戻すのは、15年ぶりのことだ。アップデートされたSiriは常時
AI専門家が投入:大規模モデルが工場を席巻、工業生産が新たな進化の段階へ
生物発酵、建築設計、さらには排水処理の最前線において、ある新しい「従業員」が、従来の製造業を静かに変革しつつある。彼らは汗まみれの労働者ではなく、「AIマスター」として知られる産業用時系列制御大規模モデルであり、その名は「ManuDrive」だ。上海交通大学の人工知能・微細構造研究所(AIMS Lab)による最近の画期的な成果が、産業界の注目を集めている。李金金教授が設立したこの研究所は、現在、A
関連特集おすすめ
コメント (1)
0/500
2026年3月12日、xAIは次世代大規模言語モデル「

製品ラインナップと技術仕様に関して、xAIは3つのAPIバージョンを同時にリリースしました。推論機能を備えたバージョン、推論機能のないバージョン、そしてマルチエージェント運用向けに設計されたバージョンです。 このモデルは最大200万トークンのコンテキストウィンドウに対応しており、100万トークンあたり2~6ドルという極めて競争力のある価格戦略を採用しています。これは以前のGrok 4よりも大幅に低価格です。技術的には、Grok 4.20は未知の領域において強い自制心を示し、「分からない」と認める傾向が大幅に高まっており、誤答率は約5分の1となっています。

大規模AIモデル間の世界的な競争は、もはや純粋なスケール重視から、推論の深さと事実の正確さを競う二面的な競争へと進化しています。 Grok 4.20のリリースは、汎用人工知能(AGI)の追求において「誠実さ」と「低い幻覚率」を優先することで、独自の競争優位性を構築するというxAIの戦略を象徴しています。事実の信頼性に対するこの徹底したこだわりは、厳格な業界におけるAIの実用性を高めるだけでなく、将来のマルチエージェントシステムにおける情報の完全性に対して、より信頼できる基盤を築くことにもつながります。
Apple初のAIハードウェアが公開:カメラ搭載のAirPodsがDVT段階へ
AppleのAIハードウェアへの野心が、ますます明確になってきている。 著名なテックジャーナリストのマーク・ガーマン氏によると、かねてより期待されていたカメラ内蔵のAirPodsが、開発の重要な最終段階である「デザイン検証テスト(DVT)」に入ったという。これは、製品の工業デザインと主要機能がほぼ確定したことを意味し、このイヤホンはApple初の真のAIウェアラブルデバイスとなる見込みだ。写真撮影
iOS 27で、チャットボット機能を備えた独立型Siriアプリがリリースされる
Appleの2026年ワールドワイド・デベロッパーズ・カンファレンス(WWDC)まであと1ヶ月を切った今、著名なテックジャーナリストのマーク・ガーマン氏が、iOS 27に関する新たな情報を明らかにした。 「Rave」というコードネームが付けられた次期システムでは、Siriが独立したアプリとして復活する。Siriが専用の起動ポイントを取り戻すのは、15年ぶりのことだ。アップデートされたSiriは常時
AI専門家が投入:大規模モデルが工場を席巻、工業生産が新たな進化の段階へ
生物発酵、建築設計、さらには排水処理の最前線において、ある新しい「従業員」が、従来の製造業を静かに変革しつつある。彼らは汗まみれの労働者ではなく、「AIマスター」として知られる産業用時系列制御大規模モデルであり、その名は「ManuDrive」だ。上海交通大学の人工知能・微細構造研究所(AIMS Lab)による最近の画期的な成果が、産業界の注目を集めている。李金金教授が設立したこの研究所は、現在、A





家






