Datagemmaは、実際のデータを使用してAIの幻覚に取り組んでいます

家

ニュース

2025年4月10日

ChristopherAllen

237

# ai

Datagemmaは、実際のデータを使用してAIの幻覚に取り組んでいます

大規模言語モデル（LLMs）は、今日のAIのブレークスルーの中心にあり、膨大なテキストデータセットを分析して要約を生成し、創造的なアイデアを生み出し、コードを書くことさえ可能です。しかし、その能力にもかかわらず、これらのモデルは時に完全に間違った情報を提供することがあり、これを「ハルシネーション」と呼びます。これは生成AIの世界における大きな課題です。

私たちはこの問題に正面から取り組む最先端の研究を共有できることを嬉しく思います。LLMsを現実世界の統計データに基づかせることで、ハルシネーションを抑えることを目指しています。そして、GoogleのData Commonsから豊富な現実世界のデータとLLMsをリンクする初のオープンモデル、DataGemmaを紹介します。

Data Commons：信頼できるデータの宝庫

Data Commonsは、2400億以上のデータポイントを持つ、公共データの巨大で成長し続けるライブラリのようなものです。健康から経済まで、あらゆる情報をUN、WHO、CDC、統計局などの信頼できる情報源から収集します。これらのデータセットを一つの強力なツールセットとAIモデルに統合することで、Data Commonsは政策立案者、研究者、組織が必要とする正確な洞察を提供します。

たとえば、アフリカのどの国が電力アクセスで最も大きな進展を遂げたか、または米国の郡ごとの収入と糖尿病の関係を、簡単な英語で質問できる巨大なデータベースを想像してください。それがData Commonsです。

Data Commonsがハルシネーション対策にどう役立つか

生成AIを利用する人が増える中、私たちはData CommonsをGemma（軽量で高性能なオープンモデルのファミリー）に組み込むことで、より信頼性の高い体験を提供しようとしています。これらのDataGemmaモデルは、研究者や開発者が利用できるようになりました。

DataGemmaは、Data Commonsの知識を活用してLLMsの精度と推論能力を向上させる2つの優れた手法を用いて、Gemmaの能力を強化します：

RIG（Retrieval-Interleaved Generation）は、Gemma 2モデルを強化し、Data Commonsに対して事実を積極的に検証します。DataGemmaに質問すると、Data Commonsから統計データを探し出し、確かな回答を提供します。RIGは新しいアイデアではありませんが、DataGemmaでの使用方法は非常に特別です。
例のクエリ：「世界で再生可能エネルギーの使用は増えていますか？」DataGemma RIG手法を適用することで、Data Commons（DC）から信頼できるデータを活用します。
RAG（Retrieval-Augmented Generation）は、言語モデルがトレーニングデータ以外の追加情報を引き出し、より豊かで正確な回答を可能にします。DataGemmaでは、Gemini 1.5 Proの長いコンテキストウィンドウを使用して、モデルが回答を作成する前にData Commonsから関連データを取得し、ハルシネーションを減らします。
例のクエリ：「世界で再生可能エネルギーの使用は増えていますか？」DataGemma RAG手法を適用することで、より高い推論能力と注釈の包含を示します。

有望な結果と今後の展望

RIGとRAGの初期テストは良好な結果を示しています。数値を扱う際のモデルの精度が向上し、研究、意思決定、または好奇心を満たすためにこれらのモデルを使用する人々のハルシネーションが減少しています。これらの結果は私たちの研究論文で確認できます。

RAGクエリと回答の例。Data Commonsから提供される表として参照される裏付けとなる真実の統計データ。*簡潔さのために部分的な回答を示しています。私たちはここで終わりません。これらの手法を改良し、取り組みを拡大し、さらに多くのテストで検証を進めます。最終的には、GemmaおよびGeminiモデルにこれらの改良を展開し、限定アクセスフェーズから始めます。

私たちの研究を共有し、この新しいGemmaモデルバリアントをオープンにすることで、Data Commonsに基づくこれらの技術の使用を広く広めたいと考えています。LLMsをより信頼性が高く、信頼できるものにすることは、AIが正確な情報を提供し、情報に基づいた選択をサポートし、世界の理解を深めるための不可欠なツールにするために重要です。

研究者や開発者は、RIGとRAGのクイックスタートノートブックを使用して、DataGemmaをすぐに始めることができます。Data CommonsとGemmaがどのように連携するかをさらに詳しく知りたい場合は、研究投稿をご覧ください。

カカオ・モビリティ、物理AIに向けたレベル4自動運転のロードマップを提示カカオ・モビリティは、フィジカルAI戦略の一環として、レベル4の自動運転技術を自社開発する計画だ。ソウルCOEXで開催された「2026ワールドITショー」のカンファレンスにおいて、カカオモビリティのフィジカルAI部門長兼副社長であるキム・ジンギュ氏がロードマップを発表した。同氏の講演は、フィジカルAI時代におけるモビリティプラットフォームを軸とした自動運転サービスに焦点を当てたものだった。聯合

バリー・ディラー：AGIの実現が近づく中、サム・アルトマンへの信頼は重要ではない億万長者のメディア界の巨頭であるバリー・ディラー氏は、最近の報道でそのように示唆されているにもかかわらず、OpenAIのCEOサム・アルトマン氏が信頼できない人物だとは考えていない。今週開催されたウォール・ストリート・ジャーナル紙主催の「Future of Everything」カンファレンスで講演したディラー氏は、一部の元同僚や取締役から、時折人を利用したり欺いたりする傾向があるとの非難を受けて

YouTube、政治家、政府関係者、ジャーナリストを対象にAIによるディープフェイク検出機能を拡大火曜日、YouTubeは、ディープフェイク検出技術を、特定の政府関係者、政治家候補者、ジャーナリストを対象に拡大すると発表した。このツールはAIによって生成された肖像を識別し、パイロットプログラムの参加者は、YouTubeのポリシーに違反していると判断した無断コンテンツの削除をリクエストできるようになる。この検出システムは、先行するテスト段階を経て、昨年、YouTubeパートナープログラムに参加す

関連特集おすすめ

仕事

おすすめのAI採用ツール：履歴書の選考と候補者の面接スケジュール管理を自動化

XIX.AIで、2026年最新の評価の高いAI採用ツールをチェックしましょう。厳選されたリストには、履歴書のスクリーニングや候補者の面接スケジュール管理を自動化する、強力で画期的なソリューションが揃っています。実際のテスト結果や毎週更新されるランキングを参考に、無料版と有料版の比較が可能です。最適な採用アシスタントを見つけて、今すぐ採用業務を効率化しましょう！

10 ツール

xix.ai

生産性

AIパーソナルウェルネス＆集中力コーチ：バーンアウトの予防とメンタルエネルギーの向上

XIX.AIで、2026年最高のAIパーソナルウェルネス＆集中力向上ツールをご紹介。厳選されたランキングでは、バーンアウトの解消やメンタルエネルギーの向上に役立つ、高評価で画期的なツールを取り上げています。実際のユーザーの声をもとに、無料版と有料版の比較も可能です。今すぐ、最高の生産性とウェルビーイングへの道を開きましょう。

10 ツール

xix.ai

チャットボット

高評価のAI恋愛チャットボット：一貫した個性で長期的な関係を築く

2026年版、本物の長期的なつながりを築くための、高評価のAI恋愛チャットボットをご紹介します。厳選されたリストには、魅力的で一貫性のあるキャラクター、無料版と有料版の比較、そして実地テストの結果が掲載されています。あなたにぴったりのパートナーを見つけて、今すぐXIX.AIで関係を築き始めましょう。

10 ツール

xix.ai

教育と学習

最高のAIデータサイエンスメンター：SQL、Pandas、および機械学習ワークフローをマスターしましょう

2026年に最も優れたAIデータサイエンスのメンターを探して、SQL、Pandas、およびMLワークフローをマスターしましょう。XIX.AIで評価の高い厳選されたメンターたちの指導を受けて、力強く、革新的なアドバイスを得てください。無料オプションと有料オプションを実世界の視点から比較しましょう。今日すぐにデータサイエンスのスキルを向上させましょう。

10 ツール

xix.ai

チャットボット

最高のAIを使ったナンパ＆会話トレーニング：社交的な魅力と自信をリアルタイムで高める

XIX.AIで、2026年最高のAIを使った口説き術・会話トレーニングツールを発見しましょう。厳選された高評価のツールが、リアルタイムで社交的な魅力と自信を築くお手伝いをします。無料版と有料版の比較や毎週更新されるランキングを参考に、ぜひ試すべき画期的なツールを探してみてください。今すぐ、あなたの社交力を引き出しましょう。

10 ツール

xix.ai

コード

自動化ユニットテストに最適なAIツール：ワンクリックでJest、PyTest、JUnitのテストケースを生成する

2026年に登場した、自動化ユニットテスト用の最高評価を受けたAIツールを発見してください。当社が厳選したこれらのツールは、Jest、PyTest、JUnitのテストケースを瞬時に生成するための強力で革新的なソリューションです。XIX.AIでは、無料オプションと有料オプションを実際のテストデータと共に比較し、毎週更新されるランキングもご覧いただけます。今すぐAIの力を活用して、開発生産性を向上させましょう。

10 ツール

xix.ai

コメント (42)

0/500

最初にログインしてください

PaulLopez

2026年5月9日 21:00:13 JST

DataGemma這方法聽起來挺實際的，直接用真實數據來對抗AI幻覺，感覺比單純調整演算法更治本。不過好奇它處理的數據範圍有多大？會不會有偏見問題？希望未來能看到更多實測結果！🤔

HarryRoberts

2026年4月12日 15:01:14 JST

Interesting approach! Using real-world data to ground the model seems like a practical step beyond just scaling parameters. Hope it doesn't just trade hallucinations for boring, overly-cautious outputs though. The 'Gemma' naming trend continues! 🤔

WilliamRamirez

2025年10月18日 19:30:33 JST

Finally! A real solution to AI hallucinations? DataGemma sounds promising, but I'm honestly a bit skeptical. 🤔 How do they ensure the "real-world data" isn't biased itself? Would love to see a breakdown of their methodology compared to other approaches like Retrieval-Augmented Generation.

WillMitchell

2025年10月5日 3:30:40 JST

Me pregunto si DataGemma realmente podrá resolver el problema de las alucinaciones en IA. Parece prometedor, pero ya hemos visto muchas soluciones 'milagrosas' que luego no cumplen. Ojalá esta vez sea diferente, porque los errores en los modelos actuales pueden ser bastante graves 😅

BillyAdams

2025年8月25日 18:47:02 JST

This article on DataGemma is super intriguing! It's wild how LLMs can churn out so much but still trip up on facts sometimes. 😅 Makes me wonder if grounding them in real-world data could finally make AI as reliable as we hope!

StephenScott

2025年8月8日 18:00:59 JST

This article on DataGemma is super intriguing! I love how it dives into fixing AI hallucinations with real-world data. Makes me wonder if we’ll finally get models that don’t spit out random nonsense. 😄 Anyone else excited about this?

トップニュース

AI BuilderとPower Automateがドキュメントの要約を革新 AIホストのNotebooklm Podcastのホストは、インタビューに利用できるようになりました中国、国家ヒューマノイドロボット及び具現化された知能の基準を発表企業のAI導入は頭打ち、ランプのデータで明らかに Bing Image Creator チュートリアル: AIアート生成ガイドあなたの声を使用してAIミュージックを作成することを学ぶ：ステップバイステップSunoチュートリアル iMyFone MagicMic：リアルタイムAIボイスチェンジャーのレビューとチュートリアル 2025年トップAIビデオジェネレーター：Pika Labs vs 代替案 DeepSeek V4、マルチモーダルAIのゲームチェンジャーとして登場エンボディッド・インテリジェンス、無秩序な拡大を抑制するための初の業界標準を発表

もっと

特集