オプション
ニュース
Datagemmaは、実際のデータを使用してAIの幻覚に取り組んでいます

Datagemmaは、実際のデータを使用してAIの幻覚に取り組んでいます

2025年4月10日
171

Datagemmaは、実際のデータを使用してAIの幻覚に取り組んでいます

大規模言語モデル(LLMs)は、今日のAIのブレークスルーの中心にあり、膨大なテキストデータセットを分析して要約を生成し、創造的なアイデアを生み出し、コードを書くことさえ可能です。しかし、その能力にもかかわらず、これらのモデルは時に完全に間違った情報を提供することがあり、これを「ハルシネーション」と呼びます。これは生成AIの世界における大きな課題です。

私たちはこの問題に正面から取り組む最先端の研究を共有できることを嬉しく思います。LLMsを現実世界の統計データに基づかせることで、ハルシネーションを抑えることを目指しています。そして、GoogleのData Commonsから豊富な現実世界のデータとLLMsをリンクする初のオープンモデル、DataGemmaを紹介します。

Data Commons:信頼できるデータの宝庫

Data Commonsは、2400億以上のデータポイントを持つ、公共データの巨大で成長し続けるライブラリのようなものです。健康から経済まで、あらゆる情報をUN、WHO、CDC、統計局などの信頼できる情報源から収集します。これらのデータセットを一つの強力なツールセットとAIモデルに統合することで、Data Commonsは政策立案者、研究者、組織が必要とする正確な洞察を提供します。

たとえば、アフリカのどの国が電力アクセスで最も大きな進展を遂げたか、または米国の郡ごとの収入と糖尿病の関係を、簡単な英語で質問できる巨大なデータベースを想像してください。それがData Commonsです。

Data Commonsがハルシネーション対策にどう役立つか

生成AIを利用する人が増える中、私たちはData CommonsをGemma(軽量で高性能なオープンモデルのファミリー)に組み込むことで、より信頼性の高い体験を提供しようとしています。これらのDataGemmaモデルは、研究者や開発者が利用できるようになりました。

DataGemmaは、Data Commonsの知識を活用してLLMsの精度と推論能力を向上させる2つの優れた手法を用いて、Gemmaの能力を強化します:

  1. RIG(Retrieval-Interleaved Generation)は、Gemma 2モデルを強化し、Data Commonsに対して事実を積極的に検証します。DataGemmaに質問すると、Data Commonsから統計データを探し出し、確かな回答を提供します。RIGは新しいアイデアではありませんが、DataGemmaでの使用方法は非常に特別です。

    例のクエリ:「世界で再生可能エネルギーの使用は増えていますか?」DataGemma RIG手法を適用することで、Data Commons(DC)から信頼できるデータを活用します。
  2. RAG(Retrieval-Augmented Generation)は、言語モデルがトレーニングデータ以外の追加情報を引き出し、より豊かで正確な回答を可能にします。DataGemmaでは、Gemini 1.5 Proの長いコンテキストウィンドウを使用して、モデルが回答を作成する前にData Commonsから関連データを取得し、ハルシネーションを減らします。

    例のクエリ:「世界で再生可能エネルギーの使用は増えていますか?」DataGemma RAG手法を適用することで、より高い推論能力と注釈の包含を示します。

有望な結果と今後の展望

RIGとRAGの初期テストは良好な結果を示しています。数値を扱う際のモデルの精度が向上し、研究、意思決定、または好奇心を満たすためにこれらのモデルを使用する人々のハルシネーションが減少しています。これらの結果は私たちの研究論文で確認できます。

RAGクエリと回答の例。Data Commonsから提供される表として参照される裏付けとなる真実の統計データ。*簡潔さのために部分的な回答を示しています。 私たちはここで終わりません。これらの手法を改良し、取り組みを拡大し、さらに多くのテストで検証を進めます。最終的には、GemmaおよびGeminiモデルにこれらの改良を展開し、限定アクセスフェーズから始めます。

私たちの研究を共有し、この新しいGemmaモデルバリアントをオープンにすることで、Data Commonsに基づくこれらの技術の使用を広く広めたいと考えています。LLMsをより信頼性が高く、信頼できるものにすることは、AIが正確な情報を提供し、情報に基づいた選択をサポートし、世界の理解を深めるための不可欠なツールにするために重要です。

研究者や開発者は、RIGとRAGのクイックスタートノートブックを使用して、DataGemmaをすぐに始めることができます。Data CommonsとGemmaがどのように連携するかをさらに詳しく知りたい場合は、研究投稿をご覧ください。

関連記事
"ドットAIコンパニオンアプリが閉鎖を発表、パーソナライズドサービスを中止" 個人的な友人や親友として機能するように設計されたAIコンパニオン・アプリケーションであるDotが、金曜日の開発者からの発表によると、運営を終了する。Dotを開発したスタートアップのNew Computer社は、10月5日までサービスを提供し、ユーザーが個人データをエクスポートできるようにするとウェブサイトで述べている。このアプリは、共同設立者であるサム・ホイットモアと元アップルのデザイン・スペシャ
Anthropic、AIが作成した書籍の著作権侵害をめぐる訴訟を解決 Anthropic、AIが作成した書籍の著作権侵害をめぐる訴訟を解決 Anthropic社は、米国の著作者との重要な著作権紛争で解決に達し、高額になる可能性のある裁判を回避する集団訴訟の和解案に合意した。今週火曜日に裁判所文書に提出されたこの合意は、AI企業が海賊版の文学作品を使ってクロードモデルを訓練したという申し立てに起因する。和解の詳細は非公開だが、この訴訟は作家のアンドレア・バーツ、チャールズ・グレイバー、カーク・ウォレス・ジョンソンの主張に端を発している。
Figma、AIを搭載したアプリビルダー・ツールを全ユーザーに公開 Figma、AIを搭載したアプリビルダー・ツールを全ユーザーに公開 今年初めに発表された革新的なプロンプト・トゥ・アプリ開発プラットフォームであるFigma Makeが、正式にベータ版を終了し、全ユーザーにロールアウトしました。この画期的なツールは、グーグルのジェミニ・コード・アシストやマイクロソフトのギットハブ・コパイロットのようなAIを搭載したコーディング・アシスタントの仲間入りをし、クリエイターが従来のプログラミングの専門知識がなくても、自然言語の記述を機能
コメント (39)
0/200
WillMitchell
WillMitchell 2025年10月5日 3:30:40 JST

Me pregunto si DataGemma realmente podrá resolver el problema de las alucinaciones en IA. Parece prometedor, pero ya hemos visto muchas soluciones 'milagrosas' que luego no cumplen. Ojalá esta vez sea diferente, porque los errores en los modelos actuales pueden ser bastante graves 😅

BillyAdams
BillyAdams 2025年8月25日 18:47:02 JST

This article on DataGemma is super intriguing! It's wild how LLMs can churn out so much but still trip up on facts sometimes. 😅 Makes me wonder if grounding them in real-world data could finally make AI as reliable as we hope!

StephenScott
StephenScott 2025年8月8日 18:00:59 JST

This article on DataGemma is super intriguing! I love how it dives into fixing AI hallucinations with real-world data. Makes me wonder if we’ll finally get models that don’t spit out random nonsense. 😄 Anyone else excited about this?

ArthurYoung
ArthurYoung 2025年7月29日 21:25:16 JST

This article on DataGemma is super intriguing! It's wild how LLMs can churn out so much but still trip over facts. Excited to see how real-world data could make AI less of a fibber! 😄

RalphJohnson
RalphJohnson 2025年4月21日 13:26:32 JST

DataGemmaは本当に助かる!AIの幻覚を現実世界のデータで抑えてくれるから、まるでAIにファクトチェッカーが付いているみたい。もう少し処理が早ければ完璧なんだけど、それでも素晴らしいツールだよね!👍

WillieAnderson
WillieAnderson 2025年4月18日 6:10:42 JST

DataGemma 정말 도움이 돼! AI의 환각을 현실 세계 데이터로 줄여주니까, 마치 AI에 팩트체커가 있는 것 같아. 처리 속도가 조금 더 빨랐으면 좋겠지만, 그래도 훌륭한 도구야! 👍

トップに戻ります
OR