オプション
ニュース Datagemmaは、実際のデータを使用してAIの幻覚に取り組んでいます

Datagemmaは、実際のデータを使用してAIの幻覚に取り組んでいます

発売日 発売日 2025年4月10日
ビュー ビュー 73

Datagemmaは、実際のデータを使用してAIの幻覚に取り組んでいます

大規模な言語モデル(LLM)は、今日のAIブレークスルーの中心にあり、概要を作成して、概要を作成し、創造的なアイデアを引き起こし、コードを書くことさえできます。しかし、彼らの腕前にもかかわらず、これらのモデルは、私たちが「幻覚」と呼ぶ問題である単なる間違っている情報を提供することがあります。これは、生成AIの世界では大きなハードルです。

この問題に真正面から取り組んでいる最先端の研究を共有することを楽しみにしています。また、LLMSをGoogleのデータコモンズからの豊富な現実世界のデータと結びつける最初のオープンモデルであるDatagemmaを導入することに興奮しています。

データコモンズ:信頼できるデータの宝庫

Data Commonsは、一般的に成長し続ける公開データのライブラリのようなものであり、健康から経済学まで、2,400億を超えるデータポイントを誇っています。この情報は、国連、WHO、CDC、および国勢調査局などの信頼できる情報源から引き出します。これらのデータセットを単一の強力なツールセットとAIモデルにマージすることにより、データコモンズは政策立案者、研究者、および組織が必要な正確な洞察を得るのに役立ちます。

アフリカ諸国が電力アクセスの最大のジャンプを見た、または米国郡の糖尿病にどのように関係しているかなど、平易な英語で質問することができる広大なデータベースを想像してください。それはあなたのためのデータコモンズです。

データコモンズが幻覚と戦う方法

より多くの人々が生成的なAIに目を向けるにつれて、私たちはこれらの経験を、軽量で一流のオープンモデルの家族であるジェマにデータのコモンを織り込むことで、より根ざしているように取り組んでいます。これらのDatagemmaモデルは、研究者と開発者が飛び込むために利用できるようになりました。

Datagemmaは、2つのクールな方法を使用してLLMSの精度と推論を改善するために、データコモンズの知識を活用することにより、Gemmaの能力を高めます。

  1. RIG(検索型インターレーブ生成)は、データコモンズに対して事実を積極的にチェックすることにより、Gemma 2モデルを増やします。 Datagemmaに質問をすると、Data Commonsから統計データを追い詰めて、しっかりした答えを出します。 Rigは新しいアイデアではありませんが、Datagemmaでそれを使用する方法はかなり特別です。

    クエリの例:「再生可能エネルギーの使用は世界で増加しましたか?」 'datagemmaリグの方法論の適用権は、権威あるデータにデータコモンズ(DC)を活用します。
  2. RAG(検索された高等世代)を使用すると、言語モデルがトレーニングされているものを超えて追加の情報を引き込み、回答をより豊かで正確にします。 Datagemmaを使用すると、Gemini 1.5 Proの長いコンテキストウィンドウを使用して、モデルが応答を作成し始め、幻覚を削減する前に、データコモンズから関連するデータを取得します。

    クエリの例:「再生可能エネルギーの使用が世界で増加したのか?」Datagemma rag方法論の適用は、脚注のより大きな推論と包含を示しています。

有望な結果と次は何ですか

リグとラグを使用した初期のテストは見栄えがよくあります。数字を扱う際にモデルの精度が向上しているため、研究、意思決定、または好奇心を満たすために、これらのモデルを使用する人々の幻覚が少なくなります。これらの結果を研究論文で確認できます。

ぼろきれのクエリと応答の図。グラウンドトゥルース統計をサポートすることは、データコモンズから提供される表として参照されます。 *簡潔に示されている部分的な応答。 ここでは止まっていません。私たちは皆、これらの方法を洗練し、努力を拡大し、より多くのテストで絞り手を介してそれらを置くことに取り組んでいます。最終的に、これらの改善は、限定されたアクセスフェーズから始めて、GemmaモデルとGeminiモデルの両方に展開します。

私たちの研究を共有し、この新しいGemmaモデルバリアントをオープンにすることにより、これらのデータコモンズベースのテクニックの使用を広範囲に広めることを望んでいます。 LLMをより信頼性と信頼できるものにすることは、それらをすべての人にとって重要なツールに変えるために重要であり、AIが人々に正確な情報を提供し、情報に基づいた選択をサポートし、世界の理解を深める未来を構築するのに役立ちます。

研究者と開発者は、RIGとRAGの両方にQuickStartノートブックを使用して、DatageMMAにすぐに飛び込むことができます。 Data CommonsとGemmaがどのように連携するかをさらに深く掘り下げるには、調査投稿をご覧ください。

関連記事
Google’s AI Futures Fund may have to tread carefully Google’s AI Futures Fund may have to tread carefully Google’s New AI Investment Initiative: A Strategic Shift Amid Regulatory ScrutinyGoogle's recent announcement of an AI Futures Fund marks a bold move in the tech giant's ongoing qu
Oura adds AI-powered glucose tracking and meal logging Oura adds AI-powered glucose tracking and meal logging Oura Reinforces Its Commitment to Metabolic Health with Two Exciting New FeaturesOura is stepping up its game in the world of metabolic health with two cutting-edge, AI-driven feat
Judge slams lawyers for ‘bogus AI-generated research’ Judge slams lawyers for ‘bogus AI-generated research’ Judge Penalizes Law Firms for Using AI Without DisclosureIn a recent ruling, California Judge Michael Wilner slapped two prominent law firms with a hefty fine of $31,000 for secret
コメント (30)
0/200
StevenHill
StevenHill 2025年4月10日 8:45:43 GMT

DataGemma's approach to tackling AI hallucinations is impressive! It really helps in filtering out the nonsense from AI outputs. However, sometimes it's a bit too cautious and filters out useful info too. Still, a step in the right direction!

RoySmith
RoySmith 2025年4月11日 6:38:27 GMT

DataGemmaのAIの幻覚対策は素晴らしいですね!AIの出力から無意味な情報をフィルタリングするのに役立ちます。ただ、時々過剰に慎重で、有用な情報までフィルタリングしてしまうことがあります。それでも、正しい方向への一歩です!

CarlHill
CarlHill 2025年4月11日 6:18:09 GMT

DataGemma의 AI 환각 문제 해결 방식이 인상적이에요! AI 출력에서 nonsense를 걸러내는 데 정말 도움이 됩니다. 하지만 때때로 너무 신중해서 유용한 정보도 걸러내는 경우가 있어요. 그래도 올바른 방향으로 나아가는 한 걸음이죠!

JosephGreen
JosephGreen 2025年4月10日 19:38:27 GMT

A abordagem da DataGemma para lidar com as alucinações de IA é impressionante! Realmente ajuda a filtrar o absurdo das saídas de IA. No entanto, às vezes é um pouco cautelosa demais e filtra informações úteis também. Ainda assim, um passo na direção certa!

LarryMartinez
LarryMartinez 2025年4月10日 11:04:37 GMT

La forma en que DataGemma aborda las alucinaciones de la IA es impresionante. Realmente ayuda a filtrar la basura de las salidas de la IA. Sin embargo, a veces es un poco demasiado cautelosa y filtra información útil también. Aún así, es un paso en la dirección correcta.

RonaldMartinez
RonaldMartinez 2025年4月11日 17:27:29 GMT

DataGemma is a lifesaver when it comes to dealing with AI hallucinations. It really grounds the models with real-world data, which is super helpful for my projects. Sometimes it feels a bit slow, but hey, accuracy over speed any day, right? Definitely a must-have tool!

トップに戻ります
OR