選項
首頁
新聞
Datagemma使用現實世界數據處理AI幻覺

Datagemma使用現實世界數據處理AI幻覺

2025-04-10
147

Datagemma使用現實世界數據處理AI幻覺

大型語言模型(LLMs)是當今AI突破的核心,能夠篩選海量文本數據集,生成摘要、激發創意,甚至撰寫程式碼。然而,儘管其能力強大,這些模型有時會提供完全錯誤的資訊,這一問題被稱為「幻覺」。這是生成式AI世界中的一大障礙。

我們很高興分享一些前沿研究,這些研究正面解決此問題,旨在通過將LLMs與現實世界的統計數據結合,減少幻覺。我們也興奮地介紹DataGemma,這是首個將LLMs與Google的Data Commons豐富現實數據連結的開放模型。

Data Commons:可信數據的寶庫

Data Commons就像一個不斷擴展的公共數據巨型圖書館,擁有超過2400億個數據點,涵蓋從健康到經濟的各種主題。它從聯合國、世界衛生組織、疾病控制中心和人口普查局等可靠性來源收集這些資訊。通過將這些數據集整合成單一、強大的工具集和AI模型,Data Commons幫助政策制定者、研究人員和組織獲得所需的精確洞察。

想像一個龐大的數據庫,你可以用簡單的英文提問,例如哪些非洲國家電力普及率增長最快,或美國各郡的收入與糖尿病有何關聯。這就是Data Commons的魅力。

Data Commons如何幫助對抗幻覺

隨著越來越多的人轉向生成式AI,我們致力於通過將Data Commons融入我們的輕量級頂尖開放模型家族Gemma,使這些體驗更加扎實。這些DataGemma模型現已開放供研究人員和開發者使用。

DataGemma通過利用Data Commons的知識,提升了Gemma的能力,使用兩種方法來提高LLMs的準確性和推理能力:

  1. RIG(檢索交錯生成)通過主動對照Data Commons的數據檢查事實,增強了我們的Gemma 2模型。當你向DataGemma提問時,它會從Data Commons中搜尋統計數據,提供堅實的答案。雖然RIG不是新概念,但我們在DataGemma中使用它的方式相當特別。

    範例查詢:「全球可再生能源使用量增加嗎?」應用DataGemma RIG方法利用Data Commons(DC)提供權威數據。
  2. RAG(檢索增強生成)讓語言模型提取超出其訓練範圍的額外資訊,使回答更豐富、更準確。透過DataGemma,我們利用Gemini 1.5 Pro的長上下文窗口,在模型生成回答前從Data Commons獲取相關數據,減少幻覺。

    範例查詢:「全球可再生能源使用量增加嗎?」應用DataGemma RAG方法展示更強的推理能力和腳註包含。

令人振奮的成果與未來展望

我們的RIG和RAG初步測試結果良好。我們的模型在處理數字時展現出更高的準確性,這意味著研究、決策或僅出於好奇心使用這些模型的人將遇到更少的幻覺。你可以在我們的研究論文中查看這些結果。

RAG查詢與回答的示意圖。支持真實統計數據以表格形式從Data Commons提供。*為簡潔起見,僅顯示部分回答。 我們不會就此止步。我們全力以赴改進這些方法,擴大努力規模,並進行更多測試。最終,我們將把這些改進應用於Gemma和Gemini模型,從有限訪問階段開始。

通過分享我們的研究並開放這個新的Gemma模型變體,我們希望廣泛推廣基於Data Commons的技術。使LLMs更可靠和可信對於將其轉化為每個人的重要工具至關重要,幫助構建一個AI提供準確資訊、支持明智選擇並深化我們對世界理解的未來。

研究人員和開發者可立即使用我們的RIG和RAG快速入門筆記本開始體驗DataGemma。要深入了解Data Commons與Gemma如何協作,請查看我們的Research post。

相關文章
Salesforce 揭曉 Slack 中 AI 數位隊友以對抗 Microsoft Copilot Salesforce 揭曉 Slack 中 AI 數位隊友以對抗 Microsoft Copilot Salesforce 推出全新工作場所 AI 策略,於週一宣布在 Slack 對話中引入專屬的「數位隊友」。全新工具 Agentforce in Slack 讓企業能夠創建並部署針對特定任務的 AI 代理,這些代理可搜尋工作場所聊天記錄、存取公司資料,並在員工日常工作的訊息平台內執行操作。「正如專業員工協作解決問題,我們的客戶需要 AI 代理共同合作,為客戶和員工解決問題,」Salesforce
甲骨文40億美元Nvidia晶片投資推動德州AI數據中心 甲骨文40億美元Nvidia晶片投資推動德州AI數據中心 據《金融時報》報導,甲骨文計劃投資約40億美元於Nvidia晶片,為OpenAI在德州開發的大型新數據中心提供動力。這筆交易是迄今為止最大的晶片收購之一,凸顯了對AI運算資源的激增需求。該設施位於德州阿比林,是美國首個「星門」數據中心。由OpenAI和軟銀支持,屬於建設大規模AI基礎設施的更廣泛計劃的一部分。該德州中心預計明年完工,將提供1.2吉瓦的運算能力,位列全球最大之列。甲骨文計劃採購約40
Meta AI應用程式將推出高級訂閱與廣告 Meta AI應用程式將推出高級訂閱與廣告 Meta的AI應用程式即將推出付費訂閱服務,類似於OpenAI、Google和Microsoft等競爭對手的產品。在2025年第一季財報電話會議中,Meta首席執行官馬克·祖克柏格概述了高級服務的計劃,讓用戶能夠使用更強大的運算能力或Meta AI的額外功能。為了與ChatGPT競爭,Meta本週推出了一款獨立的AI應用程式,允許用戶直接與聊天機器人互動並進行圖像生成。該聊天機器人目前擁有近10億
評論 (37)
0/200
StephenScott
StephenScott 2025-08-08 17:00:59

This article on DataGemma is super intriguing! I love how it dives into fixing AI hallucinations with real-world data. Makes me wonder if we’ll finally get models that don’t spit out random nonsense. 😄 Anyone else excited about this?

ArthurYoung
ArthurYoung 2025-07-29 20:25:16

This article on DataGemma is super intriguing! It's wild how LLMs can churn out so much but still trip over facts. Excited to see how real-world data could make AI less of a fibber! 😄

RalphJohnson
RalphJohnson 2025-04-21 12:26:32

DataGemmaは本当に助かる!AIの幻覚を現実世界のデータで抑えてくれるから、まるでAIにファクトチェッカーが付いているみたい。もう少し処理が早ければ完璧なんだけど、それでも素晴らしいツールだよね!👍

WillieAnderson
WillieAnderson 2025-04-18 05:10:42

DataGemma 정말 도움이 돼! AI의 환각을 현실 세계 데이터로 줄여주니까, 마치 AI에 팩트체커가 있는 것 같아. 처리 속도가 조금 더 빨랐으면 좋겠지만, 그래도 훌륭한 도구야! 👍

JosephGreen
JosephGreen 2025-04-17 04:14:53

DataGemma is a lifesaver! It really cuts down on those annoying AI hallucinations by grounding the models in real-world data. It's like having a fact-checker for my AI buddy. Only wish it was a bit faster at processing, but still, it's a solid tool! 👍

LeviKing
LeviKing 2025-04-14 04:47:31

DataGemma가 AI의 환각을 해결하기 위한 접근 방식은 정말 멋집니다. 실제 세계의 데이터를 사용하여 AI를 제어하는 것은 훌륭해요. 하지만 정말 문제를 해결하는 건지, 아니면 그저 가리는 건지 궁금해요. 그래도 올바른 방향으로 나아가는 한 걸음이죠. 계속 하세요!

回到頂部
OR