選項
首頁 消息 Datagemma使用現實世界數據處理AI幻覺

Datagemma使用現實世界數據處理AI幻覺

發布日期 發布日期 2025-04-10
視圖 視圖 73

Datagemma使用現實世界數據處理AI幻覺

大型語言模型(LLM)是當今AI突破的核心,能夠篩選大量文本數據集以產生摘要,引發創意甚至編寫代碼。然而,儘管它們具有實力,但這些模型有時可以提供完全錯誤的信息,這是我們稱為“幻覺”的問題。這是生成AI界的一個巨大障礙。

我們很高興分享一些尖端的研究,這些研究正直接解決這個問題,旨在通過將LLMS紮根於現實世界的統計數據來遏制幻覺。我們很高興介紹Datagemma,這是第一個開放模型,該模型將LLM與Google數據共享中的大量現實數據聯繫起來。

數據共享:可信賴的數據寶庫

數據共享就像一個巨大的,不斷增長的公共數據庫,從健康到經濟學的所有內容都擁有超過2400億個數據點。它從聯合國,誰,CDC和人口普查局等可靠來源中獲取此信息。通過將這些數據集合併為單個功能強大的工具集和AI模型,數據共享共同體可以幫助決策者,研究人員和組織獲得所需的準確見解。

想像一下,一個龐大的數據庫,您可以在其中提出簡單的英語問題,例如哪些非洲國家的電力訪問量最大,或收入與美國縣的糖尿病有何關係。這是您的數據共享。

數據共享如何幫助幻覺

隨著越來越多的人轉向生成的AI,我們正在努力使這些體驗更加紮根,將數據共享匯總到我們的輕巧,一流的開放模型家族Gemma。這些數據基模型現在可以供研究人員和開發人員潛入其中。

Datagemma通過利用兩種很酷的方法來提高LLMS的準確性和推理來提高Gemma的能力:

  1. 鑽機(檢索間隔的生成)通過積極檢查數據共享的事實來擴大我們的Gemma 2模型。當您向Datagemma提出問題時,它會從數據共享中尋找統計數據,從而為您提供可靠的答案。雖然鑽機不是一個新想法,但我們在數據基因中使用它的方式非常特別。

    示例查詢:“世界上的可再生能源的使用在世界上增加了嗎?”應用Datagemma鑽機方法利用數據共享(DC)作為權威數據。
  2. 抹布(檢索效果的一代)讓語言模型可以汲取額外的信息,超出他們接受過的培訓,使他們的答案更加豐富,更準確。使用Datagemma,我們使用Gemini 1.5 Pro的長上下文窗口在模型開始製定響應之前從數據共享中獲取相關數據,從而減少了幻覺。

    示例查詢:''世界上使用可再生能源的使用是否有所增加? ”應用Datagemma Rag方法論展示了更大的推理和包含腳註。

有希望的結果和下一步

我們與鑽機和抹布的早期測試看起來不錯。當處理數字時,我們會看到模型中更好的準確性,這意味著對於使用這些模型進行研究,決策或僅僅滿足其好奇心的人們而言,幻覺更少。您可以在我們的研究論文中查看這些結果。

抹布查詢和響應的插圖。支持地面真實統計數據被稱為數據共享的表。 *對簡潔的部分響應。 我們不停在這裡。我們都在完善這些方法,擴大我們的努力,並通過更多的測試將它們放在蠕動中。最終,我們將從限制階段開始對Gemma和Gemini模型進行這些改進。

通過分享我們的研究並使這種新的Gemma模型變體打開,我們希望將這些基於數據共享技術的技術廣泛傳播。使LLMS更加可靠和值得信賴對於將它們變成每個人的重要工具至關重要,從而幫助建立一個未來,在該未來中,AI可以為人們提供準確的信息,支持知情的選擇並加深我們對世界的理解。

研究人員和開發人員可以使用我們的鑽機和抹布的Quickstart Notebook使用Datagemma跳入。要深入研究數據共享和Gemma如何共同努力,請查看我們的研究文章。

相關文章
Google’s AI Futures Fund may have to tread carefully Google’s AI Futures Fund may have to tread carefully Google’s New AI Investment Initiative: A Strategic Shift Amid Regulatory ScrutinyGoogle's recent announcement of an AI Futures Fund marks a bold move in the tech giant's ongoing qu
Oura adds AI-powered glucose tracking and meal logging Oura adds AI-powered glucose tracking and meal logging Oura Reinforces Its Commitment to Metabolic Health with Two Exciting New FeaturesOura is stepping up its game in the world of metabolic health with two cutting-edge, AI-driven feat
Judge slams lawyers for ‘bogus AI-generated research’ Judge slams lawyers for ‘bogus AI-generated research’ Judge Penalizes Law Firms for Using AI Without DisclosureIn a recent ruling, California Judge Michael Wilner slapped two prominent law firms with a hefty fine of $31,000 for secret
評論 (30)
0/200
StevenHill
StevenHill 2025-04-10 16:45:43

DataGemma's approach to tackling AI hallucinations is impressive! It really helps in filtering out the nonsense from AI outputs. However, sometimes it's a bit too cautious and filters out useful info too. Still, a step in the right direction!

RoySmith
RoySmith 2025-04-11 14:38:27

DataGemmaのAIの幻覚対策は素晴らしいですね!AIの出力から無意味な情報をフィルタリングするのに役立ちます。ただ、時々過剰に慎重で、有用な情報までフィルタリングしてしまうことがあります。それでも、正しい方向への一歩です!

CarlHill
CarlHill 2025-04-11 14:18:09

DataGemma의 AI 환각 문제 해결 방식이 인상적이에요! AI 출력에서 nonsense를 걸러내는 데 정말 도움이 됩니다. 하지만 때때로 너무 신중해서 유용한 정보도 걸러내는 경우가 있어요. 그래도 올바른 방향으로 나아가는 한 걸음이죠!

JosephGreen
JosephGreen 2025-04-11 03:38:27

A abordagem da DataGemma para lidar com as alucinações de IA é impressionante! Realmente ajuda a filtrar o absurdo das saídas de IA. No entanto, às vezes é um pouco cautelosa demais e filtra informações úteis também. Ainda assim, um passo na direção certa!

LarryMartinez
LarryMartinez 2025-04-10 19:04:37

La forma en que DataGemma aborda las alucinaciones de la IA es impresionante. Realmente ayuda a filtrar la basura de las salidas de la IA. Sin embargo, a veces es un poco demasiado cautelosa y filtra información útil también. Aún así, es un paso en la dirección correcta.

RonaldMartinez
RonaldMartinez 2025-04-12 01:27:29

DataGemma is a lifesaver when it comes to dealing with AI hallucinations. It really grounds the models with real-world data, which is super helpful for my projects. Sometimes it feels a bit slow, but hey, accuracy over speed any day, right? Definitely a must-have tool!

回到頂部
OR