Datagemma वास्तविक दुनिया के डेटा के साथ AI मतिभ्रम से निपटता है

घर

समाचार

10 अप्रैल 2025

ChristopherAllen

# ai

Datagemma वास्तविक दुनिया के डेटा के साथ AI मतिभ्रम से निपटता है

बड़े भाषा मॉडल (LLM) आज की AI सफलताओं के केंद्र में हैं, जो सारांश का उत्पादन करने, रचनात्मक विचारों को स्पार्क करने और यहां तक कि कोड लिखने के लिए बड़े पैमाने पर पाठ डेटासेट के माध्यम से स्थानांतरित करने में सक्षम हैं। फिर भी, उनके कौशल के बावजूद, ये मॉडल कभी -कभी जानकारी दे सकते हैं कि यह सिर्फ सादा गलत है, एक समस्या जिसे हम "मतिभ्रम" कहते हैं। यह उदार एआई की दुनिया में एक बड़ी बाधा है।

हम कुछ अत्याधुनिक अनुसंधान को साझा करने के लिए उत्साहित हैं जो इस मुद्दे से निपट रहे हैं, जो वास्तविक दुनिया के आंकड़ों में एलएलएम को ग्राउंडिंग करके मतिभ्रम पर अंकुश लगाने के उद्देश्य से है। और हम Datagemma को पेश करने के लिए रोमांचित हैं, पहला खुला मॉडल जो LLM को Google के डेटा कॉमन्स से वास्तविक दुनिया के डेटा के धन के साथ जोड़ता है।

डेटा कॉमन्स: भरोसेमंद डेटा का एक खजाना

डेटा कॉमन्स सार्वजनिक डेटा के एक विशाल, कभी-कभी बढ़ते पुस्तकालय की तरह है, जो स्वास्थ्य से अर्थशास्त्र तक सब कुछ पर 240 बिलियन से अधिक डेटा बिंदुओं पर गर्व करता है। यह इस जानकारी को संयुक्त राष्ट्र, डब्ल्यूएचओ, सीडीसी और जनगणना ब्यूरो जैसे विश्वसनीय स्रोतों से खींचता है। इन डेटासेट को एक एकल, शक्तिशाली टूलसेट और एआई मॉडल में विलय करके, डेटा कॉमन्स नीति निर्माताओं, शोधकर्ताओं और संगठनों को सटीक अंतर्दृष्टि प्राप्त करने में मदद करते हैं।

एक विशाल डेटाबेस की कल्पना करें जहां आप सादे अंग्रेजी में सवाल पूछ सकते हैं, जैसे कि अफ्रीकी देशों ने बिजली पहुंच में सबसे बड़ी छलांग देखी है, या कैसे आय अमेरिकी काउंटियों में मधुमेह से संबंधित है। यह आपके लिए डेटा कॉमन्स है।

कैसे डेटा कॉमन्स मतिभ्रम से लड़ने में मदद करते हैं

जैसा कि अधिक लोग जेनेरिक एआई की ओर मुड़ते हैं, हम इन अनुभवों को अधिक से अधिक काम करने के लिए काम कर रहे हैं, जो डेटा कॉमन्स को जेम्मा, हमारे परिवार के हल्के, शीर्ष पायदान खुले मॉडल में बुनने के द्वारा अधिक ग्राउंडेड कर रहे हैं। ये डेटागेम्मा मॉडल अब शोधकर्ताओं और डेवलपर्स के लिए गोता लगाने के लिए उपलब्ध हैं।

Datagemma LLM की सटीकता और तर्क को बेहतर बनाने के लिए दो शांत तरीकों का उपयोग करते हुए, डेटा कॉमन्स के ज्ञान में टैप करके Gemma की क्षमताओं को बढ़ाता है:

RIG (पुनर्प्राप्ति-इंटरलेव्ड जेनरेशन) डेटा कॉमन्स के खिलाफ तथ्यों की सक्रिय रूप से जांच करके हमारे जेम्मा 2 मॉडल को बढ़ाता है। जब आप डेटागेम्मा को एक प्रश्न पूछते हैं, तो यह आपको एक ठोस उत्तर देने के लिए डेटा कॉमन्स से सांख्यिकीय डेटा का शिकार करता है। जबकि रिग एक नया विचार नहीं है, जिस तरह से हम इसे डेटागेम में उपयोग कर रहे हैं वह बहुत विशेष है।
उदाहरण क्वेरी: '' क्या दुनिया में नवीकरणीय वस्तुओं का उपयोग बढ़ गया है? '
आरएजी (पुनर्प्राप्ति-अगस्त पीढ़ी) भाषा के मॉडल को अतिरिक्त जानकारी में खींचने देता है जो उन्हें प्रशिक्षित किया गया है, जिससे उनके उत्तर समृद्ध और अधिक सटीक हो जाते हैं। Datagemma के साथ, हम GEMINI 1.5 Pro की लंबी संदर्भ विंडो का उपयोग डेटा कॉमन्स से प्रासंगिक डेटा लाने के लिए करते हैं, इससे पहले कि मॉडल अपनी प्रतिक्रिया को क्राफ्ट करना शुरू कर देता है, मतिभ्रम पर कटौती करता है।
उदाहरण क्वेरी: '' क्या दुनिया में नवीकरणीय वस्तुओं का उपयोग बढ़ गया है? '

होनहार परिणाम और आगे क्या है

रिग और चीर के साथ हमारे शुरुआती परीक्षण अच्छे दिख रहे हैं। हम संख्याओं से निपटने के दौरान अपने मॉडल में बेहतर सटीकता देख रहे हैं, जिसका अर्थ है कि अनुसंधान, निर्णय लेने के लिए इन मॉडलों का उपयोग करने वाले लोगों के लिए कम मतिभ्रम, या सिर्फ उनकी जिज्ञासा को संतुष्ट करने के लिए। आप हमारे शोध पत्र में इन परिणामों की जांच कर सकते हैं।

एक चीर क्वेरी और प्रतिक्रिया का चित्रण। ग्राउंड ट्रुथ आंकड़ों का समर्थन करना डेटा कॉमन्स से परोसी जाने वाली तालिकाओं के रूप में संदर्भित किया जाता है। *संक्षिप्तता के लिए दिखाया गया आंशिक प्रतिक्रिया। हम यहां नहीं रुक रहे हैं। हम इन तरीकों को परिष्कृत करने, हमारे प्रयासों को बढ़ा रहे हैं, और उन्हें अधिक परीक्षणों के साथ झुर्री के माध्यम से डाल रहे हैं। आखिरकार, हम इन सुधारों को जेम्मा और मिथुन दोनों मॉडल के लिए रोल आउट करेंगे, जो एक सीमित-पहुंच चरण के साथ शुरू होगा।

अपने शोध को साझा करके और इस नए जेम्मा मॉडल वेरिएंट को खुला बनाकर, हम इन डेटा कॉमन्स-आधारित तकनीकों के उपयोग को दूर-दूर तक फैलाने की उम्मीद करते हैं। एलएलएम को अधिक विश्वसनीय और भरोसेमंद बनाना उन्हें सभी के लिए आवश्यक उपकरणों में बदलने के लिए महत्वपूर्ण है, एक भविष्य बनाने में मदद करना जहां एआई लोगों को सटीक जानकारी देता है, सूचित विकल्पों का समर्थन करता है, और दुनिया की हमारी समझ को गहरा करता है।

शोधकर्ता और डेवलपर्स रिग और आरएजी दोनों के लिए हमारे क्विकस्टार्ट नोटबुक का उपयोग करके डेटागेम्मा के साथ सही कूद सकते हैं। डेटा कॉमन्स और जेम्मा एक साथ काम करने के लिए गहराई से गोता लगाने के लिए, हमारे शोध पोस्ट को देखें।

संबंधित लेख

Google’s AI Futures Fund may have to tread carefully Google’s New AI Investment Initiative: A Strategic Shift Amid Regulatory ScrutinyGoogle's recent announcement of an AI Futures Fund marks a bold move in the tech giant's ongoing qu

Oura adds AI-powered glucose tracking and meal logging Oura Reinforces Its Commitment to Metabolic Health with Two Exciting New FeaturesOura is stepping up its game in the world of metabolic health with two cutting-edge, AI-driven feat

Judge slams lawyers for ‘bogus AI-generated research’ Judge Penalizes Law Firms for Using AI Without DisclosureIn a recent ruling, California Judge Michael Wilner slapped two prominent law firms with a hefty fine of $31,000 for secret

सूचना (30)

0/200

जमा करना

StevenHill

10 अप्रैल 2025 8:45:43 पूर्वाह्न GMT

DataGemma's approach to tackling AI hallucinations is impressive! It really helps in filtering out the nonsense from AI outputs. However, sometimes it's a bit too cautious and filters out useful info too. Still, a step in the right direction!

RoySmith

11 अप्रैल 2025 6:38:27 पूर्वाह्न GMT

DataGemmaのAIの幻覚対策は素晴らしいですね！AIの出力から無意味な情報をフィルタリングするのに役立ちます。ただ、時々過剰に慎重で、有用な情報までフィルタリングしてしまうことがあります。それでも、正しい方向への一歩です！

CarlHill

11 अप्रैल 2025 6:18:09 पूर्वाह्न GMT

DataGemma의 AI 환각 문제 해결 방식이 인상적이에요! AI 출력에서 nonsense를 걸러내는 데 정말 도움이 됩니다. 하지만 때때로 너무 신중해서 유용한 정보도 걸러내는 경우가 있어요. 그래도 올바른 방향으로 나아가는 한 걸음이죠!

JosephGreen

10 अप्रैल 2025 7:38:27 अपराह्न GMT

A abordagem da DataGemma para lidar com as alucinações de IA é impressionante! Realmente ajuda a filtrar o absurdo das saídas de IA. No entanto, às vezes é um pouco cautelosa demais e filtra informações úteis também. Ainda assim, um passo na direção certa!

LarryMartinez

10 अप्रैल 2025 11:04:37 पूर्वाह्न GMT

La forma en que DataGemma aborda las alucinaciones de la IA es impresionante. Realmente ayuda a filtrar la basura de las salidas de la IA. Sin embargo, a veces es un poco demasiado cautelosa y filtra información útil también. Aún así, es un paso en la dirección correcta.

RonaldMartinez

11 अप्रैल 2025 5:27:29 अपराह्न GMT

DataGemma is a lifesaver when it comes to dealing with AI hallucinations. It really grounds the models with real-world data, which is super helpful for my projects. Sometimes it feels a bit slow, but hey, accuracy over speed any day, right? Definitely a must-have tool!

शीर्ष समाचार

Openai बेहतर चैट के लिए AI वॉयस असिस्टेंट को बढ़ाता है एआई-संचालित I/O क्रॉसवर्ड का अनुभव करें: क्लासिक वर्ड गेम पर एक आधुनिक मोड़ एआई कंप्यूटिंग 2026 तक कई एनवाईसीएस की शक्ति का उपभोग करने के लिए, संस्थापक कहते हैं नोटबुकलम विश्व स्तर पर फैलता है, स्लाइड जोड़ता है और तथ्य-जाँच में वृद्धि करता है एनवीडिया के सीईओ ने दीपसेक के बाजार प्रभाव पर गलतफहमी को स्पष्ट किया चैट की ऊर्जा का उपयोग अपेक्षा से कम है Adobe 10 विशिष्ट AI एजेंटों का अनावरण करता है: उनके व्यावसायिक अनुप्रयोगों की खोज करें नोटबुकल्म वेब स्रोत खोज सुविधा जोड़ता है Openai का O3 मॉडल संभावित रूप से अधिक महंगा है जो शुरू में विचार की तुलना में संचालित होता है "2024 विश्व चैम्पियनशिप के लिए 5 शतरंज अन्वेषण युक्तियाँ"

अधिक

प्रदर्शित