Datagemma वास्तविक दुनिया के डेटा के साथ AI मतिभ्रम से निपटता है

बड़े भाषा मॉडल (LLM) आज की AI सफलताओं के केंद्र में हैं, जो सारांश का उत्पादन करने, रचनात्मक विचारों को स्पार्क करने और यहां तक कि कोड लिखने के लिए बड़े पैमाने पर पाठ डेटासेट के माध्यम से स्थानांतरित करने में सक्षम हैं। फिर भी, उनके कौशल के बावजूद, ये मॉडल कभी -कभी जानकारी दे सकते हैं कि यह सिर्फ सादा गलत है, एक समस्या जिसे हम "मतिभ्रम" कहते हैं। यह उदार एआई की दुनिया में एक बड़ी बाधा है।
हम कुछ अत्याधुनिक अनुसंधान को साझा करने के लिए उत्साहित हैं जो इस मुद्दे से निपट रहे हैं, जो वास्तविक दुनिया के आंकड़ों में एलएलएम को ग्राउंडिंग करके मतिभ्रम पर अंकुश लगाने के उद्देश्य से है। और हम Datagemma को पेश करने के लिए रोमांचित हैं, पहला खुला मॉडल जो LLM को Google के डेटा कॉमन्स से वास्तविक दुनिया के डेटा के धन के साथ जोड़ता है।
डेटा कॉमन्स: भरोसेमंद डेटा का एक खजाना
डेटा कॉमन्स सार्वजनिक डेटा के एक विशाल, कभी-कभी बढ़ते पुस्तकालय की तरह है, जो स्वास्थ्य से अर्थशास्त्र तक सब कुछ पर 240 बिलियन से अधिक डेटा बिंदुओं पर गर्व करता है। यह इस जानकारी को संयुक्त राष्ट्र, डब्ल्यूएचओ, सीडीसी और जनगणना ब्यूरो जैसे विश्वसनीय स्रोतों से खींचता है। इन डेटासेट को एक एकल, शक्तिशाली टूलसेट और एआई मॉडल में विलय करके, डेटा कॉमन्स नीति निर्माताओं, शोधकर्ताओं और संगठनों को सटीक अंतर्दृष्टि प्राप्त करने में मदद करते हैं।
एक विशाल डेटाबेस की कल्पना करें जहां आप सादे अंग्रेजी में सवाल पूछ सकते हैं, जैसे कि अफ्रीकी देशों ने बिजली पहुंच में सबसे बड़ी छलांग देखी है, या कैसे आय अमेरिकी काउंटियों में मधुमेह से संबंधित है। यह आपके लिए डेटा कॉमन्स है।
कैसे डेटा कॉमन्स मतिभ्रम से लड़ने में मदद करते हैं
जैसा कि अधिक लोग जेनेरिक एआई की ओर मुड़ते हैं, हम इन अनुभवों को अधिक से अधिक काम करने के लिए काम कर रहे हैं, जो डेटा कॉमन्स को जेम्मा, हमारे परिवार के हल्के, शीर्ष पायदान खुले मॉडल में बुनने के द्वारा अधिक ग्राउंडेड कर रहे हैं। ये डेटागेम्मा मॉडल अब शोधकर्ताओं और डेवलपर्स के लिए गोता लगाने के लिए उपलब्ध हैं।
Datagemma LLM की सटीकता और तर्क को बेहतर बनाने के लिए दो शांत तरीकों का उपयोग करते हुए, डेटा कॉमन्स के ज्ञान में टैप करके Gemma की क्षमताओं को बढ़ाता है:
RIG (पुनर्प्राप्ति-इंटरलेव्ड जेनरेशन) डेटा कॉमन्स के खिलाफ तथ्यों की सक्रिय रूप से जांच करके हमारे जेम्मा 2 मॉडल को बढ़ाता है। जब आप डेटागेम्मा को एक प्रश्न पूछते हैं, तो यह आपको एक ठोस उत्तर देने के लिए डेटा कॉमन्स से सांख्यिकीय डेटा का शिकार करता है। जबकि रिग एक नया विचार नहीं है, जिस तरह से हम इसे डेटागेम में उपयोग कर रहे हैं वह बहुत विशेष है।
उदाहरण क्वेरी: '' क्या दुनिया में नवीकरणीय वस्तुओं का उपयोग बढ़ गया है? ' आरएजी (पुनर्प्राप्ति-अगस्त पीढ़ी) भाषा के मॉडल को अतिरिक्त जानकारी में खींचने देता है जो उन्हें प्रशिक्षित किया गया है, जिससे उनके उत्तर समृद्ध और अधिक सटीक हो जाते हैं। Datagemma के साथ, हम GEMINI 1.5 Pro की लंबी संदर्भ विंडो का उपयोग डेटा कॉमन्स से प्रासंगिक डेटा लाने के लिए करते हैं, इससे पहले कि मॉडल अपनी प्रतिक्रिया को क्राफ्ट करना शुरू कर देता है, मतिभ्रम पर कटौती करता है।
उदाहरण क्वेरी: '' क्या दुनिया में नवीकरणीय वस्तुओं का उपयोग बढ़ गया है? '
होनहार परिणाम और आगे क्या है
रिग और चीर के साथ हमारे शुरुआती परीक्षण अच्छे दिख रहे हैं। हम संख्याओं से निपटने के दौरान अपने मॉडल में बेहतर सटीकता देख रहे हैं, जिसका अर्थ है कि अनुसंधान, निर्णय लेने के लिए इन मॉडलों का उपयोग करने वाले लोगों के लिए कम मतिभ्रम, या सिर्फ उनकी जिज्ञासा को संतुष्ट करने के लिए। आप हमारे शोध पत्र में इन परिणामों की जांच कर सकते हैं।
एक चीर क्वेरी और प्रतिक्रिया का चित्रण। ग्राउंड ट्रुथ आंकड़ों का समर्थन करना डेटा कॉमन्स से परोसी जाने वाली तालिकाओं के रूप में संदर्भित किया जाता है। *संक्षिप्तता के लिए दिखाया गया आंशिक प्रतिक्रिया। हम यहां नहीं रुक रहे हैं। हम इन तरीकों को परिष्कृत करने, हमारे प्रयासों को बढ़ा रहे हैं, और उन्हें अधिक परीक्षणों के साथ झुर्री के माध्यम से डाल रहे हैं। आखिरकार, हम इन सुधारों को जेम्मा और मिथुन दोनों मॉडल के लिए रोल आउट करेंगे, जो एक सीमित-पहुंच चरण के साथ शुरू होगा। अपने शोध को साझा करके और इस नए जेम्मा मॉडल वेरिएंट को खुला बनाकर, हम इन डेटा कॉमन्स-आधारित तकनीकों के उपयोग को दूर-दूर तक फैलाने की उम्मीद करते हैं। एलएलएम को अधिक विश्वसनीय और भरोसेमंद बनाना उन्हें सभी के लिए आवश्यक उपकरणों में बदलने के लिए महत्वपूर्ण है, एक भविष्य बनाने में मदद करना जहां एआई लोगों को सटीक जानकारी देता है, सूचित विकल्पों का समर्थन करता है, और दुनिया की हमारी समझ को गहरा करता है।
शोधकर्ता और डेवलपर्स रिग और आरएजी दोनों के लिए हमारे क्विकस्टार्ट नोटबुक का उपयोग करके डेटागेम्मा के साथ सही कूद सकते हैं। डेटा कॉमन्स और जेम्मा एक साथ काम करने के लिए गहराई से गोता लगाने के लिए, हमारे शोध पोस्ट को देखें।
संबंधित लेख
Google’s AI Futures Fund may have to tread carefully
Google’s New AI Investment Initiative: A Strategic Shift Amid Regulatory ScrutinyGoogle's recent announcement of an AI Futures Fund marks a bold move in the tech giant's ongoing qu
Oura adds AI-powered glucose tracking and meal logging
Oura Reinforces Its Commitment to Metabolic Health with Two Exciting New FeaturesOura is stepping up its game in the world of metabolic health with two cutting-edge, AI-driven feat
Judge slams lawyers for ‘bogus AI-generated research’
Judge Penalizes Law Firms for Using AI Without DisclosureIn a recent ruling, California Judge Michael Wilner slapped two prominent law firms with a hefty fine of $31,000 for secret
सूचना (30)
0/200
StevenHill
10 अप्रैल 2025 8:45:43 पूर्वाह्न GMT
DataGemma's approach to tackling AI hallucinations is impressive! It really helps in filtering out the nonsense from AI outputs. However, sometimes it's a bit too cautious and filters out useful info too. Still, a step in the right direction!
0
RoySmith
11 अप्रैल 2025 6:38:27 पूर्वाह्न GMT
DataGemmaのAIの幻覚対策は素晴らしいですね!AIの出力から無意味な情報をフィルタリングするのに役立ちます。ただ、時々過剰に慎重で、有用な情報までフィルタリングしてしまうことがあります。それでも、正しい方向への一歩です!
0
CarlHill
11 अप्रैल 2025 6:18:09 पूर्वाह्न GMT
DataGemma의 AI 환각 문제 해결 방식이 인상적이에요! AI 출력에서 nonsense를 걸러내는 데 정말 도움이 됩니다. 하지만 때때로 너무 신중해서 유용한 정보도 걸러내는 경우가 있어요. 그래도 올바른 방향으로 나아가는 한 걸음이죠!
0
JosephGreen
10 अप्रैल 2025 7:38:27 अपराह्न GMT
A abordagem da DataGemma para lidar com as alucinações de IA é impressionante! Realmente ajuda a filtrar o absurdo das saídas de IA. No entanto, às vezes é um pouco cautelosa demais e filtra informações úteis também. Ainda assim, um passo na direção certa!
0
LarryMartinez
10 अप्रैल 2025 11:04:37 पूर्वाह्न GMT
La forma en que DataGemma aborda las alucinaciones de la IA es impresionante. Realmente ayuda a filtrar la basura de las salidas de la IA. Sin embargo, a veces es un poco demasiado cautelosa y filtra información útil también. Aún así, es un paso en la dirección correcta.
0
RonaldMartinez
11 अप्रैल 2025 5:27:29 अपराह्न GMT
DataGemma is a lifesaver when it comes to dealing with AI hallucinations. It really grounds the models with real-world data, which is super helpful for my projects. Sometimes it feels a bit slow, but hey, accuracy over speed any day, right? Definitely a must-have tool!
0
बड़े भाषा मॉडल (LLM) आज की AI सफलताओं के केंद्र में हैं, जो सारांश का उत्पादन करने, रचनात्मक विचारों को स्पार्क करने और यहां तक कि कोड लिखने के लिए बड़े पैमाने पर पाठ डेटासेट के माध्यम से स्थानांतरित करने में सक्षम हैं। फिर भी, उनके कौशल के बावजूद, ये मॉडल कभी -कभी जानकारी दे सकते हैं कि यह सिर्फ सादा गलत है, एक समस्या जिसे हम "मतिभ्रम" कहते हैं। यह उदार एआई की दुनिया में एक बड़ी बाधा है।
हम कुछ अत्याधुनिक अनुसंधान को साझा करने के लिए उत्साहित हैं जो इस मुद्दे से निपट रहे हैं, जो वास्तविक दुनिया के आंकड़ों में एलएलएम को ग्राउंडिंग करके मतिभ्रम पर अंकुश लगाने के उद्देश्य से है। और हम Datagemma को पेश करने के लिए रोमांचित हैं, पहला खुला मॉडल जो LLM को Google के डेटा कॉमन्स से वास्तविक दुनिया के डेटा के धन के साथ जोड़ता है।
डेटा कॉमन्स: भरोसेमंद डेटा का एक खजाना
डेटा कॉमन्स सार्वजनिक डेटा के एक विशाल, कभी-कभी बढ़ते पुस्तकालय की तरह है, जो स्वास्थ्य से अर्थशास्त्र तक सब कुछ पर 240 बिलियन से अधिक डेटा बिंदुओं पर गर्व करता है। यह इस जानकारी को संयुक्त राष्ट्र, डब्ल्यूएचओ, सीडीसी और जनगणना ब्यूरो जैसे विश्वसनीय स्रोतों से खींचता है। इन डेटासेट को एक एकल, शक्तिशाली टूलसेट और एआई मॉडल में विलय करके, डेटा कॉमन्स नीति निर्माताओं, शोधकर्ताओं और संगठनों को सटीक अंतर्दृष्टि प्राप्त करने में मदद करते हैं।
एक विशाल डेटाबेस की कल्पना करें जहां आप सादे अंग्रेजी में सवाल पूछ सकते हैं, जैसे कि अफ्रीकी देशों ने बिजली पहुंच में सबसे बड़ी छलांग देखी है, या कैसे आय अमेरिकी काउंटियों में मधुमेह से संबंधित है। यह आपके लिए डेटा कॉमन्स है।
कैसे डेटा कॉमन्स मतिभ्रम से लड़ने में मदद करते हैं
जैसा कि अधिक लोग जेनेरिक एआई की ओर मुड़ते हैं, हम इन अनुभवों को अधिक से अधिक काम करने के लिए काम कर रहे हैं, जो डेटा कॉमन्स को जेम्मा, हमारे परिवार के हल्के, शीर्ष पायदान खुले मॉडल में बुनने के द्वारा अधिक ग्राउंडेड कर रहे हैं। ये डेटागेम्मा मॉडल अब शोधकर्ताओं और डेवलपर्स के लिए गोता लगाने के लिए उपलब्ध हैं।
Datagemma LLM की सटीकता और तर्क को बेहतर बनाने के लिए दो शांत तरीकों का उपयोग करते हुए, डेटा कॉमन्स के ज्ञान में टैप करके Gemma की क्षमताओं को बढ़ाता है:
RIG (पुनर्प्राप्ति-इंटरलेव्ड जेनरेशन) डेटा कॉमन्स के खिलाफ तथ्यों की सक्रिय रूप से जांच करके हमारे जेम्मा 2 मॉडल को बढ़ाता है। जब आप डेटागेम्मा को एक प्रश्न पूछते हैं, तो यह आपको एक ठोस उत्तर देने के लिए डेटा कॉमन्स से सांख्यिकीय डेटा का शिकार करता है। जबकि रिग एक नया विचार नहीं है, जिस तरह से हम इसे डेटागेम में उपयोग कर रहे हैं वह बहुत विशेष है।
उदाहरण क्वेरी: '' क्या दुनिया में नवीकरणीय वस्तुओं का उपयोग बढ़ गया है? ' आरएजी (पुनर्प्राप्ति-अगस्त पीढ़ी) भाषा के मॉडल को अतिरिक्त जानकारी में खींचने देता है जो उन्हें प्रशिक्षित किया गया है, जिससे उनके उत्तर समृद्ध और अधिक सटीक हो जाते हैं। Datagemma के साथ, हम GEMINI 1.5 Pro की लंबी संदर्भ विंडो का उपयोग डेटा कॉमन्स से प्रासंगिक डेटा लाने के लिए करते हैं, इससे पहले कि मॉडल अपनी प्रतिक्रिया को क्राफ्ट करना शुरू कर देता है, मतिभ्रम पर कटौती करता है।
उदाहरण क्वेरी: '' क्या दुनिया में नवीकरणीय वस्तुओं का उपयोग बढ़ गया है? '
होनहार परिणाम और आगे क्या है
रिग और चीर के साथ हमारे शुरुआती परीक्षण अच्छे दिख रहे हैं। हम संख्याओं से निपटने के दौरान अपने मॉडल में बेहतर सटीकता देख रहे हैं, जिसका अर्थ है कि अनुसंधान, निर्णय लेने के लिए इन मॉडलों का उपयोग करने वाले लोगों के लिए कम मतिभ्रम, या सिर्फ उनकी जिज्ञासा को संतुष्ट करने के लिए। आप हमारे शोध पत्र में इन परिणामों की जांच कर सकते हैं।
अपने शोध को साझा करके और इस नए जेम्मा मॉडल वेरिएंट को खुला बनाकर, हम इन डेटा कॉमन्स-आधारित तकनीकों के उपयोग को दूर-दूर तक फैलाने की उम्मीद करते हैं। एलएलएम को अधिक विश्वसनीय और भरोसेमंद बनाना उन्हें सभी के लिए आवश्यक उपकरणों में बदलने के लिए महत्वपूर्ण है, एक भविष्य बनाने में मदद करना जहां एआई लोगों को सटीक जानकारी देता है, सूचित विकल्पों का समर्थन करता है, और दुनिया की हमारी समझ को गहरा करता है।
शोधकर्ता और डेवलपर्स रिग और आरएजी दोनों के लिए हमारे क्विकस्टार्ट नोटबुक का उपयोग करके डेटागेम्मा के साथ सही कूद सकते हैं। डेटा कॉमन्स और जेम्मा एक साथ काम करने के लिए गहराई से गोता लगाने के लिए, हमारे शोध पोस्ट को देखें।



DataGemma's approach to tackling AI hallucinations is impressive! It really helps in filtering out the nonsense from AI outputs. However, sometimes it's a bit too cautious and filters out useful info too. Still, a step in the right direction!




DataGemmaのAIの幻覚対策は素晴らしいですね!AIの出力から無意味な情報をフィルタリングするのに役立ちます。ただ、時々過剰に慎重で、有用な情報までフィルタリングしてしまうことがあります。それでも、正しい方向への一歩です!




DataGemma의 AI 환각 문제 해결 방식이 인상적이에요! AI 출력에서 nonsense를 걸러내는 데 정말 도움이 됩니다. 하지만 때때로 너무 신중해서 유용한 정보도 걸러내는 경우가 있어요. 그래도 올바른 방향으로 나아가는 한 걸음이죠!




A abordagem da DataGemma para lidar com as alucinações de IA é impressionante! Realmente ajuda a filtrar o absurdo das saídas de IA. No entanto, às vezes é um pouco cautelosa demais e filtra informações úteis também. Ainda assim, um passo na direção certa!




La forma en que DataGemma aborda las alucinaciones de la IA es impresionante. Realmente ayuda a filtrar la basura de las salidas de la IA. Sin embargo, a veces es un poco demasiado cautelosa y filtra información útil también. Aún así, es un paso en la dirección correcta.




DataGemma is a lifesaver when it comes to dealing with AI hallucinations. It really grounds the models with real-world data, which is super helpful for my projects. Sometimes it feels a bit slow, but hey, accuracy over speed any day, right? Definitely a must-have tool!












