Datagemma는 실제 데이터를 사용하여 AI 환각을 다룹니다

대형 언어 모델 (LLM)은 오늘날의 AI 혁신의 핵심이며, 대규모 텍스트 데이터 세트를 통해 요약을 생성하고 창의적인 아이디어를 촉발하며 코드를 작성할 수 있습니다. 그러나 그들의 능력에도 불구하고,이 모델들은 때때로 우리가 "환각"이라고 부르는 문제인 때로는 잘못된 정보를 전달할 수 있습니다. 생성 AI의 세계에서 큰 장애물입니다.
우리는 실제 통계에 LLM을 접지하여 환각을 억제하는 것을 목표 로이 문제를 정면으로 해결하는 최첨단 연구를 공유하게되어 기쁩니다. 또한 LLM을 Google 데이터 커먼즈의 풍부한 실제 데이터와 연결하는 최초의 오픈 모델 인 DataGemma를 소개하게되어 기쁩니다.
데이터 커먼즈 : 신뢰할 수있는 데이터의 보물 창고
Data Commons는 거대하고 성장하는 공개 데이터 라이브러리와 같습니다. 이 정보는 UN, WHO, CDC 및 인구 조사 기관과 같은 신뢰할 수있는 출처에서이 정보를 가져옵니다. 이러한 데이터 세트를 단일의 강력한 도구 세트 및 AI 모델로 병합함으로써 데이터 커먼즈는 정책 입안자, 연구원 및 조직이 필요한 정확한 통찰력을 얻을 수 있도록 도와줍니다.
아프리카 국가가 전기 접근에서 가장 큰 점프를 보았던 것과 같은 일반 영어로 질문을 할 수있는 방대한 데이터베이스 또는 미국 카운티의 당뇨병과 어떻게 관련이 있는지 상상해보십시오. 그것은 당신을위한 데이터 커먼즈입니다.
데이터 커먼즈가 환각과 싸우는 데 도움이되는 방법
더 많은 사람들이 생성 AI로 전환함에 따라, 우리는 데이터 커먼즈를 가볍고 최고 수준의 개방형 모델 인 Gemma로 직조함으로써 이러한 경험을보다 근거로 만들기 위해 노력하고 있습니다. 이러한 Datagemma 모델은 이제 연구원과 개발자가 다이빙 할 수 있습니다.
Datagemma는 LLM의 정확성과 추론을 개선하기 위해 두 가지 멋진 방법을 사용하여 데이터 커먼즈의 지식을 활용하여 Gemma의 기능을 향상시킵니다.
RIG (검색-간극 생성)는 데이터 커먼즈에 대한 사실을 적극적으로 확인하여 Gemma 2 모델을 강화합니다. Datagemma에게 질문을하면 데이터 커먼즈의 통계 데이터를 사냥하여 확실한 답변을 제공합니다. RIG는 새로운 아이디어는 아니지만 Datagemma에서 우리가 사용하는 방식은 매우 특별합니다.
예제 쿼리 :`` '전 세계에서 재생 에너지를 증가 시켰습니까?' Rag (검색된 세대)을 통해 언어 모델이 훈련을받은 것 이상의 추가 정보를 끌어내어 답변이 더 풍부하고 정확하게 만듭니다. Datagemma를 사용하면 Gemini 1.5 Pro의 긴 상황 컨텍스트 창을 사용하여 모델이 반응을 만들기 시작하기 전에 환각을 줄이기 전에 데이터 커먼즈의 관련 데이터를 가져옵니다.
예제 쿼리 :``전 세계에서 재생 에너지를 사용 하는가? ''라고 Datagemma Rag 방법론을 적용하면 각주의 추론과 포함을 보여줍니다.
유망한 결과와 다음 단계
Rig와 Rag에 대한 초기 테스트는 좋아 보입니다. 우리는 숫자를 다룰 때 모델에서 더 나은 정확도를보고 있습니다. 이는 연구, 의사 결정을 위해 이러한 모델을 사용하거나 호기심을 충족시키는 사람들에게 환각이 적습니다. 우리의 연구 논문 에서이 결과를 확인할 수 있습니다.
래그 쿼리 및 응답의 그림. 지원 지상 진실 통계는 데이터 커먼즈에서 제공되는 테이블로 참조됩니다. *간결성에 대한 부분 응답. 우리는 여기서 멈추지 않습니다. 우리는 이러한 방법을 개선하고, 노력을 확장하고, 더 많은 테스트를 통해 Wringer를 통과시킵니다. 결국, 우리는 제한된 접근 단계부터 시작하여 젬마와 쌍둥이 자리 모델에 대한 이러한 개선 사항을 출시 할 것입니다. 우리의 연구를 공유 하고이 새로운 Gemma 모델 변형을 개방함으로써, 우리는 이러한 데이터 커먼즈 기반 기술의 사용을 훨씬 넓게 전파하기를 희망합니다. LLM을보다 신뢰할 수 있고 신뢰할 수있게 만드는 것은 모든 사람을위한 필수 도구로 전환하는 데 중요합니다. AI가 사람들에게 정확한 정보를 제공하고, 정보를 제공하는 선택을 지원하며, 세상에 대한 우리의 이해를 심화시키는 미래를 구축하는 데 도움이됩니다.
연구원과 개발자는 Rig and Rag의 QuickStart 노트북을 사용하여 Datagemma를 사용하여 바로 뛰어들 수 있습니다. 데이터 커먼즈와 젬마가 함께 작동하는 방식에 대해 더 깊이 뛰어 들으려면 연구 게시물을 확인하십시오.
관련 기사
Google’s AI Futures Fund may have to tread carefully
Google’s New AI Investment Initiative: A Strategic Shift Amid Regulatory ScrutinyGoogle's recent announcement of an AI Futures Fund marks a bold move in the tech giant's ongoing qu
Oura adds AI-powered glucose tracking and meal logging
Oura Reinforces Its Commitment to Metabolic Health with Two Exciting New FeaturesOura is stepping up its game in the world of metabolic health with two cutting-edge, AI-driven feat
Judge slams lawyers for ‘bogus AI-generated research’
Judge Penalizes Law Firms for Using AI Without DisclosureIn a recent ruling, California Judge Michael Wilner slapped two prominent law firms with a hefty fine of $31,000 for secret
의견 (30)
0/200
StevenHill
2025년 4월 10일 오전 8시 45분 43초 GMT
DataGemma's approach to tackling AI hallucinations is impressive! It really helps in filtering out the nonsense from AI outputs. However, sometimes it's a bit too cautious and filters out useful info too. Still, a step in the right direction!
0
RoySmith
2025년 4월 11일 오전 6시 38분 27초 GMT
DataGemmaのAIの幻覚対策は素晴らしいですね!AIの出力から無意味な情報をフィルタリングするのに役立ちます。ただ、時々過剰に慎重で、有用な情報までフィルタリングしてしまうことがあります。それでも、正しい方向への一歩です!
0
CarlHill
2025년 4월 11일 오전 6시 18분 9초 GMT
DataGemma의 AI 환각 문제 해결 방식이 인상적이에요! AI 출력에서 nonsense를 걸러내는 데 정말 도움이 됩니다. 하지만 때때로 너무 신중해서 유용한 정보도 걸러내는 경우가 있어요. 그래도 올바른 방향으로 나아가는 한 걸음이죠!
0
JosephGreen
2025년 4월 10일 오후 7시 38분 27초 GMT
A abordagem da DataGemma para lidar com as alucinações de IA é impressionante! Realmente ajuda a filtrar o absurdo das saídas de IA. No entanto, às vezes é um pouco cautelosa demais e filtra informações úteis também. Ainda assim, um passo na direção certa!
0
LarryMartinez
2025년 4월 10일 오전 11시 4분 37초 GMT
La forma en que DataGemma aborda las alucinaciones de la IA es impresionante. Realmente ayuda a filtrar la basura de las salidas de la IA. Sin embargo, a veces es un poco demasiado cautelosa y filtra información útil también. Aún así, es un paso en la dirección correcta.
0
RonaldMartinez
2025년 4월 11일 오후 5시 27분 29초 GMT
DataGemma is a lifesaver when it comes to dealing with AI hallucinations. It really grounds the models with real-world data, which is super helpful for my projects. Sometimes it feels a bit slow, but hey, accuracy over speed any day, right? Definitely a must-have tool!
0
대형 언어 모델 (LLM)은 오늘날의 AI 혁신의 핵심이며, 대규모 텍스트 데이터 세트를 통해 요약을 생성하고 창의적인 아이디어를 촉발하며 코드를 작성할 수 있습니다. 그러나 그들의 능력에도 불구하고,이 모델들은 때때로 우리가 "환각"이라고 부르는 문제인 때로는 잘못된 정보를 전달할 수 있습니다. 생성 AI의 세계에서 큰 장애물입니다.
우리는 실제 통계에 LLM을 접지하여 환각을 억제하는 것을 목표 로이 문제를 정면으로 해결하는 최첨단 연구를 공유하게되어 기쁩니다. 또한 LLM을 Google 데이터 커먼즈의 풍부한 실제 데이터와 연결하는 최초의 오픈 모델 인 DataGemma를 소개하게되어 기쁩니다.
데이터 커먼즈 : 신뢰할 수있는 데이터의 보물 창고
Data Commons는 거대하고 성장하는 공개 데이터 라이브러리와 같습니다. 이 정보는 UN, WHO, CDC 및 인구 조사 기관과 같은 신뢰할 수있는 출처에서이 정보를 가져옵니다. 이러한 데이터 세트를 단일의 강력한 도구 세트 및 AI 모델로 병합함으로써 데이터 커먼즈는 정책 입안자, 연구원 및 조직이 필요한 정확한 통찰력을 얻을 수 있도록 도와줍니다.
아프리카 국가가 전기 접근에서 가장 큰 점프를 보았던 것과 같은 일반 영어로 질문을 할 수있는 방대한 데이터베이스 또는 미국 카운티의 당뇨병과 어떻게 관련이 있는지 상상해보십시오. 그것은 당신을위한 데이터 커먼즈입니다.
데이터 커먼즈가 환각과 싸우는 데 도움이되는 방법
더 많은 사람들이 생성 AI로 전환함에 따라, 우리는 데이터 커먼즈를 가볍고 최고 수준의 개방형 모델 인 Gemma로 직조함으로써 이러한 경험을보다 근거로 만들기 위해 노력하고 있습니다. 이러한 Datagemma 모델은 이제 연구원과 개발자가 다이빙 할 수 있습니다.
Datagemma는 LLM의 정확성과 추론을 개선하기 위해 두 가지 멋진 방법을 사용하여 데이터 커먼즈의 지식을 활용하여 Gemma의 기능을 향상시킵니다.
RIG (검색-간극 생성)는 데이터 커먼즈에 대한 사실을 적극적으로 확인하여 Gemma 2 모델을 강화합니다. Datagemma에게 질문을하면 데이터 커먼즈의 통계 데이터를 사냥하여 확실한 답변을 제공합니다. RIG는 새로운 아이디어는 아니지만 Datagemma에서 우리가 사용하는 방식은 매우 특별합니다.
예제 쿼리 :`` '전 세계에서 재생 에너지를 증가 시켰습니까?' Rag (검색된 세대)을 통해 언어 모델이 훈련을받은 것 이상의 추가 정보를 끌어내어 답변이 더 풍부하고 정확하게 만듭니다. Datagemma를 사용하면 Gemini 1.5 Pro의 긴 상황 컨텍스트 창을 사용하여 모델이 반응을 만들기 시작하기 전에 환각을 줄이기 전에 데이터 커먼즈의 관련 데이터를 가져옵니다.
예제 쿼리 :``전 세계에서 재생 에너지를 사용 하는가? ''라고 Datagemma Rag 방법론을 적용하면 각주의 추론과 포함을 보여줍니다.
유망한 결과와 다음 단계
Rig와 Rag에 대한 초기 테스트는 좋아 보입니다. 우리는 숫자를 다룰 때 모델에서 더 나은 정확도를보고 있습니다. 이는 연구, 의사 결정을 위해 이러한 모델을 사용하거나 호기심을 충족시키는 사람들에게 환각이 적습니다. 우리의 연구 논문 에서이 결과를 확인할 수 있습니다.
우리의 연구를 공유 하고이 새로운 Gemma 모델 변형을 개방함으로써, 우리는 이러한 데이터 커먼즈 기반 기술의 사용을 훨씬 넓게 전파하기를 희망합니다. LLM을보다 신뢰할 수 있고 신뢰할 수있게 만드는 것은 모든 사람을위한 필수 도구로 전환하는 데 중요합니다. AI가 사람들에게 정확한 정보를 제공하고, 정보를 제공하는 선택을 지원하며, 세상에 대한 우리의 이해를 심화시키는 미래를 구축하는 데 도움이됩니다.
연구원과 개발자는 Rig and Rag의 QuickStart 노트북을 사용하여 Datagemma를 사용하여 바로 뛰어들 수 있습니다. 데이터 커먼즈와 젬마가 함께 작동하는 방식에 대해 더 깊이 뛰어 들으려면 연구 게시물을 확인하십시오.



DataGemma's approach to tackling AI hallucinations is impressive! It really helps in filtering out the nonsense from AI outputs. However, sometimes it's a bit too cautious and filters out useful info too. Still, a step in the right direction!




DataGemmaのAIの幻覚対策は素晴らしいですね!AIの出力から無意味な情報をフィルタリングするのに役立ちます。ただ、時々過剰に慎重で、有用な情報までフィルタリングしてしまうことがあります。それでも、正しい方向への一歩です!




DataGemma의 AI 환각 문제 해결 방식이 인상적이에요! AI 출력에서 nonsense를 걸러내는 데 정말 도움이 됩니다. 하지만 때때로 너무 신중해서 유용한 정보도 걸러내는 경우가 있어요. 그래도 올바른 방향으로 나아가는 한 걸음이죠!




A abordagem da DataGemma para lidar com as alucinações de IA é impressionante! Realmente ajuda a filtrar o absurdo das saídas de IA. No entanto, às vezes é um pouco cautelosa demais e filtra informações úteis também. Ainda assim, um passo na direção certa!




La forma en que DataGemma aborda las alucinaciones de la IA es impresionante. Realmente ayuda a filtrar la basura de las salidas de la IA. Sin embargo, a veces es un poco demasiado cautelosa y filtra información útil también. Aún así, es un paso en la dirección correcta.




DataGemma is a lifesaver when it comes to dealing with AI hallucinations. It really grounds the models with real-world data, which is super helpful for my projects. Sometimes it feels a bit slow, but hey, accuracy over speed any day, right? Definitely a must-have tool!












