घर समाचार दीपमाइंड के सीईओ डेमिस हसाबिस ने Google के मिथुन और वीओ एआई मॉडल के भविष्य के एकीकरण की घोषणा की

दीपमाइंड के सीईओ डेमिस हसाबिस ने Google के मिथुन और वीओ एआई मॉडल के भविष्य के एकीकरण की घोषणा की

26 अप्रैल 2025
KeithGonzález
0

दीपमाइंड के सीईओ डेमिस हसाबिस ने Google के मिथुन और वीओ एआई मॉडल के भविष्य के एकीकरण की घोषणा की

पॉडकास्ट संभव के एक हालिया एपिसोड में, लिंक्डइन के सह-संस्थापक रीड हॉफमैन द्वारा सह-होस्ट किया गया, Google डीपमाइंड के सीईओ डेमिस हसाबिस ने Google की योजनाओं के बारे में कुछ रोमांचक समाचार साझा किए। उन्होंने खुलासा किया कि Google अपने मिथुन एआई मॉडल को वीओ वीडियो-जनरेटिंग मॉडल के साथ मर्ज करना चाहता है। इस संलयन का उद्देश्य भौतिक दुनिया की मिथुन की समझ को बढ़ाना है, जिससे यह वास्तविक जीवन की गतिशीलता को समझने में अधिक निपुणता है।

हसबिस ने जोर देकर कहा कि गेट-गो से, मिथुन को मल्टीमॉडल बनने के लिए डिज़ाइन किया गया था। "हमने हमेशा मिथुन, हमारे फाउंडेशन मॉडल का निर्माण किया है, शुरू से ही मल्टीमॉडल होने के लिए," उन्होंने समझाया। इस दृष्टिकोण के पीछे प्रेरणा? एक सार्वभौमिक डिजिटल सहायक के लिए एक दृष्टि जो वास्तव में रोजमर्रा की जिंदगी में सहायता कर सकती है। "एक सहायक कि ... वास्तव में वास्तविक दुनिया में आपकी मदद करता है," हसबिस ने विस्तार से बताया।

एआई उद्योग लगातार प्रगति कर रहा है जिसे आप "ओमनी" मॉडल कह सकते हैं - जो विभिन्न प्रकार के मीडिया को संभालने और संश्लेषित करने में सक्षम हैं। उदाहरण के लिए, Google का नवीनतम मिथुन पुनरावृत्तियां न केवल पाठ बल्कि ऑडियो और छवियों का उत्पादन कर सकती हैं। इस बीच, Openai का Chatgpt डिफ़ॉल्ट मॉडल उस स्थान पर छवियों को कोड़ा कर सकता है, जिसमें रमणीय स्टूडियो घिबली-शैली की कला भी शामिल है। अमेज़ॅन इस साल के अंत में "किसी भी-से-" "मॉडल को रोल करने की योजना के साथ बहुत पीछे नहीं है।

ये ओमनी मॉडल एक भारी मात्रा में प्रशिक्षण डेटा की मांग करते हैं - छवियों, वीडियो, ऑडियो और पाठ को सोचें। हसाबिस ने संकेत दिया कि वीओ का वीडियो डेटा मुख्य रूप से YouTube से आता है, जो Google के स्वामित्व वाली एक खजाना है। "मूल रूप से, YouTube वीडियो देखकर - बहुत सारे YouTube वीडियो - [VEO 2] यह पता लगा सकते हैं, आप जानते हैं, दुनिया के भौतिकी," उन्होंने कहा।

Google ने पहले TechCrunch के लिए उल्लेख किया था कि इसके मॉडल "कुछ" YouTube सामग्री पर प्रशिक्षित "हो सकते हैं, YouTube रचनाकारों के साथ किए गए समझौतों के साथ संरेखित करते हैं। यह ध्यान देने योग्य है कि पिछले साल, Google ने अपनी सेवा की शर्तों का विस्तार किया, आंशिक रूप से अपने AI मॉडल को प्रशिक्षित करने के लिए अधिक डेटा तक पहुंचने के लिए।

संबंधित लेख
Google在其工作区生产力应用程序中添加了更多的AI工具 Google在其工作区生产力应用程序中添加了更多的AI工具 Google通过将其顶级AI模型集成到其生产力套件中,增强其双子座功能,从而使工作更加顺畅,更高效,从而加强了游戏。今天,这家技术巨头推出了其工作区产品的一系列更新,介绍了音频概述和管理M的新方法
Google Gemini:有关生成AI应用程序和模型的所有信息 Google Gemini:有关生成AI应用程序和模型的所有信息 Gemini是什么?Gemini是Google备受期待的下一代生成AI模型家族,它是通过DeepMind和Google Research之间的合作而开发的。它的设计用途广泛,有各种尺寸,以满足不同的需求:双子座Ultra:设计F的强大模型,设计F
三星将Google的双子座整合到Ballie Home Robot 三星将Google的双子座整合到Ballie Home Robot 三星周三宣布,通过与Google Cloud的合作,为其家用机器人Ballie进行了令人兴奋的新开发项目。这种合作伙伴关系将使Google的双子座AI集成到Ballie中,使用户可以通过提出各种问题与机器人互动,Gemini将会
सूचना (0)
शीर्ष समाचार
AI एक अधिक कुशल यूके सार्वजनिक क्षेत्र को अनलॉक करने की कुंजी हो सकती है चुपके पीक: एडोब की नवीनतम परियोजनाओं में उन्नत एआई एजेंट हैं IPhone और iPad पर LiDAR का उपयोग करने के लिए 8 अभिनव तरीके प्रकट हुए टिंडर उपयोगकर्ता की गिरावट के बीच एआई मैचिंग की खोज करता है 7 कारण किंडल एक महान खरीद रहे हैं, यहां तक ​​कि डाउनलोड के बिना भी "समूह एआई के इको प्रभाव को कम करने के लिए स्विफ्ट उपायों का आग्रह करते हैं" क्या एआई हमारी बुद्धिमत्ता को कम कर रहा है? नोटबुकल्म वेब स्रोत खोज सुविधा जोड़ता है Google.org Unveils $15M AI Training Grants for Government Workers टेलि, एक वाईसी फिटकिरी, एआई वॉयस एजेंटों के लिए पूर्व-बीज फंडिंग सुरक्षित करता है
अधिक
OR