Google Cloud AI मीडिया टूल्स को नए संगीत और वीडियो सुविधाओं के साथ बढ़ाता है

बुधवार को, Google ने अपने Vertex AI क्लाउड प्लेटफॉर्म में अपग्रेड्स का अनावरण किया, जिसमें कई मालिकाना मीडिया-उत्पादन AI मॉडल्स को बढ़ावा दिया गया।
Lyria, Google का टेक्स्ट-टू-म्यूजिक AI, अब चुनिंदा उपयोगकर्ताओं के लिए प्रीव्यू में है, जबकि Veo 2 वीडियो मॉडल में उन्नत संपादन और दृश्य प्रभाव विकल्प जोड़े गए हैं। इसके अतिरिक्त, Google ने Chirp 3, इसके ऑडियो प्रोसेसिंग मॉडल द्वारा संचालित एक आवाज-क्लोनिंग सुविधा पेश की, जो स्वीकृत उपयोगकर्ताओं के लिए है। Google के अनुसार, Imagen 3 इमेज जनरेटर अब उल्लेखनीय रूप से बेहतर प्रदर्शन प्रदान करता है।
Cloud Next में घोषित, ये अपडेट Google की उद्यम जेनरेटिव AI बाजार में नेतृत्व करने की बोली को मजबूत करते हैं, जो Amazon के Bedrock प्लेटफॉर्म के साथ निकटता से प्रतिस्पर्धा करता है, जो समान AI टूल्स प्रदान करता है।
Google Lyria को रॉयल्टी-मुक्त संगीत पुस्तकालयों के प्रतिस्थापन के रूप में विपणन करता है, जो उपयोगकर्ताओं को जैज़ पियानो सोलो से लेकर लो-फाई बीट्स तक विविध शैलियों में गाने बनाने में सक्षम बनाता है।
Chirp 3 लगभग 35 भाषाओं में भाषण संश्लेषण का समर्थन करता है। इस साल की शुरुआत में प्रीव्यू किया गया, यह Instant Custom Voice को शक्ति देता है, जो केवल 10 सेकंड के ऑडियो का उपयोग करके आवाज को दोहरा सकता है और अब व्यापक रूप से उपलब्ध है। Chirp 3 एक नया प्रीव्यू टूल, Transcription with Diarization, भी सक्षम बनाता है, जो बहु-व्यक्ति रिकॉर्डिंग में वक्ताओं को अलग और लेबल करता है।
दुरुपयोग को रोकने के लिए, Instant Custom Voice एक सत्यापन प्रक्रिया से गुजरता है ताकि उचित आवाज उपयोग अनुमतियों को सुनिश्चित किया जा सके, Google का कहना है।
Veo 2 अब उपयोगकर्ताओं को वीडियो से पृष्ठभूमि, लोगो, या वस्तुओं को हटाने और वीडियो फ्रेम को विस्तारित करने की अनुमति देता है, जैसे कि लैंडस्केप फुटेज को पोर्ट्रेट में बदलना। यह AI-जनरेटेड दृश्यों के लिए कैमरा कोण और गति को समायोजित करने का भी समर्थन करता है, जैसे कि टाइम लैप्स या ड्रोन-शैली शॉट्स बनाने, और निर्दिष्ट प्रारंभ और अंत फ्रेम के बीच इंटरपोलेट कर सकता है।
ये Veo 2 सुविधाएँ वर्तमान में प्रीव्यू में हैं।
Google ने उल्लेख किया कि Imagen 3 के सुधार इसकी वस्तुओं को हटाने और लापता या क्षतिग्रस्त छवि क्षेत्रों को पुनर्स्थापित करने की क्षमता को बेहतर बनाते हैं।
Imagen, Veo, और Lyria (लेकिन Chirp नहीं) द्वारा बनाए गए सभी मीडिया में Google का SynthID वॉटरमार्क होता है। Google ने जोर दिया कि इसके जेनरेटिव AI मॉडल्स में हानिकारक सामग्री निर्माण को रोकने के लिए सुरक्षाएँ शामिल हैं।
Google ने अपने मॉडल्स के प्रशिक्षण डेटा का खुलासा नहीं किया, जो बौद्धिक संपदा चिंताओं के कारण अक्सर बहस का विषय है। कुछ कंपनियाँ बिना अनुमति के कॉपीराइट सामग्री पर AI को प्रशिक्षित करती हैं, जो अमेरिकी उचित उपयोग संरक्षणों का दावा करती हैं, हालांकि रचनाकार अक्सर इसे अदालत में चुनौती देते हैं।
Google ने पहले TechCrunch को बताया था कि यह मॉडल प्रशिक्षण के लिए ऑप्ट-आउट विकल्प प्रदान करता है और Google Cloud और Vertex AI उपयोगकर्ताओं को AI-संबंधित कॉपीराइट दावों से बचाने के लिए एक क्षतिपूर्ति नीति प्रदान करता है।
संबंधित लेख
AI-चालित ओज़ का जादूगर लास वेगास स्फीयर के विशाल स्क्रीन पर चमकेगा
स्फीयर एंटरटेनमेंट ने हाल ही में अपने विशिष्ट लास वेगास स्थल के लिए द विजार्ड ऑफ ओज़ के एक immersive संस्करण की योजना का खुलासा किया, जिसमें नए अंतर्दृष्टि से पता चलता है कि Google और Magnopus कैसे AI
Google ने Android XR स्मार्ट चश्मे का अनावरण किया, Warby Parker के साथ साझेदारी
Google ने Google I/O 2025 में घोषित नई साझेदारियों के साथ Meta के Ray-Ban Meta चश्मों को चुनौती दी, जिसमें Gentle Monster और Warby Parker के साथ मिलकर Android XR द्वारा संचालित स्मार्ट चश्मे विकसित कि
Apple Safari के लिए AI खोज एकीकरण की खोज करता है
Apple सक्रिय रूप से Safari में AI-चालित खोज क्षमताओं के एकीकरण की खोज कर रहा है। बुधवार को Google के अविश्वास मुकदमे के दौरान, Apple के सेवाओं के वरिष्ठ उपाध्यक्ष Eddy Cue ने अगले वर्ष के भीतर Safari
सूचना (0)
0/200
बुधवार को, Google ने अपने Vertex AI क्लाउड प्लेटफॉर्म में अपग्रेड्स का अनावरण किया, जिसमें कई मालिकाना मीडिया-उत्पादन AI मॉडल्स को बढ़ावा दिया गया।
Lyria, Google का टेक्स्ट-टू-म्यूजिक AI, अब चुनिंदा उपयोगकर्ताओं के लिए प्रीव्यू में है, जबकि Veo 2 वीडियो मॉडल में उन्नत संपादन और दृश्य प्रभाव विकल्प जोड़े गए हैं। इसके अतिरिक्त, Google ने Chirp 3, इसके ऑडियो प्रोसेसिंग मॉडल द्वारा संचालित एक आवाज-क्लोनिंग सुविधा पेश की, जो स्वीकृत उपयोगकर्ताओं के लिए है। Google के अनुसार, Imagen 3 इमेज जनरेटर अब उल्लेखनीय रूप से बेहतर प्रदर्शन प्रदान करता है।
Cloud Next में घोषित, ये अपडेट Google की उद्यम जेनरेटिव AI बाजार में नेतृत्व करने की बोली को मजबूत करते हैं, जो Amazon के Bedrock प्लेटफॉर्म के साथ निकटता से प्रतिस्पर्धा करता है, जो समान AI टूल्स प्रदान करता है।
Google Lyria को रॉयल्टी-मुक्त संगीत पुस्तकालयों के प्रतिस्थापन के रूप में विपणन करता है, जो उपयोगकर्ताओं को जैज़ पियानो सोलो से लेकर लो-फाई बीट्स तक विविध शैलियों में गाने बनाने में सक्षम बनाता है।
Chirp 3 लगभग 35 भाषाओं में भाषण संश्लेषण का समर्थन करता है। इस साल की शुरुआत में प्रीव्यू किया गया, यह Instant Custom Voice को शक्ति देता है, जो केवल 10 सेकंड के ऑडियो का उपयोग करके आवाज को दोहरा सकता है और अब व्यापक रूप से उपलब्ध है। Chirp 3 एक नया प्रीव्यू टूल, Transcription with Diarization, भी सक्षम बनाता है, जो बहु-व्यक्ति रिकॉर्डिंग में वक्ताओं को अलग और लेबल करता है।
दुरुपयोग को रोकने के लिए, Instant Custom Voice एक सत्यापन प्रक्रिया से गुजरता है ताकि उचित आवाज उपयोग अनुमतियों को सुनिश्चित किया जा सके, Google का कहना है।
Veo 2 अब उपयोगकर्ताओं को वीडियो से पृष्ठभूमि, लोगो, या वस्तुओं को हटाने और वीडियो फ्रेम को विस्तारित करने की अनुमति देता है, जैसे कि लैंडस्केप फुटेज को पोर्ट्रेट में बदलना। यह AI-जनरेटेड दृश्यों के लिए कैमरा कोण और गति को समायोजित करने का भी समर्थन करता है, जैसे कि टाइम लैप्स या ड्रोन-शैली शॉट्स बनाने, और निर्दिष्ट प्रारंभ और अंत फ्रेम के बीच इंटरपोलेट कर सकता है।
ये Veo 2 सुविधाएँ वर्तमान में प्रीव्यू में हैं।
Google ने उल्लेख किया कि Imagen 3 के सुधार इसकी वस्तुओं को हटाने और लापता या क्षतिग्रस्त छवि क्षेत्रों को पुनर्स्थापित करने की क्षमता को बेहतर बनाते हैं।
Imagen, Veo, और Lyria (लेकिन Chirp नहीं) द्वारा बनाए गए सभी मीडिया में Google का SynthID वॉटरमार्क होता है। Google ने जोर दिया कि इसके जेनरेटिव AI मॉडल्स में हानिकारक सामग्री निर्माण को रोकने के लिए सुरक्षाएँ शामिल हैं।
Google ने अपने मॉडल्स के प्रशिक्षण डेटा का खुलासा नहीं किया, जो बौद्धिक संपदा चिंताओं के कारण अक्सर बहस का विषय है। कुछ कंपनियाँ बिना अनुमति के कॉपीराइट सामग्री पर AI को प्रशिक्षित करती हैं, जो अमेरिकी उचित उपयोग संरक्षणों का दावा करती हैं, हालांकि रचनाकार अक्सर इसे अदालत में चुनौती देते हैं।
Google ने पहले TechCrunch को बताया था कि यह मॉडल प्रशिक्षण के लिए ऑप्ट-आउट विकल्प प्रदान करता है और Google Cloud और Vertex AI उपयोगकर्ताओं को AI-संबंधित कॉपीराइट दावों से बचाने के लिए एक क्षतिपूर्ति नीति प्रदान करता है।











