"8 नए एआई उत्पाद और अपडेट परीक्षण किए गए"

I/O पर, हम केवल नई जेमिनी मॉडल, AI एजेंट्स और एंड्रॉइड ट्वीक्स जैसी अपडेट्स की सूची नहीं लॉन्च करते—हम वास्तव में डेवलपर्स, पत्रकारों और भागीदारों को हैंड्स-ऑन प्रोडक्ट डेमो के साथ एक्शन में उतरने देते हैं। इस साल, मुझे शोरलाइन एम्फीथिएटर में दिन बिताने का मौका मिला, जहां I/O होता है, और मुझे इनमें से कई डेमो देखने को मिले। यहाँ कुछ का सार है।
मेरा दिन का पहला डेमो काफी शानदार था। मैंने देखा कि जेमिनी एडवांस्ड ने 20 से अधिक पेजों के प्रॉपर्टी लीज को संभाला, जो कानूनी शब्दजाल और जटिल क्लॉज से भरा था। दस्तावेज़ को प्रोसेस करने के बाद, मैं इसके बारे में सवाल पूछ सकता था, जैसे कि क्या मेरा मकान मालिक मुझे पालतू कुत्ता रखने देगा या क्या मुझे कोई अतिरिक्त शुल्क देना होगा। मैं पहले से ही इस फीचर का उपयोग अपनी अगली लीज को समझने के लिए करने की उम्मीद कर रहा हूँ, जब मेरे अपार्टमेंट का नवीनीकरण होगा।
अगला डेमो और भी प्रभावशाली था। दो गूगलर्स ने जेमिनी को एक विशाल अर्थशास्त्र की पाठ्यपुस्तक का पीडीएफ दिया—जो सैकड़ों पेजों की थी। मुझे इसे पढ़ने में युगों लग जाते, लेकिन जेमिनी ने तुरंत एक सारांश तैयार किया और पढ़ने के लिए मुख्य विषयों को इंगित किया। इसने एक बहुविकल्पी क्विज़ भी बनाया, जिसमें एक सही जवाब और तीन मुश्किल गलत जवाब थे, ताकि मैं एक काल्पनिक परीक्षा की तैयारी कर सकूँ।
गूगलर्स सिड लाल (बाएं) और एडम कुर्ज़रोक (दाएं) प्रदर्शित करते हैं कि जेमिनी एडवांस्ड अब एक भारी अर्थशास्त्र पाठ्यपुस्तक या हजारों पेजों के दस्तावेज़ों का सारांश कैसे बना सकता है।
इन दोनों डेमो ने जेमिनी 1.5 प्रो का उपयोग किया, जिसे हमने इस साल की शुरुआत में किसी भी बड़े पैमाने के फाउंडेशन मॉडल के सबसे लंबे संदर्भ विंडो के साथ पेश किया था। हम अब जेमिनी एडवांस्ड सब्सक्राइबर्स के लिए जेमिनी 1.5 प्रो का प्रारंभिक एक्सेस रोल आउट कर रहे हैं, जिससे वे ड्राइव से सीधे दस्तावेज़ अपलोड कर सकते हैं। इसका मतलब है कि वे जेमिनी का उपयोग 1,500 पेजों तक के दस्तावेज़ों का सारांश या विश्लेषण करने के लिए कर सकते हैं।
जेमिनी 1.5 प्रो वर्कस्पेस ऐप्स जैसे जीमेल, डॉक्स, शीट्स, स्लाइड्स और ड्राइव के साइड पैनल में भी अपनी जगह बना रहा है। मुझे इसे जीमेल में एक सैंपल साप्ताहिक स्कूल रिपोर्ट ईमेल का सारांश बनाते हुए देखने का मौका मिला, और इसने 7वीं कक्षा के छात्रों के लिए गतिविधियों और रात भर की यात्रा के लिए पैकिंग लिस्ट जैसे विशिष्ट विवरण निकाले।
जेमिनी का साइड पैनल आपके जीमेल, ड्राइव और अन्य में सामग्री के बारे में महत्वपूर्ण सवालों के जवाब देने में मदद कर सकता है।
बेहतर लंबा संदर्भ विंडो एक ही प्रॉम्प्ट का जवाब देते समय कई दस्तावेज़ों से जानकारी भी निकाल सकता है। डॉक्स में, मैंने एक संभावित नौकरी उम्मीदवार को सैंपल पत्र लिखने में मदद मांगी, जिसमें नौकरी विवरण दस्तावेज़ और मेरे ड्राइव में आवेदक के पीडीएफ पोर्टफोलियो को लिंक किया। जेमिनी ने तुरंत एक ईमेल ड्राफ्ट किया जो दोनों दस्तावेज़ों के विवरण को ध्यान में रखता था।
लेकिन जेमिनी 1.5 प्रो ही एकमात्र नया खिलाड़ी नहीं है। मुझे नव घोषित इमेजन 3 के साथ भी खेलने का मौका मिला, जो हमारा अब तक का सबसे अच्छा टेक्स्ट-टू-इमेज मॉडल है। मैंने जो एक शानदार फीचर आजमाया, वह थी इसकी सजावटी टेक्स्ट और अक्षर उत्पन्न करने की क्षमता। मैंने एक स्टाइलिश वर्णमाला मांगी, जैसे कि टोस्ट पर जैम से बने अक्षर या आकाश में तैरते चांदी के गुब्बारे। इमेजन 3 ने अक्षरों की पूरी वर्णमाला तैयार की, जिसे मैं फिर अपने (स्वादिष्ट) मेनू बनाने के लिए उपयोग कर सकता था।
इमेजन 3 के साथ मजे करने के बाद, मैं फिर से जेमिनी डेमो में कूद गया। एक डेमो ने मुझे एक एंड्रॉइड फोन पर जेमिनी का ओवरले खींचने और स्क्रीन पर मौजूद किसी भी चीज़ के बारे में सवाल पूछने की अनुमति दी। इससे पता चला कि हम न केवल यह बढ़ा रहे हैं कि आप जेमिनी से क्या पूछ सकते हैं, बल्कि इसे संदर्भ-जागरूक भी बना रहे हैं ताकि यह आपकी जरूरतों का अनुमान लगा सके और उपयोगी सुझाव दे सके।
डेमो में एक लंबे ओवन मैनुअल का उदाहरण इस्तेमाल किया गया। दस्तावेज़ को पढ़ने की मेहनत करने के बजाय, मैंने जेमिनी को खींचा और तुरंत "इस पीडीएफ से पूछें" का सुझाव मिला। मैंने "घड़ी को कैसे अपडेट करूँ" जैसे सवाल पूछे और तुरंत सटीक जवाब मिले। यह यूट्यूब वीडियो के साथ भी उतना ही अच्छा काम करता था। 20 मिनट के वर्कआउट वीडियो को देखने के बजाय, मैंने पूछा कि प्लैंक को कैसे संशोधित किया जाए और तुरंत जवाब मिला, फिर अगले डेमो पर चला गया।
इस अगले डेमो ने जेमिनी लाइव नामक एक नया वार्तालाप मोड पेश किया, जहां आप बिना टाइप किए ऐप में जेमिनी से बात कर सकते हैं। जेमिनी से बात करना सामान्य चैटबॉट इंटरफेस से अलग अनुभव था। इसके जवाब अधिक बातचीत जैसे थे, न कि केवल टेक्स्ट के पैराग्राफ या बुलेट-पॉइंटेड सूचियाँ। मेरे डेमो में, मैंने गर्मी की छुट्टियों के लिए बच्चों की गतिविधियों की सूची मांगी और सूची को बीच में रोककर टाई-डाई शर्ट के लिए मुझे किन सामग्रियों की जरूरत होगी, इसके बारे में और पूछ सका।
प्रोजेक्ट एस्ट्रा डेमो ने चीजों को अगले स्तर पर ले गया, यह दिखाते हुए कि हमारे वार्तालाप AI प्रोजेक्ट्स कहाँ जा रहे हैं।
हमारा AI सैंडबॉक्स, जहां डेवलपर्स और उपस्थित लोग प्रोजेक्ट एस्ट्रा और अन्य रचनात्मक AI प्रयोगों, जैसे म्यूज़िकएफएक्स के डीजे मोड जैसे डेमो आजमा सकते थे।
स्क्रीन पर मौजूद चीज़ों या आपके द्वारा चैट बॉक्स में टाइप किए गए के साथ काम करने के बजाय, एस्ट्रा की मल्टीमॉडल क्षमताएँ वार्तालाप भाषण प्रॉम्प्ट और लाइव वीडियो फीड को एक साथ समझ सकती हैं, जिससे नए प्रकार के AI अनुभव अनलॉक होते हैं।
एस्ट्रा का समान ध्वन्यात्मकता डेमो सरल शुरू हुआ: मैंने कैमरे को एक वस्तु दिखाई, जैसे केला या रोटी का टुकड़ा, और जेमिनी ने एक समान ध्वन्यात्मक वाक्य बनाया। जैसे-जैसे मैंने और वस्तुएँ जोड़ीं, जेमिनी ने बातचीत को जारी रखा, एक फल के साथ "ब्राइट बनानास बास्क ब्यूटीफुली ऑन द बोर्ड" से लेकर पूरे बुफे बोर्ड के साथ "क्यूलिनरी क्रिएशन्स कैन कैच द आई" तक।
एस्ट्रा केले, बैगेट… और आपके द्वारा दिखाई गई किसी भी चीज़ के साथ समान ध्वन्यात्मकता करता है।
एक अन्य एस्ट्रा डेमो ने मुझे जेमिनी के साथ पिक्शनरी खेलने दिया। यह सरल लग सकता है, लेकिन इसके लिए एजेंट को छवियों को समझने, प्रत्येक राउंड में क्या बनाया गया था उसे याद रखने, और सामान्य ज्ञान का उपयोग करके यह अनुमान लगाने की आवश्यकता थी कि मैं क्या बना रहा हूँ। एक डेमो में, एस्ट्रा को पता था कि एक गोला अनुमान लगाने के लिए पर्याप्त नहीं था, लेकिन जैसे ही मैंने इसके नीचे रेखाएँ जोड़ीं, यह तेजी से एक स्टिक फिगर से एक व्यक्ति को खोपड़ी इमोजी पकड़े हुए हैमलेट के रूप में पहचानने लगा।
एस्ट्रा पिक्शनरी में अजेय है।
AI सैंडबॉक्स और अन्य डेमो स्टेशनों के माध्यम से घूमना भविष्य की एक झलक जैसा लगा। यह थोड़ा विनम्र भी था: एस्ट्रा ने मुझे कई राउंड में पिक्शनरी में हरा दिया!
संबंधित लेख
मेटा ने उन्नत लामा उपकरणों के साथ AI सुरक्षा को बढ़ाया
मेटा ने AI विकास को मजबूत करने और उभरते खतरों से बचाव के लिए नए लामा सुरक्षा उपकरण जारी किए हैं।ये उन्नत लामा AI मॉडल सुरक्षा उपकरण मेटा के नए संसाधनों के साथ जोड़े गए हैं, ताकि साइबरसुरक्षा टीमों को
NotebookLM ने शीर्ष प्रकाशनों और विशेषज्ञों से संग्रहित नोटबुक्स का अनावरण किया
Google अपने AI-चालित अनुसंधान और नोट-टेकिंग टूल, NotebookLM को एक व्यापक ज्ञान केंद्र के रूप में बढ़ा रहा है। सोमवार को, कंपनी ने प्रमुख लेखकों, प्रकाशनों, शोधकर्ताओं और गैर-लाभकारी संगठनों से संग्रहि
अलीबाबा ने Wan2.1-VACE का अनावरण किया: ओपन-सोर्स AI वीडियो समाधान
अलीबाबा ने Wan2.1-VACE पेश किया है, जो एक ओपन-सोर्स AI मॉडल है और वीडियो निर्माण और संपादन प्रक्रियाओं को बदलने के लिए तैयार है।VACE अलीबाबा के Wan2.1 वीडियो AI मॉडल परिवार का एक प्रमुख घटक है, कंपनी
सूचना (36)
0/200
WillWalker
31 जुलाई 2025 7:11:20 पूर्वाह्न IST
Whoa, hands-on demos at I/O sound epic! Tried any cool AI agents yet? Bet they’re game-changers for devs! 😎
0
JeffreyThomas
21 अप्रैल 2025 7:03:38 पूर्वाह्न IST
¡Las demostraciones prácticas en I/O fueron una pasada! Pude probar los nuevos modelos Gemini y agentes de IA, que fueron bastante geniales pero un poco llenos de errores. Los ajustes de Android fueron un buen toque, sin embargo. En general, un día divertido en el Shoreline Amphitheatre, pero necesitan solucionar esos errores! 🤓
0
GregoryRodriguez
19 अप्रैल 2025 9:54:35 अपराह्न IST
I/O's hands-on approach with new AI products is awesome! Got to play around with the Gemini models and AI agents at Shoreline Amphitheatre. It's super engaging and you really get a feel for what's coming next. Only wish there was more time to explore everything! 🤓
0
ThomasYoung
18 अप्रैल 2025 4:43:01 अपराह्न IST
Os demos práticos no I/O foram incríveis! Consegui experimentar os novos modelos Gemini e agentes de IA, que foram bem legais, mas um pouco cheios de bugs. As melhorias no Android foram um toque agradável, no entanto. No geral, um dia divertido no Shoreline Amphitheatre, mas eles precisam corrigir esses bugs! 🤓
0
BrianThomas
18 अप्रैल 2025 10:07:15 पूर्वाह्न IST
A abordagem prática do I/O com novos produtos de IA é incrível! Pude brincar com os modelos Gemini e agentes de IA no Shoreline Amphitheatre. É super envolvente e você realmente sente o que está por vir. Só queria ter mais tempo para explorar tudo! 😎
0
JackMartin
16 अप्रैल 2025 6:48:17 पूर्वाह्न IST
I/Oでの新しいAI製品の体験は最高です!ジェミニモデルやAIエージェントをショアライン円形劇場で試せました。とても楽しく、次に何が来るのかを実感できます。もっと時間があれば全部を探検したいですね!😊
0
I/O पर, हम केवल नई जेमिनी मॉडल, AI एजेंट्स और एंड्रॉइड ट्वीक्स जैसी अपडेट्स की सूची नहीं लॉन्च करते—हम वास्तव में डेवलपर्स, पत्रकारों और भागीदारों को हैंड्स-ऑन प्रोडक्ट डेमो के साथ एक्शन में उतरने देते हैं। इस साल, मुझे शोरलाइन एम्फीथिएटर में दिन बिताने का मौका मिला, जहां I/O होता है, और मुझे इनमें से कई डेमो देखने को मिले। यहाँ कुछ का सार है।
मेरा दिन का पहला डेमो काफी शानदार था। मैंने देखा कि जेमिनी एडवांस्ड ने 20 से अधिक पेजों के प्रॉपर्टी लीज को संभाला, जो कानूनी शब्दजाल और जटिल क्लॉज से भरा था। दस्तावेज़ को प्रोसेस करने के बाद, मैं इसके बारे में सवाल पूछ सकता था, जैसे कि क्या मेरा मकान मालिक मुझे पालतू कुत्ता रखने देगा या क्या मुझे कोई अतिरिक्त शुल्क देना होगा। मैं पहले से ही इस फीचर का उपयोग अपनी अगली लीज को समझने के लिए करने की उम्मीद कर रहा हूँ, जब मेरे अपार्टमेंट का नवीनीकरण होगा।
अगला डेमो और भी प्रभावशाली था। दो गूगलर्स ने जेमिनी को एक विशाल अर्थशास्त्र की पाठ्यपुस्तक का पीडीएफ दिया—जो सैकड़ों पेजों की थी। मुझे इसे पढ़ने में युगों लग जाते, लेकिन जेमिनी ने तुरंत एक सारांश तैयार किया और पढ़ने के लिए मुख्य विषयों को इंगित किया। इसने एक बहुविकल्पी क्विज़ भी बनाया, जिसमें एक सही जवाब और तीन मुश्किल गलत जवाब थे, ताकि मैं एक काल्पनिक परीक्षा की तैयारी कर सकूँ।
जेमिनी 1.5 प्रो वर्कस्पेस ऐप्स जैसे जीमेल, डॉक्स, शीट्स, स्लाइड्स और ड्राइव के साइड पैनल में भी अपनी जगह बना रहा है। मुझे इसे जीमेल में एक सैंपल साप्ताहिक स्कूल रिपोर्ट ईमेल का सारांश बनाते हुए देखने का मौका मिला, और इसने 7वीं कक्षा के छात्रों के लिए गतिविधियों और रात भर की यात्रा के लिए पैकिंग लिस्ट जैसे विशिष्ट विवरण निकाले।
बेहतर लंबा संदर्भ विंडो एक ही प्रॉम्प्ट का जवाब देते समय कई दस्तावेज़ों से जानकारी भी निकाल सकता है। डॉक्स में, मैंने एक संभावित नौकरी उम्मीदवार को सैंपल पत्र लिखने में मदद मांगी, जिसमें नौकरी विवरण दस्तावेज़ और मेरे ड्राइव में आवेदक के पीडीएफ पोर्टफोलियो को लिंक किया। जेमिनी ने तुरंत एक ईमेल ड्राफ्ट किया जो दोनों दस्तावेज़ों के विवरण को ध्यान में रखता था।
लेकिन जेमिनी 1.5 प्रो ही एकमात्र नया खिलाड़ी नहीं है। मुझे नव घोषित इमेजन 3 के साथ भी खेलने का मौका मिला, जो हमारा अब तक का सबसे अच्छा टेक्स्ट-टू-इमेज मॉडल है। मैंने जो एक शानदार फीचर आजमाया, वह थी इसकी सजावटी टेक्स्ट और अक्षर उत्पन्न करने की क्षमता। मैंने एक स्टाइलिश वर्णमाला मांगी, जैसे कि टोस्ट पर जैम से बने अक्षर या आकाश में तैरते चांदी के गुब्बारे। इमेजन 3 ने अक्षरों की पूरी वर्णमाला तैयार की, जिसे मैं फिर अपने (स्वादिष्ट) मेनू बनाने के लिए उपयोग कर सकता था।
इमेजन 3 के साथ मजे करने के बाद, मैं फिर से जेमिनी डेमो में कूद गया। एक डेमो ने मुझे एक एंड्रॉइड फोन पर जेमिनी का ओवरले खींचने और स्क्रीन पर मौजूद किसी भी चीज़ के बारे में सवाल पूछने की अनुमति दी। इससे पता चला कि हम न केवल यह बढ़ा रहे हैं कि आप जेमिनी से क्या पूछ सकते हैं, बल्कि इसे संदर्भ-जागरूक भी बना रहे हैं ताकि यह आपकी जरूरतों का अनुमान लगा सके और उपयोगी सुझाव दे सके।
डेमो में एक लंबे ओवन मैनुअल का उदाहरण इस्तेमाल किया गया। दस्तावेज़ को पढ़ने की मेहनत करने के बजाय, मैंने जेमिनी को खींचा और तुरंत "इस पीडीएफ से पूछें" का सुझाव मिला। मैंने "घड़ी को कैसे अपडेट करूँ" जैसे सवाल पूछे और तुरंत सटीक जवाब मिले। यह यूट्यूब वीडियो के साथ भी उतना ही अच्छा काम करता था। 20 मिनट के वर्कआउट वीडियो को देखने के बजाय, मैंने पूछा कि प्लैंक को कैसे संशोधित किया जाए और तुरंत जवाब मिला, फिर अगले डेमो पर चला गया।
इस अगले डेमो ने जेमिनी लाइव नामक एक नया वार्तालाप मोड पेश किया, जहां आप बिना टाइप किए ऐप में जेमिनी से बात कर सकते हैं। जेमिनी से बात करना सामान्य चैटबॉट इंटरफेस से अलग अनुभव था। इसके जवाब अधिक बातचीत जैसे थे, न कि केवल टेक्स्ट के पैराग्राफ या बुलेट-पॉइंटेड सूचियाँ। मेरे डेमो में, मैंने गर्मी की छुट्टियों के लिए बच्चों की गतिविधियों की सूची मांगी और सूची को बीच में रोककर टाई-डाई शर्ट के लिए मुझे किन सामग्रियों की जरूरत होगी, इसके बारे में और पूछ सका।
प्रोजेक्ट एस्ट्रा डेमो ने चीजों को अगले स्तर पर ले गया, यह दिखाते हुए कि हमारे वार्तालाप AI प्रोजेक्ट्स कहाँ जा रहे हैं।
एस्ट्रा का समान ध्वन्यात्मकता डेमो सरल शुरू हुआ: मैंने कैमरे को एक वस्तु दिखाई, जैसे केला या रोटी का टुकड़ा, और जेमिनी ने एक समान ध्वन्यात्मक वाक्य बनाया। जैसे-जैसे मैंने और वस्तुएँ जोड़ीं, जेमिनी ने बातचीत को जारी रखा, एक फल के साथ "ब्राइट बनानास बास्क ब्यूटीफुली ऑन द बोर्ड" से लेकर पूरे बुफे बोर्ड के साथ "क्यूलिनरी क्रिएशन्स कैन कैच द आई" तक।


Whoa, hands-on demos at I/O sound epic! Tried any cool AI agents yet? Bet they’re game-changers for devs! 😎




¡Las demostraciones prácticas en I/O fueron una pasada! Pude probar los nuevos modelos Gemini y agentes de IA, que fueron bastante geniales pero un poco llenos de errores. Los ajustes de Android fueron un buen toque, sin embargo. En general, un día divertido en el Shoreline Amphitheatre, pero necesitan solucionar esos errores! 🤓




I/O's hands-on approach with new AI products is awesome! Got to play around with the Gemini models and AI agents at Shoreline Amphitheatre. It's super engaging and you really get a feel for what's coming next. Only wish there was more time to explore everything! 🤓




Os demos práticos no I/O foram incríveis! Consegui experimentar os novos modelos Gemini e agentes de IA, que foram bem legais, mas um pouco cheios de bugs. As melhorias no Android foram um toque agradável, no entanto. No geral, um dia divertido no Shoreline Amphitheatre, mas eles precisam corrigir esses bugs! 🤓




A abordagem prática do I/O com novos produtos de IA é incrível! Pude brincar com os modelos Gemini e agentes de IA no Shoreline Amphitheatre. É super envolvente e você realmente sente o que está por vir. Só queria ter mais tempo para explorar tudo! 😎




I/Oでの新しいAI製品の体験は最高です!ジェミニモデルやAIエージェントをショアライン円形劇場で試せました。とても楽しく、次に何が来るのかを実感できます。もっと時間があれば全部を探検したいですね!😊












