Google चुपके से एंटरप्राइज एआई में पार करता है: 'कैच अप' से 'कैच यूएस' तक

घर

समाचार

20 अप्रैल 2025

EricMartin

103

# Google # ChatGPT # openai # LLMs # tpus # bard

बस एक साल पहले, Google और उद्यम AI के आसपास का उत्साह तटस्थ स्थिति में अटका हुआ लग रहा था। ट्रांसफॉर्मर जैसी अग्रणी तकनीकों के बावजूद, यह तकनीकी दिग्गज पिछड़ता हुआ प्रतीत हो रहा था, जो OpenAI की वायरल सफलता, Anthropic की कोडिंग दक्षता, और Microsoft के उद्यम बाजार में आक्रामक प्रयासों से ग्रहण लग गया था।

लेकिन पिछले हफ्ते लास वेगास में Google Cloud Next 2025 में तेजी से आगे बढ़ें, और दृश्य स्पष्ट रूप से अलग था। आत्मविश्वास से भरे Google ने, शीर्ष प्रदर्शन करने वाले मॉडल, मजबूत बुनियादी ढांचे, और एक स्पष्ट उद्यम रणनीति के साथ, एक नाटकीय बदलाव की घोषणा की। Google के वरिष्ठ अधिकारियों के साथ एक बंद कमरे में विश्लेषक बैठक में, एक विश्लेषक ने मूड को संक्षेप में कहा: "यह ऐसा लगता है जैसे वह क्षण जब Google 'पकड़ने' से 'हमें पकड़ो' की ओर बढ़ गया।"

Google का आगे बढ़ना

यह भावना—कि Google ने न केवल पकड़ लिया है बल्कि उद्यम AI दौड़ में OpenAI और Microsoft से आगे निकल गया है—पूरे आयोजन में स्पष्ट थी। और यह सिर्फ मार्केटिंग का शोर नहीं है। पिछले एक साल में, Google ने कार्यान्वयन पर गहन ध्यान केंद्रित किया है, अपनी तकनीकी दक्षता को एक उच्च-प्रदर्शन, एकीकृत मंच में बदलते हुए, जो जल्दी ही उद्यम निर्णय निर्माताओं को जीत रहा है। दुनिया के सबसे शक्तिशाली AI मॉडल जो अत्यधिक कुशल कस्टम सिलिकॉन पर चल रहे हैं, से लेकर वास्तविक दुनिया की व्यावसायिक चुनौतियों के लिए अनुकूलित AI एजेंट्स के बढ़ते पारिस्थितिकी तंत्र तक, Google यह मजबूत तर्क दे रहा है कि वह कभी वास्तव में खोया नहीं था, बल्कि गहरे, आधारभूत विकास की अवधि से गुजर रहा था।

अपने एकीकृत स्टैक के अब पूर्ण क्षमता पर काम करने के साथ, Google उद्यम AI क्रांति के अगले चरण का नेतृत्व करने के लिए तैयार दिखता है। Next में Google के अधिकारियों के साथ मेरी साक्षात्कार में, उन्होंने बुनियादी ढांचे और मॉडल एकीकरण में Google के अद्वितीय लाभों पर जोर दिया—ऐसे लाभ जो OpenAI, Microsoft, या AWS जैसे प्रतिस्पर्धियों के लिए दोहराना मुश्किल होगा।

संदेह की छाया: हाल के अतीत को स्वीकार करना

Google की वर्तमान गति को पूरी तरह समझने के लिए, हाल के अतीत को स्वीकार करना आवश्यक है। Google ने ट्रांसफॉर्मर आर्किटेक्चर का आविष्कार किया, जिसने आधुनिक बड़े भाषा मॉडल (LLMs) में क्रांति ला दी, और एक दशक पहले विशेष AI हार्डवेयर (TPUs) में निवेश शुरू किया, जो अब उद्योग-अग्रणी दक्षता प्रदान करता है। फिर भी, अस्पष्ट रूप से, सिर्फ ढाई साल पहले, Google खुद को रक्षा में पाया।

OpenAI का ChatGPT ने जनता की कल्पना और उद्यम रुचि को तेजी से अपने कब्जे में लिया, जो इतिहास में सबसे तेजी से बढ़ने वाला ऐप बन गया। Anthropic जैसे प्रतिस्पर्धियों ने कोडिंग जैसे क्षेत्रों में अपनी जगह बनाई। इस बीच, Google के सार्वजनिक कदम अक्सर अनिश्चित या दोषपूर्ण लगे। 2023 में कुख्यात Bard डेमो की गलतियाँ और इसके इमेज जनरेटर द्वारा ऐतिहासिक रूप से गलत चित्रणों ने एक ऐसी कंपनी की कहानी को बढ़ावा दिया जो शायद आंतरिक नौकरशाही या संरेखण पर अत्यधिक सुधार से बाधित थी। Google खोया हुआ लग रहा था, जो क्लाउड प्रतियोगिता में इसकी शुरुआती धीमापन को प्रतिबिंबित करता था, जहाँ यह Amazon और Microsoft के पीछे बाजार हिस्सेदारी में तीसरे स्थान पर रहा।

मोड़: नेतृत्व करने का सचेत निर्णय

हालांकि, पर्दे के पीछे, एक महत्वपूर्ण बदलाव हो रहा था, जो उच्चतम स्तरों पर नेतृत्व को पुनः प्राप्त करने के सचेत निर्णय से प्रेरित था। Mat Velloso, Google DeepMind के AI डेवलपर प्लेटफॉर्म के लिए उत्पाद के उपाध्यक्ष, ने फरवरी 2024 में Microsoft छोड़कर Google में शामिल होने पर इस निर्णायक क्षण को महसूस किया। "जब मैं Google में आया, मैंने सुंदर [पिचाई] से बात की, मैंने यहाँ कई नेताओं से बात की, और मुझे लगा कि यह वह क्षण था जब उन्होंने निर्णय लिया, ठीक है, यह [जेनरेटिव AI] एक ऐसी चीज है जिसे उद्योग स्पष्ट रूप से महत्व देता है। इसे बनाएँ," Velloso ने पिछले हफ्ते Next में एक साक्षात्कार के दौरान साझा किया।

यह नवीकृत जोश उस कथित "ब्रेन ड्रेन" से बाधित नहीं हुआ जिसे कुछ बाहरी लोग मानते थे कि Google को कमजोर कर रहा था। इसके बजाय, कंपनी ने 2024 की शुरुआत में कार्यान्वयन पर दोगुना जोर दिया, जिसमें आक्रामक भर्ती, आंतरिक एकीकरण, और ग्राहक कर्षण शामिल था। जबकि प्रतिस्पर्धियों ने शानदार भर्तियाँ कीं, Google ने अपनी मुख्य AI नेतृत्व को बनाए रखा, जिसमें DeepMind के सीईओ Demis Hassabis और Google Cloud के सीईओ Thomas Kurian शामिल थे, जो स्थिरता और गहरी विशेषज्ञता प्रदान करते थे।

इसके अलावा, प्रतिभा Google के केंद्रित मिशन की ओर बहने लगी। उदाहरण के लिए, Logan Kilpatrick, OpenAI से Google में लौटे, कंपनी के भीतर आधारभूत AI बनाने के अवसर से आकर्षित हुए। उन्होंने Velloso के साथ एक "शून्य से एक अनुभव" में शामिल हुए, जिसे उन्होंने Gemini के लिए डेवलपर कर्षण बनाने का काम सौंपा गया। "यह ऐसा था जैसे पहले दिन टीम में मैं ही था... इस मंच पर हमारे पास कोई उपयोगकर्ता नहीं हैं, कोई राजस्व नहीं है। इस समय कोई भी Gemini में रुचि नहीं रखता," Kilpatrick ने शुरुआती बिंदु को याद किया। Josh Woodward जैसे नेता, जिन्होंने AI Studio शुरू करने में मदद की और अब Gemini App और Labs का नेतृत्व करते हैं, और Noam Shazeer, मूल "Attention Is All You Need" ट्रांसफॉर्मर पेपर के प्रमुख सह-लेखक, भी 2024 के अंत में महत्वपूर्ण Gemini परियोजना के लिए तकनीकी सह-नेता के रूप में कंपनी में लौटे।

स्तंभ 1: Gemini 2.5 और सोचने वाले मॉडल का युग

हालांकि उद्यम मंत्र अब "यह सिर्फ मॉडल के बारे में नहीं है" की ओर स्थानांतरित हो गया है, फिर भी सर्वश्रेष्ठ प्रदर्शन करने वाला LLM होना एक महत्वपूर्ण उपलब्धि और कंपनी की बेहतर अनुसंधान और कुशल प्रौद्योगिकी वास्तुकला का एक शक्तिशाली सत्यापन है। Next '25 से कुछ हफ्ते पहले Gemini 2.5 Pro के रिलीज के साथ, Google ने इस ताज को निर्णायक रूप से हासिल कर लिया। यह जल्दी ही स्वतंत्र Chatbot Arena लीडरबोर्ड में शीर्ष पर रहा, OpenAI के नवीनतम GPT-4o वेरिएंट को काफी हद तक पछाड़ते हुए, और Humanity’s Last Exam जैसे कठिन तर्क बेंचमार्क में उत्कृष्ट प्रदर्शन किया। जैसा कि पिचाई ने मुख्य भाषण में कहा, "यह हमारा अब तक का सबसे बुद्धिमान AI मॉडल है। और यह दुनिया का सबसे अच्छा मॉडल है।" उन्होंने अलग से ट्वीट किया कि इस मॉडल ने एक महीने के भीतर Gemini उपयोग में 80 प्रतिशत की वृद्धि की।

पहली बार, Gemini की मांग आग की तरह थी। मुझे Gemini 2.5 Pro की कच्ची बुद्धिमत्ता के अलावा, इसकी प्रदर्शनशील तर्क क्षमता ने प्रभावित किया। Google ने एक "सोचने" की क्षमता को इंजीनियर किया है, जो मॉडल को बहु-चरण तर्क, योजना, और यहाँ तक कि अंतिम प्रतिक्रिया देने से पहले आत्म-चिंतन करने की अनुमति देता है। संरचित, सुसंगत चेन-ऑफ-थॉट (CoT) – क्रमांकित चरणों और उप-बुलेट्स का उपयोग करके – DeepSeek या OpenAI के अन्य मॉडलों से अस्पष्ट या अपारदर्शी आउटपुट की प्रकृति से बचता है। महत्वपूर्ण कार्यों के लिए आउटपुट का मूल्यांकन करने वाली तकनीकी टीमों के लिए, यह पारदर्शिता अभूतपूर्व आत्मविश्वास के साथ सत्यापन, सुधार, और पुनर्निर्देशन की अनुमति देती है।

लेकिन उद्यम उपयोगकर्ताओं के लिए और भी महत्वपूर्ण, Gemini 2.5 Pro ने कोडिंग में अंतर को नाटकीय रूप से कम कर दिया, जो जेनरेटिव AI के लिए सबसे बड़े अनुप्रयोग क्षेत्रों में से एक है। VentureBeat के साथ एक साक्षात्कार में, प्रमुख रिटेलर Wayfair के CTO Fiona Tan ने कहा कि प्रारंभिक परीक्षणों के बाद, कंपनी ने पाया कि यह "काफी हद तक बेहतर हुआ" और अब Anthropic के Claude 3.7 Sonnet के "काफी तुलनीय" था, जो पहले कई डेवलपर्स की पसंदीदा पसंद थी।

Google ने मॉडल में एक विशाल 1 मिलियन टोकन संदर्भ विंडो भी जोड़ा, जो पूरे कोडबेस या लंबी दस्तावेज़ीकरण में तर्क करने में सक्षम बनाता है, जो OpenAI या Anthropic के मॉडलों की क्षमताओं को काफी हद तक पार करता है। (OpenAI ने इस हफ्ते समान रूप से बड़े संदर्भ विंडो वाले मॉडलों के साथ जवाब दिया, हालांकि बेंचमार्क सुझाते हैं कि Gemini 2.5 Pro समग्र तर्क में बढ़त बनाए रखता है।) यह लाभ जटिल, बहु-फाइल सॉफ्टवेयर इंजीनियरिंग कार्यों की अनुमति देता है।

Pro को पूरक करने वाला Gemini 2.5 Flash है, जिसे Next '25 में घोषित किया गया और कल ही रिलीज किया गया। यह भी एक "सोचने" वाला मॉडल है, जिसे कम विलंबता और लागत-दक्षता के लिए अनुकूलित किया गया है। आप यह नियंत्रित कर सकते हैं कि मॉडल कितना तर्क करता है और प्रदर्शन को अपने बजट के साथ संतुलित कर सकते हैं। यह स्तरित दृष्टिकोण Google के अधिकारियों द्वारा समर्थित "प्रति डॉलर बुद्धिमत्ता" रणनीति को और प्रतिबिंबित करता है।

Velloso ने एक चार्ट दिखाया जिसमें बुद्धिमत्ता के पूरे स्पेक्ट्रम में Google मॉडल सबसे अच्छा मूल्य प्रदान करते हैं। "अगर हमने यह बातचीत एक साल पहले की होती... मेरे पास दिखाने के लिए कुछ भी नहीं होता," Velloso ने स्वीकार किया, जिसने तेजी से बदलाव को उजागर किया। "और अब, जैसे, पूरे बोर्ड में, हम हैं, अगर आप किसी भी मॉडल की तलाश में हैं, किसी भी आकार के, जैसे, अगर आप Google नहीं हैं, तो आप पैसे खो रहे हैं।" इसी तरह के चार्ट को OpenAI के नवीनतम मॉडल रिलीज को ध्यान में रखते हुए अपडेट किया गया है, जो सभी एक ही बात दिखाते हैं: Google के मॉडल प्रति डॉलर सबसे अच्छी बुद्धिमत्ता प्रदान करते हैं। नीचे देखें:

किसी भी दी गई कीमत के लिए, Google के मॉडल अन्य मॉडलों की तुलना में लगभग 90 प्रतिशत समय में अधिक बुद्धिमत्ता प्रदान करते हैं। स्रोत: Pierre Bongrand।

Wayfair की Tan ने 2.5 Pro के साथ विलंबता में आशाजनक सुधार भी देखा: "Gemini 2.5 तेजी से वापस आया," जिससे यह "अधिक ग्राहक-मुखी क्षमताओं" के लिए व्यवहार्य हो गया, उन्होंने कहा, जो पहले अन्य मॉडलों के साथ नहीं था। Gemini वह पहला मॉडल बन सकता है जिसे Wayfair इन ग्राहक इंटरैक्शन के लिए उपयोग करता है, उन्होंने कहा।

Gemini परिवार की क्षमताएँ मल्टीमॉडलिटी तक विस्तारित हैं, जो Google के अन्य अग्रणी मॉडलों जैसे Imagen 3 (इमेज जनरेशन), Veo 2 (वीडियो जनरेशन), Chirp 3 (ऑडियो), और हाल ही में घोषित Lyria (टेक्स्ट-टू-म्यूजिक) के साथ सहजता से एकीकृत हैं, जो सभी Google के उद्यम उपयोगकर्ताओं के लिए Vertex मंच के माध्यम से उपलब्ध हैं। Google एकमात्र कंपनी है जो अपने मंच पर सभी मोडालिटीज में अपने स्वयं के जेनरेटिव मीडिया मॉडल प्रदान करती है। Microsoft, AWS, और OpenAI को ऐसा करने के लिए अन्य कंपनियों के साथ साझेदारी करनी पड़ती है।

स्तंभ 2: बुनियादी ढांचे की दक्षता – हुड के नीचे का इंजन

इन शक्तिशाली मॉडलों को तेजी से दोहराने और कुशलता से सेवा देने की क्षमता Google के संभवतः अद्वितीय बुनियादी ढांचे से आती है, जिसे दशकों तक ग्रह-स्तर की सेवाओं को चलाने में निखारा गया है। इसमें केंद्रीय भूमिका Tensor Processing Unit (TPU) की है।

Next '25 में, Google ने अपनी सातवीं पीढ़ी का TPU, Ironwood, अनावरण किया, जिसे विशेष रूप से अनुमान और "सोचने वाले मॉडल" की मांगों के लिए डिज़ाइन किया गया है। इसका पैमाना विशाल है, जो मांग वाले AI कार्यभार के लिए तैयार किया गया है: Ironwood पॉड्स में 9,000 से अधिक लिक्विड-कूल्ड चिप्स पैक हैं, जो 42.5 एक्साफ्लॉप्स की गणना शक्ति प्रदान करते हैं। Google के ML सिस्टम्स के उपाध्यक्ष Amin Vahdat ने Next में मंच पर कहा कि यह दुनिया के वर्तमान #1 सुपरकंप्यूटर की गणना शक्ति से "24 गुना से अधिक" है।

Google ने कहा कि Ironwood पिछले पीढ़ी के TPU, Trillium की तुलना में 2x प्रदर्शन/वाट प्रदान करता है। यह महत्वपूर्ण है क्योंकि उद्यम ग्राहक तेजी से कहते हैं कि ऊर्जा लागत और उपलब्धता बड़े पैमाने पर AI परिनियोजन को बाधित करती है।

Google Cloud CTO Will Grannis ने इस प्रगति की निरंतरता पर जोर दिया। साल दर साल, Google अपने प्रोसेसर्स में 10x, 8x, 9x, 10x सुधार कर रहा है, उन्होंने VentureBeat को एक साक्षात्कार में बताया, जिसे उन्होंने AI त्वरकों के लिए "हाइपर मूर का नियम" कहा। उन्होंने कहा कि ग्राहक Google के रोडमैप को खरीद रहे हैं, न कि केवल इसकी तकनीक को।

Google की स्थिति ने इस निरंतर TPU निवेश को बढ़ावा दिया। इसे 2 अरब से अधिक उपयोगकर्ताओं के लिए Search, YouTube, और Gmail जैसे विशाल सेवाओं को कुशलता से संचालित करने की आवश्यकता थी। इसने वर्तमान जेनरेटिव AI उछाल से बहुत पहले कस्टम, अनुकूलित हार्डवेयर विकसित करने की आवश्यकता थी। जबकि Meta एक समान उपभोक्ता पैमाने पर संचालित होता है, अन्य प्रतिस्पर्धियों में दशक-लंबे, लंबवत एकीकृत AI हार्डवेयर विकास के लिए यह विशिष्ट आंतरिक प्रेरक नहीं था।

अब ये TPU निवेश भुगतान कर रहे हैं क्योंकि वे न केवल अपनी ऐप्स के लिए बल्कि Gemini को अन्य उपयोगकर्ताओं को बेहतर प्रति डॉलर बुद्धिमत्ता प्रदान करने की अनुमति दे रहे हैं, सभी चीजें बराबर होने पर।

आप पूछते हैं कि Google के प्रतिस्पर्धी Nvidia से कुशल प्रोसेसर्स क्यों नहीं खरीद सकते? यह सच है कि Nvidia के GPU प्रोसेसर्स LLM के प्री-ट्रेनिंग में हावी हैं। लेकिन बाजार की मांग ने इन GPUs की कीमत को बढ़ा दिया है, और Nvidia अपने लिए एक स्वस्थ लाभ लेता है। इससे इसके चिप्स के उपयोगकर्ताओं को महत्वपूर्ण लागतें हस्तांतरित होती हैं। और साथ ही, जबकि प्री-ट्रेनिंग ने अब तक AI चिप्स के उपयोग पर हावी रहा है, यह अब बदल रहा है क्योंकि उद्यम वास्तव में इन अनुप्रयोगों को परिनियोजित कर रहे हैं। यहाँ "अनुमान" आता है, और यहाँ TPUs को बड़े पैमाने पर कार्यभार के लिए GPUs से अधिक कुशल माना जाता है।

जब आप Google के अधिकारियों से पूछते हैं कि AI में उनकी मुख्य तकनीकी बढ़त कहाँ से आती है, वे आमतौर पर TPU को सबसे महत्वपूर्ण मानते हैं। Google के कंप्यूटिंग बुनियादी ढांचे को चलाने वाले उपाध्यक्ष Mark Lohmeyer स्पष्ट थे: TPUs "निश्चित रूप से हमारे काम का एक अत्यधिक विशिष्ट हिस्सा हैं... OpenAI, उनके पास ऐसी क्षमताएँ नहीं हैं।"

महत्वपूर्ण रूप से, Google TPUs को अलगाव में नहीं बल्कि व्यापक, अधिक जटिल उद्यम AI वास्तुकला के हिस्से के रूप में प्रस्तुत करता है। तकनीकी अंदरूनी लोगों के लिए, यह समझा जाता है कि शीर्ष-स्तरीय प्रदर्शन तेजी से विशेषीकृत प्रौद्योगिकी सफलताओं के एकीकरण पर निर्भर करता है। Next में कई अपडेट्स का विवरण दिया गया। Vahdat ने इसे एक "सुपरकंप्यूटिंग सिस्टम" के रूप में वर्णित किया, जिसमें हार्डवेयर (TPUs, नवीनतम Nvidia GPUs जैसे Blackwell और आगामी Vera Rubin, उन्नत स्टोरेज जैसे Hyperdisk Exapools, Anywhere Cache, और Rapid Storage) को एक एकीकृत सॉफ्टवेयर स्टैक के साथ एकीकृत किया गया। इस सॉफ्टवेयर में Cluster Director शामिल है जो त्वरकों को प्रबंधित करता है, Pathways (Gemini का वितरित रनटाइम, अब ग्राहकों के लिए उपलब्ध), और vLLM को TPUs में लाने जैसे अनुकूलन, जो पहले Nvidia/PyTorch स्टैक पर थे, उनके लिए कार्यभार माइग्रेशन को आसान बनाता है। यह एकीकृत सिस्टम, Vahdat ने तर्क दिया, यही कारण है कि Gemini 2.0 Flash GPT-4o की तुलना में 24 गुना अधिक प्रति डॉलर बुद्धिमत्ता प्राप्त करता है।

Google अपनी भौतिक बुनियादी ढांचे की पहुंच को भी विस्तारित कर रहा है। Cloud WAN Google के कम-विलंबता वाले 2-मिलियन-मील निजी फाइबर नेटवर्क को उद्यमों के लिए उपलब्ध कराता है, जो ग्राहक-प्रबंधित नेटवर्क की तुलना में 40% तेज प्रदर्शन और 40% कम कुल स्वामित्व लागत (TCO) का वादा करता है।

इसके अलावा, Google Distributed Cloud (GDC) Gemini और Nvidia हार्डवेयर (Dell के साथ साझेदारी के माध्यम से) को संप्रभु, ऑन-प्रिमाइसेस, या यहाँ तक कि एयर-गैप्ड वातावरण में चलाने की अनुमति देता है – एक क्षमता जिसे Nvidia के सीईओ Jensen Huang ने नियंत्रित उद्योगों और राष्ट्रों के लिए अत्याधुनिक AI लाने के लिए "पूरी तरह से विशाल" बताया। Next में, Huang ने Google के बुनियादी ढांचे को दुनिया में सर्वश्रेष्ठ बताया: "कोई भी कंपनी Google और Google Cloud से बेहतर हर एक कंप्यूटिंग परत पर नहीं है," उन्होंने कहा।

स्तंभ 3: एकीकृत पूर्ण स्टैक – बिंदुओं को जोड़ना

Google की रणनीतिक बढ़त तब बढ़ती है जब यह विचार किया जाता है कि ये मॉडल और बुनियादी ढांचे के घटक एक सुसंगत मंच में कैसे बुने गए हैं। प्रतिस्पर्धियों के विपरीत, जो अक्सर अंतराल को पाटने के लिए साझेदारी पर निर्भर करते हैं, Google लगभग हर परत को नियंत्रित करता है, जिससे सख्त एकीकरण और तेज नवाचार चक्र संभव होते हैं।

तो यह एकीकरण क्यों मायने रखता है, अगर Microsoft जैसे प्रतिस्पर्धी OpenAI के साथ साझेदारी करके बुनियादी ढांचे की व्यापकता को LLM मॉडल की दक्षता के साथ मिला सकता है? मेरे द्वारा बात किए गए Googlers ने कहा कि यह बहुत बड़ा अंतर बनाता है, और उन्होंने इसे समर्थन देने के लिए उपाख्यानों के साथ आए।

Google के उद्यम डेटाबेस BigQuery में महत्वपूर्ण सुधार को लें। डेटाबेस अब एक ज्ञान ग्राफ प्रदान करता है जो LLMs को डेटा पर बहुत अधिक कुशलता से खोज करने की अनुमति देता है, और अब इसमें Snowflake और Databricks जैसे प्रतिस्पर्धियों की तुलना में पांच गुना अधिक ग्राहक हैं। Google Cloud के डेटा एनालिटिक्स के लिए उत्पाद प्रमुख Yasmeen Ahmad ने कहा कि ये विशाल सुधार केवल इसलिए संभव थे क्योंकि Google की डेटा टीमें DeepMind टीम के साथ मिलकर काम कर रही थीं। उन्होंने उन उपयोग मामलों पर काम किया जो हल करना कठिन था, और इससे डेटाबेस ने Google के आंतरिक परीक्षण के अनुसार, सामान्य प्रश्नों के आधार पर 50 प्रतिशत अधिक सटीकता प्रदान की, जो निकटतम प्रतिस्पर्धियों की तुलना में सही डेटा तक पहुँचने में थी, Ahmad ने VentureBeat को एक साक्षात्कार में बताया। Ahmad ने कहा कि स्टैक में इस तरह का गहरा एकीकरण ही है जिसके कारण Google ने उद्योग को "छलांग" लगाई है।

यह आंतरिक सामंजस्य Microsoft के "frenemies" गतिशीलता के साथ तेजी से विपरीत है। जबकि Microsoft OpenAI के साथ साझेदारी करके अपने मॉडलों को Azure क्लाउड पर वितरित करता है, Microsoft अपने स्वयं के मॉडल भी बना रहा है। Google के कार्यकारी Mat Velloso, जो अब AI डेवलपर प्रोग्राम का नेतृत्व करते हैं, ने Windows Copilot योजनाओं को OpenAI के मॉडल प्रस्तावों के साथ संरेखित करने की कोशिश में निराश होकर Microsoft छोड़ दिया। "आप अपने उत्पाद योजनाओं को किसी अन्य कंपनी के साथ कैसे साझा करते हैं जो वास्तव में आपके साथ प्रतिस्पर्धा कर रही है... पूरी बात एक विरोधाभास है," उन्होंने याद किया। "यहाँ मैं उन लोगों के साथ कंधे से कंधा मिलाकर बैठता हूँ जो मॉडल बना रहे हैं।"

यह एकीकरण Google के नेताओं को उनके मुख्य लाभ के रूप में देखता है: आधारभूत अनुसंधान और मॉडल निर्माण से लेकर "ग्रह-स्तर" अनुप्रयोग परिनियोजन और बुनियादी ढांचे के डिज़ाइन तक पूरे स्पेक्ट्रम में गहरी विशेषज्ञता को जोड़ने की इसकी अद्वितीय क्षमता।

Vertex AI Google के उद्यम AI प्रयासों के लिए केंद्रीय तंत्रिका तंत्र के रूप में कार्य करता है। और एकीकरण केवल Google के स्वयं के प्रस्तावों से परे जाता है। Vertex का Model Garden 200 से अधिक क्यूरेटेड मॉडल प्रदान करता है, जिसमें Google के, Meta के Llama 4, और कई ओपन-सोर्स विकल्प शामिल हैं। Vertex ट्यूनिंग, मूल्यांकन (AI-संचालित Evals सहित, जिसे Grannis ने एक प्रमुख त्वरक के रूप में उजागर किया), परिनियोजन, और निगरानी के लिए उपकरण प्रदान करता है। इसकी ग्राउंडिंग क्षमताएँ आंतरिक AI-तैयार डेटाबेस के साथ-साथ बाहरी वेक्टर डेटाबेस के साथ संगतता का लाभ उठाती हैं। इसमें Google के नए प्रस्तावों को जोड़ा गया है जो मॉडलों को Google Search, दुनिया के सर्वश्रेष्ठ सर्च इंजन के साथ ग्राउंड करने के लिए हैं।

एकीकरण Google Workspace तक विस्तारित है। Next '25 में घोषित नई सुविधाएँ, जैसे Sheets में "Help Me Analyze" (हाँ, Sheets में अब एक "=AI" सूत्र है), Docs में Audio Overviews और Workspace Flows, Gemini की क्षमताओं को दैनिक कार्यप्रवाह में और अधिक शामिल करते हैं, जिससे Google को अनुभव को बेहतर बनाने के लिए एक शक्तिशाली प्रतिक्रिया लूप बनता है।

अपने एकीकृत स्टैक को चलाने के दौरान, Google वहाँ खुलापन भी समर्थन करता है जहाँ यह पारिस्थितिकी तंत्र की सेवा करता है। Kubernetes को अपनाने को बढ़ावा देने के बाद, यह अब AI ढांचों के लिए JAX को बढ़ावा दे रहा है और अब एजेंट संचार के लिए ओपन प्रोटोकॉल (A2A) के साथ-साथ मौजूदा मानकों (MCP) के लिए समर्थन दे रहा है। Google Agentspace के भीतर से बाहरी मंचों के लिए सैकड़ों कनेक्टर्स भी प्रदान कर रहा है, जो कर्मचारियों के लिए एजेंट्स को खोजने और उपयोग करने के लिए Google का नया एकीकृत इंटरफ़ेस है। यह हब अवधारणा आकर्षक है। Agentspace का मुख्य प्रदर्शन (51:40 से शुरू) इसे दर्शाता है। Google उपयोगकर्ताओं को पहले से निर्मित एजेंट्स प्रदान करता है, या कर्मचारी या डेवलपर्स नो-कोड AI क्षमताओं का उपयोग करके अपने स्वयं के बना सकते हैं। या वे A2A कनेक्टर्स के माध्यम से बाहर से एजेंट्स ला सकते हैं। यह Chrome ब्राउज़र में सहज पहुँच के लिए एकीकृत होता है।

स्तंभ 4: उद्यम मूल्य और एजेंट पारिस्थितिकी तंत्र पर ध्यान

शायद सबसे महत्वपूर्ण बदलाव Google का ठोस उद्यम समस्याओं को हल करने पर तेज ध्यान है, विशेष रूप से AI एजेंट्स के दृष्टिकोण से। Google Cloud के सीईओ Thomas Kurian ने तीन कारण बताए कि ग्राहक Google को क्यों चुनते हैं: AI-अनुकूलित मंच, मौजूदा IT से कनेक्शन की अनुमति देने वाला खुला मल्टी-क्लाउड दृष्टिकोण, और सुरक्षा, संप्रभुता, और अनुपालन पर उद्यम-तैयार ध्यान।

एजेंट्स इस रणनीति की कुंजी हैं। Agentspace के अलावा, इसमें शामिल हैं:

बिल्डिंग ब्लॉक्स: Next में घोषित ओपन-सोर्स Agent Development Kit (ADK) ने पहले ही डेवलपर्स से महत्वपूर्ण रुचि देखी है। ADK मल्टी-एजेंट सिस्टम बनाने को सरल बनाता है, जबकि प्रस्तावित Agent2Agent (A2A) प्रोटोकॉल अंतरसंचालनीयता सुनिश्चित करने का लक्ष्य रखता है, जिससे विभिन्न उपकरणों (Gemini ADK, LangGraph, CrewAI, आदि) के साथ निर्मित एजेंट्स सहयोग कर सकें। Google के Grannis ने कहा कि A2A संभावित रूप से लाखों इंटरैक्टिंग एजेंट्स के साथ भविष्य की पैमाने और सुरक्षा चुनौतियों का अनुमान लगाता है।
विशिष्ट उद्देश्य वाले एजेंट्स: Google ने Agentspace में एकीकृत विशेषज्ञ एजेंट्स को प्रदर्शित किया (जैसे NotebookLM, Idea Generation, Deep Research) और पाँच प्रमुख श्रेणियों को उजागर किया जो कर्षण प्राप्त कर रही हैं: ग्राहक एजेंट्स (Reddit Answers, Verizon के समर्थन सहायक, Wendy’s ड्राइव-थ्रू जैसे उपकरणों को शक्ति प्रदान करते हैं), रचनात्मक एजेंट्स (WPP, Brandtech, Sphere द्वारा उपयोग), डेटा एजेंट्स (Mattel, Spotify, Bayer में अंतर्दृष्टि प्रदान करते हैं), कोडिंग एजेंट्स (Gemini Code Assist), और सुरक्षा एजेंट्स (नए Google Unified Security मंच में एकीकृत)।

यह व्यापक एजेंट रणनीति गूंज रही प्रतीत होती है। पिछले हफ्ते तीन अन्य बड़े उद्यमों के अधिकारियों के साथ बातचीत, जो प्रतिस्पर्धी संवेदनशीलता के कारण गुमनाम रूप से बोल रहे थे, ने Google की एजेंट रणनीति के लिए इस उत्साह को प्रतिबिंबित किया। Google Cloud के COO Francis DeSouza ने एक साक्षात्कार में पुष्टि की: "हर बातचीत में AI शामिल है। विशेष रूप से, हर बातचीत में एजेंट्स शामिल हैं।"

Deloitte के कार्यकारी Kevin Laughridge, जो Google के AI उत्पादों का बड़ा उपयोगकर्ता है और उन्हें अन्य कंपनियों को वितरित करता है, ने एजेंट बाजार को एक "जमीन हथियाने" के रूप में वर्णित किया जहाँ प्रोटोकॉल और इसके एकीकृत मंच के साथ Google की शुरुआती चालें महत्वपूर्ण लाभ प्रदान करती हैं। "जो पहले बाहर निकल रहा है और सबसे अधिक एजेंट्स प्राप्त कर रहा है जो वास्तव में मूल्य प्रदान करते हैं – वही इस दौड़ में जीतेगा," Laughridge ने एक साक्षात्कार में कहा। उन्होंने कहा कि Google की प्रगति "आश्चर्यजनक" थी, यह देखते हुए कि Deloitte ने एक साल पहले बनाए गए कस्टम एजेंट्स को अब Agentspace का उपयोग करके "बॉक्स से बाहर" दोहराया जा सकता है। Deloitte स्वयं मंच पर 100 एजेंट्स बना रहा है, जो वित्त, जोखिम, और इंजीनियरिंग जैसे मध्य-कार्यालय कार्यों को लक्षित कर रहा है, उन्होंने कहा।

ग्राहक प्रमाण बिंदु बढ़ रहे हैं। Next में, Google ने जेनरेटिव AI के साथ "500 से अधिक ग्राहकों को उत्पादन में" उद्धृत किया, जो एक साल पहले केवल "दर्जनों प्रोटोटाइप" से बढ़ा है। यदि Microsoft को एक साल पहले बहुत आगे माना जाता था, तो अब ऐसा स्पष्ट रूप से नहीं लगता। सभी पक्षों से पीआर युद्ध को देखते हुए, यह कहना मुश्किल है कि अभी निश्चित रूप से कौन जीत रहा है। मेट्रिक्स भिन्न हैं। Google का 500 नंबर Microsoft द्वारा प्रचारित 400 केस स्टडीज के साथ सीधे तुलनीय नहीं है (और Microsoft ने प्रेस समय पर VentureBeat को बताया कि यह जल्द ही इस सार्वजनिक गणना को 600 तक अपडेट करने की योजना बना रहा है, जो तीव्र मार्केटिंग को रेखांकित करता है)। और यदि Google का अपने ऐप्स के माध्यम से AI का वितरण महत्वपूर्ण है, तो Microsoft का Copilot के माध्यम से 365 ऑफरिंग के माध्यम से वितरण समान रूप से प्रभावशाली है। दोनों अब APIs के माध्यम से लाखों डेवलपर्स तक पहुँच रहे हैं।

लेकिन Google के कर्षण के उदाहरण प्रचुर हैं:

Wendy’s: केवल एक साल में हजारों स्थानों पर एक AI ड्राइव-थ्रू सिस्टम तैनात किया, जिसने कर्मचारी अनुभव और ऑर्डर सटीकता में सुधार किया। Google Cloud CTO Will Grannis ने नोट किया कि AI सिस्टम स्लैंग को समझने और पृष्ठभूमि शोर को फ़िल्टर करने में सक्षम है, जिससे लाइव ग्राहक इंटरैक्शन का तनाव काफी कम हो जाता है। इससे कर्मचारियों को भोजन तैयार करने और गुणवत्ता पर ध्यान केंद्रित करने की स्वतंत्रता मिलती है — एक बदलाव जिसे Grannis ने "AI द्वारा वास्तविक दुनिया के संचालन को सुव्यवस्थित करने का एक शानदार उदाहरण" कहा।
Salesforce: ने एक बड़ा विस्तार घोषित किया, जिससे इसका मंच पहली बार Google Cloud पर चल सकेगा (AWS से परे), Google की "नवाचार और अनुकूलन" में मदद करने की क्षमता का हवाला देते हुए।
Honeywell & Intuit: पहले Microsoft और AWS से मजबूती से जुड़ी कंपनियाँ, अब Google Cloud के साथ AI पहलों पर साझेदारी कर रही हैं।
प्रमुख बैंक (Deutsche Bank, Wells Fargo): अनुसंधान, विश्लेषण, और ग्राहक सेवा को आधुनिक बनाने के लिए एजेंट्स और Gemini का लाभ उठा रहे हैं।
खुदरा विक्रेता (Walmart, Mercado Libre, Lowe’s): खोज, एजेंट्स, और डेटा मंचों का उपयोग कर रहे हैं।

यह उद्यम कर्षण Google Cloud की समग्र वृद्धि को बढ़ावा देता है, जिसने पिछले तीन तिमाहियों में AWS और Azure को पीछे छोड़ दिया है। Google Cloud ने 2024 में 44 अरब डॉलर की वार्षिक रन रेट हासिल की, जो 2018 में केवल 5 अरब डॉलर थी।

प्रतिस्पर्धी जल में नेविगेशन

Google का उत्थान यह नहीं दर्शाता कि प्रतिस्पर्धी स्थिर हैं। OpenAI की इस हफ्ते की तेज रिलीज, GPT-4.1 (कोडिंग और लंबे संदर्भ पर केंद्रित) और o-सीरीज (मल्टीमॉडल तर्क, उपकरण उपयोग) OpenAI की निरंतर नवाचार को प्रदर्शित करती हैं। इसके अलावा, GPT-4o में OpenAI की नई इमेज जनरेशन सुविधा अपडेट ने पिछले महीने में ही भारी वृद्धि को बढ़ावा दिया, जिससे ChatGPT 800 मिलियन उपयोगकर्ताओं तक पहुँच गया। Microsoft अपनी विशाल उद्यम उपस्थिति और OpenAI साझेदारी का लाभ उठाना जारी रखता है, जबकि Anthropic विशेष रूप से कोडिंग और सुरक्षा-सचेत अनुप्रयोगों में एक मजबूत दावेदार बना हुआ है।

हालांकि, यह निर्विवाद है कि Google की कहानी में उल्लेखनीय सुधार हुआ है। बस एक साल पहले, Google को एक रूढ़िगत, रुकने वाला, गलती करने वाला प्रतिस्पर्धी माना जाता था जो शायद AI में नेतृत्व करने का मौका खोने वाला था। इसके बजाय, इसकी अद्वितीय, एकीकृत स्टैक और कॉर्पोरेट दृढ़ता ने कुछ और प्रकट किया है: Google के पास पूरे स्पेक्ट्रम में विश्व-स्तरीय क्षमताएँ हैं – चिप डिज़ाइन (TPUs) और वैश्विक बुनियादी ढांचे से लेकर आधारभूत मॉडल अनुसंधान (DeepMind), अनुप्रयोग विकास (Workspace, Search, YouTube), और उद्यम क्लाउड सेवाएँ (Vertex AI, BigQuery, Agentspace)। "हम एकमात्र हाइपरस्केलर हैं जो आधारभूत मॉडल की बातचीत में हैं," deSouza ने स्पष्ट रूप से कहा। यह अंत-से-अंत स्वामित्व अनुकूलन (जैसे "प्रति डॉलर बुद्धिमत्ता") और एकीकरण की गहराई की अनुमति देता है जो साझेदारी-निर्भर मॉडल मिलान करने में कठिनाई पाते हैं। प्रतिस्पर्धी अक्सर असमान टुकड़ों को एक साथ जोड़ने की आवश्यकता होती है, जो संभावित रूप से घर्षण पैदा करता है या नवाचार की गति को सीमित करता है।

Google का क्षण अब है

जबकि AI दौड़ गतिशील बनी हुई है, Google ने इन सभी टुकड़ों को उस सटीक क्षण में इकट्ठा किया है जब बाजार उनकी मांग करता है। जैसा कि Deloitte के Laughridge ने कहा, Google उस बिंदु पर पहुँच गया जहाँ इसकी क्षमताएँ "बाजार की मांग के साथ पूरी तरह से संरेखित" हो गईं। यदि आप Google के उद्यम AI में खुद को साबित करने की प्रतीक्षा कर रहे थे, तो आप शायद वह क्षण चूक गए हैं — यह पहले ही ऐसा कर चुका है। वह कंपनी जिसने इस क्रांति को शक्ति प्रदान करने वाली कई मूलभूत तकनीकों का आविष्कार किया, अंततः पकड़ में आ गई है – और इससे भी अधिक, यह अब वह गति निर्धारित कर रही है जिसे प्रतिस्पर्धियों को मिलान करने की आवश्यकता है।

नीचे दिए गए वीडियो में, Next के ठीक बाद रिकॉर्ड किया गया, AI विशेषज्ञ Sam Witteveen और मैं वर्तमान परिदृश्य और उभरते रुझानों को तोड़ते हैं, और क्यों Google का AI पारिस्थितिकी तंत्र इतना मजबूत लगता है: