Google चुपके से एंटरप्राइज एआई में पार करता है: 'कैच अप' से 'कैच यूएस' तक
ठीक एक साल पहले, Google और एंटरप्राइज एआई के आसपास की चर्चा तटस्थ में फंस गई थी। ट्रांसफॉर्मर जैसी अग्रणी प्रौद्योगिकियों के बावजूद, टेक दिग्गज पीछे पिछड़ते हुए दिखाई दिए, ओपनईआई की वायरल सफलता, एंथ्रोपिक की कोडिंग कौशल और एंटरप्राइज मार्केट में माइक्रोसॉफ्ट के आक्रामक धक्का से ग्रहण किया गया।
लेकिन लास वेगास में अगले 2025 में Google क्लाउड में पिछले सप्ताह तेजी से आगे बढ़ा, और दृश्य स्पष्ट रूप से अलग था। एक आश्वस्त Google, शीर्ष प्रदर्शन करने वाले मॉडल, मजबूत बुनियादी ढांचे और एक स्पष्ट उद्यम रणनीति से लैस, एक नाटकीय बदलाव की घोषणा की। Google के वरिष्ठ अधिकारियों के साथ एक बंद दरवाजे के विश्लेषक की बैठक में, एक विश्लेषक ने मूड को घेर लिया: "यह वह क्षण ऐसा लगता है जब Google 'कैच अप' से 'कैच यू'।"
Google की लीप फॉरवर्ड
यह भावना - कि Google ने न केवल पकड़ लिया है, बल्कि उद्यम AI दौड़ में Openai और Microsoft से आगे बढ़ा है - पूरे कार्यक्रम में स्पष्ट रूप से। और यह सिर्फ प्रचारित प्रचार नहीं है। पिछले एक साल में, Google ने निष्पादन पर ध्यान केंद्रित किया है, अपने तकनीकी कौशल को एक उच्च-प्रदर्शन, एकीकृत मंच में बदल दिया है जो उद्यम निर्णय निर्माताओं पर जल्दी से जीत रहा है। दुनिया के सबसे शक्तिशाली एआई मॉडल से लेकर अत्यधिक कुशल कस्टम सिलिकॉन पर चल रहे एआई एजेंटों के एक दफन पारिस्थितिकी तंत्र के लिए वास्तविक दुनिया की व्यावसायिक चुनौतियों के लिए, Google एक मजबूत मामला बना रहा है, यह वास्तव में खो गया था, बल्कि गहरे, मूलभूत विकास की अवधि से गुजर रहा था।
अपने एकीकृत स्टैक के साथ अब पूरी क्षमता से काम कर रहा है, Google उद्यम एआई क्रांति के अगले चरण का नेतृत्व करने के लिए तैयार है। अगले में Google के अधिकारियों के साथ मेरे साक्षात्कार में, उन्होंने बुनियादी ढांचे और मॉडल एकीकरण में Google के अद्वितीय लाभों पर जोर दिया - जो कि Openai, Microsoft, या AWS जैसे प्रतियोगियों को दोहराने के लिए चुनौतीपूर्ण लगेगा।
संदेह की छाया: हाल के अतीत को स्वीकार करना
Google की वर्तमान गति की पूरी तरह से सराहना करने के लिए, हाल के अतीत को स्वीकार करना आवश्यक है। Google ने ट्रांसफार्मर आर्किटेक्चर का आविष्कार किया, बड़े भाषा मॉडल (LLMS) में आधुनिक क्रांति को स्पार्क करते हुए, और एक दशक पहले विशेष AI हार्डवेयर (TPU) में निवेश करना शुरू किया, जो अब उद्योग-अग्रणी दक्षता को चलाता है। फिर भी, बेवजह, सिर्फ ढाई साल पहले, Google ने खुद को रक्षा करते हुए पाया।
Openai के चैट ने जनता की कल्पना और उद्यम की रुचि को एक लुभावनी गति से पकड़ लिया, जो इतिहास में सबसे तेजी से बढ़ता हुआ ऐप बन गया। एंथ्रोपिक जैसे प्रतियोगियों ने कोडिंग जैसे क्षेत्रों में निक्स को बाहर निकाला। इस बीच, Google की सार्वजनिक चालें अक्सर अस्थायी या त्रुटिपूर्ण लगती थीं। कुख्यात बार्ड डेमो 2023 में फंबल करता है और ऐतिहासिक रूप से गलत चित्रण का उत्पादन करने वाले इसकी छवि जनरेटर पर विवाद ने एक कंपनी की एक कथा को संभावित रूप से आंतरिक नौकरशाही या संरेखण पर ओवरकॉर्नर द्वारा बाधित किया। Google को खो दिया गया था, क्लाउड प्रतियोगिता में अपनी प्रारंभिक सुस्ती को गूंजते हुए, जहां यह अमेज़ॅन और Microsoft के पीछे बाजार हिस्सेदारी में एक तीसरा स्थान बना रहा।
धुरी: नेतृत्व करने के लिए एक सचेत निर्णय
पर्दे के पीछे, हालांकि, एक महत्वपूर्ण बदलाव हो रहा था, जो नेतृत्व को पुनः प्राप्त करने के लिए उच्चतम स्तर पर एक जानबूझकर निर्णय द्वारा संचालित था। Mat Velloso, Google DeepMind के AI डेवलपर प्लेटफॉर्म के लिए उत्पाद के VP, ने Microsoft छोड़ने के बाद फरवरी 2024 में Google में शामिल होने पर इस महत्वपूर्ण क्षण को महसूस किया। "जब मैं Google के पास आया, तो मैंने सुंदर [पिचाई] के साथ बात की, मैंने यहां कई नेताओं के साथ बात की, और मुझे ऐसा लगा कि वह वह क्षण था जहां वे निर्णय ले रहे थे, ठीक है, यह [जनरेटिव एआई] एक ऐसी चीज है जिसके बारे में उद्योग स्पष्ट रूप से परवाह करता है। चलो इसे बनाते हैं," वेल्लोसो ने अगले सप्ताह में एक साक्षात्कार के दौरान साझा किया।
इस नए सिरे से धक्का "ब्रेन ड्रेन" के डर से बाधित नहीं था, जो कुछ बाहरी लोगों का मानना था कि Google को समाप्त कर रहे थे। इसके बजाय, कंपनी 2024 की शुरुआत में निष्पादन पर दोगुनी हो गई, आक्रामक भर्ती, आंतरिक एकीकरण और ग्राहक कर्षण द्वारा चिह्नित। जबकि प्रतियोगियों ने स्प्लैश हायर बनाया, Google ने अपने मुख्य एआई नेतृत्व को बनाए रखा, जिसमें दीपमाइंड के सीईओ डेमिस हसाबिस और Google क्लाउड के सीईओ थॉमस कुरियन शामिल हैं, जो स्थिरता और गहरी विशेषज्ञता प्रदान करते हैं।
इसके अलावा, प्रतिभा Google के केंद्रित मिशन की ओर बहने लगी। उदाहरण के लिए, लोगन किलपैट्रिक, Openai से Google पर लौटे, कंपनी के भीतर मूलभूत AI के निर्माण के अवसर से तैयार किया गया। वह वेलोसो में शामिल हो गए, जिसे उन्होंने "शून्य से एक अनुभव" के रूप में वर्णित किया, जमीन से मिथुन के लिए डेवलपर ट्रैक्शन का निर्माण किया। किलपैट्रिक ने शुरुआती बिंदु को याद करते हुए कहा, "यह टीम की तरह था, टीम मैं वास्तव में इस प्लेटफॉर्म पर कोई उपयोगकर्ता नहीं है, हमारे पास कोई राजस्व नहीं है। इस समय कोई भी मिथुन में दिलचस्पी नहीं ले रहा है।" जोश वुडवर्ड जैसे नेताओं, जिन्होंने एआई स्टूडियो शुरू करने में मदद की और अब मिथुन ऐप और लैब्स का नेतृत्व करते हैं, और मूल "ध्यान इज ऑल यू नीड" ट्रांसफार्मर पेपर के एक प्रमुख सह-लेखक, नोआम शेज़ियर ने भी 2024 के अंत में क्रूसियल जेमिनी प्रोजेक्ट के लिए एक तकनीकी सह-लीड के रूप में कंपनी में वापसी की।
स्तंभ 1: मिथुन 2.5 और सोच मॉडल का युग
जबकि एंटरप्राइज मंत्र "यह केवल मॉडल के बारे में नहीं है," में स्थानांतरित हो गया है, सबसे अच्छा प्रदर्शन करने वाला एलएलएम एक महत्वपूर्ण उपलब्धि बना हुआ है और कंपनी के बेहतर अनुसंधान और कुशल प्रौद्योगिकी वास्तुकला का एक शक्तिशाली सत्यापनकर्ता है। अगले '25 के कुछ हफ्ते पहले मिथुन 2.5 प्रो की रिहाई के साथ, Google ने निर्णायक रूप से इस मंत्र का दावा किया। यह जल्दी से स्वतंत्र चैटबॉट एरिना लीडरबोर्ड में सबसे ऊपर है, यहां तक कि Openai के नवीनतम GPT-4O वेरिएंट को भी बेहतर ढंग से बेहतर बना रहा है, और मानवता की अंतिम परीक्षा जैसे बेंचमार्क को कुख्यात रूप से कठिन तर्क देता है। जैसा कि पिचाई ने कीनोट में कहा, "यह हमारा सबसे बुद्धिमान एआई मॉडल है। और यह दुनिया का सबसे अच्छा मॉडल है।" मॉडल ने एक महीने के भीतर मिथुन के उपयोग में 80 प्रतिशत की वृद्धि को बढ़ाया था, उन्होंने अलग से ट्वीट किया।
पहली बार मिथुन की मांग में आग लगी थी। मिथुन 2.5 प्रो की कच्ची बुद्धि से अलग, मुझे प्रभावित किया, इसका प्रदर्शन योग्य तर्क था। Google ने एक "सोच" क्षमता को इंजीनियर किया है, जिससे मॉडल को एक प्रतिक्रिया को अंतिम रूप देने से पहले बहु-चरणीय तर्क, योजना और यहां तक कि आत्म-प्रतिबिंब करने की अनुमति मिलती है। संरचित, सुसंगत चेन-ऑफ-थिंक (सीओटी)-गिने हुए चरणों और उप-बुललेट्स का उपयोग करके-डीपसेक या ओपनईआई से अन्य मॉडलों से आउटपुट के जुआ या अपारदर्शी प्रकृति से बचा जाता है। महत्वपूर्ण कार्यों के लिए आउटपुट का मूल्यांकन करने वाली तकनीकी टीमों के लिए, यह पारदर्शिता अभूतपूर्व आत्मविश्वास के साथ सत्यापन, सुधार और पुनर्निर्देशन की अनुमति देती है।
लेकिन एंटरप्राइज़ उपयोगकर्ताओं के लिए अधिक महत्वपूर्ण बात यह है कि मिथुन 2.5 प्रो ने भी नाटकीय रूप से कोडिंग में अंतर को बंद कर दिया, जो कि जेनेरिक एआई के लिए सबसे बड़े अनुप्रयोग क्षेत्रों में से एक है। वेंचरबीट के साथ एक साक्षात्कार में, प्रमुख रिटेलर वेफेयर के सीटीओ फियोना टैन ने कहा कि शुरुआती परीक्षणों के बाद, कंपनी ने इसे "काफी थोड़ा कदम बढ़ाया" और अब एंथ्रोपिक के क्लाउड 3.7 सोननेट के लिए "बहुत तुलनीय" था, जो पहले कई डेवलपर्स के लिए पसंदीदा पसंद था।
Google ने मॉडल में एक बड़े पैमाने पर 1 मिलियन टोकन संदर्भ विंडो भी जोड़ी, जो पूरे कोडबेस या लंबे प्रलेखन में तर्क को सक्षम करती है, जो ओपनईए या एंथ्रोपिक के मॉडल की क्षमताओं से अधिक है। (Openai ने इस सप्ताह समान रूप से बड़े संदर्भ खिड़कियों की विशेषता वाले मॉडल के साथ जवाब दिया, हालांकि बेंचमार्क का सुझाव है कि मिथुन 2.5 प्रो समग्र तर्क में बढ़त बनाए रखता है)। यह लाभ जटिल, बहु-फाइल सॉफ्टवेयर इंजीनियरिंग कार्यों के लिए अनुमति देता है।
पूरक प्रो मिथुन 2.5 फ्लैश है, अगले '25 पर घोषित किया गया और कल ही जारी किया गया। इसके अलावा एक "सोच" मॉडल, फ्लैश कम विलंबता और लागत-दक्षता के लिए अनुकूलित है। आप अपने बजट के साथ मॉडल के कारण और संतुलन प्रदर्शन को नियंत्रित कर सकते हैं। यह tiered दृष्टिकोण Google के अधिकारियों द्वारा चैंपियन द्वारा "इंटेलिजेंस प्रति डॉलर" रणनीति को दर्शाता है।
वेलोसो ने एक चार्ट दिखाया कि खुफिया स्पेक्ट्रम के पार, Google मॉडल सबसे अच्छा मूल्य प्रदान करते हैं। "अगर हमारे पास एक साल पहले यह बातचीत होती ... तो मेरे पास दिखाने के लिए कुछ भी नहीं होता," वेल्लोसो ने स्वीकार किया, तेजी से बदलाव को उजागर करते हुए। "और अब, जैसे, बोर्ड के पार, हम हैं, यदि आप जो भी मॉडल की तलाश कर रहे हैं, जो भी आकार, जैसे, जैसे, यदि आप Google नहीं हैं, तो आप पैसे खो रहे हैं।" इसी तरह के चार्ट को इस सप्ताह Openai के नवीनतम मॉडल रिलीज़ के लिए अद्यतन किया गया है, सभी एक ही चीज़ दिखाते हैं: Google के मॉडल प्रति डॉलर सबसे अच्छी बुद्धि प्रदान करते हैं। नीचे देखें:

वेफेयर के टैन ने 2.5 प्रो के साथ होनहार विलंबता सुधारों का भी अवलोकन किया: "मिथुन 2.5 तेजी से वापस आ गया," इसे "अधिक ग्राहक-सामना करने वाली क्षमताओं के लिए व्यवहार्य बना रहा है," उसने कहा, कुछ उसने कहा कि अन्य मॉडलों के साथ पहले ऐसा नहीं हुआ है। उन्होंने कहा कि मिथुन इन ग्राहक इंटरैक्शन के लिए पहला मॉडल वेफेयर का उपयोग कर सकता है।
मिथुन परिवार की क्षमताएं मल्टीमॉडलिटी तक विस्तारित होती हैं, जो कि Google के अन्य प्रमुख मॉडलों जैसे कि इमेजेन 3 (इमेज जनरेशन), वीओ 2 (वीडियो पीढ़ी), चिरप 3 (ऑडियो), और नए घोषित लिरिया (टेक्स्ट-टू-म्यूजिक) के साथ मूल रूप से एकीकृत होती है, जो कि एंटरप्राइज उपयोगकर्ताओं के लिए Google के प्लेटफ़ॉर्म के माध्यम से सभी सुलभ है। Google एकमात्र कंपनी है जो अपने प्लेटफ़ॉर्म पर सभी तौर -तरीकों में अपने स्वयं के सामान्य मीडिया मॉडल प्रदान करती है। Microsoft, AWS, और Openai को ऐसा करने के लिए अन्य कंपनियों के साथ साझेदारी करनी होगी।
पिलर 2: इन्फ्रास्ट्रक्चर प्रोवेस - हूड के नीचे इंजन
इन शक्तिशाली मॉडलों को तेजी से पुनरावृत्ति और कुशलता से सेवा करने की क्षमता Google के यकीनन अद्वितीय बुनियादी ढांचे से उपजी है, जो कि ग्रह-पैमाने पर सेवाओं के दशकों से सम्मानित है। इसके लिए केंद्रीय टेंसर प्रसंस्करण इकाई (TPU) है।
अगले '25 में, Google ने आयरनवुड का अनावरण किया, इसकी सातवीं पीढ़ी के टीपीयू, स्पष्ट रूप से अनुमान और "थिंकिंग मॉडल" की मांगों के लिए डिज़ाइन किए गए हैं। पैमाना अपार है, एआई वर्कलोड की मांग के लिए सिलवाया गया है: आयरनवुड पॉड्स 9,000 से अधिक लिक्विड-कूल्ड चिप्स पैक करते हैं, जो कम्प्यूट पावर के 42.5 एक्सफ्लॉप्स का दावा करते हैं। Google के एमएल सिस्टम के वीपी अमीन वाहदत ने अगले मंच पर कहा कि यह दुनिया के वर्तमान #1 सुपर कंप्यूटर की गणना शक्ति "24 से अधिक बार" है।
Google ने कहा कि आयरनवुड TPU की पिछली पीढ़ी ट्रिलियम के सापेक्ष 2x perf/Watt प्रदान करता है। यह महत्वपूर्ण है क्योंकि उद्यम ग्राहकों ने कहा कि ऊर्जा लागत और उपलब्धता बड़े पैमाने पर एआई तैनाती को बाधित करती है।
Google क्लाउड CTO विल ग्रैनिस ने इस प्रगति की निरंतरता पर जोर दिया। साल दर साल, Google अपने प्रोसेसर में 10x, 8x, 9x, 10x सुधार कर रहा है, उन्होंने एक साक्षात्कार में वेंचरबीट को बताया, जिससे उन्होंने एआई त्वरक के लिए "हाइपर मूर का कानून" कहा। उन्होंने कहा कि ग्राहक Google का रोडमैप खरीद रहे हैं, न कि केवल इसकी तकनीक।
Google की स्थिति ने इस निरंतर TPU निवेश को बढ़ावा दिया। इसे 2 बिलियन से अधिक उपयोगकर्ताओं के लिए खोज, YouTube, और Gmail जैसी बड़े पैमाने पर सेवाओं को कुशलतापूर्वक बिजली देने की आवश्यकता है। यह वर्तमान जनरेटिव एआई बूम से बहुत पहले विकासशील कस्टम, अनुकूलित हार्डवेयर की आवश्यकता है। जबकि मेटा एक समान उपभोक्ता पैमाने पर संचालित होता है, अन्य प्रतियोगियों के पास इस विशिष्ट आंतरिक ड्राइवर की कमी थी, जो कि दशक-लंबे, लंबवत रूप से एकीकृत एआई हार्डवेयर विकास के लिए है।
अब ये टीपीयू निवेश भुगतान कर रहे हैं क्योंकि वे न केवल अपने स्वयं के ऐप के लिए दक्षता चला रहे हैं, बल्कि Google को प्रति डॉलर बेहतर बुद्धिमत्ता पर अन्य उपयोगकर्ताओं को मिथुन की पेशकश करने की अनुमति भी दे रहे हैं, सभी चीजें समान हैं।
Google के प्रतियोगी NVIDIA से कुशल प्रोसेसर क्यों नहीं खरीद सकते हैं, आप पूछते हैं? यह सच है कि NVIDIA के GPU प्रोसेसर LLMS की प्रक्रिया पूर्व-प्रशिक्षण पर हावी हैं। लेकिन बाजार की मांग ने इन GPU की कीमत को बढ़ा दिया है, और NVIDIA लाभ के रूप में अपने लिए एक स्वस्थ कटौती करता है। यह अपने चिप्स के उपयोगकर्ताओं के साथ महत्वपूर्ण लागत पारित करता है। और यह भी, जबकि प्री-ट्रेनिंग अब तक एआई चिप्स के उपयोग पर हावी है, यह अब बदल रहा है कि उद्यम वास्तव में इन अनुप्रयोगों को तैनात कर रहे हैं। यह वह जगह है जहां "अनुमान" आता है, और यहां टीपीयू को पैमाने पर वर्कलोड के लिए जीपीयू की तुलना में अधिक कुशल माना जाता है।
जब आप Google अधिकारियों से पूछते हैं कि AI में उनकी मुख्य तकनीक का लाभ कहां से आता है, तो वे आमतौर पर सबसे महत्वपूर्ण के रूप में TPU में वापस आते हैं। मार्क लोहमेयर, वीपी जो Google के कंप्यूटिंग इन्फ्रास्ट्रक्चर को चलाता है, असमान था: टीपीयू "निश्चित रूप से हम जो करते हैं उसका एक उच्च विभेदित हिस्सा हैं ... ओपनई, उनके पास उन क्षमताओं को नहीं है।"
गौरतलब है कि Google टीपीयू को अलगाव में नहीं, बल्कि व्यापक, अधिक जटिल उद्यम एआई वास्तुकला के हिस्से के रूप में प्रस्तुत करता है। तकनीकी अंदरूनी सूत्रों के लिए, यह समझा जाता है कि शीर्ष स्तरीय प्रदर्शन तेजी से विशेष प्रौद्योगिकी सफलताओं को एकीकृत करने पर टिका है। कई अपडेट अगले पर विस्तृत थे। वाहदत ने इसे एक "सुपरकंप्यूटिंग सिस्टम" के रूप में वर्णित किया, एकीकृत हार्डवेयर (टीपीयूएस, ब्लैकवेल जैसे नवीनतम एनवीडिया जीपीयू और आगामी वेरा रुबिन, हाइपरडिस्क एक्सपोल जैसे उन्नत भंडारण, कहीं भी कैश और रैपिड स्टोरेज) एक एकीकृत सॉफ्टवेयर स्टैक के साथ। इस सॉफ़्टवेयर में एक्सेलेरेटर, पाथवे (जेमिनी के वितरित रनटाइम, अब ग्राहकों के लिए उपलब्ध) के प्रबंधन के लिए क्लस्टर निदेशक शामिल हैं, और वीएलएलएम जैसे ऑप्टिमाइज़ेशन को टीपीयू में लाते हैं, जिससे एनवीआईडीआईए/पाइटोरच स्टैक पर पहले से आसान वर्कलोड माइग्रेशन की अनुमति मिलती है। यह एकीकृत प्रणाली, वाहदत ने तर्क दिया, यही कारण है कि जीपीटी -4 ओ की तुलना में मिथुन 2.0 फ्लैश प्रति डॉलर 24 गुना अधिक खुफिया जानकारी प्राप्त करता है।
Google अपने भौतिक बुनियादी ढांचे की पहुंच भी बढ़ा रहा है। क्लाउड WAN Google के कम-विलंबता 2 मिलियन-मील निजी फाइबर नेटवर्क को उद्यमों के लिए उपलब्ध कराता है, जो ग्राहक-प्रबंधित नेटवर्क की तुलना में 40% तेज प्रदर्शन और 40% कम कुल लागत (TCO) का वादा करता है।
इसके अलावा, Google डिस्ट्रीब्यूटेड क्लाउड (GDC) ने मिथुन और एनवीडिया हार्डवेयर (एक डेल साझेदारी के माध्यम से) को संप्रभु, ऑन-प्रिमाइसेस, या यहां तक कि एयर-गेप किए गए वातावरण में चलने की अनुमति दी-एक क्षमता nvidia के सीईओ जेन्सन हुआंग ने राज्य-कीट-एआरटी एआई के लिए "पूरी तरह से विशाल" की सराहना की, जो कि राज्य-एआरटी एआई को नियंत्रित करने के लिए एआई-आर्ट एआई लाने के लिए है। इसके बाद, हुआंग ने Google के इन्फ्रास्ट्रक्चर को दुनिया में सबसे अच्छा कहा: "कोई भी कंपनी Google और Google क्लाउड की तुलना में कंप्यूटिंग की हर एक परत में बेहतर नहीं है," उन्होंने कहा।
पिलर 3: एकीकृत पूर्ण स्टैक - डॉट्स को कनेक्ट करना
Google का रणनीतिक लाभ यह देखते हुए बढ़ता है कि इन मॉडलों और बुनियादी ढांचे के घटकों को एक सामंजस्यपूर्ण मंच में कैसे बुना जाता है। प्रतियोगियों के विपरीत, जो अक्सर अंतराल को पाटने के लिए साझेदारी पर भरोसा करते हैं, Google लगभग हर परत को नियंत्रित करता है, जिससे सख्त एकीकरण और तेजी से नवाचार चक्र को सक्षम किया जाता है।
तो यह एकीकरण क्यों मायने रखता है, अगर Microsoft जैसा एक प्रतियोगी केवल LLM मॉडल के साथ बुनियादी ढांचे की चौड़ाई से मेल खाने के लिए OpenAI के साथ साझेदारी कर सकता है? जिन Googlers के साथ मैंने बात की, उन्होंने कहा कि इससे बहुत फर्क पड़ता है, और वे इसे वापस करने के लिए उपाख्यानों के साथ आए।
Google के एंटरप्राइज डेटाबेस BigQuery का महत्वपूर्ण सुधार लें। डेटाबेस अब एक ज्ञान ग्राफ प्रदान करता है जो LLM को अधिक कुशलता से डेटा पर खोज करने की अनुमति देता है, और अब यह स्नोफ्लेक और डेटाब्रिक्स जैसे प्रतियोगियों के ग्राहकों के पांच गुना से अधिक का दावा करता है। Google क्लाउड में डेटा एनालिटिक्स के लिए उत्पाद के प्रमुख यास्मीन अहमद ने कहा कि विशाल सुधार केवल इसलिए संभव थे क्योंकि Google की डेटा टीमें दीपमाइंड टीम के साथ मिलकर काम कर रही थीं। उन्होंने उपयोग के मामलों के माध्यम से काम किया जो हल करने के लिए कठिन थे, और इसके कारण डेटाबेस को सामान्य प्रश्नों के आधार पर 50 प्रतिशत अधिक सटीकता प्रदान की गई, कम से कम Google के आंतरिक परीक्षण के अनुसार, निकटतम प्रतियोगियों की तुलना में सही डेटा प्राप्त करने में, अहमद ने एक साक्षात्कार में वेंचरबीट को बताया। अहमद ने कहा कि इस तरह का गहन एकीकरण स्टैक में है कि कैसे Google ने उद्योग को "छलांग" दिया है।
यह आंतरिक सामंजस्य Microsoft में "फ्रेनेमीज़" गतिशील के साथ तेजी से विपरीत है। जबकि Azure क्लाउड पर अपने मॉडल वितरित करने के लिए OpenAI के साथ Microsoft साझेदार, Microsoft भी अपने स्वयं के मॉडल का निर्माण कर रहा है। Mat Velloso, Google कार्यकारी, जो अब AI डेवलपर कार्यक्रम का नेतृत्व करता है, ने Microsoft को छोड़ दिया, जो Windows Copilot योजनाओं को Openai के मॉडल प्रसाद के साथ संरेखित करने की कोशिश कर रहा था। "आप अपनी उत्पाद योजनाओं को एक अन्य कंपनी के साथ कैसे साझा करते हैं जो वास्तव में आपके साथ प्रतिस्पर्धा कर रही है ... पूरी बात एक विरोधाभास है," उन्होंने याद किया। "यहां मैं उन लोगों के साथ कंधे से कंधा मिलाकर बैठता हूं जो मॉडल का निर्माण कर रहे हैं।"
यह एकीकरण इस बात से बात करता है कि Google नेताओं ने अपने मूल लाभ के रूप में क्या देखा है: पूर्ण स्पेक्ट्रम में गहरी विशेषज्ञता को जोड़ने की इसकी अद्वितीय क्षमता, मूलभूत अनुसंधान और मॉडल बिल्डिंग से लेकर "ग्रह-स्केल" एप्लिकेशन परिनियोजन और बुनियादी ढांचा डिजाइन तक।
वर्टेक्स एआई Google के एंटरप्राइज़ एआई प्रयासों के लिए केंद्रीय तंत्रिका तंत्र के रूप में कार्य करता है। और एकीकरण केवल Google के अपने प्रसाद से परे है। वर्टेक्स के मॉडल गार्डन में 200 से अधिक क्यूरेट किए गए मॉडल शामिल हैं, जिनमें Google, मेटा के लामा 4 और कई ओपन-सोर्स विकल्प शामिल हैं। वर्टेक्स ट्यूनिंग, मूल्यांकन के लिए उपकरण प्रदान करता है (एआई-संचालित ईवीएल सहित, जिसे ग्रैनिस ने एक प्रमुख त्वरक के रूप में हाइलाइट किया था), तैनाती और निगरानी। इसकी ग्राउंडिंग क्षमताएं बाहरी वेक्टर डेटाबेस के साथ संगतता के साथ आंतरिक ए-तैयार डेटाबेस का लाभ उठाती हैं। Google खोज, दुनिया के सर्वश्रेष्ठ खोज इंजन के साथ ग्राउंड मॉडल में Google के नए प्रसाद में जोड़ें।
एकीकरण Google कार्यक्षेत्र तक फैला हुआ है। अगले '25 में घोषित नई सुविधाएँ, जैसे कि शीट्स में "हेल्प मी एनालिसिज़" (हां, शीट्स में अब एक "= एआई" फॉर्मूला है), डॉक्स और वर्कस्पेस प्रवाह में ऑडियो ओवरव्यू, डेली वर्कफ़्लो में मिथुन की क्षमताओं को आगे बढ़ाते हैं, अनुभव में सुधार करने के लिए Google के लिए एक शक्तिशाली फीडबैक लूप बनाते हैं।
अपने एकीकृत स्टैक को चलाने के दौरान, Google ने खुलेपन को भी चैंपियन बनाया, जहां यह पारिस्थितिकी तंत्र की सेवा करता है। कुबेरनेट्स को गोद लेने के बाद, यह अब एआई फ्रेमवर्क के लिए JAX को बढ़ावा दे रहा है और अब मौजूदा मानकों (MCP) के लिए समर्थन के साथ एजेंट संचार (A2A) के लिए खुले प्रोटोकॉल। Google एजेंट्सस्पेस के भीतर से बाहरी प्लेटफार्मों के लिए सैकड़ों कनेक्टर्स की पेशकश कर रहा है, जो कर्मचारियों के लिए Google का नया एकीकृत इंटरफ़ेस है जो एजेंटों को खोजने और उपयोग करने के लिए है। यह हब अवधारणा सम्मोहक है। एजेंटस्पेस का मुख्य प्रदर्शन (51:40 से शुरू) यह दिखाता है। Google उपयोगकर्ताओं को पूर्व-निर्मित एजेंटों की पेशकश करता है, या कर्मचारी या डेवलपर्स नो-कोड AI क्षमताओं का उपयोग करके अपना निर्माण कर सकते हैं। या वे A2A कनेक्टर्स के माध्यम से बाहर से एजेंटों में खींच सकते हैं। यह सीमलेस एक्सेस के लिए क्रोम ब्राउज़र में एकीकृत करता है।
पिलर 4: एंटरप्राइज वैल्यू और एजेंट इकोसिस्टम पर ध्यान केंद्रित करें
शायद सबसे महत्वपूर्ण बदलाव Google का ठोस उद्यम समस्याओं को हल करने पर ध्यान केंद्रित करने पर विशेष रूप से AI एजेंटों के लेंस के माध्यम से। Google क्लाउड के सीईओ थॉमस कुरियन ने तीन कारणों को रेखांकित किया, जो ग्राहक Google का चयन करते हैं: Ai-Optimized प्लेटफ़ॉर्म, ओपन मल्टी-क्लाउड दृष्टिकोण जो मौजूदा आईटी से कनेक्शन की अनुमति देता है, और सुरक्षा, संप्रभुता और अनुपालन पर उद्यम-तैयार ध्यान केंद्रित करता है।
एजेंट इस रणनीति के लिए महत्वपूर्ण हैं। एजेंटस्पेस के अलावा, इसमें भी शामिल है:
- बिल्डिंग ब्लॉक: ओपन-सोर्स एजेंट डेवलपमेंट किट (ADK), जिसे अगले में घोषित किया गया है, ने पहले से ही डेवलपर्स से महत्वपूर्ण रुचि देखी है। ADK मल्टी-एजेंट सिस्टम बनाने को सरल बनाता है, जबकि प्रस्तावित Agent2Agent (A2A) प्रोटोकॉल का उद्देश्य इंटरऑपरेबिलिटी सुनिश्चित करना है, जिससे विभिन्न उपकरणों (GEMINI ADK, Langgraph, Crewai, आदि) के साथ निर्मित एजेंटों को सहयोग करने की अनुमति मिलती है। Google के ग्रैनिस ने कहा कि A2A भविष्य के हजारों बातचीत करने वाले एजेंटों के साथ भविष्य के पैमाने और सुरक्षा चुनौतियों का अनुमान लगाता है।
- उद्देश्य-निर्मित एजेंट: Google शोकेस किए गए विशेषज्ञ एजेंटों को एजेंटस्पेस में एकीकृत किया गया (जैसे नोटबुक, आइडिया जनरेशन, डीप रिसर्च) और पांच प्रमुख श्रेणियों को हाइलाइट किया गया। एजेंट (मिथुन कोड सहायता), और सुरक्षा एजेंट (नए Google एकीकृत सुरक्षा मंच में एकीकृत)।
यह व्यापक एजेंट रणनीति गूंजती हुई प्रतीत होती है। पिछले सप्ताह तीन अन्य बड़े उद्यमों में अधिकारियों के साथ बातचीत, प्रतिस्पर्धी संवेदनशीलता के कारण गुमनाम रूप से बोलते हुए, Google की एजेंट रणनीति के लिए इस उत्साह को प्रतिध्वनित किया। Google क्लाउड COO फ्रांसिस Desouza ने एक साक्षात्कार में पुष्टि की: "हर बातचीत में AI शामिल है। विशेष रूप से, हर बातचीत में एजेंट शामिल हैं।"
केविन हंसीरिज, डेलॉइट में एक कार्यकारी, Google के एआई उत्पादों का एक बड़ा उपयोगकर्ता, और अन्य कंपनियों के लिए उनमें से एक वितरक, ने एजेंट बाजार को "भूमि हड़पने" के रूप में वर्णित किया, जहां Google के शुरुआती कदमों के साथ प्रोटोकॉल और इसके एकीकृत मंच के साथ महत्वपूर्ण लाभ प्रदान करते हैं। "जो भी पहले बाहर निकल रहा है और सबसे अधिक एजेंट प्राप्त कर रहा है जो वास्तव में मूल्य प्रदान करता है - जो इस दौड़ में जीतने जा रहा है," हंसी ने एक साक्षात्कार में कहा। उन्होंने कहा कि Google की प्रगति "आश्चर्यजनक" थी, यह देखते हुए कि कस्टम एजेंटों ने एक साल पहले ही निर्मित डेलॉइट को "आउट ऑफ द बॉक्स" को दोहराया जा सकता था, जो एजेंटस्पेस का उपयोग कर रहा था। डेलॉइट स्वयं मंच पर 100 एजेंटों का निर्माण कर रहा है, वित्त, जोखिम और इंजीनियरिंग जैसे मिड-ऑफिस कार्यों को लक्षित कर रहा है, उन्होंने कहा।
ग्राहक प्रूफ पॉइंट बढ़ रहे हैं। अगले समय, Google ने एक साल पहले "दर्जनों दर्जनों प्रोटोटाइप" से उदार एआई के साथ "500 प्लस ग्राहकों को उत्पादन में" का हवाला दिया। यदि Microsoft को एक साल पहले आगे के रूप में माना जाता था, तो यह स्पष्ट रूप से अब ऐसा नहीं लगता है। सभी पक्षों से पीआर युद्ध को देखते हुए, यह कहना मुश्किल है कि वास्तव में अभी निश्चित रूप से कौन जीत रहा है। मेट्रिक्स भिन्न होते हैं। Google का 500 नंबर सीधे 400 केस स्टडीज के लिए तुलनीय नहीं है, Microsoft को बढ़ावा देता है (और Microsoft ने जवाब में, प्रेस समय पर वेंचरबीट को बताया कि वह इस सार्वजनिक गणना को 600 को शीघ्र ही अपडेट करने की योजना बना रहा है, तीव्र विपणन को रेखांकित करता है)। और अगर Google के अपने ऐप्स के माध्यम से AI का वितरण महत्वपूर्ण है, तो Microsoft का कोपिलॉट वितरण अपने 365 की पेशकश के माध्यम से समान रूप से प्रभावशाली है। दोनों अब एपीआई के माध्यम से लाखों डेवलपर्स को मार रहे हैं।
लेकिन उदाहरण Google के कर्षण के लिए लाजिमी है:
- वेंडी: केवल एक वर्ष में हजारों स्थानों पर एआई ड्राइव-थ्रू सिस्टम को तैनात किया, कर्मचारी अनुभव और ऑर्डर सटीकता में सुधार किया। Google क्लाउड CTO विल ग्रैनिस ने नोट किया कि AI सिस्टम स्लैंग को समझने और पृष्ठभूमि के शोर को फ़िल्टर करने में सक्षम है, जो लाइव ग्राहक इंटरैक्शन के तनाव को कम करता है। यह खाद्य प्रस्तुत करने और गुणवत्ता पर ध्यान केंद्रित करने के लिए कर्मचारियों को मुक्त करता है-एक शिफ्ट ग्रैनिस जिसे "एआई को वास्तविक दुनिया के संचालन को सुव्यवस्थित करने का एक बड़ा उदाहरण" कहा जाता है।
- Salesforce: एक प्रमुख विस्तार की घोषणा की, जो पहली बार (AWS से परे) के लिए Google क्लाउड पर चलाने के लिए अपने प्लेटफॉर्म को सक्षम करता है, Google की "इनोवेट और ऑप्टिमाइज़" करने में मदद करने की क्षमता का हवाला देते हुए।
- हनीवेल और इंटुइट: कंपनियां पहले से पहले Microsoft और AWS के साथ दृढ़ता से जुड़ी हुई हैं, जो अब AI पहल पर Google क्लाउड के साथ साझेदारी कर रही हैं।
- प्रमुख बैंक (ड्यूश बैंक, वेल्स फारगो): अनुसंधान, विश्लेषण और आधुनिकीकरण ग्राहक सेवा के लिए एजेंटों और मिथुन का लाभ उठाना।
- रिटेलर्स (वॉलमार्ट, मर्काडो लिबरे, लोव्स): खोज, एजेंटों और डेटा प्लेटफार्मों का उपयोग करना।
यह एंटरप्राइज़ ट्रैक्शन Google क्लाउड की समग्र वृद्धि को बढ़ाता है, जिसने पिछली तीन तिमाहियों के लिए AWS और Azure को बाहर कर दिया है। Google क्लाउड 2024 में $ 44 बिलियन की वार्षिक रन रेट पर पहुंच गया, जो 2018 में सिर्फ 5 बिलियन डॉलर से ऊपर था।
प्रतिस्पर्धी पानी को नेविगेट करना
Google की चढ़ाई का मतलब यह नहीं है कि प्रतियोगी अभी भी खड़े हैं। GPT-4.1 (कोडिंग और लंबे संदर्भ पर केंद्रित) के इस सप्ताह Openai की रैपिड रिलीज़ और O-Series (मल्टीमॉडल रीजनिंग, टूल उपयोग) ओपनई के निरंतर नवाचार को प्रदर्शित करती है। इसके अलावा, GPT-4O में Openai की नई छवि जनरेशन फ़ीचर अपडेट ने पिछले महीने की तुलना में बड़े पैमाने पर विकास को बढ़ावा दिया, जिससे Chatgpt 800 मिलियन उपयोगकर्ताओं तक पहुंचने में मदद मिली। Microsoft अपने विशाल उद्यम पदचिह्न और Openai साझेदारी का लाभ उठाना जारी रखता है, जबकि एंथ्रोपिक एक मजबूत दावेदार बना हुआ है, विशेष रूप से कोडिंग और सुरक्षा-सचेत अनुप्रयोगों में।
हालाँकि, यह निर्विवाद है कि Google की कथा में उल्लेखनीय सुधार हुआ है। ठीक एक साल पहले, Google को एक स्टॉडी, रुकने, भड़काने वाले प्रतियोगी के रूप में देखा गया था, जो शायद एआई के लिए अपना मौका उड़ाने वाला था। इसके बजाय, इसके अनूठे, एकीकृत स्टैक और कॉर्पोरेट स्थिरता ने कुछ और खुलासा किया है: Google पूरे स्पेक्ट्रम में विश्व स्तरीय क्षमताओं के पास है-चिप डिजाइन (TPUs) और वैश्विक बुनियादी ढांचे से लेकर आधारभूत मॉडल अनुसंधान (DEEPMIND), अनुप्रयोग विकास (कार्यक्षेत्र, खोज, YouTube), और एंटरप्राइज क्लाउड सेवाओं (वर्टेक्स एआई, बिगंट्सपेस) तक। "हम एकमात्र हाइपरस्केलर हैं जो मूलभूत मॉडल वार्तालाप में है," डेसूज़ा ने सपाट रूप से कहा। यह एंड-टू-एंड स्वामित्व अनुकूलन (जैसे "इंटेलिजेंस प्रति डॉलर") और एकीकरण की गहराई के लिए अनुमति देता है जो साझेदारी-रिवालेंट मॉडल मैच के लिए संघर्ष करते हैं। प्रतियोगियों को अक्सर टुकड़ों को एक साथ सिलाई करने, संभावित रूप से घर्षण पैदा करने या नवाचार गति को सीमित करने की आवश्यकता होती है।
Google का क्षण अब है
जबकि AI दौड़ गतिशील बनी हुई है, Google ने इन सभी टुकड़ों को सटीक क्षण में इकट्ठा किया है, जिस समय बाजार उनकी मांग करता है। जैसा कि डेलॉइट के हंसी ने इसे रखा था, Google ने एक बिंदु मारा, जहां इसकी क्षमताएं पूरी तरह से संरेखित हुईं "जहां बाजार ने इसकी मांग की।" यदि आप Google के लिए एंटरप्राइज एआई में खुद को साबित करने के लिए इंतजार कर रहे थे, तो आप उस क्षण को याद कर सकते हैं - यह पहले से ही है। इस क्रांति को शक्ति देने वाली कई मुख्य प्रौद्योगिकियों का आविष्कार करने वाली कंपनी ने आखिरकार पकड़ लिया है - और इससे भी अधिक, यह अब उस गति को निर्धारित कर रहा है जिसे प्रतियोगियों को मैच करने की आवश्यकता है।
नीचे दिए गए वीडियो में, अगले के ठीक बाद रिकॉर्ड किया गया, एआई विशेषज्ञ सैम विट्टेवेन और मैं वर्तमान परिदृश्य और उभरते रुझानों को तोड़ता हूं, और क्यों Google का एआई पारिस्थितिकी तंत्र इतना मजबूत लगता है:
संबंधित लेख
Imagen 4:谷歌最新AI圖像生成器
Google近日發表最新圖像生成AI模型「Imagen 4」,宣稱將為用戶帶來比前代Imagen 3更出色的視覺體驗。本週稍早在Google I/O 2025大會亮相的這款新模型,被譽為在畫質與多樣性方面取得重大突破。Google表示,Imagen 4特別擅長處理織物質感、水珠反光與動物毛髮等精細紋理,同時能輕鬆駕馭寫實與抽象風格。其輸出解析度最高可達2K,
谷歌Gemini代碼助手強化AI編程代理功能
Google旗下AI程式開發助手Gemini Code Assist近期推出全新「代理模式」功能,目前開放預覽體驗。在最新Cloud Next大會上,Google展示這些AI代理如何突破性處理複雜編程任務——從Google文件規格書直接生成完整應用程式,或輕鬆實現跨語言程式碼轉換。更令人驚豔的是,開發者現可在Android Studio等整合開發環境中直接啟
OpenAI升級其Operator Agent的AI模型
OpenAI將Operator推向全新境界OpenAI正為其自主AI代理Operator進行重大升級。這項變革意味著Operator即將採用基於o3模型的架構,這是OpenAI尖端o系列推理模型的最新成員。此前Operator一直使用客製化版本的GPT-4o驅動,但這次迭代將帶來顯著改進。o3的突破性意義在數學與邏輯推理任務方面,o3幾乎在所有指標上都超越前
सूचना (10)
0/200
JeffreyHarris
20 अप्रैल 2025 12:00:00 पूर्वाह्न GMT
Google's sneaky move into enterprise AI is pretty cool. From playing catch-up to leading the pack, they've really turned things around. The tech is solid but the interface could be more user-friendly. Still, it's impressive how fast they've moved! 🚀
0
WillieJones
22 अप्रैल 2025 12:00:00 पूर्वाह्न GMT
グーグルのエンタープライズAIへの静かな進出はかなりクールですね。追いつくことからリードするまで、本当に状況を変えました。技術はしっかりしていますが、インターフェースがもう少しユーザーフレンドリーだといいですね。それでも、進むスピードが印象的です!🚀
0
WillBaker
22 अप्रैल 2025 12:00:00 पूर्वाह्न GMT
구글이 기업용 AI로 몰래 진출한 것이 꽤 멋지네요. 따라잡기에서 선두로 나아가 정말 상황을 바꿨어요. 기술은 훌륭하지만 인터페이스가 좀 더 사용자 친화적이면 좋겠어요. 그래도 이렇게 빠르게 움직인 것이 인상적이에요! 🚀
0
CharlesMartinez
22 अप्रैल 2025 12:00:00 पूर्वाह्न GMT
A jogada furtiva do Google no AI empresarial é bem legal. De tentar alcançar a liderar o grupo, eles realmente mudaram as coisas. A tecnologia é sólida, mas a interface poderia ser mais amigável ao usuário. Ainda assim, é impressionante como eles se moveram rápido! 🚀
0
JasonRoberts
22 अप्रैल 2025 12:00:00 पूर्वाह्न GMT
El movimiento sigiloso de Google en la IA empresarial es bastante genial. De ir a la zaga a liderar el grupo, realmente han dado la vuelta a la situación. La tecnología es sólida pero la interfaz podría ser más amigable para el usuario. Aún así, es impresionante lo rápido que se han movido! 🚀
0
FredAnderson
22 अप्रैल 2025 12:00:00 पूर्वाह्न GMT
Google's move into enterprise AI is impressive. From playing catch-up to leading the pack, they've really stepped up their game. But the interface could use some work; it's a bit clunky. Still, I'm excited to see where they go from here! 🚀
0
ठीक एक साल पहले, Google और एंटरप्राइज एआई के आसपास की चर्चा तटस्थ में फंस गई थी। ट्रांसफॉर्मर जैसी अग्रणी प्रौद्योगिकियों के बावजूद, टेक दिग्गज पीछे पिछड़ते हुए दिखाई दिए, ओपनईआई की वायरल सफलता, एंथ्रोपिक की कोडिंग कौशल और एंटरप्राइज मार्केट में माइक्रोसॉफ्ट के आक्रामक धक्का से ग्रहण किया गया।
लेकिन लास वेगास में अगले 2025 में Google क्लाउड में पिछले सप्ताह तेजी से आगे बढ़ा, और दृश्य स्पष्ट रूप से अलग था। एक आश्वस्त Google, शीर्ष प्रदर्शन करने वाले मॉडल, मजबूत बुनियादी ढांचे और एक स्पष्ट उद्यम रणनीति से लैस, एक नाटकीय बदलाव की घोषणा की। Google के वरिष्ठ अधिकारियों के साथ एक बंद दरवाजे के विश्लेषक की बैठक में, एक विश्लेषक ने मूड को घेर लिया: "यह वह क्षण ऐसा लगता है जब Google 'कैच अप' से 'कैच यू'।"
Google की लीप फॉरवर्ड
यह भावना - कि Google ने न केवल पकड़ लिया है, बल्कि उद्यम AI दौड़ में Openai और Microsoft से आगे बढ़ा है - पूरे कार्यक्रम में स्पष्ट रूप से। और यह सिर्फ प्रचारित प्रचार नहीं है। पिछले एक साल में, Google ने निष्पादन पर ध्यान केंद्रित किया है, अपने तकनीकी कौशल को एक उच्च-प्रदर्शन, एकीकृत मंच में बदल दिया है जो उद्यम निर्णय निर्माताओं पर जल्दी से जीत रहा है। दुनिया के सबसे शक्तिशाली एआई मॉडल से लेकर अत्यधिक कुशल कस्टम सिलिकॉन पर चल रहे एआई एजेंटों के एक दफन पारिस्थितिकी तंत्र के लिए वास्तविक दुनिया की व्यावसायिक चुनौतियों के लिए, Google एक मजबूत मामला बना रहा है, यह वास्तव में खो गया था, बल्कि गहरे, मूलभूत विकास की अवधि से गुजर रहा था।
अपने एकीकृत स्टैक के साथ अब पूरी क्षमता से काम कर रहा है, Google उद्यम एआई क्रांति के अगले चरण का नेतृत्व करने के लिए तैयार है। अगले में Google के अधिकारियों के साथ मेरे साक्षात्कार में, उन्होंने बुनियादी ढांचे और मॉडल एकीकरण में Google के अद्वितीय लाभों पर जोर दिया - जो कि Openai, Microsoft, या AWS जैसे प्रतियोगियों को दोहराने के लिए चुनौतीपूर्ण लगेगा।
संदेह की छाया: हाल के अतीत को स्वीकार करना
Google की वर्तमान गति की पूरी तरह से सराहना करने के लिए, हाल के अतीत को स्वीकार करना आवश्यक है। Google ने ट्रांसफार्मर आर्किटेक्चर का आविष्कार किया, बड़े भाषा मॉडल (LLMS) में आधुनिक क्रांति को स्पार्क करते हुए, और एक दशक पहले विशेष AI हार्डवेयर (TPU) में निवेश करना शुरू किया, जो अब उद्योग-अग्रणी दक्षता को चलाता है। फिर भी, बेवजह, सिर्फ ढाई साल पहले, Google ने खुद को रक्षा करते हुए पाया।
Openai के चैट ने जनता की कल्पना और उद्यम की रुचि को एक लुभावनी गति से पकड़ लिया, जो इतिहास में सबसे तेजी से बढ़ता हुआ ऐप बन गया। एंथ्रोपिक जैसे प्रतियोगियों ने कोडिंग जैसे क्षेत्रों में निक्स को बाहर निकाला। इस बीच, Google की सार्वजनिक चालें अक्सर अस्थायी या त्रुटिपूर्ण लगती थीं। कुख्यात बार्ड डेमो 2023 में फंबल करता है और ऐतिहासिक रूप से गलत चित्रण का उत्पादन करने वाले इसकी छवि जनरेटर पर विवाद ने एक कंपनी की एक कथा को संभावित रूप से आंतरिक नौकरशाही या संरेखण पर ओवरकॉर्नर द्वारा बाधित किया। Google को खो दिया गया था, क्लाउड प्रतियोगिता में अपनी प्रारंभिक सुस्ती को गूंजते हुए, जहां यह अमेज़ॅन और Microsoft के पीछे बाजार हिस्सेदारी में एक तीसरा स्थान बना रहा।
धुरी: नेतृत्व करने के लिए एक सचेत निर्णय
पर्दे के पीछे, हालांकि, एक महत्वपूर्ण बदलाव हो रहा था, जो नेतृत्व को पुनः प्राप्त करने के लिए उच्चतम स्तर पर एक जानबूझकर निर्णय द्वारा संचालित था। Mat Velloso, Google DeepMind के AI डेवलपर प्लेटफॉर्म के लिए उत्पाद के VP, ने Microsoft छोड़ने के बाद फरवरी 2024 में Google में शामिल होने पर इस महत्वपूर्ण क्षण को महसूस किया। "जब मैं Google के पास आया, तो मैंने सुंदर [पिचाई] के साथ बात की, मैंने यहां कई नेताओं के साथ बात की, और मुझे ऐसा लगा कि वह वह क्षण था जहां वे निर्णय ले रहे थे, ठीक है, यह [जनरेटिव एआई] एक ऐसी चीज है जिसके बारे में उद्योग स्पष्ट रूप से परवाह करता है। चलो इसे बनाते हैं," वेल्लोसो ने अगले सप्ताह में एक साक्षात्कार के दौरान साझा किया।
इस नए सिरे से धक्का "ब्रेन ड्रेन" के डर से बाधित नहीं था, जो कुछ बाहरी लोगों का मानना था कि Google को समाप्त कर रहे थे। इसके बजाय, कंपनी 2024 की शुरुआत में निष्पादन पर दोगुनी हो गई, आक्रामक भर्ती, आंतरिक एकीकरण और ग्राहक कर्षण द्वारा चिह्नित। जबकि प्रतियोगियों ने स्प्लैश हायर बनाया, Google ने अपने मुख्य एआई नेतृत्व को बनाए रखा, जिसमें दीपमाइंड के सीईओ डेमिस हसाबिस और Google क्लाउड के सीईओ थॉमस कुरियन शामिल हैं, जो स्थिरता और गहरी विशेषज्ञता प्रदान करते हैं।
इसके अलावा, प्रतिभा Google के केंद्रित मिशन की ओर बहने लगी। उदाहरण के लिए, लोगन किलपैट्रिक, Openai से Google पर लौटे, कंपनी के भीतर मूलभूत AI के निर्माण के अवसर से तैयार किया गया। वह वेलोसो में शामिल हो गए, जिसे उन्होंने "शून्य से एक अनुभव" के रूप में वर्णित किया, जमीन से मिथुन के लिए डेवलपर ट्रैक्शन का निर्माण किया। किलपैट्रिक ने शुरुआती बिंदु को याद करते हुए कहा, "यह टीम की तरह था, टीम मैं वास्तव में इस प्लेटफॉर्म पर कोई उपयोगकर्ता नहीं है, हमारे पास कोई राजस्व नहीं है। इस समय कोई भी मिथुन में दिलचस्पी नहीं ले रहा है।" जोश वुडवर्ड जैसे नेताओं, जिन्होंने एआई स्टूडियो शुरू करने में मदद की और अब मिथुन ऐप और लैब्स का नेतृत्व करते हैं, और मूल "ध्यान इज ऑल यू नीड" ट्रांसफार्मर पेपर के एक प्रमुख सह-लेखक, नोआम शेज़ियर ने भी 2024 के अंत में क्रूसियल जेमिनी प्रोजेक्ट के लिए एक तकनीकी सह-लीड के रूप में कंपनी में वापसी की।
स्तंभ 1: मिथुन 2.5 और सोच मॉडल का युग
जबकि एंटरप्राइज मंत्र "यह केवल मॉडल के बारे में नहीं है," में स्थानांतरित हो गया है, सबसे अच्छा प्रदर्शन करने वाला एलएलएम एक महत्वपूर्ण उपलब्धि बना हुआ है और कंपनी के बेहतर अनुसंधान और कुशल प्रौद्योगिकी वास्तुकला का एक शक्तिशाली सत्यापनकर्ता है। अगले '25 के कुछ हफ्ते पहले मिथुन 2.5 प्रो की रिहाई के साथ, Google ने निर्णायक रूप से इस मंत्र का दावा किया। यह जल्दी से स्वतंत्र चैटबॉट एरिना लीडरबोर्ड में सबसे ऊपर है, यहां तक कि Openai के नवीनतम GPT-4O वेरिएंट को भी बेहतर ढंग से बेहतर बना रहा है, और मानवता की अंतिम परीक्षा जैसे बेंचमार्क को कुख्यात रूप से कठिन तर्क देता है। जैसा कि पिचाई ने कीनोट में कहा, "यह हमारा सबसे बुद्धिमान एआई मॉडल है। और यह दुनिया का सबसे अच्छा मॉडल है।" मॉडल ने एक महीने के भीतर मिथुन के उपयोग में 80 प्रतिशत की वृद्धि को बढ़ाया था, उन्होंने अलग से ट्वीट किया।
पहली बार मिथुन की मांग में आग लगी थी। मिथुन 2.5 प्रो की कच्ची बुद्धि से अलग, मुझे प्रभावित किया, इसका प्रदर्शन योग्य तर्क था। Google ने एक "सोच" क्षमता को इंजीनियर किया है, जिससे मॉडल को एक प्रतिक्रिया को अंतिम रूप देने से पहले बहु-चरणीय तर्क, योजना और यहां तक कि आत्म-प्रतिबिंब करने की अनुमति मिलती है। संरचित, सुसंगत चेन-ऑफ-थिंक (सीओटी)-गिने हुए चरणों और उप-बुललेट्स का उपयोग करके-डीपसेक या ओपनईआई से अन्य मॉडलों से आउटपुट के जुआ या अपारदर्शी प्रकृति से बचा जाता है। महत्वपूर्ण कार्यों के लिए आउटपुट का मूल्यांकन करने वाली तकनीकी टीमों के लिए, यह पारदर्शिता अभूतपूर्व आत्मविश्वास के साथ सत्यापन, सुधार और पुनर्निर्देशन की अनुमति देती है।
लेकिन एंटरप्राइज़ उपयोगकर्ताओं के लिए अधिक महत्वपूर्ण बात यह है कि मिथुन 2.5 प्रो ने भी नाटकीय रूप से कोडिंग में अंतर को बंद कर दिया, जो कि जेनेरिक एआई के लिए सबसे बड़े अनुप्रयोग क्षेत्रों में से एक है। वेंचरबीट के साथ एक साक्षात्कार में, प्रमुख रिटेलर वेफेयर के सीटीओ फियोना टैन ने कहा कि शुरुआती परीक्षणों के बाद, कंपनी ने इसे "काफी थोड़ा कदम बढ़ाया" और अब एंथ्रोपिक के क्लाउड 3.7 सोननेट के लिए "बहुत तुलनीय" था, जो पहले कई डेवलपर्स के लिए पसंदीदा पसंद था।
Google ने मॉडल में एक बड़े पैमाने पर 1 मिलियन टोकन संदर्भ विंडो भी जोड़ी, जो पूरे कोडबेस या लंबे प्रलेखन में तर्क को सक्षम करती है, जो ओपनईए या एंथ्रोपिक के मॉडल की क्षमताओं से अधिक है। (Openai ने इस सप्ताह समान रूप से बड़े संदर्भ खिड़कियों की विशेषता वाले मॉडल के साथ जवाब दिया, हालांकि बेंचमार्क का सुझाव है कि मिथुन 2.5 प्रो समग्र तर्क में बढ़त बनाए रखता है)। यह लाभ जटिल, बहु-फाइल सॉफ्टवेयर इंजीनियरिंग कार्यों के लिए अनुमति देता है।
पूरक प्रो मिथुन 2.5 फ्लैश है, अगले '25 पर घोषित किया गया और कल ही जारी किया गया। इसके अलावा एक "सोच" मॉडल, फ्लैश कम विलंबता और लागत-दक्षता के लिए अनुकूलित है। आप अपने बजट के साथ मॉडल के कारण और संतुलन प्रदर्शन को नियंत्रित कर सकते हैं। यह tiered दृष्टिकोण Google के अधिकारियों द्वारा चैंपियन द्वारा "इंटेलिजेंस प्रति डॉलर" रणनीति को दर्शाता है।
वेलोसो ने एक चार्ट दिखाया कि खुफिया स्पेक्ट्रम के पार, Google मॉडल सबसे अच्छा मूल्य प्रदान करते हैं। "अगर हमारे पास एक साल पहले यह बातचीत होती ... तो मेरे पास दिखाने के लिए कुछ भी नहीं होता," वेल्लोसो ने स्वीकार किया, तेजी से बदलाव को उजागर करते हुए। "और अब, जैसे, बोर्ड के पार, हम हैं, यदि आप जो भी मॉडल की तलाश कर रहे हैं, जो भी आकार, जैसे, जैसे, यदि आप Google नहीं हैं, तो आप पैसे खो रहे हैं।" इसी तरह के चार्ट को इस सप्ताह Openai के नवीनतम मॉडल रिलीज़ के लिए अद्यतन किया गया है, सभी एक ही चीज़ दिखाते हैं: Google के मॉडल प्रति डॉलर सबसे अच्छी बुद्धि प्रदान करते हैं। नीचे देखें:
वेफेयर के टैन ने 2.5 प्रो के साथ होनहार विलंबता सुधारों का भी अवलोकन किया: "मिथुन 2.5 तेजी से वापस आ गया," इसे "अधिक ग्राहक-सामना करने वाली क्षमताओं के लिए व्यवहार्य बना रहा है," उसने कहा, कुछ उसने कहा कि अन्य मॉडलों के साथ पहले ऐसा नहीं हुआ है। उन्होंने कहा कि मिथुन इन ग्राहक इंटरैक्शन के लिए पहला मॉडल वेफेयर का उपयोग कर सकता है।
मिथुन परिवार की क्षमताएं मल्टीमॉडलिटी तक विस्तारित होती हैं, जो कि Google के अन्य प्रमुख मॉडलों जैसे कि इमेजेन 3 (इमेज जनरेशन), वीओ 2 (वीडियो पीढ़ी), चिरप 3 (ऑडियो), और नए घोषित लिरिया (टेक्स्ट-टू-म्यूजिक) के साथ मूल रूप से एकीकृत होती है, जो कि एंटरप्राइज उपयोगकर्ताओं के लिए Google के प्लेटफ़ॉर्म के माध्यम से सभी सुलभ है। Google एकमात्र कंपनी है जो अपने प्लेटफ़ॉर्म पर सभी तौर -तरीकों में अपने स्वयं के सामान्य मीडिया मॉडल प्रदान करती है। Microsoft, AWS, और Openai को ऐसा करने के लिए अन्य कंपनियों के साथ साझेदारी करनी होगी।
पिलर 2: इन्फ्रास्ट्रक्चर प्रोवेस - हूड के नीचे इंजन
इन शक्तिशाली मॉडलों को तेजी से पुनरावृत्ति और कुशलता से सेवा करने की क्षमता Google के यकीनन अद्वितीय बुनियादी ढांचे से उपजी है, जो कि ग्रह-पैमाने पर सेवाओं के दशकों से सम्मानित है। इसके लिए केंद्रीय टेंसर प्रसंस्करण इकाई (TPU) है।
अगले '25 में, Google ने आयरनवुड का अनावरण किया, इसकी सातवीं पीढ़ी के टीपीयू, स्पष्ट रूप से अनुमान और "थिंकिंग मॉडल" की मांगों के लिए डिज़ाइन किए गए हैं। पैमाना अपार है, एआई वर्कलोड की मांग के लिए सिलवाया गया है: आयरनवुड पॉड्स 9,000 से अधिक लिक्विड-कूल्ड चिप्स पैक करते हैं, जो कम्प्यूट पावर के 42.5 एक्सफ्लॉप्स का दावा करते हैं। Google के एमएल सिस्टम के वीपी अमीन वाहदत ने अगले मंच पर कहा कि यह दुनिया के वर्तमान #1 सुपर कंप्यूटर की गणना शक्ति "24 से अधिक बार" है।
Google ने कहा कि आयरनवुड TPU की पिछली पीढ़ी ट्रिलियम के सापेक्ष 2x perf/Watt प्रदान करता है। यह महत्वपूर्ण है क्योंकि उद्यम ग्राहकों ने कहा कि ऊर्जा लागत और उपलब्धता बड़े पैमाने पर एआई तैनाती को बाधित करती है।
Google क्लाउड CTO विल ग्रैनिस ने इस प्रगति की निरंतरता पर जोर दिया। साल दर साल, Google अपने प्रोसेसर में 10x, 8x, 9x, 10x सुधार कर रहा है, उन्होंने एक साक्षात्कार में वेंचरबीट को बताया, जिससे उन्होंने एआई त्वरक के लिए "हाइपर मूर का कानून" कहा। उन्होंने कहा कि ग्राहक Google का रोडमैप खरीद रहे हैं, न कि केवल इसकी तकनीक।
Google की स्थिति ने इस निरंतर TPU निवेश को बढ़ावा दिया। इसे 2 बिलियन से अधिक उपयोगकर्ताओं के लिए खोज, YouTube, और Gmail जैसी बड़े पैमाने पर सेवाओं को कुशलतापूर्वक बिजली देने की आवश्यकता है। यह वर्तमान जनरेटिव एआई बूम से बहुत पहले विकासशील कस्टम, अनुकूलित हार्डवेयर की आवश्यकता है। जबकि मेटा एक समान उपभोक्ता पैमाने पर संचालित होता है, अन्य प्रतियोगियों के पास इस विशिष्ट आंतरिक ड्राइवर की कमी थी, जो कि दशक-लंबे, लंबवत रूप से एकीकृत एआई हार्डवेयर विकास के लिए है।
अब ये टीपीयू निवेश भुगतान कर रहे हैं क्योंकि वे न केवल अपने स्वयं के ऐप के लिए दक्षता चला रहे हैं, बल्कि Google को प्रति डॉलर बेहतर बुद्धिमत्ता पर अन्य उपयोगकर्ताओं को मिथुन की पेशकश करने की अनुमति भी दे रहे हैं, सभी चीजें समान हैं।
Google के प्रतियोगी NVIDIA से कुशल प्रोसेसर क्यों नहीं खरीद सकते हैं, आप पूछते हैं? यह सच है कि NVIDIA के GPU प्रोसेसर LLMS की प्रक्रिया पूर्व-प्रशिक्षण पर हावी हैं। लेकिन बाजार की मांग ने इन GPU की कीमत को बढ़ा दिया है, और NVIDIA लाभ के रूप में अपने लिए एक स्वस्थ कटौती करता है। यह अपने चिप्स के उपयोगकर्ताओं के साथ महत्वपूर्ण लागत पारित करता है। और यह भी, जबकि प्री-ट्रेनिंग अब तक एआई चिप्स के उपयोग पर हावी है, यह अब बदल रहा है कि उद्यम वास्तव में इन अनुप्रयोगों को तैनात कर रहे हैं। यह वह जगह है जहां "अनुमान" आता है, और यहां टीपीयू को पैमाने पर वर्कलोड के लिए जीपीयू की तुलना में अधिक कुशल माना जाता है।
जब आप Google अधिकारियों से पूछते हैं कि AI में उनकी मुख्य तकनीक का लाभ कहां से आता है, तो वे आमतौर पर सबसे महत्वपूर्ण के रूप में TPU में वापस आते हैं। मार्क लोहमेयर, वीपी जो Google के कंप्यूटिंग इन्फ्रास्ट्रक्चर को चलाता है, असमान था: टीपीयू "निश्चित रूप से हम जो करते हैं उसका एक उच्च विभेदित हिस्सा हैं ... ओपनई, उनके पास उन क्षमताओं को नहीं है।"
गौरतलब है कि Google टीपीयू को अलगाव में नहीं, बल्कि व्यापक, अधिक जटिल उद्यम एआई वास्तुकला के हिस्से के रूप में प्रस्तुत करता है। तकनीकी अंदरूनी सूत्रों के लिए, यह समझा जाता है कि शीर्ष स्तरीय प्रदर्शन तेजी से विशेष प्रौद्योगिकी सफलताओं को एकीकृत करने पर टिका है। कई अपडेट अगले पर विस्तृत थे। वाहदत ने इसे एक "सुपरकंप्यूटिंग सिस्टम" के रूप में वर्णित किया, एकीकृत हार्डवेयर (टीपीयूएस, ब्लैकवेल जैसे नवीनतम एनवीडिया जीपीयू और आगामी वेरा रुबिन, हाइपरडिस्क एक्सपोल जैसे उन्नत भंडारण, कहीं भी कैश और रैपिड स्टोरेज) एक एकीकृत सॉफ्टवेयर स्टैक के साथ। इस सॉफ़्टवेयर में एक्सेलेरेटर, पाथवे (जेमिनी के वितरित रनटाइम, अब ग्राहकों के लिए उपलब्ध) के प्रबंधन के लिए क्लस्टर निदेशक शामिल हैं, और वीएलएलएम जैसे ऑप्टिमाइज़ेशन को टीपीयू में लाते हैं, जिससे एनवीआईडीआईए/पाइटोरच स्टैक पर पहले से आसान वर्कलोड माइग्रेशन की अनुमति मिलती है। यह एकीकृत प्रणाली, वाहदत ने तर्क दिया, यही कारण है कि जीपीटी -4 ओ की तुलना में मिथुन 2.0 फ्लैश प्रति डॉलर 24 गुना अधिक खुफिया जानकारी प्राप्त करता है।
Google अपने भौतिक बुनियादी ढांचे की पहुंच भी बढ़ा रहा है। क्लाउड WAN Google के कम-विलंबता 2 मिलियन-मील निजी फाइबर नेटवर्क को उद्यमों के लिए उपलब्ध कराता है, जो ग्राहक-प्रबंधित नेटवर्क की तुलना में 40% तेज प्रदर्शन और 40% कम कुल लागत (TCO) का वादा करता है।
इसके अलावा, Google डिस्ट्रीब्यूटेड क्लाउड (GDC) ने मिथुन और एनवीडिया हार्डवेयर (एक डेल साझेदारी के माध्यम से) को संप्रभु, ऑन-प्रिमाइसेस, या यहां तक कि एयर-गेप किए गए वातावरण में चलने की अनुमति दी-एक क्षमता nvidia के सीईओ जेन्सन हुआंग ने राज्य-कीट-एआरटी एआई के लिए "पूरी तरह से विशाल" की सराहना की, जो कि राज्य-एआरटी एआई को नियंत्रित करने के लिए एआई-आर्ट एआई लाने के लिए है। इसके बाद, हुआंग ने Google के इन्फ्रास्ट्रक्चर को दुनिया में सबसे अच्छा कहा: "कोई भी कंपनी Google और Google क्लाउड की तुलना में कंप्यूटिंग की हर एक परत में बेहतर नहीं है," उन्होंने कहा।
पिलर 3: एकीकृत पूर्ण स्टैक - डॉट्स को कनेक्ट करना
Google का रणनीतिक लाभ यह देखते हुए बढ़ता है कि इन मॉडलों और बुनियादी ढांचे के घटकों को एक सामंजस्यपूर्ण मंच में कैसे बुना जाता है। प्रतियोगियों के विपरीत, जो अक्सर अंतराल को पाटने के लिए साझेदारी पर भरोसा करते हैं, Google लगभग हर परत को नियंत्रित करता है, जिससे सख्त एकीकरण और तेजी से नवाचार चक्र को सक्षम किया जाता है।
तो यह एकीकरण क्यों मायने रखता है, अगर Microsoft जैसा एक प्रतियोगी केवल LLM मॉडल के साथ बुनियादी ढांचे की चौड़ाई से मेल खाने के लिए OpenAI के साथ साझेदारी कर सकता है? जिन Googlers के साथ मैंने बात की, उन्होंने कहा कि इससे बहुत फर्क पड़ता है, और वे इसे वापस करने के लिए उपाख्यानों के साथ आए।
Google के एंटरप्राइज डेटाबेस BigQuery का महत्वपूर्ण सुधार लें। डेटाबेस अब एक ज्ञान ग्राफ प्रदान करता है जो LLM को अधिक कुशलता से डेटा पर खोज करने की अनुमति देता है, और अब यह स्नोफ्लेक और डेटाब्रिक्स जैसे प्रतियोगियों के ग्राहकों के पांच गुना से अधिक का दावा करता है। Google क्लाउड में डेटा एनालिटिक्स के लिए उत्पाद के प्रमुख यास्मीन अहमद ने कहा कि विशाल सुधार केवल इसलिए संभव थे क्योंकि Google की डेटा टीमें दीपमाइंड टीम के साथ मिलकर काम कर रही थीं। उन्होंने उपयोग के मामलों के माध्यम से काम किया जो हल करने के लिए कठिन थे, और इसके कारण डेटाबेस को सामान्य प्रश्नों के आधार पर 50 प्रतिशत अधिक सटीकता प्रदान की गई, कम से कम Google के आंतरिक परीक्षण के अनुसार, निकटतम प्रतियोगियों की तुलना में सही डेटा प्राप्त करने में, अहमद ने एक साक्षात्कार में वेंचरबीट को बताया। अहमद ने कहा कि इस तरह का गहन एकीकरण स्टैक में है कि कैसे Google ने उद्योग को "छलांग" दिया है।
यह आंतरिक सामंजस्य Microsoft में "फ्रेनेमीज़" गतिशील के साथ तेजी से विपरीत है। जबकि Azure क्लाउड पर अपने मॉडल वितरित करने के लिए OpenAI के साथ Microsoft साझेदार, Microsoft भी अपने स्वयं के मॉडल का निर्माण कर रहा है। Mat Velloso, Google कार्यकारी, जो अब AI डेवलपर कार्यक्रम का नेतृत्व करता है, ने Microsoft को छोड़ दिया, जो Windows Copilot योजनाओं को Openai के मॉडल प्रसाद के साथ संरेखित करने की कोशिश कर रहा था। "आप अपनी उत्पाद योजनाओं को एक अन्य कंपनी के साथ कैसे साझा करते हैं जो वास्तव में आपके साथ प्रतिस्पर्धा कर रही है ... पूरी बात एक विरोधाभास है," उन्होंने याद किया। "यहां मैं उन लोगों के साथ कंधे से कंधा मिलाकर बैठता हूं जो मॉडल का निर्माण कर रहे हैं।"
यह एकीकरण इस बात से बात करता है कि Google नेताओं ने अपने मूल लाभ के रूप में क्या देखा है: पूर्ण स्पेक्ट्रम में गहरी विशेषज्ञता को जोड़ने की इसकी अद्वितीय क्षमता, मूलभूत अनुसंधान और मॉडल बिल्डिंग से लेकर "ग्रह-स्केल" एप्लिकेशन परिनियोजन और बुनियादी ढांचा डिजाइन तक।
वर्टेक्स एआई Google के एंटरप्राइज़ एआई प्रयासों के लिए केंद्रीय तंत्रिका तंत्र के रूप में कार्य करता है। और एकीकरण केवल Google के अपने प्रसाद से परे है। वर्टेक्स के मॉडल गार्डन में 200 से अधिक क्यूरेट किए गए मॉडल शामिल हैं, जिनमें Google, मेटा के लामा 4 और कई ओपन-सोर्स विकल्प शामिल हैं। वर्टेक्स ट्यूनिंग, मूल्यांकन के लिए उपकरण प्रदान करता है (एआई-संचालित ईवीएल सहित, जिसे ग्रैनिस ने एक प्रमुख त्वरक के रूप में हाइलाइट किया था), तैनाती और निगरानी। इसकी ग्राउंडिंग क्षमताएं बाहरी वेक्टर डेटाबेस के साथ संगतता के साथ आंतरिक ए-तैयार डेटाबेस का लाभ उठाती हैं। Google खोज, दुनिया के सर्वश्रेष्ठ खोज इंजन के साथ ग्राउंड मॉडल में Google के नए प्रसाद में जोड़ें।
एकीकरण Google कार्यक्षेत्र तक फैला हुआ है। अगले '25 में घोषित नई सुविधाएँ, जैसे कि शीट्स में "हेल्प मी एनालिसिज़" (हां, शीट्स में अब एक "= एआई" फॉर्मूला है), डॉक्स और वर्कस्पेस प्रवाह में ऑडियो ओवरव्यू, डेली वर्कफ़्लो में मिथुन की क्षमताओं को आगे बढ़ाते हैं, अनुभव में सुधार करने के लिए Google के लिए एक शक्तिशाली फीडबैक लूप बनाते हैं।
अपने एकीकृत स्टैक को चलाने के दौरान, Google ने खुलेपन को भी चैंपियन बनाया, जहां यह पारिस्थितिकी तंत्र की सेवा करता है। कुबेरनेट्स को गोद लेने के बाद, यह अब एआई फ्रेमवर्क के लिए JAX को बढ़ावा दे रहा है और अब मौजूदा मानकों (MCP) के लिए समर्थन के साथ एजेंट संचार (A2A) के लिए खुले प्रोटोकॉल। Google एजेंट्सस्पेस के भीतर से बाहरी प्लेटफार्मों के लिए सैकड़ों कनेक्टर्स की पेशकश कर रहा है, जो कर्मचारियों के लिए Google का नया एकीकृत इंटरफ़ेस है जो एजेंटों को खोजने और उपयोग करने के लिए है। यह हब अवधारणा सम्मोहक है। एजेंटस्पेस का मुख्य प्रदर्शन (51:40 से शुरू) यह दिखाता है। Google उपयोगकर्ताओं को पूर्व-निर्मित एजेंटों की पेशकश करता है, या कर्मचारी या डेवलपर्स नो-कोड AI क्षमताओं का उपयोग करके अपना निर्माण कर सकते हैं। या वे A2A कनेक्टर्स के माध्यम से बाहर से एजेंटों में खींच सकते हैं। यह सीमलेस एक्सेस के लिए क्रोम ब्राउज़र में एकीकृत करता है।
पिलर 4: एंटरप्राइज वैल्यू और एजेंट इकोसिस्टम पर ध्यान केंद्रित करें
शायद सबसे महत्वपूर्ण बदलाव Google का ठोस उद्यम समस्याओं को हल करने पर ध्यान केंद्रित करने पर विशेष रूप से AI एजेंटों के लेंस के माध्यम से। Google क्लाउड के सीईओ थॉमस कुरियन ने तीन कारणों को रेखांकित किया, जो ग्राहक Google का चयन करते हैं: Ai-Optimized प्लेटफ़ॉर्म, ओपन मल्टी-क्लाउड दृष्टिकोण जो मौजूदा आईटी से कनेक्शन की अनुमति देता है, और सुरक्षा, संप्रभुता और अनुपालन पर उद्यम-तैयार ध्यान केंद्रित करता है।
एजेंट इस रणनीति के लिए महत्वपूर्ण हैं। एजेंटस्पेस के अलावा, इसमें भी शामिल है:
- बिल्डिंग ब्लॉक: ओपन-सोर्स एजेंट डेवलपमेंट किट (ADK), जिसे अगले में घोषित किया गया है, ने पहले से ही डेवलपर्स से महत्वपूर्ण रुचि देखी है। ADK मल्टी-एजेंट सिस्टम बनाने को सरल बनाता है, जबकि प्रस्तावित Agent2Agent (A2A) प्रोटोकॉल का उद्देश्य इंटरऑपरेबिलिटी सुनिश्चित करना है, जिससे विभिन्न उपकरणों (GEMINI ADK, Langgraph, Crewai, आदि) के साथ निर्मित एजेंटों को सहयोग करने की अनुमति मिलती है। Google के ग्रैनिस ने कहा कि A2A भविष्य के हजारों बातचीत करने वाले एजेंटों के साथ भविष्य के पैमाने और सुरक्षा चुनौतियों का अनुमान लगाता है।
- उद्देश्य-निर्मित एजेंट: Google शोकेस किए गए विशेषज्ञ एजेंटों को एजेंटस्पेस में एकीकृत किया गया (जैसे नोटबुक, आइडिया जनरेशन, डीप रिसर्च) और पांच प्रमुख श्रेणियों को हाइलाइट किया गया। एजेंट (मिथुन कोड सहायता), और सुरक्षा एजेंट (नए Google एकीकृत सुरक्षा मंच में एकीकृत)।
यह व्यापक एजेंट रणनीति गूंजती हुई प्रतीत होती है। पिछले सप्ताह तीन अन्य बड़े उद्यमों में अधिकारियों के साथ बातचीत, प्रतिस्पर्धी संवेदनशीलता के कारण गुमनाम रूप से बोलते हुए, Google की एजेंट रणनीति के लिए इस उत्साह को प्रतिध्वनित किया। Google क्लाउड COO फ्रांसिस Desouza ने एक साक्षात्कार में पुष्टि की: "हर बातचीत में AI शामिल है। विशेष रूप से, हर बातचीत में एजेंट शामिल हैं।"
केविन हंसीरिज, डेलॉइट में एक कार्यकारी, Google के एआई उत्पादों का एक बड़ा उपयोगकर्ता, और अन्य कंपनियों के लिए उनमें से एक वितरक, ने एजेंट बाजार को "भूमि हड़पने" के रूप में वर्णित किया, जहां Google के शुरुआती कदमों के साथ प्रोटोकॉल और इसके एकीकृत मंच के साथ महत्वपूर्ण लाभ प्रदान करते हैं। "जो भी पहले बाहर निकल रहा है और सबसे अधिक एजेंट प्राप्त कर रहा है जो वास्तव में मूल्य प्रदान करता है - जो इस दौड़ में जीतने जा रहा है," हंसी ने एक साक्षात्कार में कहा। उन्होंने कहा कि Google की प्रगति "आश्चर्यजनक" थी, यह देखते हुए कि कस्टम एजेंटों ने एक साल पहले ही निर्मित डेलॉइट को "आउट ऑफ द बॉक्स" को दोहराया जा सकता था, जो एजेंटस्पेस का उपयोग कर रहा था। डेलॉइट स्वयं मंच पर 100 एजेंटों का निर्माण कर रहा है, वित्त, जोखिम और इंजीनियरिंग जैसे मिड-ऑफिस कार्यों को लक्षित कर रहा है, उन्होंने कहा।
ग्राहक प्रूफ पॉइंट बढ़ रहे हैं। अगले समय, Google ने एक साल पहले "दर्जनों दर्जनों प्रोटोटाइप" से उदार एआई के साथ "500 प्लस ग्राहकों को उत्पादन में" का हवाला दिया। यदि Microsoft को एक साल पहले आगे के रूप में माना जाता था, तो यह स्पष्ट रूप से अब ऐसा नहीं लगता है। सभी पक्षों से पीआर युद्ध को देखते हुए, यह कहना मुश्किल है कि वास्तव में अभी निश्चित रूप से कौन जीत रहा है। मेट्रिक्स भिन्न होते हैं। Google का 500 नंबर सीधे 400 केस स्टडीज के लिए तुलनीय नहीं है, Microsoft को बढ़ावा देता है (और Microsoft ने जवाब में, प्रेस समय पर वेंचरबीट को बताया कि वह इस सार्वजनिक गणना को 600 को शीघ्र ही अपडेट करने की योजना बना रहा है, तीव्र विपणन को रेखांकित करता है)। और अगर Google के अपने ऐप्स के माध्यम से AI का वितरण महत्वपूर्ण है, तो Microsoft का कोपिलॉट वितरण अपने 365 की पेशकश के माध्यम से समान रूप से प्रभावशाली है। दोनों अब एपीआई के माध्यम से लाखों डेवलपर्स को मार रहे हैं।
लेकिन उदाहरण Google के कर्षण के लिए लाजिमी है:
- वेंडी: केवल एक वर्ष में हजारों स्थानों पर एआई ड्राइव-थ्रू सिस्टम को तैनात किया, कर्मचारी अनुभव और ऑर्डर सटीकता में सुधार किया। Google क्लाउड CTO विल ग्रैनिस ने नोट किया कि AI सिस्टम स्लैंग को समझने और पृष्ठभूमि के शोर को फ़िल्टर करने में सक्षम है, जो लाइव ग्राहक इंटरैक्शन के तनाव को कम करता है। यह खाद्य प्रस्तुत करने और गुणवत्ता पर ध्यान केंद्रित करने के लिए कर्मचारियों को मुक्त करता है-एक शिफ्ट ग्रैनिस जिसे "एआई को वास्तविक दुनिया के संचालन को सुव्यवस्थित करने का एक बड़ा उदाहरण" कहा जाता है।
- Salesforce: एक प्रमुख विस्तार की घोषणा की, जो पहली बार (AWS से परे) के लिए Google क्लाउड पर चलाने के लिए अपने प्लेटफॉर्म को सक्षम करता है, Google की "इनोवेट और ऑप्टिमाइज़" करने में मदद करने की क्षमता का हवाला देते हुए।
- हनीवेल और इंटुइट: कंपनियां पहले से पहले Microsoft और AWS के साथ दृढ़ता से जुड़ी हुई हैं, जो अब AI पहल पर Google क्लाउड के साथ साझेदारी कर रही हैं।
- प्रमुख बैंक (ड्यूश बैंक, वेल्स फारगो): अनुसंधान, विश्लेषण और आधुनिकीकरण ग्राहक सेवा के लिए एजेंटों और मिथुन का लाभ उठाना।
- रिटेलर्स (वॉलमार्ट, मर्काडो लिबरे, लोव्स): खोज, एजेंटों और डेटा प्लेटफार्मों का उपयोग करना।
यह एंटरप्राइज़ ट्रैक्शन Google क्लाउड की समग्र वृद्धि को बढ़ाता है, जिसने पिछली तीन तिमाहियों के लिए AWS और Azure को बाहर कर दिया है। Google क्लाउड 2024 में $ 44 बिलियन की वार्षिक रन रेट पर पहुंच गया, जो 2018 में सिर्फ 5 बिलियन डॉलर से ऊपर था।
प्रतिस्पर्धी पानी को नेविगेट करना
Google की चढ़ाई का मतलब यह नहीं है कि प्रतियोगी अभी भी खड़े हैं। GPT-4.1 (कोडिंग और लंबे संदर्भ पर केंद्रित) के इस सप्ताह Openai की रैपिड रिलीज़ और O-Series (मल्टीमॉडल रीजनिंग, टूल उपयोग) ओपनई के निरंतर नवाचार को प्रदर्शित करती है। इसके अलावा, GPT-4O में Openai की नई छवि जनरेशन फ़ीचर अपडेट ने पिछले महीने की तुलना में बड़े पैमाने पर विकास को बढ़ावा दिया, जिससे Chatgpt 800 मिलियन उपयोगकर्ताओं तक पहुंचने में मदद मिली। Microsoft अपने विशाल उद्यम पदचिह्न और Openai साझेदारी का लाभ उठाना जारी रखता है, जबकि एंथ्रोपिक एक मजबूत दावेदार बना हुआ है, विशेष रूप से कोडिंग और सुरक्षा-सचेत अनुप्रयोगों में।
हालाँकि, यह निर्विवाद है कि Google की कथा में उल्लेखनीय सुधार हुआ है। ठीक एक साल पहले, Google को एक स्टॉडी, रुकने, भड़काने वाले प्रतियोगी के रूप में देखा गया था, जो शायद एआई के लिए अपना मौका उड़ाने वाला था। इसके बजाय, इसके अनूठे, एकीकृत स्टैक और कॉर्पोरेट स्थिरता ने कुछ और खुलासा किया है: Google पूरे स्पेक्ट्रम में विश्व स्तरीय क्षमताओं के पास है-चिप डिजाइन (TPUs) और वैश्विक बुनियादी ढांचे से लेकर आधारभूत मॉडल अनुसंधान (DEEPMIND), अनुप्रयोग विकास (कार्यक्षेत्र, खोज, YouTube), और एंटरप्राइज क्लाउड सेवाओं (वर्टेक्स एआई, बिगंट्सपेस) तक। "हम एकमात्र हाइपरस्केलर हैं जो मूलभूत मॉडल वार्तालाप में है," डेसूज़ा ने सपाट रूप से कहा। यह एंड-टू-एंड स्वामित्व अनुकूलन (जैसे "इंटेलिजेंस प्रति डॉलर") और एकीकरण की गहराई के लिए अनुमति देता है जो साझेदारी-रिवालेंट मॉडल मैच के लिए संघर्ष करते हैं। प्रतियोगियों को अक्सर टुकड़ों को एक साथ सिलाई करने, संभावित रूप से घर्षण पैदा करने या नवाचार गति को सीमित करने की आवश्यकता होती है।
Google का क्षण अब है
जबकि AI दौड़ गतिशील बनी हुई है, Google ने इन सभी टुकड़ों को सटीक क्षण में इकट्ठा किया है, जिस समय बाजार उनकी मांग करता है। जैसा कि डेलॉइट के हंसी ने इसे रखा था, Google ने एक बिंदु मारा, जहां इसकी क्षमताएं पूरी तरह से संरेखित हुईं "जहां बाजार ने इसकी मांग की।" यदि आप Google के लिए एंटरप्राइज एआई में खुद को साबित करने के लिए इंतजार कर रहे थे, तो आप उस क्षण को याद कर सकते हैं - यह पहले से ही है। इस क्रांति को शक्ति देने वाली कई मुख्य प्रौद्योगिकियों का आविष्कार करने वाली कंपनी ने आखिरकार पकड़ लिया है - और इससे भी अधिक, यह अब उस गति को निर्धारित कर रहा है जिसे प्रतियोगियों को मैच करने की आवश्यकता है।
नीचे दिए गए वीडियो में, अगले के ठीक बाद रिकॉर्ड किया गया, एआई विशेषज्ञ सैम विट्टेवेन और मैं वर्तमान परिदृश्य और उभरते रुझानों को तोड़ता हूं, और क्यों Google का एआई पारिस्थितिकी तंत्र इतना मजबूत लगता है:




Google's sneaky move into enterprise AI is pretty cool. From playing catch-up to leading the pack, they've really turned things around. The tech is solid but the interface could be more user-friendly. Still, it's impressive how fast they've moved! 🚀




グーグルのエンタープライズAIへの静かな進出はかなりクールですね。追いつくことからリードするまで、本当に状況を変えました。技術はしっかりしていますが、インターフェースがもう少しユーザーフレンドリーだといいですね。それでも、進むスピードが印象的です!🚀




구글이 기업용 AI로 몰래 진출한 것이 꽤 멋지네요. 따라잡기에서 선두로 나아가 정말 상황을 바꿨어요. 기술은 훌륭하지만 인터페이스가 좀 더 사용자 친화적이면 좋겠어요. 그래도 이렇게 빠르게 움직인 것이 인상적이에요! 🚀




A jogada furtiva do Google no AI empresarial é bem legal. De tentar alcançar a liderar o grupo, eles realmente mudaram as coisas. A tecnologia é sólida, mas a interface poderia ser mais amigável ao usuário. Ainda assim, é impressionante como eles se moveram rápido! 🚀




El movimiento sigiloso de Google en la IA empresarial es bastante genial. De ir a la zaga a liderar el grupo, realmente han dado la vuelta a la situación. La tecnología es sólida pero la interfaz podría ser más amigable para el usuario. Aún así, es impresionante lo rápido que se han movido! 🚀




Google's move into enterprise AI is impressive. From playing catch-up to leading the pack, they've really stepped up their game. But the interface could use some work; it's a bit clunky. Still, I'm excited to see where they go from here! 🚀












