एंड्रॉइड, क्रोम के लिए AI और पहुंच योग्यता सुधार
22 मई 2025
JustinWilliams
0
वैश्विक पहुंच जागरूकता दिवस के उपलक्ष्य में, हम अपने एंड्रॉइड और क्रोम पर उत्पादों में महत्वपूर्ण अपडेट की घोषणा करने के लिए उत्साहित हैं, साथ ही साथ भाषण पहचान उपकरणों पर काम करने वाले डेवलपर्स के लिए नए संसाधन भी। ये AI में प्रगति हमारी डिजिटल दुनिया को अधिक सुलभ और समावेशी बना रही है।
एंड्रॉइड के साथ अधिक AI-संचालित नवाचार
हम पहुंच के प्रति अपनी प्रतिबद्धता को आगे बढ़ा रहे हैं, Google AI और Gemini को मोबाइल अनुभवों में, विशेष रूप से दृष्टि और श्रवण के लिए, बुनकर।
Gemini और TalkBack के साथ विवरणों को बढ़ाना
पिछले साल, हमने Gemini की क्षमताओं को Android के स्क्रीन रीडर TalkBack में एकीकृत किया, जिसने छवियों के लिए AI-जनित विवरण प्रदान किए, भले ही alt टेक्स्ट गायब हो। अब, हम इस सुविधा का विस्तार कर रहे हैं। उपयोगकर्ता अब उन छवियों के बारे में प्रश्न पूछ सकते हैं जो वे प्राप्त करते हैं, जैसे कि एक दोस्त की नई गिटार। आप छवि में मेक, रंग या अन्य तत्वों के बारे में पूछ सकते हैं। इसके अलावा, आप अपनी पूरी स्क्रीन के बारे में विवरण और प्रश्न पूछ सकते हैं। उदाहरण के लिए, एक शॉपिंग ऐप पर सेल की खोज करते समय, आप Gemini से किसी आइटम की सामग्री के बारे में पूछ सकते हैं या उपलब्ध छूट की जांच कर सकते हैं।

कैप्शन के पीछे भावनाओं को बेहतर समझना
Expressive Captions के साथ, आपका Android डिवाइस अब अधिकांश ऐप्स में रियल-टाइम कैप्शन प्रदान करता है, जो न केवल क्या कहा जाता है, बल्कि कैसे कहा जाता है, उसे भी कैद करता है। हमने एक नई अवधि विशेषता जोड़ी है जो शब्दों को खींचने पर हाइलाइट करती है, जैसे कि खेल प्रसारण में "amaaazing shot" सुनना या वीडियो संदेश में खींचा हुआ "nooooo"। आपको ध्वनियों के लिए अधिक लेबल भी मिलेंगे, जैसे कि सीटी बजाना या गले की सफाई। यह अपडेट अंग्रेजी में उपलब्ध है, जो Android 15 और उससे ऊपर चलने वाले डिवाइसों के लिए U.S., U.K., कनाडा और ऑस्ट्रेलिया में उपलब्ध है।

दुनिया भर में भाषण पहचान में सुधार
2019 में Project Euphonia को लॉन्च करने के बाद से, हमारा उद्देश्य गैर-मानक भाषण पैटर्न वाले लोगों के लिए भाषण पहचान को अधिक सुलभ बनाना रहा है। हम अब दुनिया भर के डेवलपर्स और संगठनों के लिए समर्थन का विस्तार कर रहे हैं, उन्हें इस प्रौद्योगिकी को अधिक भाषाओं और सांस्कृतिक संदर्भों में अनुकूलित करने में मदद कर रहे हैं।
नए डेवलपर संसाधन
वैश्विक सुलभ उपकरणों के पारिस्थितिकी तंत्र को बढ़ावा देने के लिए, हम Project Euphonia के GitHub पेज के माध्यम से डेवलपर्स को हमारे ओपन-सोर्स रिपॉजिटरी तक पहुंच प्रदान कर रहे हैं। इससे उन्हें व्यक्तिगत ऑडियो उपकरण विकसित करने के लिए या अपने मॉडल को विविध भाषण पैटर्न को पहचानने के लिए प्रशिक्षित करने में मदद मिलती है।
अफ्रीका में नए प्रोजेक्ट्स के लिए समर्थन
इस वर्ष की शुरुआत में, हमने Google.org के साथ साझेदारी की है, जो University College London को डिजिटल भाषा समावेशन केंद्र (CDLI) स्थापित करने में मदद कर रहा है। CDLI अफ्रीका भर में अंग्रेजी भाषा के गैर-वक्ताओं के लिए भाषण पहचान प्रौद्योगिकी को बेहतर बनाने पर केंद्रित है। वे 10 अफ्रीकी भाषाओं में ओपन-सोर्स डेटासेट बना रहे हैं, नए भाषण पहचान मॉडल विकसित कर रहे हैं, और इस क्षेत्र में संगठनों और डेवलपर्स के व्यापक समुदाय का समर्थन कर रहे हैं।
विद्यार्थियों के लिए पहुंच विकल्पों का विस्तार
विकलांग छात्रों के लिए पहुंच उपकरण महत्वपूर्ण भूमिका निभाते हैं, चेहरे के इशारों का उपयोग करके Chromebooks को Face Control के साथ नेविगेट करने से लेकर Reading Mode के साथ अपने पढ़ने के अनुभव को अनुकूलित करने तक। अब, जब Chromebooks का उपयोग करते हुए College Board के Bluebook टेस्टिंग ऐप के साथ SAT और Advanced Placement परीक्षाओं के लिए, छात्रों को Google की सभी निर्मित पहुंच सुविधाओं तक पहुंच मिलेगी, जिसमें ChromeVox स्क्रीन रीडर और Dictation शामिल हैं, साथ ही College Board के अपने डिजिटल परीक्षण उपकरण भी।
क्रोम को अधिक सुलभ बनाना
2 बिलियन से अधिक दैनिक उपयोगकर्ताओं के साथ, हम लगातार क्रोम की पहुंच में सुधार करने के लिए काम कर रहे हैं। स्क्रीन रीडर उपयोगकर्ताओं के लिए लाइव कैप्शन और छवि विवरण इस प्रयास का हिस्सा हैं।
क्रोम पर PDFs तक आसानी से पहुंचना
पहले, डेस्कटॉप क्रोम में स्कैन किए गए PDFs स्क्रीन रीडर के लिए सुलभ नहीं थे। अब, ऑप्टिकल कैरेक्टर रिकॉग्निशन (OCR) के साथ, क्रोम इन PDFs को पहचान सकता है, जिससे आप उन्हें हाइलाइट, कॉपी, टेक्स्ट की खोज कर सकते हैं और अपने स्क्रीन रीडर का उपयोग करके उन्हें पढ़ सकते हैं।
पेज ज़ूम के साथ आसानी से पढ़ना
एंड्रॉइड के लिए क्रोम पर पेज ज़ूम अब आपको वेबपेज की लेआउट या आपके ब्राउज़िंग अनुभव को बदले बिना टेक्स्ट का आकार बढ़ाने देता है, जैसा कि क्रोम डेस्कटॉप पर काम करता है। आप अपनी ज़ूम प्राथमिकताओं को सभी पेजों या विशिष्ट पेजों पर लागू करने के लिए सेट कर सकते हैं।

इस सुविधा का उपयोग करने के लिए, बस क्रोम के ऊपरी दाएं कोने में तीन-डॉट मेनू पर टैप करें और अपनी ज़ूम सेटिंग्स को समायोजित करें।
संबंधित लेख
Adobe AI-Agenten verbessern Photoshop und Premiere Pro
Adobe bringt in der Kreativwelt mit der Einführung von KI-Agenten, die darauf ausgelegt sind, die Nutzung von Photoshop und Premiere Pro zu revolutionieren, neue Dynamik. In einem
Ex-OpenAI-CEO warnt vor Schmeichelei und Kriecherei von KI
Die beunruhigende Realität von übertrieben zustimmenden KI-SystemenStellen Sie sich einen KI-Assistenten vor, der allem zustimmt, was Sie sagen, egal wie abwegig oder schädlich Ihr
Microsoft stellt Recall und AI-verbesserte Suche für Copilot Plus PCs vor
Microsoft rollt heute endlich Recall für alle Copilot Plus PCs aus, nach langer Vorfreude und mehreren Verzögerungen. Diese Funktion, die Screenshots von fast allem, was Sie auf Ih
सूचना (0)
0/200






वैश्विक पहुंच जागरूकता दिवस के उपलक्ष्य में, हम अपने एंड्रॉइड और क्रोम पर उत्पादों में महत्वपूर्ण अपडेट की घोषणा करने के लिए उत्साहित हैं, साथ ही साथ भाषण पहचान उपकरणों पर काम करने वाले डेवलपर्स के लिए नए संसाधन भी। ये AI में प्रगति हमारी डिजिटल दुनिया को अधिक सुलभ और समावेशी बना रही है।
एंड्रॉइड के साथ अधिक AI-संचालित नवाचार
हम पहुंच के प्रति अपनी प्रतिबद्धता को आगे बढ़ा रहे हैं, Google AI और Gemini को मोबाइल अनुभवों में, विशेष रूप से दृष्टि और श्रवण के लिए, बुनकर।
Gemini और TalkBack के साथ विवरणों को बढ़ाना
पिछले साल, हमने Gemini की क्षमताओं को Android के स्क्रीन रीडर TalkBack में एकीकृत किया, जिसने छवियों के लिए AI-जनित विवरण प्रदान किए, भले ही alt टेक्स्ट गायब हो। अब, हम इस सुविधा का विस्तार कर रहे हैं। उपयोगकर्ता अब उन छवियों के बारे में प्रश्न पूछ सकते हैं जो वे प्राप्त करते हैं, जैसे कि एक दोस्त की नई गिटार। आप छवि में मेक, रंग या अन्य तत्वों के बारे में पूछ सकते हैं। इसके अलावा, आप अपनी पूरी स्क्रीन के बारे में विवरण और प्रश्न पूछ सकते हैं। उदाहरण के लिए, एक शॉपिंग ऐप पर सेल की खोज करते समय, आप Gemini से किसी आइटम की सामग्री के बारे में पूछ सकते हैं या उपलब्ध छूट की जांच कर सकते हैं।
कैप्शन के पीछे भावनाओं को बेहतर समझना
Expressive Captions के साथ, आपका Android डिवाइस अब अधिकांश ऐप्स में रियल-टाइम कैप्शन प्रदान करता है, जो न केवल क्या कहा जाता है, बल्कि कैसे कहा जाता है, उसे भी कैद करता है। हमने एक नई अवधि विशेषता जोड़ी है जो शब्दों को खींचने पर हाइलाइट करती है, जैसे कि खेल प्रसारण में "amaaazing shot" सुनना या वीडियो संदेश में खींचा हुआ "nooooo"। आपको ध्वनियों के लिए अधिक लेबल भी मिलेंगे, जैसे कि सीटी बजाना या गले की सफाई। यह अपडेट अंग्रेजी में उपलब्ध है, जो Android 15 और उससे ऊपर चलने वाले डिवाइसों के लिए U.S., U.K., कनाडा और ऑस्ट्रेलिया में उपलब्ध है।
दुनिया भर में भाषण पहचान में सुधार
2019 में Project Euphonia को लॉन्च करने के बाद से, हमारा उद्देश्य गैर-मानक भाषण पैटर्न वाले लोगों के लिए भाषण पहचान को अधिक सुलभ बनाना रहा है। हम अब दुनिया भर के डेवलपर्स और संगठनों के लिए समर्थन का विस्तार कर रहे हैं, उन्हें इस प्रौद्योगिकी को अधिक भाषाओं और सांस्कृतिक संदर्भों में अनुकूलित करने में मदद कर रहे हैं।
नए डेवलपर संसाधन
वैश्विक सुलभ उपकरणों के पारिस्थितिकी तंत्र को बढ़ावा देने के लिए, हम Project Euphonia के GitHub पेज के माध्यम से डेवलपर्स को हमारे ओपन-सोर्स रिपॉजिटरी तक पहुंच प्रदान कर रहे हैं। इससे उन्हें व्यक्तिगत ऑडियो उपकरण विकसित करने के लिए या अपने मॉडल को विविध भाषण पैटर्न को पहचानने के लिए प्रशिक्षित करने में मदद मिलती है।
अफ्रीका में नए प्रोजेक्ट्स के लिए समर्थन
इस वर्ष की शुरुआत में, हमने Google.org के साथ साझेदारी की है, जो University College London को डिजिटल भाषा समावेशन केंद्र (CDLI) स्थापित करने में मदद कर रहा है। CDLI अफ्रीका भर में अंग्रेजी भाषा के गैर-वक्ताओं के लिए भाषण पहचान प्रौद्योगिकी को बेहतर बनाने पर केंद्रित है। वे 10 अफ्रीकी भाषाओं में ओपन-सोर्स डेटासेट बना रहे हैं, नए भाषण पहचान मॉडल विकसित कर रहे हैं, और इस क्षेत्र में संगठनों और डेवलपर्स के व्यापक समुदाय का समर्थन कर रहे हैं।
विद्यार्थियों के लिए पहुंच विकल्पों का विस्तार
विकलांग छात्रों के लिए पहुंच उपकरण महत्वपूर्ण भूमिका निभाते हैं, चेहरे के इशारों का उपयोग करके Chromebooks को Face Control के साथ नेविगेट करने से लेकर Reading Mode के साथ अपने पढ़ने के अनुभव को अनुकूलित करने तक। अब, जब Chromebooks का उपयोग करते हुए College Board के Bluebook टेस्टिंग ऐप के साथ SAT और Advanced Placement परीक्षाओं के लिए, छात्रों को Google की सभी निर्मित पहुंच सुविधाओं तक पहुंच मिलेगी, जिसमें ChromeVox स्क्रीन रीडर और Dictation शामिल हैं, साथ ही College Board के अपने डिजिटल परीक्षण उपकरण भी।
क्रोम को अधिक सुलभ बनाना
2 बिलियन से अधिक दैनिक उपयोगकर्ताओं के साथ, हम लगातार क्रोम की पहुंच में सुधार करने के लिए काम कर रहे हैं। स्क्रीन रीडर उपयोगकर्ताओं के लिए लाइव कैप्शन और छवि विवरण इस प्रयास का हिस्सा हैं।
क्रोम पर PDFs तक आसानी से पहुंचना
पहले, डेस्कटॉप क्रोम में स्कैन किए गए PDFs स्क्रीन रीडर के लिए सुलभ नहीं थे। अब, ऑप्टिकल कैरेक्टर रिकॉग्निशन (OCR) के साथ, क्रोम इन PDFs को पहचान सकता है, जिससे आप उन्हें हाइलाइट, कॉपी, टेक्स्ट की खोज कर सकते हैं और अपने स्क्रीन रीडर का उपयोग करके उन्हें पढ़ सकते हैं।
पेज ज़ूम के साथ आसानी से पढ़ना
एंड्रॉइड के लिए क्रोम पर पेज ज़ूम अब आपको वेबपेज की लेआउट या आपके ब्राउज़िंग अनुभव को बदले बिना टेक्स्ट का आकार बढ़ाने देता है, जैसा कि क्रोम डेस्कटॉप पर काम करता है। आप अपनी ज़ूम प्राथमिकताओं को सभी पेजों या विशिष्ट पेजों पर लागू करने के लिए सेट कर सकते हैं।
इस सुविधा का उपयोग करने के लिए, बस क्रोम के ऊपरी दाएं कोने में तीन-डॉट मेनू पर टैप करें और अपनी ज़ूम सेटिंग्स को समायोजित करें।












