Google intègre le modèle vocal Chirp 3 dans Vertex AI

L'IA générative concernait en grande partie des interfaces textuelles pour créer du texte, des images, etc. Mais maintenant, la voix passe sous les projecteurs, et ça arrive fort. Google vient de laisser tomber de grandes nouvelles: à partir de la semaine prochaine, ils déploient le chirp 3 - leurs derniers modèles de discours à texte et de texte à dispection HD - sur leur plate-forme Vertex AI.
La semaine dernière, Google s'est un peu glissé dans une annonce que Chirp 3 introduirait huit nouvelles voix dans 31 langues. Cette technologie est parfaite pour construire des assistants vocaux, fouetter les livres audio et même créer des agents de support et des voix off pour des vidéos. Ils ont partagé cela lors d'un événement dans les bureaux DeepMind de Google à Londres.
Google n'est pas le seul à sauter dans le train de la voix de l'IA. La semaine dernière, Sesame, les gens derrière les voix de l'IA super réalistes "Maya" et "Miles", ont annoncé qu'ils laissaient les développeurs construire leurs propres applications et services personnalisés en utilisant leur technologie.
Google essaie de contrôler les choses avec Chirp 3 en mettant en place des restrictions d'utilisation pour éviter une mauvaise utilisation. "Nous travaillons simplement sur certaines de ces choses avec notre équipe de sécurité", a déclaré Thomas Kurian, PDG de Google Cloud, lors d'un événement d'actualités aujourd'hui.
ElevenLabs est un autre grand joueur du jeu de la voix de l'IA, ayant ratissé des millions pour développer leurs services vocaux.
Avec Chirp 3, Google l'a introduit dans la même famille que leurs dernières versions du LLM Gemini, qui sont toujours en test, ainsi que leur modèle de modèle de génération d'image et l'outil de génération vidéo Veo 2 coûteux.
Il est toujours en l'air, que Chirp 3 sonne aussi "réel" que d'autres voix d'IA (le travail de Sesame est assez impressionnant). Mais comme l'a souligné Demis Hassabis, le PDG de Deepmind, c'est un marathon, pas un sprint.
"À court terme ... cette idée que [l'IA est] une solution miracle pour tout dans les deux prochaines années, je ne vois pas cela se produire pour l'instant. Je pense que nous sommes encore à quelques années de quelque chose comme Agi se déroule", a-t-il déclaré. "Ça va changer les choses ... au cours de la prochaine décennie, donc le moyen à plus long. C'est l'un de ces moments intéressants dans le temps."
Google a lancé Vertex AI en 2021 en tant que place pour les développeurs afin de créer des services d'apprentissage automatique dans le cloud. C'était bien avant l'IA, et surtout l'IA génératrice, est devenu le sujet brûlant qu'il est maintenant, grâce aux services GPT d'Openai.
Depuis lors, Google pousse le sommet de l'IA, essayant de suivre Microsoft et Amazon, qui construisent également des outils d'IA génératifs pour les développeurs. Avec Vertex IA, les développeurs peuvent non seulement s'appuyer sur les Gémeaux, mais également classer les données, former des modèles et les préparer à la production. Il sera intéressant de voir si Google décide d'ouvrir leur jardin à des modèles d'autres créateurs.
Google est à ce truc de voix "chirp" depuis des années, en commençant à revenir quand ils l'ont utilisé comme nom de code pour affronter Alexa d'Amazon.
Article connexe
Imagen 4:谷歌最新AI圖像生成器
Google近日發表最新圖像生成AI模型「Imagen 4」,宣稱將為用戶帶來比前代Imagen 3更出色的視覺體驗。本週稍早在Google I/O 2025大會亮相的這款新模型,被譽為在畫質與多樣性方面取得重大突破。Google表示,Imagen 4特別擅長處理織物質感、水珠反光與動物毛髮等精細紋理,同時能輕鬆駕馭寫實與抽象風格。其輸出解析度最高可達2K,
谷歌Gemini代碼助手強化AI編程代理功能
Google旗下AI程式開發助手Gemini Code Assist近期推出全新「代理模式」功能,目前開放預覽體驗。在最新Cloud Next大會上,Google展示這些AI代理如何突破性處理複雜編程任務——從Google文件規格書直接生成完整應用程式,或輕鬆實現跨語言程式碼轉換。更令人驚豔的是,開發者現可在Android Studio等整合開發環境中直接啟
谷歌的人工智慧未來基金可能需要謹慎行事
Google 的新 AI 投資計劃:監管審查下的戰略轉變Google 最近宣布設立 AI 未來基金(AI Futures Fund),這標誌著這家科技巨頭在其塑造人工智慧未來的征程中邁出了大膽的一步。該計劃旨在為初創公司提供急需的資金、早期接觸仍在開發中的尖端人工智慧模型,以及來自 Google 內部專家的指導。儘管這不是 Google 第一次涉足初創企業生
commentaires (50)
0/200
DonaldBrown
10 avril 2025 00:00:00 UTC
Chirp 3 is a game-changer for voice AI! The integration with Vertex AI is smooth, but the HD text-to-speech is where it shines. Only wish it was a bit faster. Still, a solid step forward for voice tech!
0
PaulLopez
10 avril 2025 00:00:00 UTC
Chirp 3は音声AIのゲームチェンジャーです!Vertex AIとの統合はスムーズですが、HDテキスト読み上げが特に優れています。もう少し速ければいいのにと思います。それでも、音声技術にとって前進の一歩です!
0
CarlHill
10 avril 2025 00:00:00 UTC
Chirp 3는 음성 AI의 게임 체인저입니다! Vertex AI와의 통합이 부드럽고, HD 텍스트 음성 변환이 특히 뛰어납니다. 조금 더 빨랐으면 좋겠어요. 그래도 음성 기술에 있어 한 걸음 앞서 나갔습니다!
0
RyanLee
10 avril 2025 00:00:00 UTC
Chirp 3 é um divisor de águas para a IA de voz! A integração com o Vertex AI é suave, mas o texto para fala em HD é onde ele brilha. Só gostaria que fosse um pouco mais rápido. Ainda assim, um passo sólido para a tecnologia de voz!
0
RoyYoung
10 avril 2025 00:00:00 UTC
¡Chirp 3 es un cambio de juego para la IA de voz! La integración con Vertex AI es suave, pero donde realmente brilla es en la conversión de texto a voz en HD. Solo desearía que fuera un poco más rápido. Aún así, un paso sólido hacia adelante para la tecnología de voz!
0
MichaelAdams
10 avril 2025 00:00:00 UTC
Google's move to integrate Chirp 3 into Vertex AI is exciting! Finally, we're getting more voice-based AI tools. I'm curious to see how well it handles different accents and languages. Hope it's not just another overhyped feature that fizzles out!
0
L'IA générative concernait en grande partie des interfaces textuelles pour créer du texte, des images, etc. Mais maintenant, la voix passe sous les projecteurs, et ça arrive fort. Google vient de laisser tomber de grandes nouvelles: à partir de la semaine prochaine, ils déploient le chirp 3 - leurs derniers modèles de discours à texte et de texte à dispection HD - sur leur plate-forme Vertex AI.
La semaine dernière, Google s'est un peu glissé dans une annonce que Chirp 3 introduirait huit nouvelles voix dans 31 langues. Cette technologie est parfaite pour construire des assistants vocaux, fouetter les livres audio et même créer des agents de support et des voix off pour des vidéos. Ils ont partagé cela lors d'un événement dans les bureaux DeepMind de Google à Londres.
Google n'est pas le seul à sauter dans le train de la voix de l'IA. La semaine dernière, Sesame, les gens derrière les voix de l'IA super réalistes "Maya" et "Miles", ont annoncé qu'ils laissaient les développeurs construire leurs propres applications et services personnalisés en utilisant leur technologie.
Google essaie de contrôler les choses avec Chirp 3 en mettant en place des restrictions d'utilisation pour éviter une mauvaise utilisation. "Nous travaillons simplement sur certaines de ces choses avec notre équipe de sécurité", a déclaré Thomas Kurian, PDG de Google Cloud, lors d'un événement d'actualités aujourd'hui.
ElevenLabs est un autre grand joueur du jeu de la voix de l'IA, ayant ratissé des millions pour développer leurs services vocaux.
Avec Chirp 3, Google l'a introduit dans la même famille que leurs dernières versions du LLM Gemini, qui sont toujours en test, ainsi que leur modèle de modèle de génération d'image et l'outil de génération vidéo Veo 2 coûteux.
Il est toujours en l'air, que Chirp 3 sonne aussi "réel" que d'autres voix d'IA (le travail de Sesame est assez impressionnant). Mais comme l'a souligné Demis Hassabis, le PDG de Deepmind, c'est un marathon, pas un sprint.
"À court terme ... cette idée que [l'IA est] une solution miracle pour tout dans les deux prochaines années, je ne vois pas cela se produire pour l'instant. Je pense que nous sommes encore à quelques années de quelque chose comme Agi se déroule", a-t-il déclaré. "Ça va changer les choses ... au cours de la prochaine décennie, donc le moyen à plus long. C'est l'un de ces moments intéressants dans le temps."
Google a lancé Vertex AI en 2021 en tant que place pour les développeurs afin de créer des services d'apprentissage automatique dans le cloud. C'était bien avant l'IA, et surtout l'IA génératrice, est devenu le sujet brûlant qu'il est maintenant, grâce aux services GPT d'Openai.
Depuis lors, Google pousse le sommet de l'IA, essayant de suivre Microsoft et Amazon, qui construisent également des outils d'IA génératifs pour les développeurs. Avec Vertex IA, les développeurs peuvent non seulement s'appuyer sur les Gémeaux, mais également classer les données, former des modèles et les préparer à la production. Il sera intéressant de voir si Google décide d'ouvrir leur jardin à des modèles d'autres créateurs.
Google est à ce truc de voix "chirp" depuis des années, en commençant à revenir quand ils l'ont utilisé comme nom de code pour affronter Alexa d'Amazon.



Chirp 3 is a game-changer for voice AI! The integration with Vertex AI is smooth, but the HD text-to-speech is where it shines. Only wish it was a bit faster. Still, a solid step forward for voice tech!




Chirp 3は音声AIのゲームチェンジャーです!Vertex AIとの統合はスムーズですが、HDテキスト読み上げが特に優れています。もう少し速ければいいのにと思います。それでも、音声技術にとって前進の一歩です!




Chirp 3는 음성 AI의 게임 체인저입니다! Vertex AI와의 통합이 부드럽고, HD 텍스트 음성 변환이 특히 뛰어납니다. 조금 더 빨랐으면 좋겠어요. 그래도 음성 기술에 있어 한 걸음 앞서 나갔습니다!




Chirp 3 é um divisor de águas para a IA de voz! A integração com o Vertex AI é suave, mas o texto para fala em HD é onde ele brilha. Só gostaria que fosse um pouco mais rápido. Ainda assim, um passo sólido para a tecnologia de voz!




¡Chirp 3 es un cambio de juego para la IA de voz! La integración con Vertex AI es suave, pero donde realmente brilla es en la conversión de texto a voz en HD. Solo desearía que fuera un poco más rápido. Aún así, un paso sólido hacia adelante para la tecnología de voz!




Google's move to integrate Chirp 3 into Vertex AI is exciting! Finally, we're getting more voice-based AI tools. I'm curious to see how well it handles different accents and languages. Hope it's not just another overhyped feature that fizzles out!












