グーグルのジェミニ・ライブAIアシスタント、ビジュアルで対応を強化
グーグルは、会話型AIアシスタント、ジェミニ・ライブに一連の新機能を導入する。来週から、ジェミニ・ライブはカメラフィードを使用しながら、画面上のオブジェクトを直接ハイライトする機能を獲得し、アシスタントがより正確に特定のアイテムを視覚的に示すことができるようになる。
例えば、たくさんの工具の中から特定の工具を探す必要がある場合、スマホのカメラを品揃えに向けるだけで、ジェミニ・ライブがディスプレイ上に正しい工具の輪郭を描く。この視覚的なガイダンスは、8月28日に発表されたばかりのPixel 10端末でデビューする。その後、グーグルはこの機能を他のアンドロイド端末にも同時に拡大し、iOSにも数週間以内に対応する予定だ。

Gemini Liveは、見てほしいものの周りにボックスを配置する :グーグルグーグルはまた、より深いアプリの統合を展開しており、近い将来、ジェミニ・ライブがメッセージ、電話、時計と連携できるようになる。予定より遅れていることに気づいたとき、ジェミニと道順を相談することを想像してみてほしい。あなたは今、アシスタントに割り込んで言うことができる:「このルートで大丈夫です。アレックスに10分ほど遅れるというメッセージを送ってください"。ジェミニは、あなたが確認して送信できるようにテキストを下書きする。

Gemini Liveは近いうちに、電話をかけたり、テキストを下書きするのにも役立つだろう :グーグル関連
- GoogleのGemini AIは、よりパーソナライズされたインタラクションのために、ユーザーの詳細を自動的に記憶する。
- 最新のPixelデバイスは、ジェネレーティブAIをカメラシステムに直接統合している。
最後に、グーグルはGemini Liveの音声モデルを改良し、イントネーション、リズム、テンポなど、チャットボットの自然な発話要素を大幅に強化する。例えば、ストレスの多い話題に対してより穏やかに話すなど。
ChatGPTのカスタマイズ可能な音声スタイルを彷彿とさせる機能だ。さらに、登場人物や歴史上の人物の視点から物語をドラマチックに再現するよう依頼された場合、ジェミニは、より鮮明で没入感のある物語体験を作り出すためにアクセントを取り入れることができる。
関連記事
カカオ・モビリティ、物理AIに向けたレベル4自動運転のロードマップを提示
カカオ・モビリティは、フィジカルAI戦略の一環として、レベル4の自動運転技術を自社開発する計画だ。ソウルCOEXで開催された「2026ワールドITショー」のカンファレンスにおいて、カカオモビリティのフィジカルAI部門長兼副社長であるキム・ジンギュ氏がロードマップを発表した。同氏の講演は、フィジカルAI時代におけるモビリティプラットフォームを軸とした自動運転サービスに焦点を当てたものだった。聯合
Google、インドでChrome向け「Gemini」の提供を開始
水曜日、GoogleはChrome向けGeminiの統合機能を、インド、カナダ、ニュージーランドを含む新たな地域へ拡大すると発表した。この展開により、デスクトップユーザーはサイドバーからGeminiにアクセスできるようになり、画面上のコンテンツについてGoogleのAIチャットボットに質問したり、Gmail、Keep、Drive、YouTubeから情報を取得したり、タブの内容を比較したりすることが
バリー・ディラー:AGIの実現が近づく中、サム・アルトマンへの信頼は重要ではない
億万長者のメディア界の巨頭であるバリー・ディラー氏は、最近の報道でそのように示唆されているにもかかわらず、OpenAIのCEOサム・アルトマン氏が信頼できない人物だとは考えていない。今週開催されたウォール・ストリート・ジャーナル紙主催の「Future of Everything」カンファレンスで講演したディラー氏は、一部の元同僚や取締役から、時折人を利用したり欺いたりする傾向があるとの非難を受けて
関連特集おすすめ
コメント (0)
0/500
グーグルは、会話型AIアシスタント、ジェミニ・ライブに一連の新機能を導入する。来週から、ジェミニ・ライブはカメラフィードを使用しながら、画面上のオブジェクトを直接ハイライトする機能を獲得し、アシスタントがより正確に特定のアイテムを視覚的に示すことができるようになる。
例えば、たくさんの工具の中から特定の工具を探す必要がある場合、スマホのカメラを品揃えに向けるだけで、ジェミニ・ライブがディスプレイ上に正しい工具の輪郭を描く。この視覚的なガイダンスは、8月28日に発表されたばかりのPixel 10端末でデビューする。その後、グーグルはこの機能を他のアンドロイド端末にも同時に拡大し、iOSにも数週間以内に対応する予定だ。

グーグルはまた、より深いアプリの統合を展開しており、近い将来、ジェミニ・ライブがメッセージ、電話、時計と連携できるようになる。予定より遅れていることに気づいたとき、ジェミニと道順を相談することを想像してみてほしい。あなたは今、アシスタントに割り込んで言うことができる:「このルートで大丈夫です。アレックスに10分ほど遅れるというメッセージを送ってください"。ジェミニは、あなたが確認して送信できるようにテキストを下書きする。

関連
- GoogleのGemini AIは、よりパーソナライズされたインタラクションのために、ユーザーの詳細を自動的に記憶する。
- 最新のPixelデバイスは、ジェネレーティブAIをカメラシステムに直接統合している。
最後に、グーグルはGemini Liveの音声モデルを改良し、イントネーション、リズム、テンポなど、チャットボットの自然な発話要素を大幅に強化する。例えば、ストレスの多い話題に対してより穏やかに話すなど。
ChatGPTのカスタマイズ可能な音声スタイルを彷彿とさせる機能だ。さらに、登場人物や歴史上の人物の視点から物語をドラマチックに再現するよう依頼された場合、ジェミニは、より鮮明で没入感のある物語体験を作り出すためにアクセントを取り入れることができる。
Google、インドでChrome向け「Gemini」の提供を開始
水曜日、GoogleはChrome向けGeminiの統合機能を、インド、カナダ、ニュージーランドを含む新たな地域へ拡大すると発表した。この展開により、デスクトップユーザーはサイドバーからGeminiにアクセスできるようになり、画面上のコンテンツについてGoogleのAIチャットボットに質問したり、Gmail、Keep、Drive、YouTubeから情報を取得したり、タブの内容を比較したりすることが
バリー・ディラー:AGIの実現が近づく中、サム・アルトマンへの信頼は重要ではない
億万長者のメディア界の巨頭であるバリー・ディラー氏は、最近の報道でそのように示唆されているにもかかわらず、OpenAIのCEOサム・アルトマン氏が信頼できない人物だとは考えていない。今週開催されたウォール・ストリート・ジャーナル紙主催の「Future of Everything」カンファレンスで講演したディラー氏は、一部の元同僚や取締役から、時折人を利用したり欺いたりする傾向があるとの非難を受けて





家






