

Giám đốc điều hành DeepMind Demis Hassabis công bố tích hợp trong tương lai của các mô hình Song Tử và Veo AI của Google
Ngày 26 tháng 4 năm 2025
KeithGonzález
0

Trong một tập gần đây của Podcast có thể , được đồng tổ chức bởi người đồng sáng lập LinkedIn Reid Hoffman, Giám đốc điều hành của Google Deepmind, Demis Hassabis đã chia sẻ một số tin tức thú vị về kế hoạch của Google. Ông tiết lộ rằng Google đang tìm cách hợp nhất các mô hình AI Song Tử của mình với các mô hình tạo video VEO. Sự hợp nhất này nhằm mục đích tăng cường sự nắm bắt của Song Tử về thế giới vật chất, khiến nó trở nên lão luyện hơn trong việc tìm hiểu các động lực thực tế.
Hassabis nhấn mạnh rằng từ Get-Go, Song Tử được thiết kế để đa phương thức. "Chúng tôi luôn xây dựng Song Tử, mô hình nền tảng của chúng tôi, để được đa phương thức ngay từ đầu", ông giải thích. Động lực đằng sau cách tiếp cận này? Một tầm nhìn cho một trợ lý kỹ thuật số phổ quát có thể thực sự hỗ trợ trong cuộc sống hàng ngày. "Một trợ lý mà thực sự giúp bạn trong thế giới thực," Hassabis xây dựng.
Ngành công nghiệp AI đang dần tiến triển theo hướng mà bạn có thể gọi là mô hình "Omni", những người có khả năng xử lý và tổng hợp các loại phương tiện khác nhau. Ví dụ, các lần lặp Gemini mới nhất của Google có thể tạo ra không chỉ văn bản mà còn cả âm thanh và hình ảnh. Trong khi đó, mô hình mặc định Chatgpt của Openai có thể đánh bật hình ảnh ngay tại chỗ, bao gồm cả nghệ thuật theo phong cách Studio Ghibli thú vị. Amazon không bị bỏ lại phía sau, với kế hoạch tung ra một mô hình "bất kỳ ai" vào cuối năm nay.
Các mô hình Omni này đòi hỏi một lượng dữ liệu đào tạo khổng lồ nghĩ rằng hình ảnh, video, âm thanh và văn bản. Hassabis gợi ý rằng dữ liệu video của VEO chủ yếu đến từ YouTube, một kho báu thuộc sở hữu của Google. "Về cơ bản, bằng cách xem video YouTube - rất nhiều video trên YouTube - [[Veo 2] có thể tìm ra, bạn biết đấy, vật lý của thế giới," ông lưu ý.
Google đã đề cập trước đây với TechCrunch rằng các mô hình của nó "có thể được" đào tạo trên "một số" nội dung YouTube, phù hợp với các thỏa thuận được thực hiện với người tạo YouTube. Điều đáng chú ý là năm ngoái, Google đã mở rộng các điều khoản dịch vụ của mình, một phần để truy cập nhiều dữ liệu hơn để đào tạo các mô hình AI của mình.
Bài viết liên quan
Google在其工作区生产力应用程序中添加了更多的AI工具
Google通过将其顶级AI模型集成到其生产力套件中,增强其双子座功能,从而使工作更加顺畅,更高效,从而加强了游戏。今天,这家技术巨头推出了其工作区产品的一系列更新,介绍了音频概述和管理M的新方法
Google Gemini:有关生成AI应用程序和模型的所有信息
Gemini是什么?Gemini是Google备受期待的下一代生成AI模型家族,它是通过DeepMind和Google Research之间的合作而开发的。它的设计用途广泛,有各种尺寸,以满足不同的需求:双子座Ultra:设计F的强大模型,设计F
三星将Google的双子座整合到Ballie Home Robot
三星周三宣布,通过与Google Cloud的合作,为其家用机器人Ballie进行了令人兴奋的新开发项目。这种合作伙伴关系将使Google的双子座AI集成到Ballie中,使用户可以通过提出各种问题与机器人互动,Gemini将会
Nhận xét (0)
0/200






Trong một tập gần đây của Podcast có thể , được đồng tổ chức bởi người đồng sáng lập LinkedIn Reid Hoffman, Giám đốc điều hành của Google Deepmind, Demis Hassabis đã chia sẻ một số tin tức thú vị về kế hoạch của Google. Ông tiết lộ rằng Google đang tìm cách hợp nhất các mô hình AI Song Tử của mình với các mô hình tạo video VEO. Sự hợp nhất này nhằm mục đích tăng cường sự nắm bắt của Song Tử về thế giới vật chất, khiến nó trở nên lão luyện hơn trong việc tìm hiểu các động lực thực tế.
Hassabis nhấn mạnh rằng từ Get-Go, Song Tử được thiết kế để đa phương thức. "Chúng tôi luôn xây dựng Song Tử, mô hình nền tảng của chúng tôi, để được đa phương thức ngay từ đầu", ông giải thích. Động lực đằng sau cách tiếp cận này? Một tầm nhìn cho một trợ lý kỹ thuật số phổ quát có thể thực sự hỗ trợ trong cuộc sống hàng ngày. "Một trợ lý mà thực sự giúp bạn trong thế giới thực," Hassabis xây dựng.
Ngành công nghiệp AI đang dần tiến triển theo hướng mà bạn có thể gọi là mô hình "Omni", những người có khả năng xử lý và tổng hợp các loại phương tiện khác nhau. Ví dụ, các lần lặp Gemini mới nhất của Google có thể tạo ra không chỉ văn bản mà còn cả âm thanh và hình ảnh. Trong khi đó, mô hình mặc định Chatgpt của Openai có thể đánh bật hình ảnh ngay tại chỗ, bao gồm cả nghệ thuật theo phong cách Studio Ghibli thú vị. Amazon không bị bỏ lại phía sau, với kế hoạch tung ra một mô hình "bất kỳ ai" vào cuối năm nay.
Các mô hình Omni này đòi hỏi một lượng dữ liệu đào tạo khổng lồ nghĩ rằng hình ảnh, video, âm thanh và văn bản. Hassabis gợi ý rằng dữ liệu video của VEO chủ yếu đến từ YouTube, một kho báu thuộc sở hữu của Google. "Về cơ bản, bằng cách xem video YouTube - rất nhiều video trên YouTube - [[Veo 2] có thể tìm ra, bạn biết đấy, vật lý của thế giới," ông lưu ý.
Google đã đề cập trước đây với TechCrunch rằng các mô hình của nó "có thể được" đào tạo trên "một số" nội dung YouTube, phù hợp với các thỏa thuận được thực hiện với người tạo YouTube. Điều đáng chú ý là năm ngoái, Google đã mở rộng các điều khoản dịch vụ của mình, một phần để truy cập nhiều dữ liệu hơn để đào tạo các mô hình AI của mình.












