Google tiết lộ mô hình Gemini AI hiệu quả
Ngày 21 tháng 4 năm 2025
JasonKing
33

Google được thiết lập để tiết lộ một mô hình AI mới, Gemini 2.5 Flash, hứa hẹn hiệu suất mạnh mẽ trong khi ưu tiên hiệu quả. Mô hình này sẽ được tích hợp vào Vertex AI, nền tảng của Google để phát triển AI. Theo Google, Gemini 2.5 Flash cung cấp các khả năng tính toán "động và có thể kiểm soát", cho phép các nhà phát triển điều chỉnh thời gian xử lý theo độ phức tạp của các truy vấn của họ.
Trong một bài đăng trên blog được chia sẻ với TechCrunch, Google đã tuyên bố: "Bạn có thể điều chỉnh tốc độ, độ chính xác và cân bằng chi phí cho các nhu cầu cụ thể của bạn. Tính linh hoạt này là chìa khóa để tối ưu hóa hiệu suất flash trong các ứng dụng có khối lượng lớn, nhạy cảm với chi phí." Cách tiếp cận này đến vào thời điểm mà các chi phí liên quan đến các mô hình AI hàng đầu đang tăng lên. Các mô hình như Gemini 2.5 Flash, thân thiện với ngân sách hơn trong khi vẫn mang lại hiệu suất vững chắc, phục vụ như một sự thay thế hấp dẫn cho các tùy chọn đắt tiền hơn, mặc dù có một chút đánh đổi chính xác.
Gemini 2.5 Flash được phân loại thành một mô hình "lý luận", tương tự như O3-mini của Openai và R1 của Deepseek. Những mô hình này mất nhiều thời gian hơn để trả lời khi họ kiểm tra thực tế câu trả lời của họ, đảm bảo độ tin cậy. Google nhấn mạnh rằng 2.5 Flash đặc biệt phù hợp cho các ứng dụng "khối lượng lớn" và "thời gian thực", chẳng hạn như dịch vụ khách hàng và phân tích tài liệu.
Google mô tả 2.5 flash là một "mô hình công việc" trong bài đăng trên blog của họ, nói: "Nó được tối ưu hóa dành riêng cho độ trễ thấp và giảm chi phí. Đó là động cơ lý tưởng cho các trợ lý ảo đáp ứng và các công cụ tóm tắt thời gian thực trong đó hiệu quả ở quy mô là chìa khóa." Tuy nhiên, Google đã không công bố báo cáo an toàn hoặc kỹ thuật cho mô hình này, điều này khiến cho việc xác định điểm mạnh và điểm yếu của nó trở nên khó khăn hơn. Công ty đã đề cập trước đây với TechCrunch rằng họ không phát hành các báo cáo cho các mô hình mà nó cho là "thử nghiệm".
Vào thứ Tư, Google cũng đã tiết lộ kế hoạch mở rộng các mô hình Song Tử, bao gồm 2.5 flash, cho các môi trường tại chỗ bắt đầu trong quý thứ ba. Các mô hình này sẽ có sẵn trên Google Distributed Cloud (GDC), giải pháp tại chỗ của Google được thiết kế cho các máy khách có nhu cầu quản trị dữ liệu nghiêm ngặt. Google đang hợp tác với NVIDIA để làm cho các mô hình Gemini tương thích với các hệ thống NVIDIA Blackwell tuân thủ GDC, khách hàng có thể mua trực tiếp từ Google hoặc thông qua các kênh ưa thích khác.
Bài viết liên quan
Notion ra mắt ứng dụng email được tăng cường AI cho Gmail
Notion ra mắt Notion Mail: Một ứng dụng email được cung cấp bởi AI cho Gmail vào thứ ba, Notion đã tiết lộ Notion Mail, một ứng dụng email được cung cấp AI mới được thiết kế dành riêng cho người dùng Gmail. Công cụ sáng tạo này tích hợp liền mạch với nền tảng quản lý quy trình công việc rộng hơn của khái niệm, nâng cao năng suất của LE
Báo cáo mô hình AI mới nhất của Google thiếu các chi tiết an toàn quan trọng, các chuyên gia cho biết
Vào thứ năm, nhiều tuần sau khi ra mắt mô hình AI mới nhất và tiên tiến nhất của mình, Gemini 2.5 Pro, Google đã phát hành một báo cáo kỹ thuật chi tiết kết quả đánh giá an toàn nội bộ của mình. Tuy nhiên, các chuyên gia đã chỉ trích báo cáo vì thiếu chi tiết, khiến cho việc hiểu đầy đủ về nồi
Tìm kiếm Google giới thiệu 'chế độ AI' cho các truy vấn phức tạp, đa phần
Google tiết lộ "Chế độ AI" khi tìm kiếm đối thủ Perplexity AI và Chatgptgoogle đang đẩy mạnh trò chơi của mình trong AI Arena với sự ra mắt của tính năng "AI Mode" thử nghiệm trong công cụ tìm kiếm. Nhằm mục đích tham gia vào tìm kiếm của Perplexity AI và Openai, chế độ mới này đã được công bố vào Wed
Nhận xét (0)
0/200






Google được thiết lập để tiết lộ một mô hình AI mới, Gemini 2.5 Flash, hứa hẹn hiệu suất mạnh mẽ trong khi ưu tiên hiệu quả. Mô hình này sẽ được tích hợp vào Vertex AI, nền tảng của Google để phát triển AI. Theo Google, Gemini 2.5 Flash cung cấp các khả năng tính toán "động và có thể kiểm soát", cho phép các nhà phát triển điều chỉnh thời gian xử lý theo độ phức tạp của các truy vấn của họ.
Trong một bài đăng trên blog được chia sẻ với TechCrunch, Google đã tuyên bố: "Bạn có thể điều chỉnh tốc độ, độ chính xác và cân bằng chi phí cho các nhu cầu cụ thể của bạn. Tính linh hoạt này là chìa khóa để tối ưu hóa hiệu suất flash trong các ứng dụng có khối lượng lớn, nhạy cảm với chi phí." Cách tiếp cận này đến vào thời điểm mà các chi phí liên quan đến các mô hình AI hàng đầu đang tăng lên. Các mô hình như Gemini 2.5 Flash, thân thiện với ngân sách hơn trong khi vẫn mang lại hiệu suất vững chắc, phục vụ như một sự thay thế hấp dẫn cho các tùy chọn đắt tiền hơn, mặc dù có một chút đánh đổi chính xác.
Gemini 2.5 Flash được phân loại thành một mô hình "lý luận", tương tự như O3-mini của Openai và R1 của Deepseek. Những mô hình này mất nhiều thời gian hơn để trả lời khi họ kiểm tra thực tế câu trả lời của họ, đảm bảo độ tin cậy. Google nhấn mạnh rằng 2.5 Flash đặc biệt phù hợp cho các ứng dụng "khối lượng lớn" và "thời gian thực", chẳng hạn như dịch vụ khách hàng và phân tích tài liệu.
Google mô tả 2.5 flash là một "mô hình công việc" trong bài đăng trên blog của họ, nói: "Nó được tối ưu hóa dành riêng cho độ trễ thấp và giảm chi phí. Đó là động cơ lý tưởng cho các trợ lý ảo đáp ứng và các công cụ tóm tắt thời gian thực trong đó hiệu quả ở quy mô là chìa khóa." Tuy nhiên, Google đã không công bố báo cáo an toàn hoặc kỹ thuật cho mô hình này, điều này khiến cho việc xác định điểm mạnh và điểm yếu của nó trở nên khó khăn hơn. Công ty đã đề cập trước đây với TechCrunch rằng họ không phát hành các báo cáo cho các mô hình mà nó cho là "thử nghiệm".
Vào thứ Tư, Google cũng đã tiết lộ kế hoạch mở rộng các mô hình Song Tử, bao gồm 2.5 flash, cho các môi trường tại chỗ bắt đầu trong quý thứ ba. Các mô hình này sẽ có sẵn trên Google Distributed Cloud (GDC), giải pháp tại chỗ của Google được thiết kế cho các máy khách có nhu cầu quản trị dữ liệu nghiêm ngặt. Google đang hợp tác với NVIDIA để làm cho các mô hình Gemini tương thích với các hệ thống NVIDIA Blackwell tuân thủ GDC, khách hàng có thể mua trực tiếp từ Google hoặc thông qua các kênh ưa thích khác.











