Bên trong bước tiến AI của Google: Gemini 2.5 suy nghĩ sâu hơn, nói thông minh hơn và mã hóa nhanh hơn

Google Đang Gần Hơn Đến Tầm Nhìn Về Trợ Lý AI Toàn Cầu
Tại sự kiện Google I/O năm nay, công ty tiết lộ những nâng cấp đáng kể cho loạt sản phẩm Gemini 2.5, đặc biệt tập trung vào việc cải thiện khả năng của nó ở nhiều khía cạnh khác nhau. Các phiên bản mới nhất – Gemini 2.5 Flash và 2.5 Pro – hiện thông minh và hiệu quả hơn bao giờ hết. Những tiến bộ này giúp Google tiến gần hơn đến mục tiêu tạo ra một trợ lý AI toàn cầu có khả năng hiểu ngữ cảnh, lập kế hoạch và thực hiện nhiệm vụ một cách mượt mà.
Gemini 2.5 Pro: Đưa Trí Tuệ AI Lên Một Mức Mới
Gemini 2.5 Pro, được Google ca ngợi là mô hình tiên tiến nhất của họ cho đến nay, tự hào có cửa sổ ngữ cảnh lên tới một triệu token chưa từng có. Tính năng này cho phép AI xử lý lượng lớn dữ liệu và duy trì mạch lạc trong các cuộc trò chuyện dài hơn. Tại sự kiện, Giám đốc điều hành của Google DeepMind, Demis Hassabis, bày tỏ sự phấn khích về những tiến bộ đạt được, nói rằng: “Đây là mục tiêu cuối cùng của ứng dụng Gemini: Một AI cá nhân, chủ động và mạnh mẽ.” Một trong những tính năng nổi bật của Gemini 2.5 Pro là sự ra mắt của 'Deep Think', chế độ suy luận tăng cường thử nghiệm. Deep Think cho phép AI phân tích nhiều giả thuyết trước khi đưa ra phản hồi, nâng cao khả năng ra quyết định của nó. Theo Hassabis, sự phát triển này xuất phát từ những hiểu biết thu được trong quá trình tạo ra AlphaGo, nơi thời gian xử lý lâu hơn mang lại kết quả tốt hơn.
Hiệu Nghiệm Ấn Tượng Trên Các Bài Kiểm Tra Benchmark
Deep Think đã chứng minh hiệu suất ấn tượng trên các bài kiểm tra benchmark khó khăn. Ví dụ, nó đạt điểm số đáng kinh ngạc trong Cuộc thi Toán học Olympic Hoa Kỳ 2025 (USAMO) và xuất sắc trên LiveCodeBench, một bài kiểm tra nổi tiếng đánh giá kỹ năng mã hóa cao cấp. Ngoài ra, nó đạt 84,0% trên MMMU, đánh giá hiểu và suy luận đa phương tiện. Dù đạt được những thành tựu này, Google vẫn thận trọng. Hassabis cho biết đội ngũ đang tiến hành đánh giá an toàn toàn diện và thu thập phản hồi từ các chuyên gia trước khi triển khai Deep Think rộng rãi hơn. Hiện tại, nó có sẵn cho người dùng thử tin cậy qua API để nhận phản hồi.
Gemini 2.5 Flash: Một Công Cụ Làm Việc Hằng Ngày
Song song với Gemini 2.5 Pro, Google cũng giới thiệu phiên bản nâng cấp của Gemini 2.5 Flash, được thiết kế cho tốc độ, hiệu quả và tính kinh tế. Hassabis mô tả nó là “ngựa chiến” của loạt sản phẩm, vượt trội trong các bài kiểm tra benchmark về suy luận, đa phương tiện, mã hóa và ngữ cảnh dài. Thực tế, nó chỉ đứng sau Gemini 2.5 Pro trên bảng xếp hạng LMArena. Phiên bản Flash cập nhật này hiệu quả hơn khoảng 20 đến 30%, yêu cầu ít token hơn để thực hiện các tác vụ. Dựa trên phản hồi từ các nhà phát triển, Google đã tinh chỉnh mô hình và cho phép xem trước trong Google AI Studio, Vertex AI và ứng dụng Gemini. Nó sẽ được triển khai đầy đủ cho sản xuất vào đầu tháng Sáu.
Các Tính Năng Mới Trên Cả Hai Mô Hình
Cả Gemini 2.5 Pro và Flash đều nhận được nhiều tính năng mới nhằm nâng cao trải nghiệm tương tác người dùng. Âm thanh bản địa được thêm vào để tạo ra các trải nghiệm trò chuyện tự nhiên hơn, trong khi chức năng chuyển đổi văn bản thành giọng nói hiện hỗ trợ nhiều giọng nói hơn. Người dùng thậm chí có thể hướng dẫn giọng điệu và phong cách của giọng nói, bất kể họ muốn AI nghe như kịch tính hay trầm lắng. Các tính năng giọng nói thử nghiệm khác bao gồm đối thoại cảm xúc, cho phép AI nhận diện cảm xúc trong giọng nói của người dùng và phản hồi phù hợp, và âm thanh chủ động, lọc bỏ tiếng ồn nền. Tầm nhìn ngân sách cũng được giới thiệu, cho phép các nhà phát triển kiểm soát lượng sức mạnh tính toán mà AI sử dụng trước khi phản hồi.
Một Bước Hướng Tới Tương Lai
Những nâng cấp này nhấn mạnh cam kết của Google trong việc thúc đẩy ranh giới của công nghệ AI. Như Kavukcuoglu và Doshi đã lưu ý trong bài viết blog của họ, “Chúng ta đang sống trong một thời đại đáng kinh ngạc trong lịch sử, nơi AI đang làm nên một tương lai tuyệt vời. Đó là sự tiến bộ không ngừng.” Với những cải tiến này, Google chắc chắn đang mở đường cho một tương lai mà các trợ lý AI trở thành người đồng hành không thể thiếu trong cuộc sống hàng ngày của chúng ta.
Bài viết liên quan
Trò chuyện Gemini Nâng cao Khả năng Chỉnh sửa Hình ảnh
Ứng dụng trò chuyện Gemini của Google hiện cho phép người dùng chỉnh sửa hình ảnh do AI tạo ra và hình ảnh được tải lên từ điện thoại hoặc máy tính, công ty thông báo trong một bài đăng blog vào thứ T
Google Ra Mắt Deep Think để Nâng Cao Hiệu Suất AI Gemini
Google đang nâng cấp các mô hình AI Gemini hàng đầu của mình.Tại Google I/O 2025 vào thứ Ba, công ty đã giới thiệu Deep Think, một chế độ suy luận tiên tiến cho mô hình Gemini 2.5 Pro cao cấp. Deep Th
Thí nghiệm Bán lẻ do AI điều khiển thất bại thảm hại tại Anthropic
Hãy tưởng tượng giao một cửa hàng nhỏ cho trí tuệ nhân tạo, giao phó mọi thứ từ định giá đến tương tác với khách hàng. Điều gì có thể sai sót?Một nghiên cứu gần đây của Anthropic, công bố vào thứ Sáu,
Nhận xét (0)
0/200
Google Đang Gần Hơn Đến Tầm Nhìn Về Trợ Lý AI Toàn Cầu
Tại sự kiện Google I/O năm nay, công ty tiết lộ những nâng cấp đáng kể cho loạt sản phẩm Gemini 2.5, đặc biệt tập trung vào việc cải thiện khả năng của nó ở nhiều khía cạnh khác nhau. Các phiên bản mới nhất – Gemini 2.5 Flash và 2.5 Pro – hiện thông minh và hiệu quả hơn bao giờ hết. Những tiến bộ này giúp Google tiến gần hơn đến mục tiêu tạo ra một trợ lý AI toàn cầu có khả năng hiểu ngữ cảnh, lập kế hoạch và thực hiện nhiệm vụ một cách mượt mà.
Gemini 2.5 Pro: Đưa Trí Tuệ AI Lên Một Mức Mới
Gemini 2.5 Pro, được Google ca ngợi là mô hình tiên tiến nhất của họ cho đến nay, tự hào có cửa sổ ngữ cảnh lên tới một triệu token chưa từng có. Tính năng này cho phép AI xử lý lượng lớn dữ liệu và duy trì mạch lạc trong các cuộc trò chuyện dài hơn. Tại sự kiện, Giám đốc điều hành của Google DeepMind, Demis Hassabis, bày tỏ sự phấn khích về những tiến bộ đạt được, nói rằng: “Đây là mục tiêu cuối cùng của ứng dụng Gemini: Một AI cá nhân, chủ động và mạnh mẽ.” Một trong những tính năng nổi bật của Gemini 2.5 Pro là sự ra mắt của 'Deep Think', chế độ suy luận tăng cường thử nghiệm. Deep Think cho phép AI phân tích nhiều giả thuyết trước khi đưa ra phản hồi, nâng cao khả năng ra quyết định của nó. Theo Hassabis, sự phát triển này xuất phát từ những hiểu biết thu được trong quá trình tạo ra AlphaGo, nơi thời gian xử lý lâu hơn mang lại kết quả tốt hơn.
Hiệu Nghiệm Ấn Tượng Trên Các Bài Kiểm Tra Benchmark
Deep Think đã chứng minh hiệu suất ấn tượng trên các bài kiểm tra benchmark khó khăn. Ví dụ, nó đạt điểm số đáng kinh ngạc trong Cuộc thi Toán học Olympic Hoa Kỳ 2025 (USAMO) và xuất sắc trên LiveCodeBench, một bài kiểm tra nổi tiếng đánh giá kỹ năng mã hóa cao cấp. Ngoài ra, nó đạt 84,0% trên MMMU, đánh giá hiểu và suy luận đa phương tiện. Dù đạt được những thành tựu này, Google vẫn thận trọng. Hassabis cho biết đội ngũ đang tiến hành đánh giá an toàn toàn diện và thu thập phản hồi từ các chuyên gia trước khi triển khai Deep Think rộng rãi hơn. Hiện tại, nó có sẵn cho người dùng thử tin cậy qua API để nhận phản hồi.
Gemini 2.5 Flash: Một Công Cụ Làm Việc Hằng Ngày
Song song với Gemini 2.5 Pro, Google cũng giới thiệu phiên bản nâng cấp của Gemini 2.5 Flash, được thiết kế cho tốc độ, hiệu quả và tính kinh tế. Hassabis mô tả nó là “ngựa chiến” của loạt sản phẩm, vượt trội trong các bài kiểm tra benchmark về suy luận, đa phương tiện, mã hóa và ngữ cảnh dài. Thực tế, nó chỉ đứng sau Gemini 2.5 Pro trên bảng xếp hạng LMArena. Phiên bản Flash cập nhật này hiệu quả hơn khoảng 20 đến 30%, yêu cầu ít token hơn để thực hiện các tác vụ. Dựa trên phản hồi từ các nhà phát triển, Google đã tinh chỉnh mô hình và cho phép xem trước trong Google AI Studio, Vertex AI và ứng dụng Gemini. Nó sẽ được triển khai đầy đủ cho sản xuất vào đầu tháng Sáu.
Các Tính Năng Mới Trên Cả Hai Mô Hình
Cả Gemini 2.5 Pro và Flash đều nhận được nhiều tính năng mới nhằm nâng cao trải nghiệm tương tác người dùng. Âm thanh bản địa được thêm vào để tạo ra các trải nghiệm trò chuyện tự nhiên hơn, trong khi chức năng chuyển đổi văn bản thành giọng nói hiện hỗ trợ nhiều giọng nói hơn. Người dùng thậm chí có thể hướng dẫn giọng điệu và phong cách của giọng nói, bất kể họ muốn AI nghe như kịch tính hay trầm lắng. Các tính năng giọng nói thử nghiệm khác bao gồm đối thoại cảm xúc, cho phép AI nhận diện cảm xúc trong giọng nói của người dùng và phản hồi phù hợp, và âm thanh chủ động, lọc bỏ tiếng ồn nền. Tầm nhìn ngân sách cũng được giới thiệu, cho phép các nhà phát triển kiểm soát lượng sức mạnh tính toán mà AI sử dụng trước khi phản hồi.
Một Bước Hướng Tới Tương Lai
Những nâng cấp này nhấn mạnh cam kết của Google trong việc thúc đẩy ranh giới của công nghệ AI. Như Kavukcuoglu và Doshi đã lưu ý trong bài viết blog của họ, “Chúng ta đang sống trong một thời đại đáng kinh ngạc trong lịch sử, nơi AI đang làm nên một tương lai tuyệt vời. Đó là sự tiến bộ không ngừng.” Với những cải tiến này, Google chắc chắn đang mở đường cho một tương lai mà các trợ lý AI trở thành người đồng hành không thể thiếu trong cuộc sống hàng ngày của chúng ta.












