Bên trong bước tiến AI của Google: Gemini 2.5 suy nghĩ sâu hơn, nói thông minh hơn và mã hóa nhanh hơn

Trang chủ

Tin tức

Ngày 07 tháng 6 năm 2025

AlbertJackson

182

# Gemini # nlp

Bên trong bước tiến AI của Google: Gemini 2.5 suy nghĩ sâu hơn, nói thông minh hơn và mã hóa nhanh hơn

Google Đang Gần Hơn Đến Tầm Nhìn Về Trợ Lý AI Toàn Cầu

Tại sự kiện Google I/O năm nay, công ty tiết lộ những nâng cấp đáng kể cho loạt sản phẩm Gemini 2.5, đặc biệt tập trung vào việc cải thiện khả năng của nó ở nhiều khía cạnh khác nhau. Các phiên bản mới nhất – Gemini 2.5 Flash và 2.5 Pro – hiện thông minh và hiệu quả hơn bao giờ hết. Những tiến bộ này giúp Google tiến gần hơn đến mục tiêu tạo ra một trợ lý AI toàn cầu có khả năng hiểu ngữ cảnh, lập kế hoạch và thực hiện nhiệm vụ một cách mượt mà.

Gemini 2.5 Pro: Đưa Trí Tuệ AI Lên Một Mức Mới

Gemini 2.5 Pro, được Google ca ngợi là mô hình tiên tiến nhất của họ cho đến nay, tự hào có cửa sổ ngữ cảnh lên tới một triệu token chưa từng có. Tính năng này cho phép AI xử lý lượng lớn dữ liệu và duy trì mạch lạc trong các cuộc trò chuyện dài hơn. Tại sự kiện, Giám đốc điều hành của Google DeepMind, Demis Hassabis, bày tỏ sự phấn khích về những tiến bộ đạt được, nói rằng: “Đây là mục tiêu cuối cùng của ứng dụng Gemini: Một AI cá nhân, chủ động và mạnh mẽ.” Một trong những tính năng nổi bật của Gemini 2.5 Pro là sự ra mắt của 'Deep Think', chế độ suy luận tăng cường thử nghiệm. Deep Think cho phép AI phân tích nhiều giả thuyết trước khi đưa ra phản hồi, nâng cao khả năng ra quyết định của nó. Theo Hassabis, sự phát triển này xuất phát từ những hiểu biết thu được trong quá trình tạo ra AlphaGo, nơi thời gian xử lý lâu hơn mang lại kết quả tốt hơn.

Hiệu Nghiệm Ấn Tượng Trên Các Bài Kiểm Tra Benchmark

Deep Think đã chứng minh hiệu suất ấn tượng trên các bài kiểm tra benchmark khó khăn. Ví dụ, nó đạt điểm số đáng kinh ngạc trong Cuộc thi Toán học Olympic Hoa Kỳ 2025 (USAMO) và xuất sắc trên LiveCodeBench, một bài kiểm tra nổi tiếng đánh giá kỹ năng mã hóa cao cấp. Ngoài ra, nó đạt 84,0% trên MMMU, đánh giá hiểu và suy luận đa phương tiện. Dù đạt được những thành tựu này, Google vẫn thận trọng. Hassabis cho biết đội ngũ đang tiến hành đánh giá an toàn toàn diện và thu thập phản hồi từ các chuyên gia trước khi triển khai Deep Think rộng rãi hơn. Hiện tại, nó có sẵn cho người dùng thử tin cậy qua API để nhận phản hồi.

Gemini 2.5 Flash: Một Công Cụ Làm Việc Hằng Ngày

Song song với Gemini 2.5 Pro, Google cũng giới thiệu phiên bản nâng cấp của Gemini 2.5 Flash, được thiết kế cho tốc độ, hiệu quả và tính kinh tế. Hassabis mô tả nó là “ngựa chiến” của loạt sản phẩm, vượt trội trong các bài kiểm tra benchmark về suy luận, đa phương tiện, mã hóa và ngữ cảnh dài. Thực tế, nó chỉ đứng sau Gemini 2.5 Pro trên bảng xếp hạng LMArena. Phiên bản Flash cập nhật này hiệu quả hơn khoảng 20 đến 30%, yêu cầu ít token hơn để thực hiện các tác vụ. Dựa trên phản hồi từ các nhà phát triển, Google đã tinh chỉnh mô hình và cho phép xem trước trong Google AI Studio, Vertex AI và ứng dụng Gemini. Nó sẽ được triển khai đầy đủ cho sản xuất vào đầu tháng Sáu.

Các Tính Năng Mới Trên Cả Hai Mô Hình

Cả Gemini 2.5 Pro và Flash đều nhận được nhiều tính năng mới nhằm nâng cao trải nghiệm tương tác người dùng. Âm thanh bản địa được thêm vào để tạo ra các trải nghiệm trò chuyện tự nhiên hơn, trong khi chức năng chuyển đổi văn bản thành giọng nói hiện hỗ trợ nhiều giọng nói hơn. Người dùng thậm chí có thể hướng dẫn giọng điệu và phong cách của giọng nói, bất kể họ muốn AI nghe như kịch tính hay trầm lắng. Các tính năng giọng nói thử nghiệm khác bao gồm đối thoại cảm xúc, cho phép AI nhận diện cảm xúc trong giọng nói của người dùng và phản hồi phù hợp, và âm thanh chủ động, lọc bỏ tiếng ồn nền. Tầm nhìn ngân sách cũng được giới thiệu, cho phép các nhà phát triển kiểm soát lượng sức mạnh tính toán mà AI sử dụng trước khi phản hồi.

Một Bước Hướng Tới Tương Lai

Những nâng cấp này nhấn mạnh cam kết của Google trong việc thúc đẩy ranh giới của công nghệ AI. Như Kavukcuoglu và Doshi đã lưu ý trong bài viết blog của họ, “Chúng ta đang sống trong một thời đại đáng kinh ngạc trong lịch sử, nơi AI đang làm nên một tương lai tuyệt vời. Đó là sự tiến bộ không ngừng.” Với những cải tiến này, Google chắc chắn đang mở đường cho một tương lai mà các trợ lý AI trở thành người đồng hành không thể thiếu trong cuộc sống hàng ngày của chúng ta.

Bài viết liên quan

Trò chuyện Gemini Nâng cao Khả năng Chỉnh sửa Hình ảnh Ứng dụng trò chuyện Gemini của Google hiện cho phép người dùng chỉnh sửa hình ảnh do AI tạo ra và hình ảnh được tải lên từ điện thoại hoặc máy tính, công ty thông báo trong một bài đăng blog vào thứ T

Google Ra Mắt Deep Think để Nâng Cao Hiệu Suất AI Gemini Google đang nâng cấp các mô hình AI Gemini hàng đầu của mình.Tại Google I/O 2025 vào thứ Ba, công ty đã giới thiệu Deep Think, một chế độ suy luận tiên tiến cho mô hình Gemini 2.5 Pro cao cấp. Deep Th

Thí nghiệm Bán lẻ do AI điều khiển thất bại thảm hại tại Anthropic Hãy tưởng tượng giao một cửa hàng nhỏ cho trí tuệ nhân tạo, giao phó mọi thứ từ định giá đến tương tác với khách hàng. Điều gì có thể sai sót?Một nghiên cứu gần đây của Anthropic, công bố vào thứ Sáu,

Nhận xét (0)

0/200

Nộp

Tin tức hàng đầu

Gemini 2.5 Pro hiện không giới hạn và rẻ hơn Claude, GPT-4O Máy phát video AI hàng đầu vào năm 2025: Pika Labs so với các lựa chọn thay thế Openai tăng cường trợ lý giọng nói AI để trò chuyện tốt hơn Notebooklm mở rộng toàn cầu, thêm các slide và kiểm tra thực tế nâng cao Người sáng lập AI để tiêu thụ sức mạnh của nhiều NYC vào năm 2026, người sáng lập Trải nghiệm ô chữ I/O do AI hỗ trợ Lồng tiếng AI: Hướng dẫn Tối ưu để Tạo Giọng Nói Thực tế Giám đốc điều hành NVIDIA làm rõ những quan niệm sai lầm về tác động thị trường của Deepseek Các trung tâm dữ liệu của Hoa Kỳ có thể mở khóa 76 GW công suất năng lượng mới Các phương pháp thử nghiệm AI 2025 của ZDNet được tiết lộ

Hơn

Đặc trưng