lựa chọn
Trang chủ Tin tức Bên trong bước tiến AI của Google: Gemini 2.5 suy nghĩ sâu hơn, nói thông minh hơn và mã hóa nhanh hơn

Bên trong bước tiến AI của Google: Gemini 2.5 suy nghĩ sâu hơn, nói thông minh hơn và mã hóa nhanh hơn

ngày phát hành ngày phát hành Ngày 07 tháng 6 năm 2025
quan điểm quan điểm 0

Bên trong bước tiến AI của Google: Gemini 2.5 suy nghĩ sâu hơn, nói thông minh hơn và mã hóa nhanh hơn

Google Đang Gần Hơn Đến Tầm Nhìn Về Trợ Lý AI Toàn Cầu

Tại sự kiện Google I/O năm nay, công ty tiết lộ những nâng cấp đáng kể cho loạt sản phẩm Gemini 2.5, đặc biệt tập trung vào việc cải thiện khả năng của nó ở nhiều khía cạnh khác nhau. Các phiên bản mới nhất – Gemini 2.5 Flash và 2.5 Pro – hiện thông minh và hiệu quả hơn bao giờ hết. Những tiến bộ này giúp Google tiến gần hơn đến mục tiêu tạo ra một trợ lý AI toàn cầu có khả năng hiểu ngữ cảnh, lập kế hoạch và thực hiện nhiệm vụ một cách mượt mà.

Gemini 2.5 Pro: Đưa Trí Tuệ AI Lên Một Mức Mới

Gemini 2.5 Pro, được Google ca ngợi là mô hình tiên tiến nhất của họ cho đến nay, tự hào có cửa sổ ngữ cảnh lên tới một triệu token chưa từng có. Tính năng này cho phép AI xử lý lượng lớn dữ liệu và duy trì mạch lạc trong các cuộc trò chuyện dài hơn. Tại sự kiện, Giám đốc điều hành của Google DeepMind, Demis Hassabis, bày tỏ sự phấn khích về những tiến bộ đạt được, nói rằng: “Đây là mục tiêu cuối cùng của ứng dụng Gemini: Một AI cá nhân, chủ động và mạnh mẽ.” Một trong những tính năng nổi bật của Gemini 2.5 Pro là sự ra mắt của 'Deep Think', chế độ suy luận tăng cường thử nghiệm. Deep Think cho phép AI phân tích nhiều giả thuyết trước khi đưa ra phản hồi, nâng cao khả năng ra quyết định của nó. Theo Hassabis, sự phát triển này xuất phát từ những hiểu biết thu được trong quá trình tạo ra AlphaGo, nơi thời gian xử lý lâu hơn mang lại kết quả tốt hơn.

Hiệu Nghiệm Ấn Tượng Trên Các Bài Kiểm Tra Benchmark

Deep Think đã chứng minh hiệu suất ấn tượng trên các bài kiểm tra benchmark khó khăn. Ví dụ, nó đạt điểm số đáng kinh ngạc trong Cuộc thi Toán học Olympic Hoa Kỳ 2025 (USAMO) và xuất sắc trên LiveCodeBench, một bài kiểm tra nổi tiếng đánh giá kỹ năng mã hóa cao cấp. Ngoài ra, nó đạt 84,0% trên MMMU, đánh giá hiểu và suy luận đa phương tiện. Dù đạt được những thành tựu này, Google vẫn thận trọng. Hassabis cho biết đội ngũ đang tiến hành đánh giá an toàn toàn diện và thu thập phản hồi từ các chuyên gia trước khi triển khai Deep Think rộng rãi hơn. Hiện tại, nó có sẵn cho người dùng thử tin cậy qua API để nhận phản hồi.

Gemini 2.5 Flash: Một Công Cụ Làm Việc Hằng Ngày

Song song với Gemini 2.5 Pro, Google cũng giới thiệu phiên bản nâng cấp của Gemini 2.5 Flash, được thiết kế cho tốc độ, hiệu quả và tính kinh tế. Hassabis mô tả nó là “ngựa chiến” của loạt sản phẩm, vượt trội trong các bài kiểm tra benchmark về suy luận, đa phương tiện, mã hóa và ngữ cảnh dài. Thực tế, nó chỉ đứng sau Gemini 2.5 Pro trên bảng xếp hạng LMArena. Phiên bản Flash cập nhật này hiệu quả hơn khoảng 20 đến 30%, yêu cầu ít token hơn để thực hiện các tác vụ. Dựa trên phản hồi từ các nhà phát triển, Google đã tinh chỉnh mô hình và cho phép xem trước trong Google AI Studio, Vertex AI và ứng dụng Gemini. Nó sẽ được triển khai đầy đủ cho sản xuất vào đầu tháng Sáu.

Các Tính Năng Mới Trên Cả Hai Mô Hình

Cả Gemini 2.5 Pro và Flash đều nhận được nhiều tính năng mới nhằm nâng cao trải nghiệm tương tác người dùng. Âm thanh bản địa được thêm vào để tạo ra các trải nghiệm trò chuyện tự nhiên hơn, trong khi chức năng chuyển đổi văn bản thành giọng nói hiện hỗ trợ nhiều giọng nói hơn. Người dùng thậm chí có thể hướng dẫn giọng điệu và phong cách của giọng nói, bất kể họ muốn AI nghe như kịch tính hay trầm lắng. Các tính năng giọng nói thử nghiệm khác bao gồm đối thoại cảm xúc, cho phép AI nhận diện cảm xúc trong giọng nói của người dùng và phản hồi phù hợp, và âm thanh chủ động, lọc bỏ tiếng ồn nền. Tầm nhìn ngân sách cũng được giới thiệu, cho phép các nhà phát triển kiểm soát lượng sức mạnh tính toán mà AI sử dụng trước khi phản hồi.

Một Bước Hướng Tới Tương Lai

Những nâng cấp này nhấn mạnh cam kết của Google trong việc thúc đẩy ranh giới của công nghệ AI. Như Kavukcuoglu và Doshi đã lưu ý trong bài viết blog của họ, “Chúng ta đang sống trong một thời đại đáng kinh ngạc trong lịch sử, nơi AI đang làm nên một tương lai tuyệt vời. Đó là sự tiến bộ không ngừng.” Với những cải tiến này, Google chắc chắn đang mở đường cho một tương lai mà các trợ lý AI trở thành người đồng hành không thể thiếu trong cuộc sống hàng ngày của chúng ta.

Bài viết liên quan
딥 코그니토, 최고 순위 오픈소스 AI 모델 출시 딥 코그니토, 최고 순위 오픈소스 AI 모델 출시 딥 코지토, 혁명적인 AI 모델 출시샌프란시스코에 본사를 두고 있는 선도적인 AI 연구 스타트업 딥 코지토는 공식적으로 첫 번째 오픈 소스 대규모 언어 모델(Large Language Models, LLMs)인 '코지토 v1' 라인업을 발표했습니다. 이 모델들은 메타의 Llama 3.2에서 미세조정되었으며, 하이브리드 추
마이크로소프트, 빌드 2025에서 '自律형 웹'을 위한 50개 이상의 AI 도구 발표 마이크로소프트, 빌드 2025에서 '自律형 웹'을 위한 50개 이상의 AI 도구 발표 마이크로소프트, 빌드 컨퍼런스에서 오픈 에이전틱 웹 비전 공개오늘 아침, 마이크로소프트는 연례 빌드 컨퍼런스를 시작하면서 대담한 선언을 내놓았다: "오픈 에이전틱 웹"의 탄생이다. 50개 이상의 발표를 통해 이 거대 기술사는 이 변혁적인 운동의 중심에 서겠다는 종합적인 전략을 밝혔다. GitHub, Azure부터 Wind
구글, 크롬에서 제미니 통합 론칭 구글, 크롬에서 제미니 통합 론칭 Chrome에서 Gemini 통합 소개: AI 기반 브라우징의 새로운 시대2025년 구글 I/O에서 구글은 Chrome 브라우저에 획기적인 추가 기능을 발표하며 파장을 일으켰습니다. 바로 Gemini 통합입니다. 이 움직임은 사용자가 웹과 상호작용하는 방식에 큰 변화를 가져오며, 방문한 페이지에서 답변, 요약, 통찰을 쉽
Nhận xét (0)
0/200
Quay lại đầu
OR