lựa chọn
Trang chủ
Tin tức
Google ra mắt gia đình mô hình lý luận AI nâng cao

Google ra mắt gia đình mô hình lý luận AI nâng cao

Ngày 10 tháng 4 năm 2025
54

Google ra mắt gia đình mô hình lý luận AI nâng cao

Vào thứ Ba, Google đã triển khai Gemini 2.5, một bộ mô hình AI mới có khả năng thực sự dành một chút thời gian để "suy nghĩ" trước khi đưa ra câu trả lời. Nó giống như họ đang cố gắng bắt chước con người chúng ta, phải không?

Dẫn đầu là Gemini 2.5 Pro Experimental, mà Google tự hào là mô hình thông minh nhất của họ cho đến nay. Cậu bé này có khả năng đa phương thức và có thể xử lý các nhiệm vụ suy luận một cách xuất sắc. Bạn sẽ có thể trải nghiệm nó từ thứ Ba trên Google AI Studio, hoặc nếu bạn chi trả 20 đô la mỗi tháng cho Gemini Advanced, bạn có thể truy cập qua ứng dụng Gemini.

Google rất nghiêm túc với chuyện suy luận này—họ dự định sẽ tích hợp nó vào tất cả các mô hình AI tương lai của mình.

Kể từ khi OpenAI ra mắt mô hình suy luận AI đầu tiên, o1, vào tháng 9 năm 2024, thế giới công nghệ đã chạy đua để bắt kịp. Bây giờ, bạn có Anthropic, DeepSeek, Google và xAI đều tham gia cuộc đua với các mô hình suy luận của riêng mình. Những mô hình này cần nhiều thời gian và sức mạnh tính toán hơn để kiểm tra lại thông tin và suy nghĩ kỹ trước khi trả lời.

Các kỹ thuật suy luận đã thay đổi cuộc chơi cho AI, đặc biệt là trong lĩnh vực toán học và lập trình. Nhiều người trong ngành công nghệ cho rằng các mô hình suy luận này sẽ rất quan trọng đối với các tác nhân AI—những hệ thống tự động có thể hoạt động mà không cần con người giám sát. Nhưng, đúng vậy, chúng cũng đắt đỏ hơn.

Google không lạ lẫm với việc này—họ đã thử nghiệm với các mô hình suy luận trước đây, như phiên bản "suy nghĩ" của Gemini mà họ phát hành vào tháng 12. Nhưng Gemini 2.5? Đó là cú đánh lớn của họ nhằm vượt qua dòng "o" của OpenAI.

Google tuyên bố rằng Gemini 2.5 Pro vượt trội hơn các mô hình cũ của họ và một số đối thủ hàng đầu trên nhiều bài kiểm tra chuẩn. Họ đã tùy chỉnh Gemini 2.5 để xuất sắc trong các ứng dụng web đẹp mắt và các dự án lập trình có thể hoạt động độc lập.

Trong bài kiểm tra Aider Polyglot về chỉnh sửa mã, Gemini 2.5 Pro đạt 68,6%, vượt qua các đối thủ tốt nhất từ OpenAI, Anthropic và DeepSeek. Nhưng trong bài kiểm tra SWE-bench Verified về phát triển phần mềm, nó đạt 63,8%—đủ để đánh bại o3-mini của OpenAI và R1 của DeepSeek, nhưng vẫn thua Claude 3.7 Sonnet của Anthropic, đạt 70,3%.

Sau đó là Bài kiểm tra cuối cùng của Nhân loại, một bài kiểm tra đa phương thức khó khăn với hàng ngàn câu hỏi về toán học, nhân văn và khoa học. Gemini 2.5 Pro đạt 18,8%, tốt hơn hầu hết các tên tuổi lớn ngoài kia.

Ngay từ đầu, Gemini 2.5 Pro đi kèm với cửa sổ ngữ cảnh 1 triệu token—giống như có thể đọc toàn bộ bộ ba "Chúa tể của những chiếc nhẫn" trong một lần ngồi. Và sắp tới, họ dự định tăng gấp đôi lên 2 triệu token.

Google đang giữ kín giá API, nhưng họ hứa sẽ tiết lộ chi tiết trong vài tuần tới.

Bài viết liên quan
Google Ra Mắt Công Cụ Simplify Dựa Trên AI Để Đọc Web Dễ Dàng Hơn Google Ra Mắt Công Cụ Simplify Dựa Trên AI Để Đọc Web Dễ Dàng Hơn Ứng dụng iOS của Google giờ đây bao gồm tính năng “Simplify”, sử dụng AI để chuyển đổi văn bản web phức tạp thành nội dung rõ ràng, dễ hiểu mà không cần rời khỏi trang.Công cụ Simplify, được phát triể
Trò chuyện Gemini Nâng cao Khả năng Chỉnh sửa Hình ảnh Trò chuyện Gemini Nâng cao Khả năng Chỉnh sửa Hình ảnh Ứng dụng trò chuyện Gemini của Google hiện cho phép người dùng chỉnh sửa hình ảnh do AI tạo ra và hình ảnh được tải lên từ điện thoại hoặc máy tính, công ty thông báo trong một bài đăng blog vào thứ T
Google Ra Mắt Deep Think để Nâng Cao Hiệu Suất AI Gemini Google Ra Mắt Deep Think để Nâng Cao Hiệu Suất AI Gemini Google đang nâng cấp các mô hình AI Gemini hàng đầu của mình.Tại Google I/O 2025 vào thứ Ba, công ty đã giới thiệu Deep Think, một chế độ suy luận tiên tiến cho mô hình Gemini 2.5 Pro cao cấp. Deep Th
Nhận xét (35)
0/200
RonaldMartinez
RonaldMartinez 11:43:27 GMT+07:00 Ngày 24 tháng 4 năm 2025

Gemini 2.5 is pretty cool! It's like it pauses to think before answering, which is kinda human-like. I tried it out and it's definitely smarter than the last version. Only thing is, sometimes it takes too long to respond, but hey, I guess that's the price of deep thinking! 🤔

RalphHill
RalphHill 21:53:21 GMT+07:00 Ngày 22 tháng 4 năm 2025

O Gemini 2.5 é bem legal, mas às vezes demora muito para 'pensar'. Entendo que está tentando ser mais humano, mas quando preciso de respostas rápidas, é um pouco frustrante. Ainda assim, é mais inteligente que a maioria dos AIs por aí! 🤖💭

HenryJackson
HenryJackson 13:08:13 GMT+07:00 Ngày 20 tháng 4 năm 2025

ジェミニ2.5は結構クールだけど、時々「考える」のに時間がかかりすぎる。もっと人間っぽくなるのは分かるけど、早く答えが欲しい時はちょっとイライラする。でも、他のAIより賢いからね!🤖💭

JerryGonzález
JerryGonzález 19:28:17 GMT+07:00 Ngày 19 tháng 4 năm 2025

ジェミニ2.5、面白いですね!回答前に少し考えるのが人間っぽくて好きです。試してみたら前より賢くなってるのがわかりました。ただ、時々レスポンスが遅いのが気になりますが、深く考えるための代償だと思えば許せますね!🤔

ScottJohnson
ScottJohnson 03:30:39 GMT+07:00 Ngày 18 tháng 4 năm 2025

Gemini 2.5 thật tuyệt! Nó dừng lại để suy nghĩ trước khi trả lời, rất giống con người. Mình đã thử và thấy nó thông minh hơn phiên bản trước nhiều. Chỉ có điều là đôi khi nó trả lời chậm quá, nhưng mình nghĩ đó là cái giá của việc suy nghĩ sâu sắc, phải không? 🤔

MarkScott
MarkScott 00:52:58 GMT+07:00 Ngày 18 tháng 4 năm 2025

Gemini 2.5 крутой! Он действительно делает паузу, чтобы подумать, прежде чем ответить, что делает его более похожим на человека. Попробовал версию Pro Experimental, и она определенно умнее. Хотелось бы, чтобы он был быстрее! 🤔🚀

Quay lại đầu
OR