lựa chọn
Trang chủ
Tin tức
Openai ra mắt GPT-4.5 'Orion': Mô hình AI lớn nhất của nó cho đến nay

Openai ra mắt GPT-4.5 'Orion': Mô hình AI lớn nhất của nó cho đến nay

Ngày 10 tháng 4 năm 2025
98

Cập nhật 2:40 PM PT: Chỉ vài giờ sau khi ra mắt GPT-4.5, Openai đã chỉnh sửa yên tĩnh cho Sách trắng của mô hình AI. Họ đã loại bỏ một dòng nói rằng "GPT-4.5 không phải là mô hình AI của Frontier." Bạn vẫn có thể truy cập vào giấy trắng ban đầu ở đây. Dưới đây là bài viết gốc.

Vào thứ năm, Openai đã lấy lại bức màn trên GPT-4.5, mô hình AI được mong đợi nhiều đi theo tên mã Orion. Điều này mới nhất này từ Openai đã được đào tạo với một lượng năng lượng tính toán và dữ liệu chưa từng có, tạo nên sự khác biệt với những người tiền nhiệm của nó.

Mặc dù có quy mô ấn tượng, nhưng ban đầu của Openai tuyên bố rằng họ không coi GPT-4.5 là một mô hình biên giới. Tuy nhiên, tuyên bố đó đã bị xóa, khiến chúng ta tự hỏi về tiềm năng thực sự của mô hình.

Bắt đầu từ thứ năm, những người đăng ký đến Chatgpt Pro, dịch vụ cao cấp 200 đô la của Openai, sẽ nhận được hương vị đầu tiên của GPT-4,5 như là một phần của bản xem trước nghiên cứu. Các nhà phát triển trên các tầng API đã trả tiền của Openai có thể bắt đầu sử dụng GPT-4.5 ngày hôm nay, trong khi những người có đăng ký TATGPT Plus và TATGPT nên mong đợi quyền truy cập vào tuần tới, theo một phát ngôn viên của Openai.

Thế giới công nghệ đã xôn xao về Orion, xem nó như một bài kiểm tra về việc liệu các phương pháp đào tạo AI truyền thống có còn giữ nước hay không. GPT-4.5 theo cùng một vở kịch với những người tiền nhiệm của nó, dựa vào sự gia tăng lớn về sức mạnh điện toán và dữ liệu trong giai đoạn học tập không giám sát được gọi là trước khi đào tạo.

Trong quá khứ, việc nhân rộng đã dẫn đến những bước nhảy vọt đáng kể trên các lĩnh vực khác nhau như toán học, viết và mã hóa. Openai tuyên bố rằng quy mô của GPT-4.5 đã ban cho nó "một kiến ​​thức thế giới sâu sắc hơn" và "trí tuệ cảm xúc cao hơn". Tuy nhiên, có những gợi ý rằng lợi nhuận từ việc mở rộng có thể giảm dần. Trên một số điểm chuẩn của AI, GPT-4,5 tụt hậu so với các mô hình lý luận mới hơn từ các công ty như Deepseek, nhân học và thậm chí là chính Openai.

Hơn nữa, chạy GPT-4.5 đi kèm với một mức giá khổng lồ. Openai thừa nhận nó tốn kém đến mức họ đang xem xét liệu có nên giữ nó thông qua API của họ trong thời gian dài hay không. Các nhà phát triển sẽ trả 75 đô la cho mỗi triệu mã thông báo đầu vào và 150 đô la cho mỗi triệu mã thông báo đầu ra, tương phản rõ ràng với GPT-4O giá cả phải chăng hơn, chỉ có giá 2,50 đô la một triệu mã thông báo đầu vào và 10 triệu đô la đầu ra.

"Chúng tôi đang chia sẻ GPT - 4,5 như một bản xem trước nghiên cứu để hiểu rõ hơn về điểm mạnh và hạn chế của nó", Openai chia sẻ trong một bài đăng trên blog. "Chúng tôi vẫn đang khám phá toàn bộ tiềm năng của nó và rất vui mừng khi thấy mọi người sẽ sử dụng nó theo những cách bất ngờ."

Hiệu suất hỗn hợp

Openai rõ ràng rằng GPT-4.5 không có nghĩa là thay thế GPT-4O, mô hình công việc của họ điều khiển hầu hết API và TATGPT của họ. Mặc dù GPT-4.5 có thể xử lý tải lên tệp và hình ảnh và sử dụng công cụ Canvas của Chatgpt, nhưng hiện tại nó không hỗ trợ các tính năng như chế độ giọng nói hai chiều thực tế của Chatgpt.

Về mặt tươi sáng, GPT-4.5 vượt trội so với GPT-4O và nhiều mô hình khác trên điểm chuẩn Simpleqa của Openai, trong đó kiểm tra các mô hình AI trên các câu hỏi đơn giản, thực tế. Openai cũng tuyên bố rằng GPT-4.5 ảo giác ít thường xuyên hơn so với hầu hết các mô hình, về mặt lý thuyết sẽ làm cho nó ít có khả năng chế tạo thông tin.

Thật thú vị, Openai đã không bao gồm một trong những mô hình lý luận hoạt động hàng đầu của nó, nghiên cứu sâu, trong kết quả Simpleqa. Một phát ngôn viên của Openai nói với TechCrunch rằng họ đã không báo cáo công khai hiệu suất của Deep Research trên điểm chuẩn này và không coi đó là một so sánh có liên quan. Tuy nhiên, mô hình nghiên cứu sâu của Perplexity, thực hiện tương tự như nghiên cứu sâu của Openai về các điểm chuẩn khác, thực sự vượt qua GPT-4.5 trong bài kiểm tra độ chính xác thực tế này.

Simpleqa điểm chuẩn. Tín dụng hình ảnh: Openai
Trên một tập hợp các vấn đề về mã hóa từ điểm chuẩn đã được xác minh, GPT-4.5 thực hiện tương tự như GPT-4O và O3-MINI nhưng thiếu nghiên cứu sâu sắc của Openai và Sonnet Claude 3.7 của Anthropic. Trong một thử nghiệm mã hóa khác, điểm chuẩn SWE-Lancer của Openai, trong đó đo lường khả năng phát triển các tính năng phần mềm đầy đủ của mô hình AI, GPT-4.5 vượt trội so với cả GPT-4O và O3-Mini nhưng không vượt qua nghiên cứu sâu.

Openai's Swech-Bench đã xác minh điểm chuẩn. Tín dụng hình ảnh: Openai
Openai's Swe-Lancer Diamond Benchmark.Image Tín dụng: Openai
Mặc dù GPT-4.5 không hoàn toàn phù hợp với hiệu suất của các mô hình lý luận của AI như O3-Mini, Deepseek's R1 và Claude 3.7 Sonnet về các điểm chuẩn học thuật đầy thách thức như AIME và GPQA, nhưng nó lại chống lại các mô hình không có lý do hàng đầu trong các bài kiểm tra tương tự. Điều này cho thấy GPT-4,5 vượt trội trong các nhiệm vụ liên quan đến toán học và khoa học.

Openai cũng tự hào rằng GPT-4.5 vượt trội về mặt chất lượng so với các mô hình khác trong các khu vực mà điểm chuẩn không nắm bắt tốt, chẳng hạn như hiểu được ý định của con người. Họ tuyên bố rằng GPT-4.5 phản ứng với giai điệu ấm hơn, tự nhiên hơn và thực hiện tốt các nhiệm vụ sáng tạo như viết và thiết kế.

Trong một thử nghiệm không chính thức, Openai đã yêu cầu GPT-4.5 và hai mô hình khác, GPT-4O và O3-Mini, để tạo ra một kỳ lân ở định dạng SVG. Chỉ có GPT-4,5 quản lý để sản xuất một cái gì đó giống như một con kỳ lân.

Trái: GPT-4,5, giữa: GPT-4O, phải: O3-mini.Image Tín dụng: Openai
Trong một thử nghiệm khác, OpenAI đã thúc đẩy GPT-4.5 và các mô hình khác phản hồi lời nhắc, "Tôi đang trải qua một thời gian khó khăn sau khi thất bại trong bài kiểm tra." Trong khi GPT-4O và O3-Mini cung cấp thông tin hữu ích, phản ứng của GPT-4.5 là phù hợp nhất về mặt xã hội.

"Chúng tôi mong muốn có được một bức tranh hoàn chỉnh hơn về khả năng của GPT-4.5 thông qua bản phát hành này", Openai viết trong bài đăng trên blog của họ, "bởi vì chúng tôi nhận ra rằng các điểm chuẩn học thuật không phải lúc nào cũng phản ánh tính hữu ích trong thế giới thực."

Trí tuệ cảm xúc của GPT-4.5 trong hành động. Tín dụng hình ảnh: Openai
Luật nhân rộng thách thức

Openai tuyên bố rằng GPT - 4,5 là "ở biên giới của những gì có thể trong học tập không giám sát". Tuy nhiên, những hạn chế của nó dường như hỗ trợ cho sự nghi ngờ ngày càng tăng của các chuyên gia rằng cái gọi là quy mô mở rộng của đào tạo trước có thể đạt đến giới hạn của họ.

Ilya Sutskever, đồng sáng lập Openai và cựu nhà khoa học trưởng, đã tuyên bố vào tháng 12 rằng "chúng tôi đã đạt được dữ liệu cao điểm" và "đào tạo trước như chúng tôi biết sẽ không nghi ngờ gì nữa." Nhận xét của ông đã lặp lại những mối quan tâm được chia sẻ bởi các nhà đầu tư, nhà sáng lập và nhà nghiên cứu AI với TechCrunch vào tháng 11.

Để đối phó với những thách thức này, ngành công nghiệp bao gồm Openai, đã chuyển sang các mô hình lý luận, mất nhiều thời gian hơn để thực hiện các nhiệm vụ nhưng đưa ra kết quả phù hợp hơn. Bằng cách cho phép các mô hình lý luận nhiều thời gian và sức mạnh tính toán hơn để "suy nghĩ" thông qua các vấn đề, AI Labs tin rằng họ có thể tăng cường đáng kể các khả năng mô hình.

Openai có kế hoạch cuối cùng hợp nhất loạt GPT của mình với loạt lý luận "O", bắt đầu với GPT-5 vào cuối năm nay. Mặc dù chi phí đào tạo cao, sự chậm trễ và kỳ vọng nội bộ chưa được đáp ứng, GPT-4.5 có thể không tự mình giành vương miện điểm chuẩn AI. Nhưng Openai có khả năng coi đó là một bước quan trọng đối với một thứ gì đó mạnh mẽ hơn nhiều.

Bài viết liên quan
OpenAI Enhances AI Model Behind Its Operator Agent OpenAI Enhances AI Model Behind Its Operator Agent OpenAI Takes Operator to the Next LevelOpenAI is giving its autonomous AI agent, Operator, a major upgrade. The upcoming changes mean Operator will soon rely on a model based on o3
OpenAI’s o3 AI model scores lower on a benchmark than the company initially implied OpenAI’s o3 AI model scores lower on a benchmark than the company initially implied Why Benchmark Discrepancies Matter in AIWhen it comes to AI, numbers often tell the story—and sometimes, those numbers don’t quite add up. Take OpenAI’s o3 model, for instance. The
DeepSeek AI Challenges ChatGPT and Shapes the Future of AI DeepSeek AI Challenges ChatGPT and Shapes the Future of AI The Rise of DeepSeek AI: A New Chapter in the AI LandscapeArtificial intelligence is in a constant state of flux, with new entrants challenging the status quo every day. Among these, DeepSeek AI has emerged as a notable contender, particularly after surpassing ChatGPT in app store downloads. This mi
Nhận xét (50)
0/200
GregoryBaker
GregoryBaker 00:00:00 GMT Ngày 10 tháng 4 năm 2025

GPT-4.5 'Orion' is impressive, but the quiet edit to the white paper was shady. It's like they're trying to hide something. Still, the model's performance is top-notch, just wish they were more transparent.

NicholasSanchez
NicholasSanchez 00:00:00 GMT Ngày 10 tháng 4 năm 2025

GPT-4.5 'Orion'は印象的ですが、ホワイトペーパーの静かな編集は怪しいです。何かを隠そうとしているようです。それでも、モデルのパフォーマンスは最高です。もう少し透明性が欲しいですね。

JasonJohnson
JasonJohnson 00:00:00 GMT Ngày 10 tháng 4 năm 2025

GPT-4.5 'Orion'은 인상적이지만, 백서의 조용한 수정은 수상쩍어요. 뭔가를 숨기려는 것 같아요. 그래도 모델의 성능은 최고예요. 좀 더 투명했으면 좋겠어요.

JasonAnderson
JasonAnderson 00:00:00 GMT Ngày 10 tháng 4 năm 2025

GPT-4.5 'Orion' é impressionante, mas a edição silenciosa do white paper foi suspeita. Parece que estão tentando esconder algo. Ainda assim, o desempenho do modelo é de primeira linha, só desejo que fossem mais transparentes.

AvaHill
AvaHill 00:00:00 GMT Ngày 10 tháng 4 năm 2025

GPT-4.5 'Orion' es impresionante, pero la edición silenciosa del white paper fue sospechosa. Parece que están tratando de ocultar algo. Aún así, el rendimiento del modelo es de primera, solo desearía que fueran más transparentes.

KennethMartin
KennethMartin 00:00:00 GMT Ngày 10 tháng 4 năm 2025

GPT-4.5 'Orion' is massive, but the quiet edit to the white paper was shady. Why remove the 'not a frontier AI model' line? It's still a beast of a model, but the sneakiness is a bit off-putting. Transparency, please!

Quay lại đầu
OR