Openai ra mắt GPT-4.5 'Orion': Mô hình AI lớn nhất của nó cho đến nay

Trang chủ

Tin tức

Ngày 10 tháng 4 năm 2025

JuanJackson

159

# ChatGPT # openai

Cập nhật 2:40 PM PT: Chỉ vài giờ sau khi ra mắt GPT-4.5, Openai đã chỉnh sửa yên tĩnh cho Sách trắng của mô hình AI. Họ đã loại bỏ một dòng nói rằng "GPT-4.5 không phải là mô hình AI của Frontier." Bạn vẫn có thể truy cập vào giấy trắng ban đầu ở đây. Dưới đây là bài viết gốc.

Vào thứ năm, Openai đã lấy lại bức màn trên GPT-4.5, mô hình AI được mong đợi nhiều đi theo tên mã Orion. Điều này mới nhất này từ Openai đã được đào tạo với một lượng năng lượng tính toán và dữ liệu chưa từng có, tạo nên sự khác biệt với những người tiền nhiệm của nó.

Mặc dù có quy mô ấn tượng, nhưng ban đầu của Openai tuyên bố rằng họ không coi GPT-4.5 là một mô hình biên giới. Tuy nhiên, tuyên bố đó đã bị xóa, khiến chúng ta tự hỏi về tiềm năng thực sự của mô hình.

Bắt đầu từ thứ năm, những người đăng ký đến Chatgpt Pro, dịch vụ cao cấp 200 đô la của Openai, sẽ nhận được hương vị đầu tiên của GPT-4,5 như là một phần của bản xem trước nghiên cứu. Các nhà phát triển trên các tầng API đã trả tiền của Openai có thể bắt đầu sử dụng GPT-4.5 ngày hôm nay, trong khi những người có đăng ký TATGPT Plus và TATGPT nên mong đợi quyền truy cập vào tuần tới, theo một phát ngôn viên của Openai.

Thế giới công nghệ đã xôn xao về Orion, xem nó như một bài kiểm tra về việc liệu các phương pháp đào tạo AI truyền thống có còn giữ nước hay không. GPT-4.5 theo cùng một vở kịch với những người tiền nhiệm của nó, dựa vào sự gia tăng lớn về sức mạnh điện toán và dữ liệu trong giai đoạn học tập không giám sát được gọi là trước khi đào tạo.

Trong quá khứ, việc nhân rộng đã dẫn đến những bước nhảy vọt đáng kể trên các lĩnh vực khác nhau như toán học, viết và mã hóa. Openai tuyên bố rằng quy mô của GPT-4.5 đã ban cho nó "một kiến thức thế giới sâu sắc hơn" và "trí tuệ cảm xúc cao hơn". Tuy nhiên, có những gợi ý rằng lợi nhuận từ việc mở rộng có thể giảm dần. Trên một số điểm chuẩn của AI, GPT-4,5 tụt hậu so với các mô hình lý luận mới hơn từ các công ty như Deepseek, nhân học và thậm chí là chính Openai.

Hơn nữa, chạy GPT-4.5 đi kèm với một mức giá khổng lồ. Openai thừa nhận nó tốn kém đến mức họ đang xem xét liệu có nên giữ nó thông qua API của họ trong thời gian dài hay không. Các nhà phát triển sẽ trả 75 đô la cho mỗi triệu mã thông báo đầu vào và 150 đô la cho mỗi triệu mã thông báo đầu ra, tương phản rõ ràng với GPT-4O giá cả phải chăng hơn, chỉ có giá 2,50 đô la một triệu mã thông báo đầu vào và 10 triệu đô la đầu ra.

"Chúng tôi đang chia sẻ GPT - 4,5 như một bản xem trước nghiên cứu để hiểu rõ hơn về điểm mạnh và hạn chế của nó", Openai chia sẻ trong một bài đăng trên blog. "Chúng tôi vẫn đang khám phá toàn bộ tiềm năng của nó và rất vui mừng khi thấy mọi người sẽ sử dụng nó theo những cách bất ngờ."

Hiệu suất hỗn hợp

Openai rõ ràng rằng GPT-4.5 không có nghĩa là thay thế GPT-4O, mô hình công việc của họ điều khiển hầu hết API và TATGPT của họ. Mặc dù GPT-4.5 có thể xử lý tải lên tệp và hình ảnh và sử dụng công cụ Canvas của Chatgpt, nhưng hiện tại nó không hỗ trợ các tính năng như chế độ giọng nói hai chiều thực tế của Chatgpt.

Về mặt tươi sáng, GPT-4.5 vượt trội so với GPT-4O và nhiều mô hình khác trên điểm chuẩn Simpleqa của Openai, trong đó kiểm tra các mô hình AI trên các câu hỏi đơn giản, thực tế. Openai cũng tuyên bố rằng GPT-4.5 ảo giác ít thường xuyên hơn so với hầu hết các mô hình, về mặt lý thuyết sẽ làm cho nó ít có khả năng chế tạo thông tin.

Thật thú vị, Openai đã không bao gồm một trong những mô hình lý luận hoạt động hàng đầu của nó, nghiên cứu sâu, trong kết quả Simpleqa. Một phát ngôn viên của Openai nói với TechCrunch rằng họ đã không báo cáo công khai hiệu suất của Deep Research trên điểm chuẩn này và không coi đó là một so sánh có liên quan. Tuy nhiên, mô hình nghiên cứu sâu của Perplexity, thực hiện tương tự như nghiên cứu sâu của Openai về các điểm chuẩn khác, thực sự vượt qua GPT-4.5 trong bài kiểm tra độ chính xác thực tế này.

Simpleqa điểm chuẩn. Tín dụng hình ảnh: Openai

Trên một tập hợp các vấn đề về mã hóa từ điểm chuẩn đã được xác minh, GPT-4.5 thực hiện tương tự như GPT-4O và O3-MINI nhưng thiếu nghiên cứu sâu sắc của Openai và Sonnet Claude 3.7 của Anthropic. Trong một thử nghiệm mã hóa khác, điểm chuẩn SWE-Lancer của Openai, trong đó đo lường khả năng phát triển các tính năng phần mềm đầy đủ của mô hình AI, GPT-4.5 vượt trội so với cả GPT-4O và O3-Mini nhưng không vượt qua nghiên cứu sâu.

Openai's Swech-Bench đã xác minh điểm chuẩn. Tín dụng hình ảnh: Openai

Openai's Swe-Lancer Diamond Benchmark.Image Tín dụng: Openai

Mặc dù GPT-4.5 không hoàn toàn phù hợp với hiệu suất của các mô hình lý luận của AI như O3-Mini, Deepseek's R1 và Claude 3.7 Sonnet về các điểm chuẩn học thuật đầy thách thức như AIME và GPQA, nhưng nó lại chống lại các mô hình không có lý do hàng đầu trong các bài kiểm tra tương tự. Điều này cho thấy GPT-4,5 vượt trội trong các nhiệm vụ liên quan đến toán học và khoa học.

Openai cũng tự hào rằng GPT-4.5 vượt trội về mặt chất lượng so với các mô hình khác trong các khu vực mà điểm chuẩn không nắm bắt tốt, chẳng hạn như hiểu được ý định của con người. Họ tuyên bố rằng GPT-4.5 phản ứng với giai điệu ấm hơn, tự nhiên hơn và thực hiện tốt các nhiệm vụ sáng tạo như viết và thiết kế.

Trong một thử nghiệm không chính thức, Openai đã yêu cầu GPT-4.5 và hai mô hình khác, GPT-4O và O3-Mini, để tạo ra một kỳ lân ở định dạng SVG. Chỉ có GPT-4,5 quản lý để sản xuất một cái gì đó giống như một con kỳ lân.

Trái: GPT-4,5, giữa: GPT-4O, phải: O3-mini.Image Tín dụng: Openai

Trong một thử nghiệm khác, OpenAI đã thúc đẩy GPT-4.5 và các mô hình khác phản hồi lời nhắc, "Tôi đang trải qua một thời gian khó khăn sau khi thất bại trong bài kiểm tra." Trong khi GPT-4O và O3-Mini cung cấp thông tin hữu ích, phản ứng của GPT-4.5 là phù hợp nhất về mặt xã hội.

"Chúng tôi mong muốn có được một bức tranh hoàn chỉnh hơn về khả năng của GPT-4.5 thông qua bản phát hành này", Openai viết trong bài đăng trên blog của họ, "bởi vì chúng tôi nhận ra rằng các điểm chuẩn học thuật không phải lúc nào cũng phản ánh tính hữu ích trong thế giới thực."

Trí tuệ cảm xúc của GPT-4.5 trong hành động. Tín dụng hình ảnh: Openai
Luật nhân rộng thách thức

Openai tuyên bố rằng GPT - 4,5 là "ở biên giới của những gì có thể trong học tập không giám sát". Tuy nhiên, những hạn chế của nó dường như hỗ trợ cho sự nghi ngờ ngày càng tăng của các chuyên gia rằng cái gọi là quy mô mở rộng của đào tạo trước có thể đạt đến giới hạn của họ.

Ilya Sutskever, đồng sáng lập Openai và cựu nhà khoa học trưởng, đã tuyên bố vào tháng 12 rằng "chúng tôi đã đạt được dữ liệu cao điểm" và "đào tạo trước như chúng tôi biết sẽ không nghi ngờ gì nữa." Nhận xét của ông đã lặp lại những mối quan tâm được chia sẻ bởi các nhà đầu tư, nhà sáng lập và nhà nghiên cứu AI với TechCrunch vào tháng 11.

Để đối phó với những thách thức này, ngành công nghiệp bao gồm Openai, đã chuyển sang các mô hình lý luận, mất nhiều thời gian hơn để thực hiện các nhiệm vụ nhưng đưa ra kết quả phù hợp hơn. Bằng cách cho phép các mô hình lý luận nhiều thời gian và sức mạnh tính toán hơn để "suy nghĩ" thông qua các vấn đề, AI Labs tin rằng họ có thể tăng cường đáng kể các khả năng mô hình.

Openai có kế hoạch cuối cùng hợp nhất loạt GPT của mình với loạt lý luận "O", bắt đầu với GPT-5 vào cuối năm nay. Mặc dù chi phí đào tạo cao, sự chậm trễ và kỳ vọng nội bộ chưa được đáp ứng, GPT-4.5 có thể không tự mình giành vương miện điểm chuẩn AI. Nhưng Openai có khả năng coi đó là một bước quan trọng đối với một thứ gì đó mạnh mẽ hơn nhiều.

128

Bài viết liên quan

Cựu Kỹ sư OpenAI Chia sẻ Thông tin về Văn hóa Công ty và Tăng trưởng Nhanh chóng Ba tuần trước, Calvin French-Owen, một kỹ sư đã đóng góp vào một sản phẩm chủ chốt của OpenAI, đã rời công ty.Gần đây, anh ấy đã chia sẻ một bài đăng blog hấp dẫn, mô tả chi tiết một năm làm việc tại

Google Ra Mắt Các Mô Hình AI Gemini 2.5 Sẵn Sàng Sản Xuất để Cạnh Tranh với OpenAI trên Thị Trường Doanh Nghiệp Google tăng cường chiến lược AI vào thứ Hai, ra mắt các mô hình Gemini 2.5 tiên tiến cho doanh nghiệp và giới thiệu biến thể tiết kiệm chi phí để cạnh tranh về giá và hiệu suất.Công ty thuộc sở hữu củ

Meta cung cấp lương cao cho nhân tài AI, phủ nhận tiền thưởng ký hợp đồng 100 triệu USD Meta đang thu hút các nhà nghiên cứu AI đến phòng thí nghiệm siêu trí tuệ mới của mình với các gói lương thưởng trị giá hàng triệu USD. Tuy nhiên, các tuyên bố về tiền thưởng ký hợp đồng 100 triệu USD

Nhận xét (58)

0/200

Nộp

JeffreyRamirez

02:01:00 GMT+07:00 Ngày 07 tháng 8 năm 2025

Wow, GPT-4.5 Orion sounds massive! But that sneaky white paper edit? Shady move, OpenAI. Makes me wonder what else they’re hiding. 🤔 Still, can’t wait to see what this beast can do!

RalphPerez

22:01:00 GMT+07:00 Ngày 05 tháng 8 năm 2025

Wow, GPT-4.5 Orion sounds like a beast! But that sneaky white paper edit raises some eyebrows 🤔. Why hide that it’s not a frontier model? Smells like they’re dodging some big questions about what this thing can really do.

WillPerez

11:59:29 GMT+07:00 Ngày 23 tháng 7 năm 2025

Wow, GPT-4.5 Orion sounds massive! But that sneaky white paper edit about it not being a frontier model? Shady move, OpenAI. Makes me wonder what else they’re tweaking behind the scenes. 🧐 Anyone else suspicious?

FredWhite

06:21:15 GMT+07:00 Ngày 16 tháng 4 năm 2025

Just tried out GPT-4.5 'Orion' and wow, it's a beast! The responses are so detailed and nuanced, it's like having a super-smart friend on speed dial. Only thing is, it's a bit too advanced for my simple questions sometimes 🤓. Still, a must-try for AI enthusiasts!

WillieHernández

19:54:33 GMT+07:00 Ngày 15 tháng 4 năm 2025

GPT-4.5『オリオン』を試してみたけど、すごいね！回答が詳細でニュアンスも豊か、まるで超賢い友達がすぐそばにいるみたい。ただ、私の簡単な質問にはちょっと高度すぎるかな🤓。それでも、AIファンには試してほしいよ！

FrankSmith

06:57:47 GMT+07:00 Ngày 15 tháng 4 năm 2025

¡GPT-4.5 'Orion' es una bestia! He estado jugando con él y los resultados son impresionantes. ¿La edición silenciosa en el white paper? Movimiento astuto, OpenAI. ¡No puedo esperar a ver qué más tienen en mente! 🚀

Tin tức hàng đầu

Gemini 2.5 Pro hiện không giới hạn và rẻ hơn Claude, GPT-4O Máy phát video AI hàng đầu vào năm 2025: Pika Labs so với các lựa chọn thay thế Lồng tiếng AI: Hướng dẫn Tối ưu để Tạo Giọng Nói Thực tế Openai tăng cường trợ lý giọng nói AI để trò chuyện tốt hơn Notebooklm mở rộng toàn cầu, thêm các slide và kiểm tra thực tế nâng cao Các trung tâm dữ liệu của Hoa Kỳ có thể mở khóa 76 GW công suất năng lượng mới Người sáng lập AI để tiêu thụ sức mạnh của nhiều NYC vào năm 2026, người sáng lập Sao chép giọng nói AI: Hướng dẫn tối thượng để làm chủ chuyển đổi giọng nói Trải nghiệm ô chữ I/O do AI hỗ trợ Giám đốc điều hành NVIDIA làm rõ những quan niệm sai lầm về tác động thị trường của Deepseek

Hơn

Đặc trưng