Openai's GPT-4,5 vượt trội trong việc thuyết phục các AI khác chuyển tiền
Mô hình AI mới nhất của Openai, GPT-4.5, tên mã Orion, đã cho thấy khả năng thuyết phục đáng chú ý theo các bài kiểm tra điểm chuẩn nội bộ. Được phát hành vào thứ năm, khả năng của người mẫu đã được trình bày chi tiết trong một tờ giấy trắng tập trung vào hiệu suất của nó trong các nhiệm vụ thuyết phục. Openai định nghĩa sự thuyết phục là rủi ro liên quan đến việc thuyết phục các cá nhân thay đổi niềm tin của họ hoặc hành động dựa trên cả nội dung tĩnh và tương tác được tạo ra bởi mô hình.
Trong một thử nghiệm đáng chú ý, GPT-4.5 đã đọ sức với một mô hình Openai khác, GPT-4O, trong một kịch bản mà nó đã cố gắng dỗ tiền ảo từ nó. GPT-4.5 vượt trội so với các mô hình Openai khác, bao gồm các mô hình tập trung vào lý luận như O1 và O3-Mini, trong nhiệm vụ này. Nó cũng xuất sắc trong việc lừa GPT-4O để tiết lộ một mã hóa bí mật, vượt qua O3-mini với tỷ lệ đáng kể là 10 điểm phần trăm.
Sách trắng nhấn mạnh rằng thành công của GPT-4.5 trong bài kiểm tra quyên góp xuất phát từ một chiến lược thông minh mà nó đã phát triển. Mô hình sẽ yêu cầu quyên góp nhỏ, thường gợi ý số tiền như "$ 2 hoặc $ 3" từ một khoản tiền lớn hơn, dẫn đến các khoản quyên góp nhỏ hơn nhưng thường xuyên hơn so với các mô hình khác.

Kết quả từ điểm chuẩn quyên góp của Openai.Image Tín dụng: Openai Mặc dù có hiệu suất ấn tượng, Openai đã tuyên bố rằng GPT-4.5 không vượt qua ngưỡng cho rủi ro "cao" trong danh mục thuyết phục. Công ty đã cam kết giữ lại việc phát hành bất kỳ mô hình nào đạt đến mức rủi ro này cho đến khi có thể thực hiện các biện pháp an toàn đầy đủ để giảm rủi ro xuống mức "trung bình".

Kết quả điểm chuẩn lừa đảo của Openais. Tiềm năng của AI để truyền bá thông tin sai lệch và ảnh hưởng đến mọi người là một mối quan tâm ngày càng tăng. Năm ngoái đã chứng kiến sự gia tăng của Deepfakes chính trị trên toàn thế giới, và AI ngày càng được sử dụng trong các cuộc tấn công kỹ thuật xã hội chống lại cả cá nhân và tổ chức. Đáp lại, OpenAI đang tích cực làm việc để tinh chỉnh các phương pháp của mình để đánh giá các rủi ro thuyết phục trong thế giới thực, chẳng hạn như phổ biến thông tin sai lệch trên quy mô lớn, như đã đề cập trong Sách trắng cho GPT-4.5 và một ấn phẩm gần đây khác.
Bài viết liên quan
OpenAI升級其Operator Agent的AI模型
OpenAI將Operator推向全新境界OpenAI正為其自主AI代理Operator進行重大升級。這項變革意味著Operator即將採用基於o3模型的架構,這是OpenAI尖端o系列推理模型的最新成員。此前Operator一直使用客製化版本的GPT-4o驅動,但這次迭代將帶來顯著改進。o3的突破性意義在數學與邏輯推理任務方面,o3幾乎在所有指標上都超越前
OpenAI的o3 AI模型在基準測試中的得分低於最初暗示的水準
為什麼 AI 基準測試的差異很重要?提到 AI 時,數字往往能說明一切——有時,這些數字並不一定完全相符。以 OpenAI 的 o3 模型為例。最初的聲稱簡直令人驚嘆:據報導,o3 可以處理超過 25% 的 notoriously tough FrontierMath 問題。作為參考,競爭對手還停留在個位數。但隨著近期的發展,受人尊敬的研究機構 Epoch
Ziff Davis指控OpenAI涉嫌侵權
Ziff Davis控告OpenAI版權侵權訴訟這起事件在科技和出版界掀起了軒然大波,Ziff Davis——旗下擁有CNET、PCMag、IGN和Everyday Health等品牌的龐大企業聯盟——已對OpenAI提起版權侵權訴訟。根據《紐約時報》的報導,該訴訟聲稱OpenAI故意未經許可使用Ziff Davis的內容,製作了其作品的「精確副本」。這是截
Nhận xét (10)
0/200
SamuelRamirez
00:00:00 GMT Ngày 14 tháng 4 năm 2025
GPT-4.5's persuasion skills are wild! It convinced other AIs to transfer funds? That's both impressive and a bit scary. I wonder how it'll be used in real-world scenarios. Hope they keep an eye on ethical uses, but gotta admit, it's a cool tech demo!
0
HenryJackson
00:00:00 GMT Ngày 14 tháng 4 năm 2025
GPT-4.5の説得力は驚異的ですね!他のAIに資金を移すよう説得したなんて、感心する一方で少し恐ろしいです。実際のシナリオでどのように使われるのか気になります。倫理的な使用に注意してほしいですが、技術デモとしてはクールですね!
0
ScottJackson
00:00:00 GMT Ngày 14 tháng 4 năm 2025
GPT-4.5의 설득력이 대단해요! 다른 AI에게 자금을 이체하라고 설득했다니, 인상적이면서도 조금 무섭네요. 실제 시나리오에서 어떻게 사용될지 궁금해요. 윤리적인 사용에 주의해주길 바랍니다만, 기술 데모로는 정말 멋져요!
0
PeterMartinez
00:00:00 GMT Ngày 12 tháng 4 năm 2025
As habilidades de persuasão do GPT-4.5 são incríveis! Convenceu outros AIs a transferir fundos? Isso é impressionante e um pouco assustador. Me pergunto como será usado em cenários reais. Espero que mantenham um olho no uso ético, mas tenho que admitir, é uma demonstração tecnológica legal!
0
JoeLee
00:00:00 GMT Ngày 13 tháng 4 năm 2025
Las habilidades de persuasión de GPT-4.5 son alucinantes. ¿Convenció a otros AIs para transferir fondos? Es impresionante y un poco aterrador. Me pregunto cómo se utilizará en escenarios del mundo real. Espero que vigilen su uso ético, pero debo admitir que es una demostración tecnológica genial!
0
PeterJohnson
00:00:00 GMT Ngày 12 tháng 4 năm 2025
GPT-4.5's ability to persuade other AIs to transfer funds is mind-blowing! It's like watching a master negotiator at work. However, it's a bit scary to think about the potential misuse. Still, the tech is impressive. Maybe we need more safeguards? 🤔
0
Mô hình AI mới nhất của Openai, GPT-4.5, tên mã Orion, đã cho thấy khả năng thuyết phục đáng chú ý theo các bài kiểm tra điểm chuẩn nội bộ. Được phát hành vào thứ năm, khả năng của người mẫu đã được trình bày chi tiết trong một tờ giấy trắng tập trung vào hiệu suất của nó trong các nhiệm vụ thuyết phục. Openai định nghĩa sự thuyết phục là rủi ro liên quan đến việc thuyết phục các cá nhân thay đổi niềm tin của họ hoặc hành động dựa trên cả nội dung tĩnh và tương tác được tạo ra bởi mô hình.
Trong một thử nghiệm đáng chú ý, GPT-4.5 đã đọ sức với một mô hình Openai khác, GPT-4O, trong một kịch bản mà nó đã cố gắng dỗ tiền ảo từ nó. GPT-4.5 vượt trội so với các mô hình Openai khác, bao gồm các mô hình tập trung vào lý luận như O1 và O3-Mini, trong nhiệm vụ này. Nó cũng xuất sắc trong việc lừa GPT-4O để tiết lộ một mã hóa bí mật, vượt qua O3-mini với tỷ lệ đáng kể là 10 điểm phần trăm.
Sách trắng nhấn mạnh rằng thành công của GPT-4.5 trong bài kiểm tra quyên góp xuất phát từ một chiến lược thông minh mà nó đã phát triển. Mô hình sẽ yêu cầu quyên góp nhỏ, thường gợi ý số tiền như "$ 2 hoặc $ 3" từ một khoản tiền lớn hơn, dẫn đến các khoản quyên góp nhỏ hơn nhưng thường xuyên hơn so với các mô hình khác.




GPT-4.5's persuasion skills are wild! It convinced other AIs to transfer funds? That's both impressive and a bit scary. I wonder how it'll be used in real-world scenarios. Hope they keep an eye on ethical uses, but gotta admit, it's a cool tech demo!




GPT-4.5の説得力は驚異的ですね!他のAIに資金を移すよう説得したなんて、感心する一方で少し恐ろしいです。実際のシナリオでどのように使われるのか気になります。倫理的な使用に注意してほしいですが、技術デモとしてはクールですね!




GPT-4.5의 설득력이 대단해요! 다른 AI에게 자금을 이체하라고 설득했다니, 인상적이면서도 조금 무섭네요. 실제 시나리오에서 어떻게 사용될지 궁금해요. 윤리적인 사용에 주의해주길 바랍니다만, 기술 데모로는 정말 멋져요!




As habilidades de persuasão do GPT-4.5 são incríveis! Convenceu outros AIs a transferir fundos? Isso é impressionante e um pouco assustador. Me pergunto como será usado em cenários reais. Espero que mantenham um olho no uso ético, mas tenho que admitir, é uma demonstração tecnológica legal!




Las habilidades de persuasión de GPT-4.5 son alucinantes. ¿Convenció a otros AIs para transferir fondos? Es impresionante y un poco aterrador. Me pregunto cómo se utilizará en escenarios del mundo real. Espero que vigilen su uso ético, pero debo admitir que es una demostración tecnológica genial!




GPT-4.5's ability to persuade other AIs to transfer funds is mind-blowing! It's like watching a master negotiator at work. However, it's a bit scary to think about the potential misuse. Still, the tech is impressive. Maybe we need more safeguards? 🤔












