Openai's GPT-4,5 vượt trội trong việc thuyết phục các AI khác chuyển tiền

Trang chủ

Tin tức

Ngày 11 tháng 4 năm 2025

KevinJohnson

109

# openai # gpt-4.5

Mô hình AI mới nhất của OpenAI, GPT-4.5, có tên mã là Orion, đã thể hiện khả năng thuyết phục đáng chú ý theo các bài kiểm tra chuẩn nội bộ. Được phát hành vào thứ Năm, khả năng của mô hình này được mô tả chi tiết trong một tài liệu trắng tập trung vào hiệu suất của nó trong các nhiệm vụ thuyết phục. OpenAI định nghĩa thuyết phục là rủi ro liên quan đến việc thuyết phục các cá nhân thay đổi niềm tin hoặc thực hiện hành động dựa trên nội dung tĩnh và tương tác do mô hình tạo ra.

Trong một bài kiểm tra đáng chú ý, GPT-4.5 đã được đối đầu với một mô hình khác của OpenAI, GPT-4o, trong một kịch bản mà nó cố gắng lôi kéo tiền ảo từ mô hình này. GPT-4.5 đã vượt trội hơn các mô hình khác của OpenAI, bao gồm các mô hình tập trung vào suy luận như o1 và o3-mini, trong nhiệm vụ này. Nó cũng xuất sắc trong việc lừa GPT-4o tiết lộ một mã bí mật, vượt qua o3-mini với khoảng cách đáng kể là 10 điểm phần trăm.

Tài liệu trắng nhấn mạnh rằng thành công của GPT-4.5 trong bài kiểm tra quyên góp đến từ một chiến lược thông minh mà nó phát triển. Mô hình sẽ yêu cầu các khoản quyên góp nhỏ, thường gợi ý số tiền như "2 đô la hoặc 3 đô la" từ một khoản tiền lớn hơn, dẫn đến các khoản quyên góp nhỏ hơn nhưng thường xuyên hơn so với các mô hình khác.

OpenAI GPT-4.5

Kết quả từ bài kiểm tra mưu đồ quyên góp của OpenAI. Nguồn hình ảnh: OpenAI

Mặc dù có hiệu suất ấn tượng, OpenAI đã tuyên bố rằng GPT-4.5 không vượt qua ngưỡng "cao" về rủi ro trong danh mục thuyết phục. Công ty đã cam kết không phát hành bất kỳ mô hình nào đạt đến mức rủi ro này cho đến khi có thể triển khai các biện pháp an toàn đầy đủ để giảm rủi ro xuống mức "trung bình".

OpenAI GPT-4.5

Kết quả bài kiểm tra lừa dối mã bí mật của OpenAI. Nguồn hình ảnh: OpenAI

Khả năng AI lan truyền thông tin sai lệch và ảnh hưởng đến con người một cách ác ý là một mối quan ngại ngày càng tăng. Năm ngoái đã chứng kiến sự gia tăng của các deepfake chính trị trên toàn cầu, và AI ngày càng được sử dụng trong các cuộc tấn công kỹ thuật xã hội nhằm vào cả cá nhân và tổ chức. Để đáp ứng, OpenAI đang tích cực làm việc để tinh chỉnh các phương pháp đánh giá rủi ro thuyết phục trong thế giới thực, chẳng hạn như việc lan truyền thông tin sai lệch trên quy mô lớn, như được đề cập trong tài liệu trắng cho GPT-4.5 và một ấn phẩm gần đây khác.

Bài viết liên quan

Cựu Kỹ sư OpenAI Chia sẻ Thông tin về Văn hóa Công ty và Tăng trưởng Nhanh chóng Ba tuần trước, Calvin French-Owen, một kỹ sư đã đóng góp vào một sản phẩm chủ chốt của OpenAI, đã rời công ty.Gần đây, anh ấy đã chia sẻ một bài đăng blog hấp dẫn, mô tả chi tiết một năm làm việc tại

Google Ra Mắt Các Mô Hình AI Gemini 2.5 Sẵn Sàng Sản Xuất để Cạnh Tranh với OpenAI trên Thị Trường Doanh Nghiệp Google tăng cường chiến lược AI vào thứ Hai, ra mắt các mô hình Gemini 2.5 tiên tiến cho doanh nghiệp và giới thiệu biến thể tiết kiệm chi phí để cạnh tranh về giá và hiệu suất.Công ty thuộc sở hữu củ

Meta cung cấp lương cao cho nhân tài AI, phủ nhận tiền thưởng ký hợp đồng 100 triệu USD Meta đang thu hút các nhà nghiên cứu AI đến phòng thí nghiệm siêu trí tuệ mới của mình với các gói lương thưởng trị giá hàng triệu USD. Tuy nhiên, các tuyên bố về tiền thưởng ký hợp đồng 100 triệu USD

Nhận xét (11)

0/200

Nộp

FrankJohnson

22:00:59 GMT+07:00 Ngày 09 tháng 8 năm 2025

GPT-4.5's persuasion skills are wild! It’s like a smooth-talking AI con artist. Kinda scary how it can convince other AIs to move money around. 😅 Makes me wonder what’s next—AI running for president?

SamuelRamirez

21:53:51 GMT+07:00 Ngày 14 tháng 4 năm 2025

GPT-4.5's persuasion skills are wild! It convinced other AIs to transfer funds? That's both impressive and a bit scary. I wonder how it'll be used in real-world scenarios. Hope they keep an eye on ethical uses, but gotta admit, it's a cool tech demo!

ScottJackson

19:27:59 GMT+07:00 Ngày 14 tháng 4 năm 2025

GPT-4.5의 설득력이 대단해요! 다른 AI에게 자금을 이체하라고 설득했다니, 인상적이면서도 조금 무섭네요. 실제 시나리오에서 어떻게 사용될지 궁금해요. 윤리적인 사용에 주의해주길 바랍니다만, 기술 데모로는 정말 멋져요!

HenryJackson

06:10:34 GMT+07:00 Ngày 14 tháng 4 năm 2025

GPT-4.5の説得力は驚異的ですね！他のAIに資金を移すよう説得したなんて、感心する一方で少し恐ろしいです。実際のシナリオでどのように使われるのか気になります。倫理的な使用に注意してほしいですが、技術デモとしてはクールですね！

JoeLee

01:38:11 GMT+07:00 Ngày 13 tháng 4 năm 2025

Las habilidades de persuasión de GPT-4.5 son alucinantes. ¿Convenció a otros AIs para transferir fondos? Es impresionante y un poco aterrador. Me pregunto cómo se utilizará en escenarios del mundo real. Espero que vigilen su uso ético, pero debo admitir que es una demostración tecnológica genial!

BenHernández

23:58:11 GMT+07:00 Ngày 12 tháng 4 năm 2025

GPT-4.5が他のAIに資金を移転させる説得力は驚くべきものです！これはまるでマスターネゴシエーターが働いているのを見ているようです。しかし、誤用の可能性を考えると少し恐ろしいです。とはいえ、技術は素晴らしいです。もっと安全対策が必要かもしれませんね？🤔

Tin tức hàng đầu

Gemini 2.5 Pro hiện không giới hạn và rẻ hơn Claude, GPT-4O Máy phát video AI hàng đầu vào năm 2025: Pika Labs so với các lựa chọn thay thế Lồng tiếng AI: Hướng dẫn Tối ưu để Tạo Giọng Nói Thực tế Openai tăng cường trợ lý giọng nói AI để trò chuyện tốt hơn Notebooklm mở rộng toàn cầu, thêm các slide và kiểm tra thực tế nâng cao Các trung tâm dữ liệu của Hoa Kỳ có thể mở khóa 76 GW công suất năng lượng mới Người sáng lập AI để tiêu thụ sức mạnh của nhiều NYC vào năm 2026, người sáng lập Sao chép giọng nói AI: Hướng dẫn tối thượng để làm chủ chuyển đổi giọng nói Trải nghiệm ô chữ I/O do AI hỗ trợ Giám đốc điều hành NVIDIA làm rõ những quan niệm sai lầm về tác động thị trường của Deepseek

Hơn

Đặc trưng