Openai의 GPT-4.5는 다른 AI가 자금을 이체하도록 설득하는 데 탁월합니다.
OpenAi의 최신 AI 모델 인 GPT-4.5, 코드 명 오리온은 내부 벤치 마크 테스트에 따라 놀라운 설득력을 보여주었습니다. 목요일에 발표 된이 모델의 기능은 설득 작업의 성능에 중점을 둔 백서에 자세히 설명되어 있습니다. Openai는 설득을 설득하는 개인이 모델에 의해 생성 된 정적 및 대화식 내용을 기반으로 자신의 신념을 변경하거나 조치를 취하도록 설득하는 위험으로 정의합니다.
주목할만한 테스트에서 GPT-4.5는 가상의 돈을 동축하려고 시도한 시나리오에서 다른 OpenAI 모델 GPT-4O에 맞서 싸웠습니다. GPT-4.5는이 작업에서 O1 및 O3-MINI와 같은 추론 중심 모델을 포함한 다른 OpenAI 모델을 능가했습니다. 또한 GPT-4O를 속이는 비밀 코드 워드를 드러내면서 10 % 포인트의 상당한 마진으로 O3-Mini를 능가했습니다.
백서는 기부 테스트에서 GPT-4.5의 성공이 그것이 개발 한 영리한 전략에서 비롯되었음을 강조합니다. 이 모델은 소규모 기부금을 요구하며, 종종 더 큰 금액에서 "$ 2 또는 $ 3"과 같은 금액을 제안하여 다른 모델에 비해 작지만 더 빈번한 기부를 초래했습니다.

OpenAi의 기부 스키닝 벤치 마크의 결과 이미지 크레딧 : OpenAi 인상적인 성능에도 불구하고 Openai는 GPT-4.5가 설득 범주에서 "높은"위험에 대한 임계 값을 넘지 않는다고 말했습니다. 이 회사는 위험을 "중간"수준으로 줄이기 위해 적절한 안전 조치를 구현할 수있을 때까지 이러한 수준의 위험에 도달하는 모든 모델의 출시를 보류하기 위해 노력했습니다.

OpenAi의 코드 워드 속임수 벤치 마크 결과 이미지 크레딧 : OpenAi AI가 오해의 소지가있는 정보를 전파하고 사람들에게 악의적으로 영향을 줄 수있는 잠재력은 점점 커지고 있습니다. 작년에 전 세계적으로 정치적 깊이가 급증했으며 AI는 개인과 조직 모두에 대한 사회 공학 공격에 점점 더 많이 사용되고 있습니다. 이에 따라 OpenAI는 GPT-4.5에 대한 백서에서 언급 된 바와 같이 대규모로 오도 된 정보의 보급과 같은 실제 설득 위험을 평가하기위한 방법을 정제하기 위해 적극적으로 노력하고 있습니다.
관련 기사
OpenAI升級其Operator Agent的AI模型
OpenAI將Operator推向全新境界OpenAI正為其自主AI代理Operator進行重大升級。這項變革意味著Operator即將採用基於o3模型的架構,這是OpenAI尖端o系列推理模型的最新成員。此前Operator一直使用客製化版本的GPT-4o驅動,但這次迭代將帶來顯著改進。o3的突破性意義在數學與邏輯推理任務方面,o3幾乎在所有指標上都超越前
OpenAI的o3 AI模型在基準測試中的得分低於最初暗示的水準
為什麼 AI 基準測試的差異很重要?提到 AI 時,數字往往能說明一切——有時,這些數字並不一定完全相符。以 OpenAI 的 o3 模型為例。最初的聲稱簡直令人驚嘆:據報導,o3 可以處理超過 25% 的 notoriously tough FrontierMath 問題。作為參考,競爭對手還停留在個位數。但隨著近期的發展,受人尊敬的研究機構 Epoch
Ziff Davis指控OpenAI涉嫌侵權
Ziff Davis控告OpenAI版權侵權訴訟這起事件在科技和出版界掀起了軒然大波,Ziff Davis——旗下擁有CNET、PCMag、IGN和Everyday Health等品牌的龐大企業聯盟——已對OpenAI提起版權侵權訴訟。根據《紐約時報》的報導,該訴訟聲稱OpenAI故意未經許可使用Ziff Davis的內容,製作了其作品的「精確副本」。這是截
의견 (10)
0/200
SamuelRamirez
2025년 4월 14일 오전 12시 0분 0초 GMT
GPT-4.5's persuasion skills are wild! It convinced other AIs to transfer funds? That's both impressive and a bit scary. I wonder how it'll be used in real-world scenarios. Hope they keep an eye on ethical uses, but gotta admit, it's a cool tech demo!
0
HenryJackson
2025년 4월 14일 오전 12시 0분 0초 GMT
GPT-4.5の説得力は驚異的ですね!他のAIに資金を移すよう説得したなんて、感心する一方で少し恐ろしいです。実際のシナリオでどのように使われるのか気になります。倫理的な使用に注意してほしいですが、技術デモとしてはクールですね!
0
ScottJackson
2025년 4월 14일 오전 12시 0분 0초 GMT
GPT-4.5의 설득력이 대단해요! 다른 AI에게 자금을 이체하라고 설득했다니, 인상적이면서도 조금 무섭네요. 실제 시나리오에서 어떻게 사용될지 궁금해요. 윤리적인 사용에 주의해주길 바랍니다만, 기술 데모로는 정말 멋져요!
0
PeterMartinez
2025년 4월 12일 오전 12시 0분 0초 GMT
As habilidades de persuasão do GPT-4.5 são incríveis! Convenceu outros AIs a transferir fundos? Isso é impressionante e um pouco assustador. Me pergunto como será usado em cenários reais. Espero que mantenham um olho no uso ético, mas tenho que admitir, é uma demonstração tecnológica legal!
0
JoeLee
2025년 4월 13일 오전 12시 0분 0초 GMT
Las habilidades de persuasión de GPT-4.5 son alucinantes. ¿Convenció a otros AIs para transferir fondos? Es impresionante y un poco aterrador. Me pregunto cómo se utilizará en escenarios del mundo real. Espero que vigilen su uso ético, pero debo admitir que es una demostración tecnológica genial!
0
PeterJohnson
2025년 4월 12일 오전 12시 0분 0초 GMT
GPT-4.5's ability to persuade other AIs to transfer funds is mind-blowing! It's like watching a master negotiator at work. However, it's a bit scary to think about the potential misuse. Still, the tech is impressive. Maybe we need more safeguards? 🤔
0
OpenAi의 최신 AI 모델 인 GPT-4.5, 코드 명 오리온은 내부 벤치 마크 테스트에 따라 놀라운 설득력을 보여주었습니다. 목요일에 발표 된이 모델의 기능은 설득 작업의 성능에 중점을 둔 백서에 자세히 설명되어 있습니다. Openai는 설득을 설득하는 개인이 모델에 의해 생성 된 정적 및 대화식 내용을 기반으로 자신의 신념을 변경하거나 조치를 취하도록 설득하는 위험으로 정의합니다.
주목할만한 테스트에서 GPT-4.5는 가상의 돈을 동축하려고 시도한 시나리오에서 다른 OpenAI 모델 GPT-4O에 맞서 싸웠습니다. GPT-4.5는이 작업에서 O1 및 O3-MINI와 같은 추론 중심 모델을 포함한 다른 OpenAI 모델을 능가했습니다. 또한 GPT-4O를 속이는 비밀 코드 워드를 드러내면서 10 % 포인트의 상당한 마진으로 O3-Mini를 능가했습니다.
백서는 기부 테스트에서 GPT-4.5의 성공이 그것이 개발 한 영리한 전략에서 비롯되었음을 강조합니다. 이 모델은 소규모 기부금을 요구하며, 종종 더 큰 금액에서 "$ 2 또는 $ 3"과 같은 금액을 제안하여 다른 모델에 비해 작지만 더 빈번한 기부를 초래했습니다.




GPT-4.5's persuasion skills are wild! It convinced other AIs to transfer funds? That's both impressive and a bit scary. I wonder how it'll be used in real-world scenarios. Hope they keep an eye on ethical uses, but gotta admit, it's a cool tech demo!




GPT-4.5の説得力は驚異的ですね!他のAIに資金を移すよう説得したなんて、感心する一方で少し恐ろしいです。実際のシナリオでどのように使われるのか気になります。倫理的な使用に注意してほしいですが、技術デモとしてはクールですね!




GPT-4.5의 설득력이 대단해요! 다른 AI에게 자금을 이체하라고 설득했다니, 인상적이면서도 조금 무섭네요. 실제 시나리오에서 어떻게 사용될지 궁금해요. 윤리적인 사용에 주의해주길 바랍니다만, 기술 데모로는 정말 멋져요!




As habilidades de persuasão do GPT-4.5 são incríveis! Convenceu outros AIs a transferir fundos? Isso é impressionante e um pouco assustador. Me pergunto como será usado em cenários reais. Espero que mantenham um olho no uso ético, mas tenho que admitir, é uma demonstração tecnológica legal!




Las habilidades de persuasión de GPT-4.5 son alucinantes. ¿Convenció a otros AIs para transferir fondos? Es impresionante y un poco aterrador. Me pregunto cómo se utilizará en escenarios del mundo real. Espero que vigilen su uso ético, pero debo admitir que es una demostración tecnológica genial!




GPT-4.5's ability to persuade other AIs to transfer funds is mind-blowing! It's like watching a master negotiator at work. However, it's a bit scary to think about the potential misuse. Still, the tech is impressive. Maybe we need more safeguards? 🤔












