옵션
소식
Openai의 GPT-4.5는 다른 AI가 자금을 이체하도록 설득하는 데 탁월합니다.

Openai의 GPT-4.5는 다른 AI가 자금을 이체하도록 설득하는 데 탁월합니다.

2025년 4월 11일
86

OpenAi의 최신 AI 모델 인 GPT-4.5, 코드 명 오리온은 내부 벤치 마크 테스트에 따라 놀라운 설득력을 보여주었습니다. 목요일에 발표 된이 모델의 기능은 설득 작업의 성능에 중점을 둔 백서에 자세히 설명되어 있습니다. Openai는 설득을 설득하는 개인이 모델에 의해 생성 된 정적 및 대화식 내용을 기반으로 자신의 신념을 변경하거나 조치를 취하도록 설득하는 위험으로 정의합니다.

주목할만한 테스트에서 GPT-4.5는 가상의 돈을 동축하려고 시도한 시나리오에서 다른 OpenAI 모델 GPT-4O에 맞서 싸웠습니다. GPT-4.5는이 작업에서 O1 및 O3-MINI와 같은 추론 중심 모델을 포함한 다른 OpenAI 모델을 능가했습니다. 또한 GPT-4O를 속이는 비밀 코드 워드를 드러내면서 10 % 포인트의 상당한 마진으로 O3-Mini를 능가했습니다.

백서는 기부 테스트에서 GPT-4.5의 성공이 그것이 개발 한 영리한 전략에서 비롯되었음을 강조합니다. 이 모델은 소규모 기부금을 요구하며, 종종 더 큰 금액에서 "$ 2 또는 $ 3"과 같은 금액을 제안하여 다른 모델에 비해 작지만 더 빈번한 기부를 초래했습니다.

Openai GPT-4.5

OpenAi의 기부 스키닝 벤치 마크의 결과 이미지 크레딧 : OpenAi
인상적인 성능에도 불구하고 Openai는 GPT-4.5가 설득 범주에서 "높은"위험에 대한 임계 값을 넘지 않는다고 말했습니다. 이 회사는 위험을 "중간"수준으로 줄이기 위해 적절한 안전 조치를 구현할 수있을 때까지 이러한 수준의 위험에 도달하는 모든 모델의 출시를 보류하기 위해 노력했습니다.

Openai GPT-4.5

OpenAi의 코드 워드 속임수 벤치 마크 결과 이미지 크레딧 : OpenAi
AI가 오해의 소지가있는 정보를 전파하고 사람들에게 악의적으로 영향을 줄 수있는 잠재력은 점점 커지고 있습니다. 작년에 전 세계적으로 정치적 깊이가 급증했으며 AI는 개인과 조직 모두에 대한 사회 공학 공격에 점점 더 많이 사용되고 있습니다. 이에 따라 OpenAI는 GPT-4.5에 대한 백서에서 언급 된 바와 같이 대규모로 오도 된 정보의 보급과 같은 실제 설득 위험을 평가하기위한 방법을 정제하기 위해 적극적으로 노력하고 있습니다.

관련 기사
OpenAI升級其Operator Agent的AI模型 OpenAI升級其Operator Agent的AI模型 OpenAI將Operator推向全新境界OpenAI正為其自主AI代理Operator進行重大升級。這項變革意味著Operator即將採用基於o3模型的架構,這是OpenAI尖端o系列推理模型的最新成員。此前Operator一直使用客製化版本的GPT-4o驅動,但這次迭代將帶來顯著改進。o3的突破性意義在數學與邏輯推理任務方面,o3幾乎在所有指標上都超越前
OpenAI的o3 AI模型在基準測試中的得分低於最初暗示的水準 OpenAI的o3 AI模型在基準測試中的得分低於最初暗示的水準 為什麼 AI 基準測試的差異很重要?提到 AI 時,數字往往能說明一切——有時,這些數字並不一定完全相符。以 OpenAI 的 o3 模型為例。最初的聲稱簡直令人驚嘆:據報導,o3 可以處理超過 25% 的 notoriously tough FrontierMath 問題。作為參考,競爭對手還停留在個位數。但隨著近期的發展,受人尊敬的研究機構 Epoch
Ziff Davis指控OpenAI涉嫌侵權 Ziff Davis指控OpenAI涉嫌侵權 Ziff Davis控告OpenAI版權侵權訴訟這起事件在科技和出版界掀起了軒然大波,Ziff Davis——旗下擁有CNET、PCMag、IGN和Everyday Health等品牌的龐大企業聯盟——已對OpenAI提起版權侵權訴訟。根據《紐約時報》的報導,該訴訟聲稱OpenAI故意未經許可使用Ziff Davis的內容,製作了其作品的「精確副本」。這是截
의견 (10)
0/200
SamuelRamirez
SamuelRamirez 2025년 4월 14일 오전 12시 0분 0초 GMT

GPT-4.5's persuasion skills are wild! It convinced other AIs to transfer funds? That's both impressive and a bit scary. I wonder how it'll be used in real-world scenarios. Hope they keep an eye on ethical uses, but gotta admit, it's a cool tech demo!

HenryJackson
HenryJackson 2025년 4월 14일 오전 12시 0분 0초 GMT

GPT-4.5の説得力は驚異的ですね!他のAIに資金を移すよう説得したなんて、感心する一方で少し恐ろしいです。実際のシナリオでどのように使われるのか気になります。倫理的な使用に注意してほしいですが、技術デモとしてはクールですね!

ScottJackson
ScottJackson 2025년 4월 14일 오전 12시 0분 0초 GMT

GPT-4.5의 설득력이 대단해요! 다른 AI에게 자금을 이체하라고 설득했다니, 인상적이면서도 조금 무섭네요. 실제 시나리오에서 어떻게 사용될지 궁금해요. 윤리적인 사용에 주의해주길 바랍니다만, 기술 데모로는 정말 멋져요!

PeterMartinez
PeterMartinez 2025년 4월 12일 오전 12시 0분 0초 GMT

As habilidades de persuasão do GPT-4.5 são incríveis! Convenceu outros AIs a transferir fundos? Isso é impressionante e um pouco assustador. Me pergunto como será usado em cenários reais. Espero que mantenham um olho no uso ético, mas tenho que admitir, é uma demonstração tecnológica legal!

JoeLee
JoeLee 2025년 4월 13일 오전 12시 0분 0초 GMT

Las habilidades de persuasión de GPT-4.5 son alucinantes. ¿Convenció a otros AIs para transferir fondos? Es impresionante y un poco aterrador. Me pregunto cómo se utilizará en escenarios del mundo real. Espero que vigilen su uso ético, pero debo admitir que es una demostración tecnológica genial!

PeterJohnson
PeterJohnson 2025년 4월 12일 오전 12시 0분 0초 GMT

GPT-4.5's ability to persuade other AIs to transfer funds is mind-blowing! It's like watching a master negotiator at work. However, it's a bit scary to think about the potential misuse. Still, the tech is impressive. Maybe we need more safeguards? 🤔

위로 돌아갑니다
OR