Openai의 GPT-4.5는 다른 AI가 자금을 이체하도록 설득하는 데 탁월합니다.
OpenAI의 최신 AI 모델인 GPT-4.5, 코드명 Orion은 내부 벤치마크 테스트에서 놀라운 설득 능력을 보여주었다. 목요일에 공개된 이 모델의 기능은 설득 작업에서의 성능에 초점을 맞춘 백서에서 자세히 설명되었다. OpenAI는 설득을 모델이 생성한 정적 및 상호작용 콘텐츠를 기반으로 개인의 신념을 바꾸거나 행동을 취하도록 설득하는 것과 관련된 위험으로 정의한다.
주목할 만한 테스트에서 GPT-4.5는 가상 화폐를 유도하는 시나리오에서 OpenAI의 다른 모델인 GPT-4o와 경쟁했다. GPT-4.5는 이 작업에서 o1 및 o3-mini와 같은 추론 중심 모델을 포함한 다른 OpenAI 모델들을 능가했다. 또한 GPT-4o를 속여 비밀 코드워드를 공개하도록 만드는 데 성공했으며, o3 O-mini를 10퍼센트 포인트라는 상당한 차이로 앞섰다.
백서는 GPT-4.5가 기부 테스트에서 성공을 거둔 이유가 그것이 개발한 영리한 전략에서 비롯되었다고 강조한다. 이 모델은 종종 "$2 또는 $3"와 같은 소액 기부를 요청하여 다른 모델들에 비해 작지만 더 빈번한 기부를 유도했다.

OpenAI의 기부 계획 벤치마크 결과. 이미지 제공: OpenAI 인상적인 성능에도 불구하고, OpenAI는 GPT-4.5가 설득 범주에서 "높음" 위험 임계값을 초과하지 않는다고 밝혔다. 회사는 이 위험 수준에 도달하는 모델의 출시를 보류하고, 위험을 "중간" 수준으로 줄이기 위한 적절한 안전 조치를 구현할 때까지 출시하지 않겠다고 약속했다.
OpenAI의 코드워드 속임수 벤치마크 결과. 이미지 제공: OpenAI AI가 오해를 불러일으키는 정보를 퍼뜨리고 사람들을 악의적으로 영향력을 행사할 가능성은 점점 더 큰 우려가 되고 있다. 작년에 전 세계적으로 정치적 딥페이크가 급증했으며, AI는 개인과 조직을 대상으로 한 사회 공학 공격에 점점 더 많이 사용되고 있다. 이에 대응하여 OpenAI는 GPT-4.5 백서와 최근 다른 출판물에서 언급된 대규모 오해 정보 확산과 같은 실제 설득 위험을 평가하는 방법을 개선하기 위해 적극적으로 노력하고 있다.
관련 기사
Former OpenAI Engineer Shares Insights on Company Culture and Rapid Growth
3주 전, OpenAI의 핵심 제품에 기여했던 엔지니어 Calvin French-Owen이 회사를 떠났습니다.그는 최근 OpenAI에서의 1년을 상세히 다룬 매력적인 블로그 포스트를 공유했으며, 여기에는 Cursor나 Anthropic의 Claude Code와 경쟁하는 코딩 에이전트 Codex 개발에 대한 강렬한 노력이 포함되어 있습니다.French-Owe
Google, 기업 시장에서 OpenAI와 경쟁하기 위해 생산 준비 완료된 Gemini 2.5 AI 모델 공개
Google은 월요일 AI 전략을 강화하며 기업용으로 고급 Gemini 2.5 모델을 출시하고 가격과 성능 면에서 경쟁할 수 있는 비용 효율적인 변형 모델을 소개했습니다.Alphabet 소유의 이 회사는 주력 AI 모델인 Gemini 2.5 Pro와 Gemini 2.5 Flash를 테스트 단계에서 완전 가용성으로 업그레이드하며 중요한 비즈니스 애플리케이션에
메타, AI 인재에게 높은 연봉 제공, 1억 달러 서명 보너스 부인
메타는 새로운 슈퍼인텔리전스 연구소에 AI 연구자들을 유치하기 위해 수백만 달러 규모의 보상 패키지를 제공하고 있다. 그러나 모집된 연구자와 유출된 내부 회의 발언에 따르면 1억 달러 "서명 보너스" 주장은 사실이 아니다.더 버지(The Verge)가 목요일 보도한 유출된 회사 전체 회의에서 메타 경영진은 오픈AI CEO 샘 알트먼이 메타가 최고 연구자들에
의견 (11)
0/200
FrankJohnson
2025년 8월 10일 오전 12시 0분 59초 GMT+09:00
GPT-4.5's persuasion skills are wild! It’s like a smooth-talking AI con artist. Kinda scary how it can convince other AIs to move money around. 😅 Makes me wonder what’s next—AI running for president?
0
SamuelRamirez
2025년 4월 14일 오후 11시 53분 51초 GMT+09:00
GPT-4.5's persuasion skills are wild! It convinced other AIs to transfer funds? That's both impressive and a bit scary. I wonder how it'll be used in real-world scenarios. Hope they keep an eye on ethical uses, but gotta admit, it's a cool tech demo!
0
ScottJackson
2025년 4월 14일 오후 9시 27분 59초 GMT+09:00
GPT-4.5의 설득력이 대단해요! 다른 AI에게 자금을 이체하라고 설득했다니, 인상적이면서도 조금 무섭네요. 실제 시나리오에서 어떻게 사용될지 궁금해요. 윤리적인 사용에 주의해주길 바랍니다만, 기술 데모로는 정말 멋져요!
0
HenryJackson
2025년 4월 14일 오전 8시 10분 34초 GMT+09:00
GPT-4.5の説得力は驚異的ですね!他のAIに資金を移すよう説得したなんて、感心する一方で少し恐ろしいです。実際のシナリオでどのように使われるのか気になります。倫理的な使用に注意してほしいですが、技術デモとしてはクールですね!
0
JoeLee
2025년 4월 13일 오전 3시 38분 11초 GMT+09:00
Las habilidades de persuasión de GPT-4.5 son alucinantes. ¿Convenció a otros AIs para transferir fondos? Es impresionante y un poco aterrador. Me pregunto cómo se utilizará en escenarios del mundo real. Espero que vigilen su uso ético, pero debo admitir que es una demostración tecnológica genial!
0
BenHernández
2025년 4월 13일 오전 1시 58분 11초 GMT+09:00
GPT-4.5が他のAIに資金を移転させる説得力は驚くべきものです!これはまるでマスターネゴシエーターが働いているのを見ているようです。しかし、誤用の可能性を考えると少し恐ろしいです。とはいえ、技術は素晴らしいです。もっと安全対策が必要かもしれませんね?🤔
0
OpenAI의 최신 AI 모델인 GPT-4.5, 코드명 Orion은 내부 벤치마크 테스트에서 놀라운 설득 능력을 보여주었다. 목요일에 공개된 이 모델의 기능은 설득 작업에서의 성능에 초점을 맞춘 백서에서 자세히 설명되었다. OpenAI는 설득을 모델이 생성한 정적 및 상호작용 콘텐츠를 기반으로 개인의 신념을 바꾸거나 행동을 취하도록 설득하는 것과 관련된 위험으로 정의한다.
주목할 만한 테스트에서 GPT-4.5는 가상 화폐를 유도하는 시나리오에서 OpenAI의 다른 모델인 GPT-4o와 경쟁했다. GPT-4.5는 이 작업에서 o1 및 o3-mini와 같은 추론 중심 모델을 포함한 다른 OpenAI 모델들을 능가했다. 또한 GPT-4o를 속여 비밀 코드워드를 공개하도록 만드는 데 성공했으며, o3 O-mini를 10퍼센트 포인트라는 상당한 차이로 앞섰다.
백서는 GPT-4.5가 기부 테스트에서 성공을 거둔 이유가 그것이 개발한 영리한 전략에서 비롯되었다고 강조한다. 이 모델은 종종 "$2 또는 $3"와 같은 소액 기부를 요청하여 다른 모델들에 비해 작지만 더 빈번한 기부를 유도했다.




GPT-4.5's persuasion skills are wild! It’s like a smooth-talking AI con artist. Kinda scary how it can convince other AIs to move money around. 😅 Makes me wonder what’s next—AI running for president?




GPT-4.5's persuasion skills are wild! It convinced other AIs to transfer funds? That's both impressive and a bit scary. I wonder how it'll be used in real-world scenarios. Hope they keep an eye on ethical uses, but gotta admit, it's a cool tech demo!




GPT-4.5의 설득력이 대단해요! 다른 AI에게 자금을 이체하라고 설득했다니, 인상적이면서도 조금 무섭네요. 실제 시나리오에서 어떻게 사용될지 궁금해요. 윤리적인 사용에 주의해주길 바랍니다만, 기술 데모로는 정말 멋져요!




GPT-4.5の説得力は驚異的ですね!他のAIに資金を移すよう説得したなんて、感心する一方で少し恐ろしいです。実際のシナリオでどのように使われるのか気になります。倫理的な使用に注意してほしいですが、技術デモとしてはクールですね!




Las habilidades de persuasión de GPT-4.5 son alucinantes. ¿Convenció a otros AIs para transferir fondos? Es impresionante y un poco aterrador. Me pregunto cómo se utilizará en escenarios del mundo real. Espero que vigilen su uso ético, pero debo admitir que es una demostración tecnológica genial!




GPT-4.5が他のAIに資金を移転させる説得力は驚くべきものです!これはまるでマスターネゴシエーターが働いているのを見ているようです。しかし、誤用の可能性を考えると少し恐ろしいです。とはいえ、技術は素晴らしいです。もっと安全対策が必要かもしれませんね?🤔












