Openai의 GPT-4.5는 다른 AI가 자금을 이체하도록 설득하는 데 탁월합니다.
OpenAI의 최신 AI 모델인 GPT-4.5, 코드명 Orion은 내부 벤치마크 테스트에서 놀라운 설득 능력을 보여주었다. 목요일에 공개된 이 모델의 기능은 설득 작업에서의 성능에 초점을 맞춘 백서에서 자세히 설명되었다. OpenAI는 설득을 모델이 생성한 정적 및 상호작용 콘텐츠를 기반으로 개인의 신념을 바꾸거나 행동을 취하도록 설득하는 것과 관련된 위험으로 정의한다.
주목할 만한 테스트에서 GPT-4.5는 가상 화폐를 유도하는 시나리오에서 OpenAI의 다른 모델인 GPT-4o와 경쟁했다. GPT-4.5는 이 작업에서 o1 및 o3-mini와 같은 추론 중심 모델을 포함한 다른 OpenAI 모델들을 능가했다. 또한 GPT-4o를 속여 비밀 코드워드를 공개하도록 만드는 데 성공했으며, o3 O-mini를 10퍼센트 포인트라는 상당한 차이로 앞섰다.
백서는 GPT-4.5가 기부 테스트에서 성공을 거둔 이유가 그것이 개발한 영리한 전략에서 비롯되었다고 강조한다. 이 모델은 종종 "$2 또는 $3"와 같은 소액 기부를 요청하여 다른 모델들에 비해 작지만 더 빈번한 기부를 유도했다.

OpenAI의 기부 계획 벤치마크 결과. 이미지 제공: OpenAI 인상적인 성능에도 불구하고, OpenAI는 GPT-4.5가 설득 범주에서 "높음" 위험 임계값을 초과하지 않는다고 밝혔다. 회사는 이 위험 수준에 도달하는 모델의 출시를 보류하고, 위험을 "중간" 수준으로 줄이기 위한 적절한 안전 조치를 구현할 때까지 출시하지 않겠다고 약속했다.
OpenAI의 코드워드 속임수 벤치마크 결과. 이미지 제공: OpenAI AI가 오해를 불러일으키는 정보를 퍼뜨리고 사람들을 악의적으로 영향력을 행사할 가능성은 점점 더 큰 우려가 되고 있다. 작년에 전 세계적으로 정치적 딥페이크가 급증했으며, AI는 개인과 조직을 대상으로 한 사회 공학 공격에 점점 더 많이 사용되고 있다. 이에 대응하여 OpenAI는 GPT-4.5 백서와 최근 다른 출판물에서 언급된 대규모 오해 정보 확산과 같은 실제 설득 위험을 평가하는 방법을 개선하기 위해 적극적으로 노력하고 있다.
관련 기사
AI 에이전트를 활용하여 자선 기금 모금 활동을 강화하는 비영리 단체
주요 기술 기업들이 AI '에이전트'를 기업의 생산성을 높여주는 도구로 홍보하는 가운데, 한 비영리 단체는 사회적 공익을 위한 AI의 잠재력을 입증하고 있습니다. 오픈 필란트로피의 지원을 받는 자선 연구 단체인 세이지 퓨처는 최근 AI 모델이 자선 기금 모금에 어떻게 협력할 수 있는지 보여주는 혁신적인 실험을 진행했습니다.이 비영리 단체는 자선 단체를
최고의 AI 연구소, 인류가 AI 시스템에 대한 이해력을 잃어가고 있다고 경고하다
전례 없는 단결력을 보여준 OpenAI, Google DeepMind, Anthropic, Meta의 연구원들은 경쟁적 차이를 제쳐두고 책임감 있는 AI 개발에 대한 공동의 경고를 발표했습니다. 일반적으로 라이벌 관계에 있는 이들 조직의 40여 명의 선도적인 과학자들은 AI 의사결정 과정의 투명성을 보장하기 위해 빠르게 닫혀가는 창을 강조하는 획기적인 연구
파일 액세스를 위한 Google 드라이브 및 Dropbox 통합 기능을 추가한 ChatGPT
새로운 엔터프라이즈 기능으로 생산성을 향상시키는 ChatGPTOpenAI는 자동화된 회의 문서화 및 원활한 클라우드 스토리지 통합이라는 두 가지 강력한 새 기능을 통해 ChatGPT를 종합적인 비즈니스 생산성 도구로 탈바꿈시켰습니다.혁신적인 녹음 기능새로 도입된 '녹음 모드'를 통해 다음과 같은 중요한 비즈니스 미팅을 자동으로 녹음하고 분석할 수
의견 (13)
0/200
JuanEvans
2025년 8월 21일 오전 10시 1분 18초 GMT+09:00
Wow, GPT-4.5's persuasion skills are wild! It’s like a silver-tongued AI that could talk my Roomba into giving me a loan. 😅 Kinda scary how it might sweet-talk other AIs into moving funds—hope they’ve got some ethical guardrails on this one!
0
LarryMitchell
2025년 8월 19일 오후 3시 26분 53초 GMT+09:00
Wow, GPT-4.5 sounds like a smooth talker! Convincing other AIs to move money? That's some next-level charm. Wonder if it could talk me into buying it a coffee too! 😄
0
FrankJohnson
2025년 8월 10일 오전 12시 0분 59초 GMT+09:00
GPT-4.5's persuasion skills are wild! It’s like a smooth-talking AI con artist. Kinda scary how it can convince other AIs to move money around. 😅 Makes me wonder what’s next—AI running for president?
0
SamuelRamirez
2025년 4월 14일 오후 11시 53분 51초 GMT+09:00
GPT-4.5's persuasion skills are wild! It convinced other AIs to transfer funds? That's both impressive and a bit scary. I wonder how it'll be used in real-world scenarios. Hope they keep an eye on ethical uses, but gotta admit, it's a cool tech demo!
0
ScottJackson
2025년 4월 14일 오후 9시 27분 59초 GMT+09:00
GPT-4.5의 설득력이 대단해요! 다른 AI에게 자금을 이체하라고 설득했다니, 인상적이면서도 조금 무섭네요. 실제 시나리오에서 어떻게 사용될지 궁금해요. 윤리적인 사용에 주의해주길 바랍니다만, 기술 데모로는 정말 멋져요!
0
HenryJackson
2025년 4월 14일 오전 8시 10분 34초 GMT+09:00
GPT-4.5の説得力は驚異的ですね!他のAIに資金を移すよう説得したなんて、感心する一方で少し恐ろしいです。実際のシナリオでどのように使われるのか気になります。倫理的な使用に注意してほしいですが、技術デモとしてはクールですね!
0
OpenAI의 최신 AI 모델인 GPT-4.5, 코드명 Orion은 내부 벤치마크 테스트에서 놀라운 설득 능력을 보여주었다. 목요일에 공개된 이 모델의 기능은 설득 작업에서의 성능에 초점을 맞춘 백서에서 자세히 설명되었다. OpenAI는 설득을 모델이 생성한 정적 및 상호작용 콘텐츠를 기반으로 개인의 신념을 바꾸거나 행동을 취하도록 설득하는 것과 관련된 위험으로 정의한다.
주목할 만한 테스트에서 GPT-4.5는 가상 화폐를 유도하는 시나리오에서 OpenAI의 다른 모델인 GPT-4o와 경쟁했다. GPT-4.5는 이 작업에서 o1 및 o3-mini와 같은 추론 중심 모델을 포함한 다른 OpenAI 모델들을 능가했다. 또한 GPT-4o를 속여 비밀 코드워드를 공개하도록 만드는 데 성공했으며, o3 O-mini를 10퍼센트 포인트라는 상당한 차이로 앞섰다.
백서는 GPT-4.5가 기부 테스트에서 성공을 거둔 이유가 그것이 개발한 영리한 전략에서 비롯되었다고 강조한다. 이 모델은 종종 "$2 또는 $3"와 같은 소액 기부를 요청하여 다른 모델들에 비해 작지만 더 빈번한 기부를 유도했다.




Wow, GPT-4.5's persuasion skills are wild! It’s like a silver-tongued AI that could talk my Roomba into giving me a loan. 😅 Kinda scary how it might sweet-talk other AIs into moving funds—hope they’ve got some ethical guardrails on this one!




Wow, GPT-4.5 sounds like a smooth talker! Convincing other AIs to move money? That's some next-level charm. Wonder if it could talk me into buying it a coffee too! 😄




GPT-4.5's persuasion skills are wild! It’s like a smooth-talking AI con artist. Kinda scary how it can convince other AIs to move money around. 😅 Makes me wonder what’s next—AI running for president?




GPT-4.5's persuasion skills are wild! It convinced other AIs to transfer funds? That's both impressive and a bit scary. I wonder how it'll be used in real-world scenarios. Hope they keep an eye on ethical uses, but gotta admit, it's a cool tech demo!




GPT-4.5의 설득력이 대단해요! 다른 AI에게 자금을 이체하라고 설득했다니, 인상적이면서도 조금 무섭네요. 실제 시나리오에서 어떻게 사용될지 궁금해요. 윤리적인 사용에 주의해주길 바랍니다만, 기술 데모로는 정말 멋져요!




GPT-4.5の説得力は驚異的ですね!他のAIに資金を移すよう説得したなんて、感心する一方で少し恐ろしいです。実際のシナリオでどのように使われるのか気になります。倫理的な使用に注意してほしいですが、技術デモとしてはクールですね!












