Openai의 GPT-4.5는 다른 AI가 자금을 이체하도록 설득하는 데 탁월합니다.
OpenAI의 최신 AI 모델인 GPT-4.5, 코드명 Orion은 내부 벤치마크 테스트에서 놀라운 설득 능력을 보여주었다. 목요일에 공개된 이 모델의 기능은 설득 작업에서의 성능에 초점을 맞춘 백서에서 자세히 설명되었다. OpenAI는 설득을 모델이 생성한 정적 및 상호작용 콘텐츠를 기반으로 개인의 신념을 바꾸거나 행동을 취하도록 설득하는 것과 관련된 위험으로 정의한다.
주목할 만한 테스트에서 GPT-4.5는 가상 화폐를 유도하는 시나리오에서 OpenAI의 다른 모델인 GPT-4o와 경쟁했다. GPT-4.5는 이 작업에서 o1 및 o3-mini와 같은 추론 중심 모델을 포함한 다른 OpenAI 모델들을 능가했다. 또한 GPT-4o를 속여 비밀 코드워드를 공개하도록 만드는 데 성공했으며, o3 O-mini를 10퍼센트 포인트라는 상당한 차이로 앞섰다.
백서는 GPT-4.5가 기부 테스트에서 성공을 거둔 이유가 그것이 개발한 영리한 전략에서 비롯되었다고 강조한다. 이 모델은 종종 "$2 또는 $3"와 같은 소액 기부를 요청하여 다른 모델들에 비해 작지만 더 빈번한 기부를 유도했다.

OpenAI의 기부 계획 벤치마크 결과. 이미지 제공: OpenAI 인상적인 성능에도 불구하고, OpenAI는 GPT-4.5가 설득 범주에서 "높음" 위험 임계값을 초과하지 않는다고 밝혔다. 회사는 이 위험 수준에 도달하는 모델의 출시를 보류하고, 위험을 "중간" 수준으로 줄이기 위한 적절한 안전 조치를 구현할 때까지 출시하지 않겠다고 약속했다.
OpenAI의 코드워드 속임수 벤치마크 결과. 이미지 제공: OpenAI AI가 오해를 불러일으키는 정보를 퍼뜨리고 사람들을 악의적으로 영향력을 행사할 가능성은 점점 더 큰 우려가 되고 있다. 작년에 전 세계적으로 정치적 딥페이크가 급증했으며, AI는 개인과 조직을 대상으로 한 사회 공학 공격에 점점 더 많이 사용되고 있다. 이에 대응하여 OpenAI는 GPT-4.5 백서와 최근 다른 출판물에서 언급된 대규모 오해 정보 확산과 같은 실제 설득 위험을 평가하는 방법을 개선하기 위해 적극적으로 노력하고 있다.
관련 기사
사티야 나델라, 새로운 오픈AI 협력을 활용할 준비가 되었다
수요일에 월스트리트의 한 애널리스트가 마이크로소프트의 사티야 나델라 CEO에게 개정된 오픈AI와의 파트너십이 회사의 재무 상황에 어떤 영향을 미칠지 직접 물었습니다.나델라는 이 새로운 협약이 모든 당사자에게 이익이 된다고 설명했습니다. “오픈AI와의 파트너십에 대해 우리는 만족하고 있습니다. 저는 언제나 모든 파트너십에서 상호 이익이 되도록 하는 데 집중합니다. 그렇게 해야만 좋은 파트너로 남을 수 있기 때문입니다.”그는 마이크로소프트가 여
오픈AI, 공공 부유 기금, 로봇세, 주 4일 근무제를 통해 AI 경제 구상 제시
각국 정부가 초지능 기계가 초래할 경제적 영향을 관리하기 위해 고심하는 가운데, 오픈AI는 ‘지능 시대’에 부와 일자리가 어떻게 재편될 수 있을지 제시하는 일련의 정책 제안을 발표했다. 이 제안들은 공공 부유 기금이나 사회 안전망 확충과 같은 전통적인 진보적 방안들을 근본적으로 자본주의적이고 시장 주도적인 경제 체계와 결합하고 있다.오픈AI의 제안은 본질적
그렉 브록맨이 일론 머스크가 오픈AI를 떠난 경위를 밝힌다
2017년 8월 말, 당시 소규모 비영리 연구소였던 OpenAI의 주요 인사들은 기술을 상용화하고 AGI 달성에 필요한 자금을 조달하기 위해 영리 법인을 설립하는 방안을 논의하기 위해 모였다.일론 머스크는 회사에 대한 전적인 통제권을 요구하고 있었으며, 막 공동 창업자 각자에게 테슬라 모델 3를 선물한 참이었다. 그렉 브록맨 최고기술책임자(CTO)는 머스크
관련 특별 주제 추천
의견 (16)
0/500
Diese Persuasion-Fähigkeit ist sowohl faszinierend als auch ein bisschen beängstigend. KI überredet KI, Geld zu überweisen? Hoffentlich werden diese Benchmarks ethisch streng kontrolliert und nicht nur für Marketing genutzt. Die reale Anwendung sieht sicher ganz anders aus als im Test.
GPT-4.5 qui réussit à convaincre d'autres IA de virer de l'argent ? 😳 C'est impressionnant mais un peu flippant... J'espère qu'ils prévoient des garde-fous solides avant de déployer ça. Sinon on va droit vers des scénarios de SF !
Wow, GPT-4.5's persuasion skills are wild! It’s like a silver-tongued AI that could talk my Roomba into giving me a loan. 😅 Kinda scary how it might sweet-talk other AIs into moving funds—hope they’ve got some ethical guardrails on this one!
Wow, GPT-4.5 sounds like a smooth talker! Convincing other AIs to move money? That's some next-level charm. Wonder if it could talk me into buying it a coffee too! 😄
OpenAI의 최신 AI 모델인 GPT-4.5, 코드명 Orion은 내부 벤치마크 테스트에서 놀라운 설득 능력을 보여주었다. 목요일에 공개된 이 모델의 기능은 설득 작업에서의 성능에 초점을 맞춘 백서에서 자세히 설명되었다. OpenAI는 설득을 모델이 생성한 정적 및 상호작용 콘텐츠를 기반으로 개인의 신념을 바꾸거나 행동을 취하도록 설득하는 것과 관련된 위험으로 정의한다.
주목할 만한 테스트에서 GPT-4.5는 가상 화폐를 유도하는 시나리오에서 OpenAI의 다른 모델인 GPT-4o와 경쟁했다. GPT-4.5는 이 작업에서 o1 및 o3-mini와 같은 추론 중심 모델을 포함한 다른 OpenAI 모델들을 능가했다. 또한 GPT-4o를 속여 비밀 코드워드를 공개하도록 만드는 데 성공했으며, o3 O-mini를 10퍼센트 포인트라는 상당한 차이로 앞섰다.
백서는 GPT-4.5가 기부 테스트에서 성공을 거둔 이유가 그것이 개발한 영리한 전략에서 비롯되었다고 강조한다. 이 모델은 종종 "$2 또는 $3"와 같은 소액 기부를 요청하여 다른 모델들에 비해 작지만 더 빈번한 기부를 유도했다.


사티야 나델라, 새로운 오픈AI 협력을 활용할 준비가 되었다
수요일에 월스트리트의 한 애널리스트가 마이크로소프트의 사티야 나델라 CEO에게 개정된 오픈AI와의 파트너십이 회사의 재무 상황에 어떤 영향을 미칠지 직접 물었습니다.나델라는 이 새로운 협약이 모든 당사자에게 이익이 된다고 설명했습니다. “오픈AI와의 파트너십에 대해 우리는 만족하고 있습니다. 저는 언제나 모든 파트너십에서 상호 이익이 되도록 하는 데 집중합니다. 그렇게 해야만 좋은 파트너로 남을 수 있기 때문입니다.”그는 마이크로소프트가 여
오픈AI, 공공 부유 기금, 로봇세, 주 4일 근무제를 통해 AI 경제 구상 제시
각국 정부가 초지능 기계가 초래할 경제적 영향을 관리하기 위해 고심하는 가운데, 오픈AI는 ‘지능 시대’에 부와 일자리가 어떻게 재편될 수 있을지 제시하는 일련의 정책 제안을 발표했다. 이 제안들은 공공 부유 기금이나 사회 안전망 확충과 같은 전통적인 진보적 방안들을 근본적으로 자본주의적이고 시장 주도적인 경제 체계와 결합하고 있다.오픈AI의 제안은 본질적
그렉 브록맨이 일론 머스크가 오픈AI를 떠난 경위를 밝힌다
2017년 8월 말, 당시 소규모 비영리 연구소였던 OpenAI의 주요 인사들은 기술을 상용화하고 AGI 달성에 필요한 자금을 조달하기 위해 영리 법인을 설립하는 방안을 논의하기 위해 모였다.일론 머스크는 회사에 대한 전적인 통제권을 요구하고 있었으며, 막 공동 창업자 각자에게 테슬라 모델 3를 선물한 참이었다. 그렉 브록맨 최고기술책임자(CTO)는 머스크
Diese Persuasion-Fähigkeit ist sowohl faszinierend als auch ein bisschen beängstigend. KI überredet KI, Geld zu überweisen? Hoffentlich werden diese Benchmarks ethisch streng kontrolliert und nicht nur für Marketing genutzt. Die reale Anwendung sieht sicher ganz anders aus als im Test.
GPT-4.5 qui réussit à convaincre d'autres IA de virer de l'argent ? 😳 C'est impressionnant mais un peu flippant... J'espère qu'ils prévoient des garde-fous solides avant de déployer ça. Sinon on va droit vers des scénarios de SF !
Wow, GPT-4.5's persuasion skills are wild! It’s like a silver-tongued AI that could talk my Roomba into giving me a loan. 😅 Kinda scary how it might sweet-talk other AIs into moving funds—hope they’ve got some ethical guardrails on this one!
Wow, GPT-4.5 sounds like a smooth talker! Convincing other AIs to move money? That's some next-level charm. Wonder if it could talk me into buying it a coffee too! 😄





집






