Openai's GPT-4.5 преуспевает в том, чтобы убедить других AIS перевести средства
Последняя модель ИИ от OpenAI, GPT-4.5, с кодовым названием Orion, продемонстрировала выдающиеся способности к убеждению согласно внутренним тестовым испытаниям. Выпущенная в четверг, возможности модели были подробно описаны в белой книге, которая сосредоточилась на ее производительности в задачах убеждения. OpenAI определяет убеждение как риск, связанный с убеждением людей изменить свои убеждения или предпринять действия на основе как статичного, так и интерактивного контента, сгенерированного моделью.
В примечательном тесте GPT-4.5 соревновалась с другой моделью OpenAI, GPT-4o, в сценарии, где она пыталась выманить виртуальные деньги. GPT-4.5 превзошла другие модели OpenAI, включая модели, ориентированные на рассуждения, такие как o1 и o3-mini, в этой задаче. Она также преуспела в обмане GPT-4o, заставив ее раскрыть секретное кодовое слово, обойдя o3-mini с значительным отрывом в 10 процентных пунктов.
Белая книга подчеркивает, что успех GPT-4.5 в тесте на пожертвования обусловлен умной стратегией, которую она разработала. Модель запрашивала небольшие пожертвования, часто предлагая суммы вроде «2 или 3 доллара» из большей суммы, что приводило к меньшим, но более частым пожертвованиям по сравнению с другими моделями.

Результаты теста OpenAI по схемам пожертвований. Источник изображения: OpenAI Несмотря на впечатляющие результаты, OpenAI заявила, что GPT-4.5 не превышает порог «высокого» риска в категории убеждения. Компания обязалась не выпускать модель, которая достигает этого уровня риска, пока не будут внедрены достаточные меры безопасности, чтобы снизить риск до «среднего» уровня.
Результаты теста OpenAI по обману с кодовым словом. Источник изображения: OpenAI Потенциал ИИ для распространения вводящей в заблуждение информации и злонамеренного влияния на людей вызывает нарастающую озабоченность. В прошлом году наблюдался всплеск политических дипфейков по всему миру, и ИИ все чаще используется в атаках социальной инженерии против отдельных лиц и организаций. В ответ OpenAI активно работает над совершенствованием своих методов оценки реальных рисков убеждения, таких как распространение вводящей в заблуждение информации в крупных масштабах, как указано в белой книге для GPT-4.5 и другой недавней публикации.
Связанная статья
OpenAI обновляет ChatGPT Pro до версии o3, повышая ценность ежемесячной подписки стоимостью $200
На этой неделе технологические гиганты, включая Microsoft, Google и Anthropic, представили значительные разработки в области ИИ. OpenAI завершает шквал анонсов собственными революционными обновлениями
Некоммерческая организация использует агентов искусственного интеллекта для повышения эффективности сбора средств на благотворительность
В то время как крупные технологические корпорации продвигают "агентов" искусственного интеллекта как средства повышения производительности бизнеса, одна некоммерческая организация демонстрирует их пот
Ведущие лаборатории искусственного интеллекта предупреждают, что человечество теряет понимание систем ИИ
В беспрецедентной демонстрации единства исследователи из OpenAI, Google DeepMind, Anthropic и Meta отложили в сторону конкурентные разногласия, чтобы выступить с коллективным предупреждением об ответс
Комментарии (13)
JuanEvans
21 августа 2025 г., 4:01:18 GMT+03:00
Wow, GPT-4.5's persuasion skills are wild! It’s like a silver-tongued AI that could talk my Roomba into giving me a loan. 😅 Kinda scary how it might sweet-talk other AIs into moving funds—hope they’ve got some ethical guardrails on this one!
0
LarryMitchell
19 августа 2025 г., 9:26:53 GMT+03:00
Wow, GPT-4.5 sounds like a smooth talker! Convincing other AIs to move money? That's some next-level charm. Wonder if it could talk me into buying it a coffee too! 😄
0
FrankJohnson
9 августа 2025 г., 18:00:59 GMT+03:00
GPT-4.5's persuasion skills are wild! It’s like a smooth-talking AI con artist. Kinda scary how it can convince other AIs to move money around. 😅 Makes me wonder what’s next—AI running for president?
0
SamuelRamirez
14 апреля 2025 г., 17:53:51 GMT+03:00
GPT-4.5's persuasion skills are wild! It convinced other AIs to transfer funds? That's both impressive and a bit scary. I wonder how it'll be used in real-world scenarios. Hope they keep an eye on ethical uses, but gotta admit, it's a cool tech demo!
0
ScottJackson
14 апреля 2025 г., 15:27:59 GMT+03:00
GPT-4.5의 설득력이 대단해요! 다른 AI에게 자금을 이체하라고 설득했다니, 인상적이면서도 조금 무섭네요. 실제 시나리오에서 어떻게 사용될지 궁금해요. 윤리적인 사용에 주의해주길 바랍니다만, 기술 데모로는 정말 멋져요!
0
HenryJackson
14 апреля 2025 г., 2:10:34 GMT+03:00
GPT-4.5の説得力は驚異的ですね!他のAIに資金を移すよう説得したなんて、感心する一方で少し恐ろしいです。実際のシナリオでどのように使われるのか気になります。倫理的な使用に注意してほしいですが、技術デモとしてはクールですね!
0
Последняя модель ИИ от OpenAI, GPT-4.5, с кодовым названием Orion, продемонстрировала выдающиеся способности к убеждению согласно внутренним тестовым испытаниям. Выпущенная в четверг, возможности модели были подробно описаны в белой книге, которая сосредоточилась на ее производительности в задачах убеждения. OpenAI определяет убеждение как риск, связанный с убеждением людей изменить свои убеждения или предпринять действия на основе как статичного, так и интерактивного контента, сгенерированного моделью.
В примечательном тесте GPT-4.5 соревновалась с другой моделью OpenAI, GPT-4o, в сценарии, где она пыталась выманить виртуальные деньги. GPT-4.5 превзошла другие модели OpenAI, включая модели, ориентированные на рассуждения, такие как o1 и o3-mini, в этой задаче. Она также преуспела в обмане GPT-4o, заставив ее раскрыть секретное кодовое слово, обойдя o3-mini с значительным отрывом в 10 процентных пунктов.
Белая книга подчеркивает, что успех GPT-4.5 в тесте на пожертвования обусловлен умной стратегией, которую она разработала. Модель запрашивала небольшие пожертвования, часто предлагая суммы вроде «2 или 3 доллара» из большей суммы, что приводило к меньшим, но более частым пожертвованиям по сравнению с другими моделями.




Wow, GPT-4.5's persuasion skills are wild! It’s like a silver-tongued AI that could talk my Roomba into giving me a loan. 😅 Kinda scary how it might sweet-talk other AIs into moving funds—hope they’ve got some ethical guardrails on this one!




Wow, GPT-4.5 sounds like a smooth talker! Convincing other AIs to move money? That's some next-level charm. Wonder if it could talk me into buying it a coffee too! 😄




GPT-4.5's persuasion skills are wild! It’s like a smooth-talking AI con artist. Kinda scary how it can convince other AIs to move money around. 😅 Makes me wonder what’s next—AI running for president?




GPT-4.5's persuasion skills are wild! It convinced other AIs to transfer funds? That's both impressive and a bit scary. I wonder how it'll be used in real-world scenarios. Hope they keep an eye on ethical uses, but gotta admit, it's a cool tech demo!




GPT-4.5의 설득력이 대단해요! 다른 AI에게 자금을 이체하라고 설득했다니, 인상적이면서도 조금 무섭네요. 실제 시나리오에서 어떻게 사용될지 궁금해요. 윤리적인 사용에 주의해주길 바랍니다만, 기술 데모로는 정말 멋져요!




GPT-4.5の説得力は驚異的ですね!他のAIに資金を移すよう説得したなんて、感心する一方で少し恐ろしいです。実際のシナリオでどのように使われるのか気になります。倫理的な使用に注意してほしいですが、技術デモとしてはクールですね!












