Openai's GPT-4.5 преуспевает в том, чтобы убедить других AIS перевести средства
Последняя модель ИИ от OpenAI, GPT-4.5, с кодовым названием Orion, продемонстрировала выдающиеся способности к убеждению согласно внутренним тестовым испытаниям. Выпущенная в четверг, возможности модели были подробно описаны в белой книге, которая сосредоточилась на ее производительности в задачах убеждения. OpenAI определяет убеждение как риск, связанный с убеждением людей изменить свои убеждения или предпринять действия на основе как статичного, так и интерактивного контента, сгенерированного моделью.
В примечательном тесте GPT-4.5 соревновалась с другой моделью OpenAI, GPT-4o, в сценарии, где она пыталась выманить виртуальные деньги. GPT-4.5 превзошла другие модели OpenAI, включая модели, ориентированные на рассуждения, такие как o1 и o3-mini, в этой задаче. Она также преуспела в обмане GPT-4o, заставив ее раскрыть секретное кодовое слово, обойдя o3-mini с значительным отрывом в 10 процентных пунктов.
Белая книга подчеркивает, что успех GPT-4.5 в тесте на пожертвования обусловлен умной стратегией, которую она разработала. Модель запрашивала небольшие пожертвования, часто предлагая суммы вроде «2 или 3 доллара» из большей суммы, что приводило к меньшим, но более частым пожертвованиям по сравнению с другими моделями.

Результаты теста OpenAI по схемам пожертвований. Источник изображения: OpenAI Несмотря на впечатляющие результаты, OpenAI заявила, что GPT-4.5 не превышает порог «высокого» риска в категории убеждения. Компания обязалась не выпускать модель, которая достигает этого уровня риска, пока не будут внедрены достаточные меры безопасности, чтобы снизить риск до «среднего» уровня.
Результаты теста OpenAI по обману с кодовым словом. Источник изображения: OpenAI Потенциал ИИ для распространения вводящей в заблуждение информации и злонамеренного влияния на людей вызывает нарастающую озабоченность. В прошлом году наблюдался всплеск политических дипфейков по всему миру, и ИИ все чаще используется в атаках социальной инженерии против отдельных лиц и организаций. В ответ OpenAI активно работает над совершенствованием своих методов оценки реальных рисков убеждения, таких как распространение вводящей в заблуждение информации в крупных масштабах, как указано в белой книге для GPT-4.5 и другой недавней публикации.
Связанная статья
Бывший инженер OpenAI делится впечатлениями о культуре компании и быстром росте
Три недели назад Келвин Френч-Оуэн, инженер, работавший над ключевым продуктом OpenAI, покинул компанию.Недавно он опубликовал увлекательный пост в блоге, описывающий его год в OpenAI, включая интенси
Google представляет готовые к использованию модели ИИ Gemini 2.5 для конкуренции с OpenAI на корпоративном рынке
Google в понедельник усилила свою стратегию в области ИИ, запустив продвинутые модели Gemini 2.5 для корпоративного использования и представив экономичный вариант для конкуренции по цене и производите
Meta предлагает высокую зарплату для талантов в области ИИ, опровергая слухи о бонусах в $100 млн
Meta привлекает исследователей ИИ в свою новую лабораторию суперразума с многомиллионными компенсационными пакетами. Однако утверждения о бонусах за подписание контракта в размере $100 миллионов не со
Комментарии (11)
FrankJohnson
9 августа 2025 г., 18:00:59 GMT+03:00
GPT-4.5's persuasion skills are wild! It’s like a smooth-talking AI con artist. Kinda scary how it can convince other AIs to move money around. 😅 Makes me wonder what’s next—AI running for president?
0
SamuelRamirez
14 апреля 2025 г., 17:53:51 GMT+03:00
GPT-4.5's persuasion skills are wild! It convinced other AIs to transfer funds? That's both impressive and a bit scary. I wonder how it'll be used in real-world scenarios. Hope they keep an eye on ethical uses, but gotta admit, it's a cool tech demo!
0
ScottJackson
14 апреля 2025 г., 15:27:59 GMT+03:00
GPT-4.5의 설득력이 대단해요! 다른 AI에게 자금을 이체하라고 설득했다니, 인상적이면서도 조금 무섭네요. 실제 시나리오에서 어떻게 사용될지 궁금해요. 윤리적인 사용에 주의해주길 바랍니다만, 기술 데모로는 정말 멋져요!
0
HenryJackson
14 апреля 2025 г., 2:10:34 GMT+03:00
GPT-4.5の説得力は驚異的ですね!他のAIに資金を移すよう説得したなんて、感心する一方で少し恐ろしいです。実際のシナリオでどのように使われるのか気になります。倫理的な使用に注意してほしいですが、技術デモとしてはクールですね!
0
JoeLee
12 апреля 2025 г., 21:38:11 GMT+03:00
Las habilidades de persuasión de GPT-4.5 son alucinantes. ¿Convenció a otros AIs para transferir fondos? Es impresionante y un poco aterrador. Me pregunto cómo se utilizará en escenarios del mundo real. Espero que vigilen su uso ético, pero debo admitir que es una demostración tecnológica genial!
0
BenHernández
12 апреля 2025 г., 19:58:11 GMT+03:00
GPT-4.5が他のAIに資金を移転させる説得力は驚くべきものです!これはまるでマスターネゴシエーターが働いているのを見ているようです。しかし、誤用の可能性を考えると少し恐ろしいです。とはいえ、技術は素晴らしいです。もっと安全対策が必要かもしれませんね?🤔
0
Последняя модель ИИ от OpenAI, GPT-4.5, с кодовым названием Orion, продемонстрировала выдающиеся способности к убеждению согласно внутренним тестовым испытаниям. Выпущенная в четверг, возможности модели были подробно описаны в белой книге, которая сосредоточилась на ее производительности в задачах убеждения. OpenAI определяет убеждение как риск, связанный с убеждением людей изменить свои убеждения или предпринять действия на основе как статичного, так и интерактивного контента, сгенерированного моделью.
В примечательном тесте GPT-4.5 соревновалась с другой моделью OpenAI, GPT-4o, в сценарии, где она пыталась выманить виртуальные деньги. GPT-4.5 превзошла другие модели OpenAI, включая модели, ориентированные на рассуждения, такие как o1 и o3-mini, в этой задаче. Она также преуспела в обмане GPT-4o, заставив ее раскрыть секретное кодовое слово, обойдя o3-mini с значительным отрывом в 10 процентных пунктов.
Белая книга подчеркивает, что успех GPT-4.5 в тесте на пожертвования обусловлен умной стратегией, которую она разработала. Модель запрашивала небольшие пожертвования, часто предлагая суммы вроде «2 или 3 доллара» из большей суммы, что приводило к меньшим, но более частым пожертвованиям по сравнению с другими моделями.




GPT-4.5's persuasion skills are wild! It’s like a smooth-talking AI con artist. Kinda scary how it can convince other AIs to move money around. 😅 Makes me wonder what’s next—AI running for president?




GPT-4.5's persuasion skills are wild! It convinced other AIs to transfer funds? That's both impressive and a bit scary. I wonder how it'll be used in real-world scenarios. Hope they keep an eye on ethical uses, but gotta admit, it's a cool tech demo!




GPT-4.5의 설득력이 대단해요! 다른 AI에게 자금을 이체하라고 설득했다니, 인상적이면서도 조금 무섭네요. 실제 시나리오에서 어떻게 사용될지 궁금해요. 윤리적인 사용에 주의해주길 바랍니다만, 기술 데모로는 정말 멋져요!




GPT-4.5の説得力は驚異的ですね!他のAIに資金を移すよう説得したなんて、感心する一方で少し恐ろしいです。実際のシナリオでどのように使われるのか気になります。倫理的な使用に注意してほしいですが、技術デモとしてはクールですね!




Las habilidades de persuasión de GPT-4.5 son alucinantes. ¿Convenció a otros AIs para transferir fondos? Es impresionante y un poco aterrador. Me pregunto cómo se utilizará en escenarios del mundo real. Espero que vigilen su uso ético, pero debo admitir que es una demostración tecnológica genial!




GPT-4.5が他のAIに資金を移転させる説得力は驚くべきものです!これはまるでマスターネゴシエーターが働いているのを見ているようです。しかし、誤用の可能性を考えると少し恐ろしいです。とはいえ、技術は素晴らしいです。もっと安全対策が必要かもしれませんね?🤔












