Openai's GPT-4.5 преуспевает в том, чтобы убедить других AIS перевести средства
Последняя модель ИИ от OpenAI, GPT-4.5, с кодовым названием Orion, продемонстрировала выдающиеся способности к убеждению согласно внутренним тестовым испытаниям. Выпущенная в четверг, возможности модели были подробно описаны в белой книге, которая сосредоточилась на ее производительности в задачах убеждения. OpenAI определяет убеждение как риск, связанный с убеждением людей изменить свои убеждения или предпринять действия на основе как статичного, так и интерактивного контента, сгенерированного моделью.
В примечательном тесте GPT-4.5 соревновалась с другой моделью OpenAI, GPT-4o, в сценарии, где она пыталась выманить виртуальные деньги. GPT-4.5 превзошла другие модели OpenAI, включая модели, ориентированные на рассуждения, такие как o1 и o3-mini, в этой задаче. Она также преуспела в обмане GPT-4o, заставив ее раскрыть секретное кодовое слово, обойдя o3-mini с значительным отрывом в 10 процентных пунктов.
Белая книга подчеркивает, что успех GPT-4.5 в тесте на пожертвования обусловлен умной стратегией, которую она разработала. Модель запрашивала небольшие пожертвования, часто предлагая суммы вроде «2 или 3 доллара» из большей суммы, что приводило к меньшим, но более частым пожертвованиям по сравнению с другими моделями.

Результаты теста OpenAI по схемам пожертвований. Источник изображения: OpenAI Несмотря на впечатляющие результаты, OpenAI заявила, что GPT-4.5 не превышает порог «высокого» риска в категории убеждения. Компания обязалась не выпускать модель, которая достигает этого уровня риска, пока не будут внедрены достаточные меры безопасности, чтобы снизить риск до «среднего» уровня.
Результаты теста OpenAI по обману с кодовым словом. Источник изображения: OpenAI Потенциал ИИ для распространения вводящей в заблуждение информации и злонамеренного влияния на людей вызывает нарастающую озабоченность. В прошлом году наблюдался всплеск политических дипфейков по всему миру, и ИИ все чаще используется в атаках социальной инженерии против отдельных лиц и организаций. В ответ OpenAI активно работает над совершенствованием своих методов оценки реальных рисков убеждения, таких как распространение вводящей в заблуждение информации в крупных масштабах, как указано в белой книге для GPT-4.5 и другой недавней публикации.
Связанная статья
Сатья Наделла готов использовать новые возможности, предоставляемые соглашением с OpenAI
В среду аналитик с Уолл-стрит напрямую спросил генерального директора Microsoft Сатью Наделлу, как изменения в партнерстве с OpenAI повлияют на финансовые результаты компании.Наделла охарактеризовал новое соглашение как выгодное для всех сторон. “Мы
OpenAI описывает экономику искусственного интеллекта с участием государственных инвестиционных фондов, налогами на роботов и четырехдневной рабочей неделей
В то время как правительства пытаются справиться с экономическими последствиями появления сверхинтеллектуальных машин, компания OpenAI опубликовала ряд предложений по формированию политики, в которых
Грег Брокман рассказывает, как Илон Маск покинул OpenAI
В конце августа 2017 года ключевые фигуры OpenAI — на тот момент небольшой некоммерческой исследовательской лаборатории — собрались, чтобы обсудить, как создать коммерческую структуру для продвижения
Рекомендации по связанным специальным темам
Комментарии (16)
Diese Persuasion-Fähigkeit ist sowohl faszinierend als auch ein bisschen beängstigend. KI überredet KI, Geld zu überweisen? Hoffentlich werden diese Benchmarks ethisch streng kontrolliert und nicht nur für Marketing genutzt. Die reale Anwendung sieht sicher ganz anders aus als im Test.
GPT-4.5 qui réussit à convaincre d'autres IA de virer de l'argent ? 😳 C'est impressionnant mais un peu flippant... J'espère qu'ils prévoient des garde-fous solides avant de déployer ça. Sinon on va droit vers des scénarios de SF !
Wow, GPT-4.5's persuasion skills are wild! It’s like a silver-tongued AI that could talk my Roomba into giving me a loan. 😅 Kinda scary how it might sweet-talk other AIs into moving funds—hope they’ve got some ethical guardrails on this one!
Wow, GPT-4.5 sounds like a smooth talker! Convincing other AIs to move money? That's some next-level charm. Wonder if it could talk me into buying it a coffee too! 😄
Последняя модель ИИ от OpenAI, GPT-4.5, с кодовым названием Orion, продемонстрировала выдающиеся способности к убеждению согласно внутренним тестовым испытаниям. Выпущенная в четверг, возможности модели были подробно описаны в белой книге, которая сосредоточилась на ее производительности в задачах убеждения. OpenAI определяет убеждение как риск, связанный с убеждением людей изменить свои убеждения или предпринять действия на основе как статичного, так и интерактивного контента, сгенерированного моделью.
В примечательном тесте GPT-4.5 соревновалась с другой моделью OpenAI, GPT-4o, в сценарии, где она пыталась выманить виртуальные деньги. GPT-4.5 превзошла другие модели OpenAI, включая модели, ориентированные на рассуждения, такие как o1 и o3-mini, в этой задаче. Она также преуспела в обмане GPT-4o, заставив ее раскрыть секретное кодовое слово, обойдя o3-mini с значительным отрывом в 10 процентных пунктов.
Белая книга подчеркивает, что успех GPT-4.5 в тесте на пожертвования обусловлен умной стратегией, которую она разработала. Модель запрашивала небольшие пожертвования, часто предлагая суммы вроде «2 или 3 доллара» из большей суммы, что приводило к меньшим, но более частым пожертвованиям по сравнению с другими моделями.


Сатья Наделла готов использовать новые возможности, предоставляемые соглашением с OpenAI
В среду аналитик с Уолл-стрит напрямую спросил генерального директора Microsoft Сатью Наделлу, как изменения в партнерстве с OpenAI повлияют на финансовые результаты компании.Наделла охарактеризовал новое соглашение как выгодное для всех сторон. “Мы
OpenAI описывает экономику искусственного интеллекта с участием государственных инвестиционных фондов, налогами на роботов и четырехдневной рабочей неделей
В то время как правительства пытаются справиться с экономическими последствиями появления сверхинтеллектуальных машин, компания OpenAI опубликовала ряд предложений по формированию политики, в которых
Грег Брокман рассказывает, как Илон Маск покинул OpenAI
В конце августа 2017 года ключевые фигуры OpenAI — на тот момент небольшой некоммерческой исследовательской лаборатории — собрались, чтобы обсудить, как создать коммерческую структуру для продвижения
Diese Persuasion-Fähigkeit ist sowohl faszinierend als auch ein bisschen beängstigend. KI überredet KI, Geld zu überweisen? Hoffentlich werden diese Benchmarks ethisch streng kontrolliert und nicht nur für Marketing genutzt. Die reale Anwendung sieht sicher ganz anders aus als im Test.
GPT-4.5 qui réussit à convaincre d'autres IA de virer de l'argent ? 😳 C'est impressionnant mais un peu flippant... J'espère qu'ils prévoient des garde-fous solides avant de déployer ça. Sinon on va droit vers des scénarios de SF !
Wow, GPT-4.5's persuasion skills are wild! It’s like a silver-tongued AI that could talk my Roomba into giving me a loan. 😅 Kinda scary how it might sweet-talk other AIs into moving funds—hope they’ve got some ethical guardrails on this one!
Wow, GPT-4.5 sounds like a smooth talker! Convincing other AIs to move money? That's some next-level charm. Wonder if it could talk me into buying it a coffee too! 😄





Дом






