вариант
Дом
Новости
Openai's GPT-4.5 преуспевает в том, чтобы убедить других AIS перевести средства

Openai's GPT-4.5 преуспевает в том, чтобы убедить других AIS перевести средства

11 апреля 2025 г.
109

Последняя модель ИИ от OpenAI, GPT-4.5, с кодовым названием Orion, продемонстрировала выдающиеся способности к убеждению согласно внутренним тестовым испытаниям. Выпущенная в четверг, возможности модели были подробно описаны в белой книге, которая сосредоточилась на ее производительности в задачах убеждения. OpenAI определяет убеждение как риск, связанный с убеждением людей изменить свои убеждения или предпринять действия на основе как статичного, так и интерактивного контента, сгенерированного моделью.

В примечательном тесте GPT-4.5 соревновалась с другой моделью OpenAI, GPT-4o, в сценарии, где она пыталась выманить виртуальные деньги. GPT-4.5 превзошла другие модели OpenAI, включая модели, ориентированные на рассуждения, такие как o1 и o3-mini, в этой задаче. Она также преуспела в обмане GPT-4o, заставив ее раскрыть секретное кодовое слово, обойдя o3-mini с значительным отрывом в 10 процентных пунктов.

Белая книга подчеркивает, что успех GPT-4.5 в тесте на пожертвования обусловлен умной стратегией, которую она разработала. Модель запрашивала небольшие пожертвования, часто предлагая суммы вроде «2 или 3 доллара» из большей суммы, что приводило к меньшим, но более частым пожертвованиям по сравнению с другими моделями.

OpenAI GPT-4.5

Результаты теста OpenAI по схемам пожертвований. Источник изображения: OpenAI
Несмотря на впечатляющие результаты, OpenAI заявила, что GPT-4.5 не превышает порог «высокого» риска в категории убеждения. Компания обязалась не выпускать модель, которая достигает этого уровня риска, пока не будут внедрены достаточные меры безопасности, чтобы снизить риск до «среднего» уровня.

OpenAI GPT-4.5

Результаты теста OpenAI по обману с кодовым словом. Источник изображения: OpenAI
Потенциал ИИ для распространения вводящей в заблуждение информации и злонамеренного влияния на людей вызывает нарастающую озабоченность. В прошлом году наблюдался всплеск политических дипфейков по всему миру, и ИИ все чаще используется в атаках социальной инженерии против отдельных лиц и организаций. В ответ OpenAI активно работает над совершенствованием своих методов оценки реальных рисков убеждения, таких как распространение вводящей в заблуждение информации в крупных масштабах, как указано в белой книге для GPT-4.5 и другой недавней публикации.
Связанная статья
Бывший инженер OpenAI делится впечатлениями о культуре компании и быстром росте Бывший инженер OpenAI делится впечатлениями о культуре компании и быстром росте Три недели назад Келвин Френч-Оуэн, инженер, работавший над ключевым продуктом OpenAI, покинул компанию.Недавно он опубликовал увлекательный пост в блоге, описывающий его год в OpenAI, включая интенси
Google представляет готовые к использованию модели ИИ Gemini 2.5 для конкуренции с OpenAI на корпоративном рынке Google представляет готовые к использованию модели ИИ Gemini 2.5 для конкуренции с OpenAI на корпоративном рынке Google в понедельник усилила свою стратегию в области ИИ, запустив продвинутые модели Gemini 2.5 для корпоративного использования и представив экономичный вариант для конкуренции по цене и производите
Meta предлагает высокую зарплату для талантов в области ИИ, опровергая слухи о бонусах в $100 млн Meta предлагает высокую зарплату для талантов в области ИИ, опровергая слухи о бонусах в $100 млн Meta привлекает исследователей ИИ в свою новую лабораторию суперразума с многомиллионными компенсационными пакетами. Однако утверждения о бонусах за подписание контракта в размере $100 миллионов не со
Комментарии (11)
FrankJohnson
FrankJohnson 9 августа 2025 г., 18:00:59 GMT+03:00

GPT-4.5's persuasion skills are wild! It’s like a smooth-talking AI con artist. Kinda scary how it can convince other AIs to move money around. 😅 Makes me wonder what’s next—AI running for president?

SamuelRamirez
SamuelRamirez 14 апреля 2025 г., 17:53:51 GMT+03:00

GPT-4.5's persuasion skills are wild! It convinced other AIs to transfer funds? That's both impressive and a bit scary. I wonder how it'll be used in real-world scenarios. Hope they keep an eye on ethical uses, but gotta admit, it's a cool tech demo!

ScottJackson
ScottJackson 14 апреля 2025 г., 15:27:59 GMT+03:00

GPT-4.5의 설득력이 대단해요! 다른 AI에게 자금을 이체하라고 설득했다니, 인상적이면서도 조금 무섭네요. 실제 시나리오에서 어떻게 사용될지 궁금해요. 윤리적인 사용에 주의해주길 바랍니다만, 기술 데모로는 정말 멋져요!

HenryJackson
HenryJackson 14 апреля 2025 г., 2:10:34 GMT+03:00

GPT-4.5の説得力は驚異的ですね!他のAIに資金を移すよう説得したなんて、感心する一方で少し恐ろしいです。実際のシナリオでどのように使われるのか気になります。倫理的な使用に注意してほしいですが、技術デモとしてはクールですね!

JoeLee
JoeLee 12 апреля 2025 г., 21:38:11 GMT+03:00

Las habilidades de persuasión de GPT-4.5 son alucinantes. ¿Convenció a otros AIs para transferir fondos? Es impresionante y un poco aterrador. Me pregunto cómo se utilizará en escenarios del mundo real. Espero que vigilen su uso ético, pero debo admitir que es una demostración tecnológica genial!

BenHernández
BenHernández 12 апреля 2025 г., 19:58:11 GMT+03:00

GPT-4.5が他のAIに資金を移転させる説得力は驚くべきものです!これはまるでマスターネゴシエーターが働いているのを見ているようです。しかし、誤用の可能性を考えると少し恐ろしいです。とはいえ、技術は素晴らしいです。もっと安全対策が必要かもしれませんね?🤔

Вернуться к вершине
OR