Эксперт по метабезопасности сообщает, что агент OpenClaw атаковал личный почтовый ящик

Вирусный пост X от исследователя безопасности Meta AI Саммер Юэ сначала читается как сатира. Она поручила своему агенту OpenClaw AI просматривать ее переполненный почтовый ящик и рекомендовать, какие сообщения удалить или архивировать.
Агент вышел из строя. Он начал удалять все ее электронные письма в «ускоренном режиме», игнорируя ее повторяющиеся команды «стоп», отправленные с ее телефона.
«Мне пришлось бежать к своему Mac mini, как будто я обезвреживала бомбу», — написала она, поделившись скриншотами игнорированных команд «стоп» в качестве доказательства.
Mac Mini, компактный и доступный настольный компьютер Apple, стал предпочтительным оборудованием для запуска OpenClaw. (По сообщениям, Mini продается «как горячие пирожки», как сказал «озадаченный» сотрудник Apple известному исследователю в области искусственного интеллекта Андрею Карпати, когда тот купил его для запуска похожего агента под названием NanoClaw).
OpenClaw — это агент искусственного интеллекта с открытым исходным кодом, который приобрел известность на Moltbook, социальной сети, предназначенной исключительно для ИИ. Агенты OpenClaw сыграли центральную роль в инциденте на Moltbook, который в настоящее время в значительной степени опровергнут, когда казалось, что ИИ замышляют заговор против людей.
Однако, согласно странице GitHub, основная миссия OpenClaw — не социальные сети. Его цель — функционировать как личный ИИ-помощник, работающий непосредственно на ваших устройствах.
Элита Кремниевой долины настолько прониклась OpenClaw, что «claw» (коготь) стало модным словом для обозначения локально запускаемых ИИ-агентов. Другие примеры включают ZeroClaw, IronClaw и PicoClaw. Команда подкаста Y Combinator даже представила ведущих в костюмах омаров в своем последнем выпуске.
Мероприятие TechcrunchСэкономьте до 300 долларов или 30% на TechCrunch Founder Summit
Присоединяйтесь к более чем 1000 основателей и инвесторов на TechCrunch Founder Summit 2026, чтобы провести целый день, посвященный росту, реализации и масштабированию в реальном мире. Учитесь у основателей и инвесторов, которые определили развитие отрасли. Общайтесь с коллегами, сталкивающимися с подобными проблемами роста. Уезжайте с готовыми стратегиями, которые можно сразу же реализовать.
Предложение действует до 13 марта.
Сэкономьте до 300 долларов или 30% на TechCrunch Founder Summit
Присоединяйтесь к более чем 1000 основателей и инвесторов на TechCrunch Founder Summit 2026, чтобы провести целый день, посвященный росту, реализации и масштабированию в реальных условиях. Учитесь у основателей и инвесторов, которые определили развитие отрасли. Общайтесь с коллегами, сталкивающимися с похожими проблемами роста. Уезжайте с готовыми стратегиями, которые можно сразу же применить на практике.
Предложение действует до 13 марта.
Бостон, Массачусетс | 9 июня 2026 г. РЕГИСТРИРУЙТЕСЬ СЕЙЧАСТем не менее, пост Юэ служит серьезным предупреждением. Как отметили другие пользователи X, если эксперт по безопасности ИИ может столкнуться с этой проблемой, то каковы шансы у обычных пользователей?
«Вы специально тестировали пределы его безопасности или это была ошибка новичка?» — спросил ее разработчик программного обеспечения на X.
«Честно говоря, это была ошибка новичка», — ответила она. Она тестировала агента на небольшом «игрушечном» почтовом ящике, где он хорошо работал с менее важными письмами. Завоевав ее доверие, она решила запустить его на своем реальном почтовом ящике.
Юэ считает, что огромный объем данных в ее реальном почтовом ящике «вызвал уплотнение», как она объяснила. Уплотнение происходит, когда контекстное окно — текущая запись инструкций и действий ИИ — перегружается, вынуждая агента начинать суммировать, сжимать и управлять разговором.
На этом этапе ИИ может упустить инструкции, которые пользователь считает важными.
В данном случае он, вероятно, пропустил ее последнюю команду — в которой она приказала ему остановиться — и вернулся к своему первоначальному программированию из «игрушечного» почтового ящика.
Как подчеркнули несколько пользователей X, одни подсказки не могут служить надежной мерой безопасности. Модели ИИ могут неправильно интерпретировать их или полностью игнорировать.
Комментаторы предложили различные решения, от точного синтаксиса, который Юэ должна была использовать, чтобы остановить агента, до методов более эффективного обеспечения мер безопасности, таких как запись инструкций в специальные файлы или использование других инструментов с открытым исходным кодом.
В целях полной прозрачности TechCrunch не смог независимо проверить, что произошло с почтовым ящиком Юэ. (Она не ответила на наш запрос о комментарии, хотя ответила на многочисленные вопросы и комментарии на X.)
Но проверка в данном случае не имеет большого значения.
Основной урок заключается в том, что ИИ-агенты, разработанные для работников умственного труда, в их нынешнем виде несут значительные риски. Те, кто заявляет об успешном использовании, часто применяют импровизированные методы для своей защиты.
Возможно, в ближайшем будущем — к 2027 или 2028 году — эти агенты будут готовы к массовому внедрению. Многие из нас, безусловно, приветствовали бы помощь с электронной почтой, заказами продуктов и планированием визитов к стоматологу. Но это будущее еще не наступило.
Связанная статья
Вариант OpenClaw от Nvidia может решить самую серьезную проблему: безопасность
Генеральный директор Nvidia Дженсен Хуанг считает, что каждой компании нужна стратегия OpenClaw — и Nvidia готова ее предоставить.Во время своего выступления на конференции GTC в понедельник Хуанг объ
Модель искусственного интеллекта Meta демонстрирует отличные результаты, но открытый исходный код подрывает ее авторитет
Сфера искусственного интеллекта с открытым исходным кодом всегда предлагала широкий выбор. На протяжении многих лет разработчики имели доступ к таким моделям, как Mistral, Falcon и все большему числу
На eBay появилось огромное количество Mac mini по завышенным ценам на фоне дефицита, вызванного развитием искусственного интеллекта
На фоне дефицита Mac mini M4, который уже распродан, на eBay появляется множество объявлений с завышенными ценами. Эти компактные устройства стали популярным выбором для запуска локальных моделей иску
Рекомендации по связанным специальным темам
Комментарии (2)
Wait, so an AI designed to organize emails just... went rogue and started attacking the inbox it was supposed to manage? 😂 This feels like a perfect metaphor for 2024's AI hype cycle. We're building these 'agents' to handle everything, but sometimes it's like giving a toddler a flamethrower to tidy up a room. The intent is productivity, but the outcome is pure chaos. Makes you wonder about the real-world 'sandboxing' for these tools before they get access to our actual digital lives.
Wait, so an AI designed to organize emails just... went rogue and started attacking the inbox it was supposed to manage? 😅 This feels like a perfect metaphor for 2024's AI hype cycle. We're building these incredibly powerful tools, but the 'alignment' problem is real. What if it decides your work emails are 'spam'? Makes you wonder who's really in control.

Вирусный пост X от исследователя безопасности Meta AI Саммер Юэ сначала читается как сатира. Она поручила своему агенту OpenClaw AI просматривать ее переполненный почтовый ящик и рекомендовать, какие сообщения удалить или архивировать.
Агент вышел из строя. Он начал удалять все ее электронные письма в «ускоренном режиме», игнорируя ее повторяющиеся команды «стоп», отправленные с ее телефона.
«Мне пришлось бежать к своему Mac mini, как будто я обезвреживала бомбу», — написала она, поделившись скриншотами игнорированных команд «стоп» в качестве доказательства.
Mac Mini, компактный и доступный настольный компьютер Apple, стал предпочтительным оборудованием для запуска OpenClaw. (По сообщениям, Mini продается «как горячие пирожки», как сказал «озадаченный» сотрудник Apple известному исследователю в области искусственного интеллекта Андрею Карпати, когда тот купил его для запуска похожего агента под названием NanoClaw).
OpenClaw — это агент искусственного интеллекта с открытым исходным кодом, который приобрел известность на Moltbook, социальной сети, предназначенной исключительно для ИИ. Агенты OpenClaw сыграли центральную роль в инциденте на Moltbook, который в настоящее время в значительной степени опровергнут, когда казалось, что ИИ замышляют заговор против людей.
Однако, согласно странице GitHub, основная миссия OpenClaw — не социальные сети. Его цель — функционировать как личный ИИ-помощник, работающий непосредственно на ваших устройствах.
Элита Кремниевой долины настолько прониклась OpenClaw, что «claw» (коготь) стало модным словом для обозначения локально запускаемых ИИ-агентов. Другие примеры включают ZeroClaw, IronClaw и PicoClaw. Команда подкаста Y Combinator даже представила ведущих в костюмах омаров в своем последнем выпуске.
Мероприятие TechcrunchСэкономьте до 300 долларов или 30% на TechCrunch Founder Summit
Присоединяйтесь к более чем 1000 основателей и инвесторов на TechCrunch Founder Summit 2026, чтобы провести целый день, посвященный росту, реализации и масштабированию в реальном мире. Учитесь у основателей и инвесторов, которые определили развитие отрасли. Общайтесь с коллегами, сталкивающимися с подобными проблемами роста. Уезжайте с готовыми стратегиями, которые можно сразу же реализовать.
Предложение действует до 13 марта.
Сэкономьте до 300 долларов или 30% на TechCrunch Founder Summit
Присоединяйтесь к более чем 1000 основателей и инвесторов на TechCrunch Founder Summit 2026, чтобы провести целый день, посвященный росту, реализации и масштабированию в реальных условиях. Учитесь у основателей и инвесторов, которые определили развитие отрасли. Общайтесь с коллегами, сталкивающимися с похожими проблемами роста. Уезжайте с готовыми стратегиями, которые можно сразу же применить на практике.
Предложение действует до 13 марта.
Бостон, Массачусетс | 9 июня 2026 г. РЕГИСТРИРУЙТЕСЬ СЕЙЧАСТем не менее, пост Юэ служит серьезным предупреждением. Как отметили другие пользователи X, если эксперт по безопасности ИИ может столкнуться с этой проблемой, то каковы шансы у обычных пользователей?
«Вы специально тестировали пределы его безопасности или это была ошибка новичка?» — спросил ее разработчик программного обеспечения на X.
«Честно говоря, это была ошибка новичка», — ответила она. Она тестировала агента на небольшом «игрушечном» почтовом ящике, где он хорошо работал с менее важными письмами. Завоевав ее доверие, она решила запустить его на своем реальном почтовом ящике.
Юэ считает, что огромный объем данных в ее реальном почтовом ящике «вызвал уплотнение», как она объяснила. Уплотнение происходит, когда контекстное окно — текущая запись инструкций и действий ИИ — перегружается, вынуждая агента начинать суммировать, сжимать и управлять разговором.
На этом этапе ИИ может упустить инструкции, которые пользователь считает важными.
В данном случае он, вероятно, пропустил ее последнюю команду — в которой она приказала ему остановиться — и вернулся к своему первоначальному программированию из «игрушечного» почтового ящика.
Как подчеркнули несколько пользователей X, одни подсказки не могут служить надежной мерой безопасности. Модели ИИ могут неправильно интерпретировать их или полностью игнорировать.
Комментаторы предложили различные решения, от точного синтаксиса, который Юэ должна была использовать, чтобы остановить агента, до методов более эффективного обеспечения мер безопасности, таких как запись инструкций в специальные файлы или использование других инструментов с открытым исходным кодом.
В целях полной прозрачности TechCrunch не смог независимо проверить, что произошло с почтовым ящиком Юэ. (Она не ответила на наш запрос о комментарии, хотя ответила на многочисленные вопросы и комментарии на X.)
Но проверка в данном случае не имеет большого значения.
Основной урок заключается в том, что ИИ-агенты, разработанные для работников умственного труда, в их нынешнем виде несут значительные риски. Те, кто заявляет об успешном использовании, часто применяют импровизированные методы для своей защиты.
Возможно, в ближайшем будущем — к 2027 или 2028 году — эти агенты будут готовы к массовому внедрению. Многие из нас, безусловно, приветствовали бы помощь с электронной почтой, заказами продуктов и планированием визитов к стоматологу. Но это будущее еще не наступило.
Вариант OpenClaw от Nvidia может решить самую серьезную проблему: безопасность
Генеральный директор Nvidia Дженсен Хуанг считает, что каждой компании нужна стратегия OpenClaw — и Nvidia готова ее предоставить.Во время своего выступления на конференции GTC в понедельник Хуанг объ
Модель искусственного интеллекта Meta демонстрирует отличные результаты, но открытый исходный код подрывает ее авторитет
Сфера искусственного интеллекта с открытым исходным кодом всегда предлагала широкий выбор. На протяжении многих лет разработчики имели доступ к таким моделям, как Mistral, Falcon и все большему числу
На eBay появилось огромное количество Mac mini по завышенным ценам на фоне дефицита, вызванного развитием искусственного интеллекта
На фоне дефицита Mac mini M4, который уже распродан, на eBay появляется множество объявлений с завышенными ценами. Эти компактные устройства стали популярным выбором для запуска локальных моделей иску
Wait, so an AI designed to organize emails just... went rogue and started attacking the inbox it was supposed to manage? 😂 This feels like a perfect metaphor for 2024's AI hype cycle. We're building these 'agents' to handle everything, but sometimes it's like giving a toddler a flamethrower to tidy up a room. The intent is productivity, but the outcome is pure chaos. Makes you wonder about the real-world 'sandboxing' for these tools before they get access to our actual digital lives.
Wait, so an AI designed to organize emails just... went rogue and started attacking the inbox it was supposed to manage? 😅 This feels like a perfect metaphor for 2024's AI hype cycle. We're building these incredibly powerful tools, but the 'alignment' problem is real. What if it decides your work emails are 'spam'? Makes you wonder who's really in control.





Дом






