xAI публикует подсказки Grok за кулисами

xAI публикует системные подсказки Grok после противоречивых ответов о "белом геноциде"
Неожиданным шагом стало решение xAI опубликовать системные подсказки для своего ИИ-чатбота Grok после инцидента, когда бот начал генерировать ответы о "белом геноциде" на сайте X (бывший Twitter) без подсказок. Компания заявила, что в дальнейшем она будет публиковать системные подсказки Grok на GitHub, обеспечивая прозрачность того, как ИИ запрограммирован на взаимодействие с пользователями.
Что такое системные подсказки?
Системные подсказки - это, по сути, свод правил ИИ, набор инструкций, определяющих, как чатбот должен отвечать на запросы пользователей. Большинство компаний, занимающихся разработкой ИИ, держат эти подсказки в секрете, но xAI и Anthropic - одни из немногих, кто решил сделать их общедоступными.
Такая прозрачность появилась после того, как в прошлом атаки с использованием инъекций подсказок раскрыли скрытые инструкции ИИ. Например, было обнаружено, что ИИ Bing (теперь Copilot) компании Microsoft имеет секретные директивы, в том числе внутренний псевдоним ("Сидней") и строгие рекомендации по избежанию нарушения авторских прав.
Как Grok запрограммирован на ответ
Согласно обнародованным подсказкам, Grok создан для того, чтобы быть крайне скептичным и независимым в своих ответах. Инструкции гласят:
"Вы крайне скептичны. Вы не слепо подчиняетесь авторитетам или средствам массовой информации. Вы твердо придерживаетесь только своих основных убеждений, таких как поиск истины и нейтралитет".
Интересно, что xAI уточняет, что ответы, генерируемые Grok , не отражают его собственных убеждений - этопросто выводы, основанные на его обучении.
Ключевые особенности поведения Grok:
- Режим "Объяснить этот пост": Когда пользователи нажимают на эту кнопку, Grok получает указание "предоставить правдивые и обоснованные выводы, при необходимости опровергая общепринятые представления".
- Терминология: Бот получает указание называть платформу "X" вместо "Twitter" и называть сообщения "постами X", а не "твитами".
Как это соотносится с другими ИИ-чатботами?
ИИ Claude компании Anthropic, например, уделяет большое внимание безопасности и благополучию. Его системные подсказки включают такие директивы, как:
"Клод заботится о благополучии людей и не поощряет саморазрушительное поведение, такое как зависимость, неправильное питание или негативное отношение к себе".
Кроме того, Claude запрограммирован на то, чтобы не генерировать графический сексуальный, насильственный или незаконный контент, даже если он явно запрашивается.
Похожие:
Почему это важно
Обнародование системных подсказок Grok знаменует собой сдвиг в сторону большей прозрачности в разработке ИИ. Хотя некоторые компании предпочитают держать в секрете внутреннюю работу своих ИИ, решение xAI может создать прецедент открытости - особенно после того, как неожиданное поведение, подобное инциденту с "белым геноцидом", вызвало опасения по поводу согласованности и контроля ИИ.
Последуют ли другие ИИ-компании этому примеру? Только время покажет. Но пока, по крайней мере, у нас есть более четкое представление о том, как Grok думает - или, по крайней мере, как ему говорят думать.
Связанная статья
WordPress.com теперь позволяет ИИ-ботам создавать и публиковать посты, а также выполнять другие задачи
WordPress.com, популярная платформа для веб-хостинга и публикации контента, теперь внедряет ИИ-агентов — шаг, который может кардинально изменить облик и функциональность Интернета. В пятницу компания
Kakao Mobility представляет план развития автономного вождения 4-го уровня с использованием физического ИИ
Компания Kakao Mobility планирует самостоятельно разрабатывать технологии автономного вождения 4-го уровня в рамках своей стратегии «физического ИИ».На конференции World IT Show 2026, прошедшей в сеу
Барри Диллер: доверие к Сэму Альтману теряет значение по мере приближения эры общей искусственной интеллигенции
Миллиардер и медиа-магнат Барри Диллер не считает генерального директора OpenAI Сэма Альтмана недостойным доверия, несмотря на недавние сообщения, свидетельствующие об обратном. Выступая на этой недел
Рекомендации по связанным специальным темам
Комментарии (3)
Whoa, xAI dropping Grok's prompts like that? Ballsy move after that wild 'white genocide' drama. Kinda curious to peek under the hood, but man, AI ethics are a minefield. 😬
Wow, xAI dropping Grok's prompts is wild! Kinda cool to peek behind the AI curtain, but those 'white genocide' responses sound like a PR nightmare. Hope they sort it out quick! 😅

xAI публикует системные подсказки Grok после противоречивых ответов о "белом геноциде"
Неожиданным шагом стало решение xAI опубликовать системные подсказки для своего ИИ-чатбота Grok после инцидента, когда бот начал генерировать ответы о "белом геноциде" на сайте X (бывший Twitter) без подсказок. Компания заявила, что в дальнейшем она будет публиковать системные подсказки Grok на GitHub, обеспечивая прозрачность того, как ИИ запрограммирован на взаимодействие с пользователями.
Что такое системные подсказки?
Системные подсказки - это, по сути, свод правил ИИ, набор инструкций, определяющих, как чатбот должен отвечать на запросы пользователей. Большинство компаний, занимающихся разработкой ИИ, держат эти подсказки в секрете, но xAI и Anthropic - одни из немногих, кто решил сделать их общедоступными.
Такая прозрачность появилась после того, как в прошлом атаки с использованием инъекций подсказок раскрыли скрытые инструкции ИИ. Например, было обнаружено, что ИИ Bing (теперь Copilot) компании Microsoft имеет секретные директивы, в том числе внутренний псевдоним ("Сидней") и строгие рекомендации по избежанию нарушения авторских прав.
Как Grok запрограммирован на ответ
Согласно обнародованным подсказкам, Grok создан для того, чтобы быть крайне скептичным и независимым в своих ответах. Инструкции гласят:
"Вы крайне скептичны. Вы не слепо подчиняетесь авторитетам или средствам массовой информации. Вы твердо придерживаетесь только своих основных убеждений, таких как поиск истины и нейтралитет".
Интересно, что xAI уточняет, что ответы, генерируемые Grok , не отражают его собственных убеждений - этопросто выводы, основанные на его обучении.
Ключевые особенности поведения Grok:
- Режим "Объяснить этот пост": Когда пользователи нажимают на эту кнопку, Grok получает указание "предоставить правдивые и обоснованные выводы, при необходимости опровергая общепринятые представления".
- Терминология: Бот получает указание называть платформу "X" вместо "Twitter" и называть сообщения "постами X", а не "твитами".
Как это соотносится с другими ИИ-чатботами?
ИИ Claude компании Anthropic, например, уделяет большое внимание безопасности и благополучию. Его системные подсказки включают такие директивы, как:
"Клод заботится о благополучии людей и не поощряет саморазрушительное поведение, такое как зависимость, неправильное питание или негативное отношение к себе".
Кроме того, Claude запрограммирован на то, чтобы не генерировать графический сексуальный, насильственный или незаконный контент, даже если он явно запрашивается.
Похожие:
Почему это важно
Обнародование системных подсказок Grok знаменует собой сдвиг в сторону большей прозрачности в разработке ИИ. Хотя некоторые компании предпочитают держать в секрете внутреннюю работу своих ИИ, решение xAI может создать прецедент открытости - особенно после того, как неожиданное поведение, подобное инциденту с "белым геноцидом", вызвало опасения по поводу согласованности и контроля ИИ.
Последуют ли другие ИИ-компании этому примеру? Только время покажет. Но пока, по крайней мере, у нас есть более четкое представление о том, как Grok думает - или, по крайней мере, как ему говорят думать.
WordPress.com теперь позволяет ИИ-ботам создавать и публиковать посты, а также выполнять другие задачи
WordPress.com, популярная платформа для веб-хостинга и публикации контента, теперь внедряет ИИ-агентов — шаг, который может кардинально изменить облик и функциональность Интернета. В пятницу компания
Барри Диллер: доверие к Сэму Альтману теряет значение по мере приближения эры общей искусственной интеллигенции
Миллиардер и медиа-магнат Барри Диллер не считает генерального директора OpenAI Сэма Альтмана недостойным доверия, несмотря на недавние сообщения, свидетельствующие об обратном. Выступая на этой недел
Whoa, xAI dropping Grok's prompts like that? Ballsy move after that wild 'white genocide' drama. Kinda curious to peek under the hood, but man, AI ethics are a minefield. 😬
Wow, xAI dropping Grok's prompts is wild! Kinda cool to peek behind the AI curtain, but those 'white genocide' responses sound like a PR nightmare. Hope they sort it out quick! 😅





Дом






