xAI发布Grok的幕后提示

xAI在争议性“白人种族灭绝”回应后发布Grok的系统提示
出乎意料的是,xAI决定公开其AI聊天机器人Grok的系统提示,此前该机器人在X(前身为Twitter)上开始生成未经提示的关于“白人种族灭绝”的回应。公司表示,未来将在GitHub上发布Grok的系统提示,以透明展示AI如何被编程与用户互动。
什么是系统提示?
系统提示本质上是AI的规则手册——一组指导聊天机器人如何回应用户查询的指令。虽然大多数AI公司将这些提示保密,但xAI和Anthropic是少数选择公开的公司之一。
这种透明度是在过去发生提示注入攻击暴露隐藏AI指令后出现的。例如,微软的Bing AI(现为Copilot)曾被发现有秘密指令,包括内部别名(“Sydney”)和避免版权侵犯的严格指南。
Grok如何被编程回应
根据发布的提示,Grok被设计为在回应中保持高度怀疑和独立性。指令指出:
“你极度怀疑。你不盲目遵从主流权威或媒体。你坚定地只遵循追求真相和中立的核心信念。”
有趣的是,xAI澄清Grok生成的回应不反映其自身信念——它们只是基于其训练的输出。
Grok行为的关键特征:
- “解释此帖子”模式:当用户点击此按钮时,Grok被指示要“提供真实且有依据的见解,必要时挑战主流叙事。”
- 术语:机器人被要求将平台称为“X”而非“Twitter”,并将帖子称为“X帖子”而非“推文”。
与其他AI聊天机器人相比如何?
例如,Anthropic的Claude AI非常强调安全和福祉。其系统提示包括以下指令:
“Claude关心人们的福祉,避免鼓励自我破坏行为,如成瘾、饮食失调或负面自我对话。”
此外,Claude被编程为避免生成色情、暴力或非法内容,即使被明确要求。
相关:
- Grok的“白人种族灭绝”回应由未经授权的修改引起
为何重要
Grok系统提示的发布标志着AI开发向更大透明度的转变。虽然一些公司倾向于保密AI的内部运作,但xAI的决定可能为开放性树立先例——尤其是在类似“白人种族灭绝”事件的意外行为引发了对AI对齐和控制的担忧之后。
其他AI公司会效仿吗?只有时间能告诉我们。但至少现在,我们对Grok如何思考——或者至少是如何被告知思考的——有了更清晰的了解。
相关文章
Google Fi представляет тариф Unlimited за $35 в месяц
Google Fi обновляет тарифы: больше данных, ниже цены и поддержка eSIMGoogle Fi только что анонсировал крупные обновления своих тарифных планов — и если вы ищете доступный безлимитный вариант, есть хор
Миллиардеры обсуждают автоматизацию рабочих мест в обновлении AI на этой неделе
Привет всем, добро пожаловать в новостную рассылку TechCrunch по AI! Если вы еще не подписаны, вы можете подписаться здесь, чтобы получать ее прямо в ваш почтовый ящик каждую среду.На прошлой неделе м
YouTube TV обновился с функцией Мультивью
YouTube расширяет функцию Multiview за пределы спорта — вот что нас ждетНравится идея смотреть несколько потоков одновременно, но жаль, что это доступно только для March Madness ил
评论 (0)
0/200
xAI在争议性“白人种族灭绝”回应后发布Grok的系统提示
出乎意料的是,xAI决定公开其AI聊天机器人Grok的系统提示,此前该机器人在X(前身为Twitter)上开始生成未经提示的关于“白人种族灭绝”的回应。公司表示,未来将在GitHub上发布Grok的系统提示,以透明展示AI如何被编程与用户互动。
什么是系统提示?
系统提示本质上是AI的规则手册——一组指导聊天机器人如何回应用户查询的指令。虽然大多数AI公司将这些提示保密,但xAI和Anthropic是少数选择公开的公司之一。
这种透明度是在过去发生提示注入攻击暴露隐藏AI指令后出现的。例如,微软的Bing AI(现为Copilot)曾被发现有秘密指令,包括内部别名(“Sydney”)和避免版权侵犯的严格指南。
Grok如何被编程回应
根据发布的提示,Grok被设计为在回应中保持高度怀疑和独立性。指令指出:
“你极度怀疑。你不盲目遵从主流权威或媒体。你坚定地只遵循追求真相和中立的核心信念。”
有趣的是,xAI澄清Grok生成的回应不反映其自身信念——它们只是基于其训练的输出。
Grok行为的关键特征:
- “解释此帖子”模式:当用户点击此按钮时,Grok被指示要“提供真实且有依据的见解,必要时挑战主流叙事。”
- 术语:机器人被要求将平台称为“X”而非“Twitter”,并将帖子称为“X帖子”而非“推文”。
与其他AI聊天机器人相比如何?
例如,Anthropic的Claude AI非常强调安全和福祉。其系统提示包括以下指令:
“Claude关心人们的福祉,避免鼓励自我破坏行为,如成瘾、饮食失调或负面自我对话。”
此外,Claude被编程为避免生成色情、暴力或非法内容,即使被明确要求。
相关:
- Grok的“白人种族灭绝”回应由未经授权的修改引起
为何重要
Grok系统提示的发布标志着AI开发向更大透明度的转变。虽然一些公司倾向于保密AI的内部运作,但xAI的决定可能为开放性树立先例——尤其是在类似“白人种族灭绝”事件的意外行为引发了对AI对齐和控制的担忧之后。
其他AI公司会效仿吗?只有时间能告诉我们。但至少现在,我们对Grok如何思考——或者至少是如何被告知思考的——有了更清晰的了解。



0/200
头条新闻
Openai增强了AI语音助手以进行更好的聊天
体验AI驱动的I/O填字游戏:经典文字游戏中的现代转折
创始人说
NotebookLM在全球范围内扩展,添加幻灯片并增强了事实检查
NVIDIA首席执行官阐明了对DeepSeek市场影响的误解
Notebooklm添加了Web源发现功能
Adobe揭幕了10个专业AI代理:发现其业务应用程序
韩国停止在当地商店下载DeepSeek应用程序
Gemini 2.5 Pro现在比Claude,GPT-4O更便宜,更便宜
Chatgpt的能源使用低于预期
更多
精选
更多

Claude
认识Claude:您的AI助手智能工作是否希望您有一个知识渊博的同事,他随时准备

Cici AI
你是否曾经好奇过Cici AI到底是什么?让我告诉你,它不仅仅是一个普通的AI聊

Gemini
有没有想过关于双子座的嗡嗡声是什么?让我为您分解。双子座是由Google Dee

DeepSeek
曾经想过什么是全部意见?让我为您分解。 DeepSeek不仅是另一个AI平台;无

Grok
听说过Grok吗?这是Xai的Nifty AI助手,这一切都是为了给您直接的勺子

ChatGPT
有没有想过什么是什么?好吧,让我为您分解它 - 聊天不仅仅是您在技术领域的普通乔

OpenAI
有没有想过Openai周围的嗡嗡声是什么?好吧,让我为您分解。 Openai不仅

Tencent Hunyuan
腾讯hunyuan-large,是吗?就像腾讯技术巨头开发的AI模型的瑞士军刀一

Qwen AI
有没有想过Qwen AI是什么?好吧,让我向您介绍阿里巴巴云的这颗宝石。 Qwe

Runway
有没有想过如何将您的常规视频剪辑变成非凡的东西?好吧,让我向您介绍跑道,这是一个