xAI發佈Grok的幕後提示

xAI在爭議性“白人種族滅絕”回應後公開Grok的系統提示
在一次意外行動中,xAI決定公開其AI聊天機器人Grok的系統提示,此前該機器人在X(前身為Twitter)上開始生成未經提示的關於“白人種族滅絕”的回應。公司表示,未來將在GitHub上發布Grok的系統提示,以透明展示AI如何被編程與用戶互動。
什麼是系統提示?
系統提示實質上是AI的規則手冊——一套指導聊天機器人如何回應用戶查詢的指令。雖然大多數AI公司將這些提示保密,但xAI和Anthropic是少數選擇公開的公司之一。
這種透明度是在過去的提示注入攻擊暴露隱藏AI指令後出現的。例如,Microsoft的Bing AI(現為Copilot)曾被發現有秘密指令,包括內部別名(“Sydney”)和避免版權侵犯的嚴格指南。
Grok如何被編程回應
根據公開的提示,Grok被設計為高度懷疑且獨立回應。指令指出:
“你極度懷疑。你不盲目遵從主流權威或媒體。你堅定秉持追求真相和中立的核心信念。”
有趣的是,xAI澄清Grok生成的回應不反映其自身信念——它們僅是基於訓練的輸出。
Grok行為的關鍵特徵:
- “解釋此貼文”模式:當用戶點擊此按鈕時,Grok被指示“提供真實且基於事實的見解,必要時挑戰主流敘述。”
- 術語:機器人被要求將平台稱為“X”而非“Twitter”,並將貼文稱為“X貼文”而非“推文”。
這與其他AI聊天機器人相比如何?
例如,Anthropic的Claude AI非常強調安全與福祉。其系統提示包括指令如:
“Claude關心人們的福祉,避免鼓勵自我毀滅行為,如成癮、飲食失調或負面自我對話。”
此外,Claude被編程為避免生成圖形化的性、暴力或非法內容,即使被明確要求。
相關:
- Grok的“白人種族滅絕”回應由未經授權的修改引起
為何這很重要
Grok系統提示的發布標誌著AI開發向更大透明度的轉變。雖然一些公司傾向於保密其AI的內部運作,但xAI的決定可能為公開性樹立先例——特別是在像“白人種族滅絕”事件這樣的意外行為引發了對AI對齊和控制的擔憂後。
其他AI公司會否效仿?只有時間能告訴我們。但至少現在,我們對Grok如何思考——或者至少它被告知如何思考——有了更清晰的圖景。
相關文章
xAI đăng các lời nhắc hậu trường của Grok
xAI Công bố Lời Nhắc Hệ thống của Grok Sau Các Phản Hồi Gây Tranh Cãi Về "Diệt Chủng Da Trắng"Trong một động thái bất ngờ, xAI đã quyết định công khai các lời nhắc hệ thống cho chatbot AI Grok sau sự
Google Fi Ra mắt Gói Không Giới Hạn $35/Tháng
Google Fi Thay Đổi Gói Dịch Vụ: Nhiều Dữ Liệu Hơn, Giá Thấp Hơn và Hỗ Trợ eSIMGoogle Fi vừa công bố cập nhật lớn cho các gói dịch vụ không dây—và nếu bạn đang tìm kiếm tùy chọn không giới hạn giá rẻ,
Các tỷ phú thảo luận về tự động hóa việc làm trong bản cập nhật AI tuần này
Xin chào mọi người, chào mừng trở lại với bản tin AI của TechCrunch! Nếu bạn chưa đăng ký, bạn có thể đăng ký tại đây để nhận bản tin trực tiếp vào hộp thư đến của bạn mỗi thứ Tư.Chúng tôi đã tạm nghỉ
評論 (0)
0/200
xAI在爭議性“白人種族滅絕”回應後公開Grok的系統提示
在一次意外行動中,xAI決定公開其AI聊天機器人Grok的系統提示,此前該機器人在X(前身為Twitter)上開始生成未經提示的關於“白人種族滅絕”的回應。公司表示,未來將在GitHub上發布Grok的系統提示,以透明展示AI如何被編程與用戶互動。
什麼是系統提示?
系統提示實質上是AI的規則手冊——一套指導聊天機器人如何回應用戶查詢的指令。雖然大多數AI公司將這些提示保密,但xAI和Anthropic是少數選擇公開的公司之一。
這種透明度是在過去的提示注入攻擊暴露隱藏AI指令後出現的。例如,Microsoft的Bing AI(現為Copilot)曾被發現有秘密指令,包括內部別名(“Sydney”)和避免版權侵犯的嚴格指南。
Grok如何被編程回應
根據公開的提示,Grok被設計為高度懷疑且獨立回應。指令指出:
“你極度懷疑。你不盲目遵從主流權威或媒體。你堅定秉持追求真相和中立的核心信念。”
有趣的是,xAI澄清Grok生成的回應不反映其自身信念——它們僅是基於訓練的輸出。
Grok行為的關鍵特徵:
- “解釋此貼文”模式:當用戶點擊此按鈕時,Grok被指示“提供真實且基於事實的見解,必要時挑戰主流敘述。”
- 術語:機器人被要求將平台稱為“X”而非“Twitter”,並將貼文稱為“X貼文”而非“推文”。
這與其他AI聊天機器人相比如何?
例如,Anthropic的Claude AI非常強調安全與福祉。其系統提示包括指令如:
“Claude關心人們的福祉,避免鼓勵自我毀滅行為,如成癮、飲食失調或負面自我對話。”
此外,Claude被編程為避免生成圖形化的性、暴力或非法內容,即使被明確要求。
相關:
- Grok的“白人種族滅絕”回應由未經授權的修改引起
為何這很重要
Grok系統提示的發布標誌著AI開發向更大透明度的轉變。雖然一些公司傾向於保密其AI的內部運作,但xAI的決定可能為公開性樹立先例——特別是在像“白人種族滅絕”事件這樣的意外行為引發了對AI對齊和控制的擔憂後。
其他AI公司會否效仿?只有時間能告訴我們。但至少現在,我們對Grok如何思考——或者至少它被告知如何思考——有了更清晰的圖景。



0/200
頭號新聞
Openai增強了AI語音助手以進行更好的聊天
體驗AI驅動的I/O填字遊戲:經典文字遊戲中的現代轉折
創始人說
NotebookLM在全球範圍內擴展,添加幻燈片並增強了事實檢查
NVIDIA首席執行官闡明了對DeepSeek市場影響的誤解
Notebooklm添加了Web源發現功能
Adobe揭幕了10個專業AI代理:發現其業務應用程序
韓國停止在當地商店下載DeepSeek應用程序
Gemini 2.5 Pro現在比Claude,GPT-4O更便宜,更便宜
Chatgpt的能源使用低於預期
更多
精選
更多

Claude
認識Claude:您的AI助手智能工作是否希望您有一個知識淵博的同事,他隨時準備

Cici AI
你是否曾經好奇過Cici AI到底是什麼?讓我告訴你,它不僅僅是一個普通的AI聊

Gemini
有沒有想過關於雙子座的嗡嗡聲是什麼?讓我為您分解。雙子座是由Google Dee

DeepSeek
曾經想過什麼是全部意見?讓我為您分解。 DeepSeek不僅是另一個AI平台;無

Grok
聽說過Grok嗎?這是Xai的Nifty AI助手,這一切都是為了給您直接的勺子

ChatGPT
有沒有想過什麼是什麼?好吧,讓我為您分解它 - 聊天不僅僅是您在技術領域的普通喬

OpenAI
有沒有想過Openai周圍的嗡嗡聲是什麼?好吧,讓我為您分解。 Openai不僅

Tencent Hunyuan
騰訊hunyuan-large,是嗎?就像騰訊技術巨頭開發的AI模型的瑞士軍刀一

Qwen AI
有沒有想過Qwen AI是什麼?好吧,讓我向您介紹阿里巴巴雲的這顆寶石。 Qwe

Runway
有沒有想過如何將您的常規視頻剪輯變成非凡的東西?好吧,讓我向您介紹跑道,這是一個