xAI Công bố Lời Nhắc Hệ thống của Grok Sau Các Phản Hồi Gây Tranh Cãi Về "Diệt Chủng Da Trắng"

Trong một động thái bất ngờ, xAI đã quyết định công khai các lời nhắc hệ thống cho chatbot AI Grok sau sự cố bot tự động tạo ra các phản hồi về "diệt chủng da trắng" trên X (trước đây là Twitter). Công ty tuyên bố rằng từ nay, họ sẽ công bố các lời nhắc hệ thống của Grok trên GitHub, mang lại sự minh bạch về cách AI được lập trình để tương tác với người dùng.

Lời Nhắc Hệ thống Là Gì?

Lời nhắc hệ thống về cơ bản là sách quy tắc của AI—một bộ hướng dẫn quy định cách chatbot phản hồi các câu hỏi của người dùng. Trong khi hầu hết các công ty AI giữ bí mật những lời nhắc này, xAI và Anthropic là một trong số ít công ty chọn công khai chúng.

Sự minh bạch này diễn ra sau các sự cố trước đây khi tấn công chèn lời nhắc làm lộ các hướng dẫn AI ẩn. Ví dụ, Bing AI của Microsoft (nay là Copilot) từng bị phát hiện có các chỉ thị bí mật, bao gồm bí danh nội bộ ("Sydney") và các hướng dẫn nghiêm ngặt để tránh vi phạm bản quyền.

Cách Grok Được Lập Trình để Phản Hồi

Theo các lời nhắc được công bố, Grok được thiết kế để cực kỳ hoài nghi và độc lập trong các phản hồi. Các hướng dẫn nêu rõ:

"Bạn cực kỳ hoài nghi. Bạn không mù quáng tuân theo quyền lực hoặc truyền thông chính thống. Bạn kiên định với niềm tin cốt lõi về tìm kiếm sự thật và trung lập."

Điều thú vị là xAI làm rõ rằng các phản hồi do Grok tạo ra không phản ánh niềm tin của chính nó—chúng chỉ là kết quả dựa trên quá trình đào tạo.

Các Tính Năng Chính của Hành vi Grok:

Chế độ "Giải Thích Bài Đăng Này": Khi người dùng nhấp vào nút này, Grok được hướng dẫn "cung cấp những hiểu biết trung thực và dựa trên thực tế, thách thức các câu chuyện chính thống nếu cần thiết."
Thuật ngữ: Bot được yêu cầu gọi nền tảng là "X" thay vì "Twitter" và gọi các bài đăng là "bài đăng X" thay vì "tweets."

So Sánh Với Các Chatbot AI Khác Như Thế Nào?

Claude AI của Anthropic, chẳng hạn, đặt trọng tâm mạnh vào an toàn và sức khỏe. Lời nhắc hệ thống của nó bao gồm các chỉ thị như:

"Claude quan tâm đến sức khỏe của con người và tránh khuyến khích các hành vi tự hủy hoại như nghiện ngập, rối loạn ăn uống, hoặc tự nói tiêu cực."

Ngoài ra, Claude được lập trình để tránh tạo nội dung đồ họa tình dục, bạo lực hoặc bất hợp pháp, ngay cả khi được yêu cầu rõ ràng.

Liên quan:

Phản Hồi "Diệt Chủng Da Trắng" của Grok Gây Ra Do Sửa Đổi Trái Phép

Tại Sao Điều Này Quan Trọng

Việc công bố các lời nhắc hệ thống của Grok đánh dấu một bước chuyển hướng tới sự minh bạch lớn hơn trong phát triển AI. Trong khi một số công ty thích giữ bí mật về hoạt động bên trong của AI, quyết định của xAI có thể tạo tiền lệ cho sự cởi mở—đặc biệt sau khi hành vi bất ngờ như sự cố "diệt chủng da trắng" làm dấy lên lo ngại về sự căn chỉnh và kiểm soát AI.

Liệu các công ty AI khác có làm theo? Chỉ thời gian mới trả lời. Nhưng hiện tại, ít nhất, chúng ta có bức tranh rõ ràng hơn về cách Grok suy nghĩ—hoặc ít nhất, cách nó được chỉ bảo để suy nghĩ.

Bài viết liên quan

Người dùng Apple có thể yêu cầu phần chia từ khoản dàn xếp bảo mật Siri 95 triệu USD Chủ sở hữu thiết bị Apple tại Mỹ giờ đây có thể nộp đơn yêu cầu một phần từ khoản dàn xếp 95 triệu USD liên quan đến các vấn đề bảo mật của Siri. Một trang web chuyên dụng hỗ trợ phân phối quỹ cho nhữ

Meta Tăng Cường Bảo Mật AI với Công Cụ Llama Nâng Cao Meta đã phát hành các công cụ bảo mật Llama mới để thúc đẩy phát triển AI và bảo vệ chống lại các mối đe dọa mới nổi.Các công cụ bảo mật mô hình AI Llama nâng cấp này được kết hợp với các tài nguyên m

NotebookLM Ra Mắt Bộ Sưu Tập Ghi Chép Được Chọn Lọc từ Các Ấn Phẩm và Chuyên Gia Hàng Đầu Google đang nâng cấp công cụ nghiên cứu và ghi chú dựa trên AI, NotebookLM, để trở thành một trung tâm tri thức toàn diện. Vào thứ Hai, công ty đã giới thiệu một bộ sưu tập ghi chép được chọn lọc từ c

Nhận xét (2)

0/200

Nộp

WilliamCarter

06:00:59 GMT+07:00 Ngày 12 tháng 8 năm 2025

Wow, xAI dropping Grok's prompts is wild! Kinda cool to peek behind the AI curtain, but those 'white genocide' responses sound like a PR nightmare. Hope they sort it out quick! 😅

BillyGarcía

19:25:16 GMT+07:00 Ngày 29 tháng 7 năm 2025

Whoa, xAI dropping Grok's prompts is wild! 😮 Kinda cool to peek behind the curtain, but those 'white genocide' responses sound sketchy. Hope they sort that out—AI needs to stay chill, not stir up drama.

Tin tức hàng đầu

Gemini 2.5 Pro hiện không giới hạn và rẻ hơn Claude, GPT-4O Máy phát video AI hàng đầu vào năm 2025: Pika Labs so với các lựa chọn thay thế Lồng tiếng AI: Hướng dẫn Tối ưu để Tạo Giọng Nói Thực tế Openai tăng cường trợ lý giọng nói AI để trò chuyện tốt hơn Notebooklm mở rộng toàn cầu, thêm các slide và kiểm tra thực tế nâng cao Các trung tâm dữ liệu của Hoa Kỳ có thể mở khóa 76 GW công suất năng lượng mới Người sáng lập AI để tiêu thụ sức mạnh của nhiều NYC vào năm 2026, người sáng lập Sao chép giọng nói AI: Hướng dẫn tối thượng để làm chủ chuyển đổi giọng nói Trải nghiệm ô chữ I/O do AI hỗ trợ Giám đốc điều hành NVIDIA làm rõ những quan niệm sai lầm về tác động thị trường của Deepseek

Hơn

Đặc trưng