OpenAI 在開發過程中整合了用於保障青少年安全的開源工具

週二,OpenAI 宣布推出一套提示語,旨在協助開發者讓其應用程式對青少年更安全。該人工智慧實驗室表示,這些青少年安全政策與其開放權重安全模型 gpt-oss-safeguard 相容。
開發者無需從頭開始研究如何提升青少年的人工智慧安全,而是可以利用這些提示來強化其應用程式。這些提示針對的關注點包括:血腥暴力與色情內容、有害的身體形象理想與行為、高風險活動與挑戰、浪漫或暴力的角色扮演情境,以及受年齡限制的產品與服務。
這些安全政策以提示詞形式設計,確保其不僅能與 GPT-OSS-Safeguard 模型無縫整合,更能輕鬆應用於其他模型,儘管在 OpenAI 的自有生態系統中效果可能最為顯著。
OpenAI 表示,其與 AI 安全組織 Common Sense Media 及 everyone.ai 合作開發了這些提示語。
「這些基於提示詞的政策有助於在整個生態系統中建立有意義的安全基準。由於它們是開源的,因此可以隨著時間推移進行調整和增強,」Common Sense Media 的 AI 與數位評估主管 Robbie Torney 在一份聲明中表示。
OpenAI 在其部落格中指出,開發者(包括經驗豐富的團隊)經常難以將安全目標轉化為精確且可執行的規則。
「這可能導致防護漏洞、執法不一致,或過濾範圍過於寬泛,」該公司解釋道。「清晰且定義明確的政策,是有效安全系統的關鍵基礎。」
OpenAI 承認,這些政策並非解決 AI 安全複雜挑戰的完整方案。然而,它們是在先前努力的基礎上建立的,包括家長控制和年齡預測等產品層級的防護措施。去年,OpenAI 更新了其大型語言模型指南(稱為 Model Spec),以規範其 AI 模型應如何與 18 歲以下使用者互動。
然而,OpenAI 自身也並非毫無瑕疵。該公司正面臨多起訴訟,原告皆為因過度使用 ChatGPT 而自殺身亡者的家屬。這類有害的互動往往發生在用戶繞過聊天機器人的安全防護機制之後,且沒有任何模型的防護措施是完全無懈可擊的。儘管如此,這些新政策仍代表著向前邁進的一步,特別是在協助獨立開發者方面。
相關文章
薩提亞·納德拉準備利用與OpenAI的新合作關係
週三,一位華爾街分析師直接詢問了微軟執行長薩蒂亞·納德拉,修訂後的OpenAI合作關係將如何影響公司的財務狀況。 納德拉將這一新協議描述為對各方都有利的結果。“我們對與OpenAI的合作感到滿意。我始終非常重視任何合作關係,並確保它能夠實現雙贏。只有這樣,雙方才能保持良好的合作伙伴關係。” 他強調,微軟仍然可以使用OpenAI的智慧財產權,包括其模型和智慧體產品,但不再需要為此向OpenAI支付費用。 談到在2032年之前可以免費使用OpenAI最先進的人工智慧技術,納德拉表示:“
OpenAI 勾勒出以公共財富基金、機器人稅及每週四天工作制為核心的人工智慧經濟藍圖
當各國政府正竭力應對超智能機器帶來的經濟衝擊之際,OpenAI 發布了一系列政策提案,闡述在「智能時代」中財富與工作可能如何重塑。這些構想將傳統的左翼機制——例如公共財富基金與擴大的社會安全網——與根本上資本主義、市場導向的經濟框架相融合。OpenAI 的提案本質上是一份願望清單,這份公開聲明有助於民選官員、投資者及公眾理解這家市值 8,520 億美元的公司,如何看待人工智慧在重塑勞動與經濟的過程
葛瑞格・布洛克曼揭露伊隆・馬斯克如何離開 OpenAI
2017年8月下旬,OpenAI(當時還是一家小型非營利研究實驗室)的核心成員召開會議,商討如何成立營利實體以將其技術商業化,並籌集實現通用人工智慧(AGI)所需的資金。伊隆·馬斯克要求對公司擁有完全控制權,並剛向每位共同創辦人贈送了一輛特斯拉Model 3。技術長格雷格·布羅克曼表示,他認為這是在馬斯克與山姆·奧特曼為各自對公司未來的願景爭取支持之際,試圖用這份禮物來收買他們。 OpenAI的研
相關專題推薦
評論 (0)
0/500

週二,OpenAI 宣布推出一套提示語,旨在協助開發者讓其應用程式對青少年更安全。該人工智慧實驗室表示,這些青少年安全政策與其開放權重安全模型 gpt-oss-safeguard 相容。
開發者無需從頭開始研究如何提升青少年的人工智慧安全,而是可以利用這些提示來強化其應用程式。這些提示針對的關注點包括:血腥暴力與色情內容、有害的身體形象理想與行為、高風險活動與挑戰、浪漫或暴力的角色扮演情境,以及受年齡限制的產品與服務。
這些安全政策以提示詞形式設計,確保其不僅能與 GPT-OSS-Safeguard 模型無縫整合,更能輕鬆應用於其他模型,儘管在 OpenAI 的自有生態系統中效果可能最為顯著。
OpenAI 表示,其與 AI 安全組織 Common Sense Media 及 everyone.ai 合作開發了這些提示語。
「這些基於提示詞的政策有助於在整個生態系統中建立有意義的安全基準。由於它們是開源的,因此可以隨著時間推移進行調整和增強,」Common Sense Media 的 AI 與數位評估主管 Robbie Torney 在一份聲明中表示。
OpenAI 在其部落格中指出,開發者(包括經驗豐富的團隊)經常難以將安全目標轉化為精確且可執行的規則。
「這可能導致防護漏洞、執法不一致,或過濾範圍過於寬泛,」該公司解釋道。「清晰且定義明確的政策,是有效安全系統的關鍵基礎。」
OpenAI 承認,這些政策並非解決 AI 安全複雜挑戰的完整方案。然而,它們是在先前努力的基礎上建立的,包括家長控制和年齡預測等產品層級的防護措施。去年,OpenAI 更新了其大型語言模型指南(稱為 Model Spec),以規範其 AI 模型應如何與 18 歲以下使用者互動。
然而,OpenAI 自身也並非毫無瑕疵。該公司正面臨多起訴訟,原告皆為因過度使用 ChatGPT 而自殺身亡者的家屬。這類有害的互動往往發生在用戶繞過聊天機器人的安全防護機制之後,且沒有任何模型的防護措施是完全無懈可擊的。儘管如此,這些新政策仍代表著向前邁進的一步,特別是在協助獨立開發者方面。
薩提亞·納德拉準備利用與OpenAI的新合作關係
週三,一位華爾街分析師直接詢問了微軟執行長薩蒂亞·納德拉,修訂後的OpenAI合作關係將如何影響公司的財務狀況。 納德拉將這一新協議描述為對各方都有利的結果。“我們對與OpenAI的合作感到滿意。我始終非常重視任何合作關係,並確保它能夠實現雙贏。只有這樣,雙方才能保持良好的合作伙伴關係。” 他強調,微軟仍然可以使用OpenAI的智慧財產權,包括其模型和智慧體產品,但不再需要為此向OpenAI支付費用。 談到在2032年之前可以免費使用OpenAI最先進的人工智慧技術,納德拉表示:“
OpenAI 勾勒出以公共財富基金、機器人稅及每週四天工作制為核心的人工智慧經濟藍圖
當各國政府正竭力應對超智能機器帶來的經濟衝擊之際,OpenAI 發布了一系列政策提案,闡述在「智能時代」中財富與工作可能如何重塑。這些構想將傳統的左翼機制——例如公共財富基金與擴大的社會安全網——與根本上資本主義、市場導向的經濟框架相融合。OpenAI 的提案本質上是一份願望清單,這份公開聲明有助於民選官員、投資者及公眾理解這家市值 8,520 億美元的公司,如何看待人工智慧在重塑勞動與經濟的過程
葛瑞格・布洛克曼揭露伊隆・馬斯克如何離開 OpenAI
2017年8月下旬,OpenAI(當時還是一家小型非營利研究實驗室)的核心成員召開會議,商討如何成立營利實體以將其技術商業化,並籌集實現通用人工智慧(AGI)所需的資金。伊隆·馬斯克要求對公司擁有完全控制權,並剛向每位共同創辦人贈送了一輛特斯拉Model 3。技術長格雷格·布羅克曼表示,他認為這是在馬斯克與山姆·奧特曼為各自對公司未來的願景爭取支持之際,試圖用這份禮物來收買他們。 OpenAI的研





首頁






