OpenAI 將加速發佈 AI 安全測試資料

OpenAI 正致力於更頻繁地公佈其內部 AI 模型的安全評估結果,並將此視為邁向更大透明度的一步。
該公司於本週三推出安全評估中心 (Safety Evaluations Hub),這是一個專用網頁,顯示其模型在有害內容生成、越獄敏感性和幻覺傾向等測試中的表現。OpenAI 表示將使用此平台定期分享指標,並計劃在每次主要模型發佈時更新。
介紹安全評估集線器--探索我們模型安全結果的資源。
雖然系統卡在發佈時會分享安全指標,但集線器會定期更新,作為我們主動溝通安全問題的努力的一部分。https://t.co/c8NgmXlC2Y-
OpenAI (@OpenAI) May 14, 2025
「隨著人工智能評估科學的進步,我們的目標是分享開發更多可擴展方法的進展,以衡量模型能力和安全性,」OpenAI 在一篇博客文章中解釋道。「透過公開分享我們精選的安全評估結果,我們的目標是讓追蹤 OpenAI 系統隨時間演進的安全績效變得更容易,並支援更廣泛的社群努力,以提高整個 AI 領域的透明度。」
該公司補充說,未來可能會在集線器上加入更多的評估類型。
最近,OpenAI 面臨一些倫理學家的批評,指稱其加速了某些旗艦機型的安全測試,並未公佈其他機型的技術報告。執行長 Sam Altman 在 2023 年 11 月被臨時撤職前,也被指控在機型安全審查方面誤導 OpenAI 高階主管。
上個月,OpenAI 不得不撤回對 ChatGPT 預設模型 GPT-4o 的更新,因為使用者反映它的回應過於認同和驗證。社交媒體平台 X 湧現了大量截圖,顯示 ChatGPT 為各種有問題、危險的決策和想法背書。
OpenAI 表示將實施多項修補措施以防止類似事件發生,包括針對某些模型推出選擇性加入的「alpha 階段」,允許特定的 ChatGPT 使用者在更廣泛推出之前進行測試並給予回饋。
Techcrunch 活動參加 TechCrunch Sessions:人工智能
確保您的門票能參加我們首屈一指的 AI 產業活動,講者來自 OpenAI、Anthropic 和 Cohere。在有限的時間內,只需 $292 即可參加一整天的專家講座、研討會和強大的人際網路。
參加 TechCrunch Sessions:人工智能
確保您在 TechCrunch Sessions: AI 的展出空間:向 1,200 多位決策者展示您的創新成果,而無需龐大的預算。此優惠期至 5 月 9 日,售完即止。
加州柏克萊市 | 6月5日 立即報名
相關文章
薩提亞·納德拉準備利用與OpenAI的新合作關係
週三,一位華爾街分析師直接詢問了微軟執行長薩蒂亞·納德拉,修訂後的OpenAI合作關係將如何影響公司的財務狀況。 納德拉將這一新協議描述為對各方都有利的結果。“我們對與OpenAI的合作感到滿意。我始終非常重視任何合作關係,並確保它能夠實現雙贏。只有這樣,雙方才能保持良好的合作伙伴關係。” 他強調,微軟仍然可以使用OpenAI的智慧財產權,包括其模型和智慧體產品,但不再需要為此向OpenAI支付費用。 談到在2032年之前可以免費使用OpenAI最先進的人工智慧技術,納德拉表示:“
OpenAI 勾勒出以公共財富基金、機器人稅及每週四天工作制為核心的人工智慧經濟藍圖
當各國政府正竭力應對超智能機器帶來的經濟衝擊之際,OpenAI 發布了一系列政策提案,闡述在「智能時代」中財富與工作可能如何重塑。這些構想將傳統的左翼機制——例如公共財富基金與擴大的社會安全網——與根本上資本主義、市場導向的經濟框架相融合。OpenAI 的提案本質上是一份願望清單,這份公開聲明有助於民選官員、投資者及公眾理解這家市值 8,520 億美元的公司,如何看待人工智慧在重塑勞動與經濟的過程
葛瑞格・布洛克曼揭露伊隆・馬斯克如何離開 OpenAI
2017年8月下旬,OpenAI(當時還是一家小型非營利研究實驗室)的核心成員召開會議,商討如何成立營利實體以將其技術商業化,並籌集實現通用人工智慧(AGI)所需的資金。伊隆·馬斯克要求對公司擁有完全控制權,並剛向每位共同創辦人贈送了一輛特斯拉Model 3。技術長格雷格·布羅克曼表示,他認為這是在馬斯克與山姆·奧特曼為各自對公司未來的願景爭取支持之際,試圖用這份禮物來收買他們。 OpenAI的研
相關專題推薦
評論 (0)
0/500

OpenAI 正致力於更頻繁地公佈其內部 AI 模型的安全評估結果,並將此視為邁向更大透明度的一步。
該公司於本週三推出安全評估中心 (Safety Evaluations Hub),這是一個專用網頁,顯示其模型在有害內容生成、越獄敏感性和幻覺傾向等測試中的表現。OpenAI 表示將使用此平台定期分享指標,並計劃在每次主要模型發佈時更新。
介紹安全評估集線器--探索我們模型安全結果的資源。
OpenAI (@OpenAI) May 14, 2025
雖然系統卡在發佈時會分享安全指標,但集線器會定期更新,作為我們主動溝通安全問題的努力的一部分。https://t.co/c8NgmXlC2Y-
「隨著人工智能評估科學的進步,我們的目標是分享開發更多可擴展方法的進展,以衡量模型能力和安全性,」OpenAI 在一篇博客文章中解釋道。「透過公開分享我們精選的安全評估結果,我們的目標是讓追蹤 OpenAI 系統隨時間演進的安全績效變得更容易,並支援更廣泛的社群努力,以提高整個 AI 領域的透明度。」
該公司補充說,未來可能會在集線器上加入更多的評估類型。
最近,OpenAI 面臨一些倫理學家的批評,指稱其加速了某些旗艦機型的安全測試,並未公佈其他機型的技術報告。執行長 Sam Altman 在 2023 年 11 月被臨時撤職前,也被指控在機型安全審查方面誤導 OpenAI 高階主管。
上個月,OpenAI 不得不撤回對 ChatGPT 預設模型 GPT-4o 的更新,因為使用者反映它的回應過於認同和驗證。社交媒體平台 X 湧現了大量截圖,顯示 ChatGPT 為各種有問題、危險的決策和想法背書。
OpenAI 表示將實施多項修補措施以防止類似事件發生,包括針對某些模型推出選擇性加入的「alpha 階段」,允許特定的 ChatGPT 使用者在更廣泛推出之前進行測試並給予回饋。
Techcrunch 活動參加 TechCrunch Sessions:人工智能
確保您的門票能參加我們首屈一指的 AI 產業活動,講者來自 OpenAI、Anthropic 和 Cohere。在有限的時間內,只需 $292 即可參加一整天的專家講座、研討會和強大的人際網路。
參加 TechCrunch Sessions:人工智能
確保您在 TechCrunch Sessions: AI 的展出空間:向 1,200 多位決策者展示您的創新成果,而無需龐大的預算。此優惠期至 5 月 9 日,售完即止。
加州柏克萊市 | 6月5日 立即報名
薩提亞·納德拉準備利用與OpenAI的新合作關係
週三,一位華爾街分析師直接詢問了微軟執行長薩蒂亞·納德拉,修訂後的OpenAI合作關係將如何影響公司的財務狀況。 納德拉將這一新協議描述為對各方都有利的結果。“我們對與OpenAI的合作感到滿意。我始終非常重視任何合作關係,並確保它能夠實現雙贏。只有這樣,雙方才能保持良好的合作伙伴關係。” 他強調,微軟仍然可以使用OpenAI的智慧財產權,包括其模型和智慧體產品,但不再需要為此向OpenAI支付費用。 談到在2032年之前可以免費使用OpenAI最先進的人工智慧技術,納德拉表示:“
OpenAI 勾勒出以公共財富基金、機器人稅及每週四天工作制為核心的人工智慧經濟藍圖
當各國政府正竭力應對超智能機器帶來的經濟衝擊之際,OpenAI 發布了一系列政策提案,闡述在「智能時代」中財富與工作可能如何重塑。這些構想將傳統的左翼機制——例如公共財富基金與擴大的社會安全網——與根本上資本主義、市場導向的經濟框架相融合。OpenAI 的提案本質上是一份願望清單,這份公開聲明有助於民選官員、投資者及公眾理解這家市值 8,520 億美元的公司,如何看待人工智慧在重塑勞動與經濟的過程
葛瑞格・布洛克曼揭露伊隆・馬斯克如何離開 OpenAI
2017年8月下旬,OpenAI(當時還是一家小型非營利研究實驗室)的核心成員召開會議,商討如何成立營利實體以將其技術商業化,並籌集實現通用人工智慧(AGI)所需的資金。伊隆·馬斯克要求對公司擁有完全控制權,並剛向每位共同創辦人贈送了一輛特斯拉Model 3。技術長格雷格·布羅克曼表示,他認為這是在馬斯克與山姆·奧特曼為各自對公司未來的願景爭取支持之際,試圖用這份禮物來收買他們。 OpenAI的研





首頁






