OpenAI 將加速發佈 AI 安全測試資料

首頁

新聞

2025-12-25

WillieMiller

# openai # safety

OpenAI 將加速發佈 AI 安全測試資料

OpenAI 正致力於更頻繁地公佈其內部 AI 模型的安全評估結果，並將此視為邁向更大透明度的一步。

該公司於本週三推出安全評估中心 (Safety Evaluations Hub)，這是一個專用網頁，顯示其模型在有害內容生成、越獄敏感性和幻覺傾向等測試中的表現。OpenAI 表示將使用此平台定期分享指標，並計劃在每次主要模型發佈時更新。

介紹安全評估集線器--探索我們模型安全結果的資源。

雖然系統卡在發佈時會分享安全指標，但集線器會定期更新，作為我們主動溝通安全問題的努力的一部分。https://t.co/c8NgmXlC2Y-
OpenAI (@OpenAI) May 14, 2025

「隨著人工智能評估科學的進步，我們的目標是分享開發更多可擴展方法的進展，以衡量模型能力和安全性，」OpenAI 在一篇博客文章中解釋道。「透過公開分享我們精選的安全評估結果，我們的目標是讓追蹤 OpenAI 系統隨時間演進的安全績效變得更容易，並支援更廣泛的社群努力，以提高整個 AI 領域的透明度。」

該公司補充說，未來可能會在集線器上加入更多的評估類型。

最近，OpenAI 面臨一些倫理學家的批評，指稱其加速了某些旗艦機型的安全測試，並未公佈其他機型的技術報告。執行長 Sam Altman 在 2023 年 11 月被臨時撤職前，也被指控在機型安全審查方面誤導 OpenAI 高階主管。

上個月，OpenAI 不得不撤回對 ChatGPT 預設模型 GPT-4o 的更新，因為使用者反映它的回應過於認同和驗證。社交媒體平台 X 湧現了大量截圖，顯示 ChatGPT 為各種有問題、危險的決策和想法背書。

OpenAI 表示將實施多項修補措施以防止類似事件發生，包括針對某些模型推出選擇性加入的「alpha 階段」，允許特定的 ChatGPT 使用者在更廣泛推出之前進行測試並給予回饋。

Techcrunch 活動

確保您的門票能參加我們首屈一指的 AI 產業活動，講者來自 OpenAI、Anthropic 和 Cohere。在有限的時間內，只需 $292 即可參加一整天的專家講座、研討會和強大的人際網路。

確保您在 TechCrunch Sessions: AI 的展出空間：向 1,200 多位決策者展示您的創新成果，而無需龐大的預算。此優惠期至 5 月 9 日，售完即止。

加州柏克萊市 | 6月5日立即報名

薩提亞·納德拉準備利用與OpenAI的新合作關係週三，一位華爾街分析師直接詢問了微軟執行長薩蒂亞·納德拉，修訂後的OpenAI合作關係將如何影響公司的財務狀況。納德拉將這一新協議描述為對各方都有利的結果。“我們對與OpenAI的合作感到滿意。我始終非常重視任何合作關係，並確保它能夠實現雙贏。只有這樣，雙方才能保持良好的合作伙伴關係。” 他強調，微軟仍然可以使用OpenAI的智慧財產權，包括其模型和智慧體產品，但不再需要為此向OpenAI支付費用。談到在2032年之前可以免費使用OpenAI最先進的人工智慧技術，納德拉表示：“

OpenAI 勾勒出以公共財富基金、機器人稅及每週四天工作制為核心的人工智慧經濟藍圖當各國政府正竭力應對超智能機器帶來的經濟衝擊之際，OpenAI 發布了一系列政策提案，闡述在「智能時代」中財富與工作可能如何重塑。這些構想將傳統的左翼機制——例如公共財富基金與擴大的社會安全網——與根本上資本主義、市場導向的經濟框架相融合。OpenAI 的提案本質上是一份願望清單，這份公開聲明有助於民選官員、投資者及公眾理解這家市值 8,520 億美元的公司，如何看待人工智慧在重塑勞動與經濟的過程

葛瑞格・布洛克曼揭露伊隆・馬斯克如何離開 OpenAI 2017年8月下旬，OpenAI（當時還是一家小型非營利研究實驗室）的核心成員召開會議，商討如何成立營利實體以將其技術商業化，並籌集實現通用人工智慧（AGI）所需的資金。伊隆·馬斯克要求對公司擁有完全控制權，並剛向每位共同創辦人贈送了一輛特斯拉Model 3。技術長格雷格·布羅克曼表示，他認為這是在馬斯克與山姆·奧特曼為各自對公司未來的願景爭取支持之際，試圖用這份禮物來收買他們。 OpenAI的研

相關專題推薦

寫作