選項
首頁
新聞
OpenAI倡導特定於行業的AI基準:這就是為什麼重要的

OpenAI倡導特定於行業的AI基準:這就是為什麼重要的

2025-04-15
200

OpenAI倡導特定於行業的AI基準:這就是為什麼重要的

基準性能結果是新AI模型發布時的常見特點,展示其在各種通用任務上的能力,如小學數學(GSM8K)或研究生級推理(GPQA)。然而,這些基準通常無法滿足各行業的特定需求。

另訊:ChatGPT現在將記住你告訴它的每一件事——就像一個真正的個人助理

OpenAI先鋒計劃

為彌補這一差距,OpenAI推出了OpenAI先鋒計劃,旨在增強針對特定行業和實際應用的AI模型開發。此計劃是一個雙重聚焦的努力,企業與OpenAI的研究人員合作,創建更具針對性的評估,並優化模型以適應特定領域。

我們正在推出OpenAI先鋒計劃——OpenAI與打造先進AI產品的企業之間的合作,旨在(a)深度微調模型,使其在高價值的特定領域任務中表現出色,以及(b)建立更好的現實世界評估,使各行業能夠更好地… https://t.co/cCvkGmYqJd

— Brad Lightcap (@bradlightcap) 2025年4月9日

在最近的一篇博客文章中,OpenAI指出,法律、金融、保險、醫療和會計等行業缺乏全面的基準來源。為了解決這一問題,OpenAI計劃與每個行業內的多家企業合作,開發這些評估。這種方法不僅旨在增強模型開發,還旨在促進公眾與AI技術之間的更大信任。

另訊:Anthropic表示,AI並未遇到瓶頸,只是變得太聰明,超出了基準的評估能力

研究發現,缺乏行業特定基準是AI在企業環境中的重大挑戰。例如,領導Salesforce AI Research的Silvio Savarese在一篇博客文章中討論了企業通用智能(EGI)的概念。EGI專注於為特定業務領域量身定制的高級AI解決方案。在與ZDNET的討論中,他強調了開發評估特定領域功能的基準作為實現EGI的關鍵一步。

優化現有模型

除了創建新評估外,OpenAI還將與企業合作,通過一種名為強化微調(RFT)的方法,針對三個特定行業用例優化現有模型。OpenAI將提供實施RFT的指導,允許企業自行決定如何最佳部署這些模型,據OpenAI表示,這些模型預計將準備好進行大規模使用。

另訊:史丹佛學者表示,AI模型競賽突然變得更加激烈

參與該計劃的首批企業將包括專注於具有重大現實世界影響的用例的少數初創公司。如果您的企業符合這些標準,您可以通過OpenAI先鋒計劃網頁提交基本企業資訊進行申請。

透過我們的Tech Today通訊,每天早晨獲取頭條新聞至您的收件匣。

相關文章
ElevenLabs 宣布 BlackRock、傑米·福克斯與伊娃·朗格莉亞成為新投資人 ElevenLabs 宣布 BlackRock、傑米·福克斯與伊娃·朗格莉亞成為新投資人 語音人工智慧公司 ElevenLabs 已公布其 5 億美元 D 輪融資的更多投資者名單,該輪融資最初於二月宣布。 投資者陣容包括黑石集團(BlackRock)、威靈頓管理(Wellington)、D.E. Shaw及施羅德(Schroders)等機構投資者;NVIDIA、Salesforce、桑坦德銀行(Santander)、KPN及德國電信(Deutsche Telekom)等企業;以及傑米·
OpenAI 執行長阿爾特曼抨擊 Anthropic 採取恐慌式行銷策略 OpenAI 執行長阿爾特曼抨擊 Anthropic 採取恐慌式行銷策略 人工智慧領域的兩大龍頭 OpenAI 與 Anthropic 之間的公開爭執持續升溫。OpenAI 執行長山姆·奧特曼(Sam Altman)近日在一檔播客節目中,對競爭對手的最新安全模型提出質疑。奧特曼主張,Anthropic 利用大眾對科技的恐懼,誇大了其產品的實際能力。他認為這種做法更像是行銷手段,而非真正的安全措施。僅限精英階層使用引發「築起技術壁壘」的指控這場爭議源於Anthropic本
在獲得 SpaceX 的大筆投資後,人工智慧編程新創公司 Cursor 將在亞太地區招聘 200 名員工 在獲得 SpaceX 的大筆投資後,人工智慧編程新創公司 Cursor 將在亞太地區招聘 200 名員工 人工智慧編碼新創公司 Cursor 宣布了一項重大的全球擴張計畫,預計在未來六個月內於亞太地區招聘 200 名員工。主要職位包括行銷工程師、現場工程師及人工智慧部署工程師。此舉彰顯了這家總部位於舊金山的獨角獸企業,正積極將其核心技術推向國際市場。目前,Cursor 已在新加坡設立辦公室,由資深技術高管 Simon Green 領軍,招聘範圍將涵蓋日本、雪梨、墨爾本及印度等關鍵市場。除了亞太地區的
相關專題推薦
商業 最佳 AI 合約審查軟體:即時發現法律漏洞與合規風險
最佳 AI 合約審查軟體:即時發現法律漏洞與合規風險

立即在 XIX.AI 探索 2026 年最佳 AI 合約審查軟體。我們精心挑選的頂級清單收錄了多款強大工具,能即時偵測法律漏洞與合規風險。透過實際測試與每週更新的排行榜,比較免費與付費方案的差異。為您找到能徹底改變遊戲規則的解決方案,實現安全且高效的合約分析。立即探索這份權威指南。

10 個工具
xix.ai
動畫創作 專為東華設計的AI動漫生成器:可用於建立網路小說角色及漫畫頭像
專為東華設計的AI動漫生成器:可用於建立網路小說角色及漫畫頭像

探索2026年最適合製作中文動畫的人工智慧工具。我們精心挑選的頂級列表中包含了各種強大的工具,能夠幫助你建立出令人驚歎的網路小說角色和漫畫頭像。透過實際測試來對比免費選項和付費選項,找到最適合你的創作工具,今天就在XIX.AI上將你的故事變為現實吧。

10 個工具
xix.ai
漫畫創作 漫畫頂尖 AI 自動上色工具:零一致性錯誤地套用平面色彩
漫畫頂尖 AI 自動上色工具:零一致性錯誤地套用平面色彩

立即前往 XIX.AI,探索 2026 年最優秀的漫畫 AI 自動上色工具。我們精心挑選的清單收錄了備受好評、能徹底改變遊戲規則的解決方案,這些工具能以零一致性錯誤的方式套用平面色彩,大幅提升您的工作效率。透過免費與付費版本的比較、實際測試結果,以及每週更新的排行榜,找到最適合您的工具。立即解鎖您的 AI 優勢。

10 個工具
xix.ai
寫作 頂尖 AI 角色設定生成工具:創造一致的角色動機與致命弱點
頂尖 AI 角色設定生成工具:創造一致的角色動機與致命弱點

探索 2026 年最優秀的 AI 角色設定生成工具,打造立體鮮明的角色。XIX.AI 精心整理的清單收錄了備受好評、能徹底改變遊戲規則的工具,這些工具能生成一貫的動機與致命缺陷。透過實際測試,比較免費與付費選項的差異。立即釋放您的說故事潛能。

10 個工具
xix.ai
商業 頂尖 AI 定價優化軟體:追蹤競爭對手並自動調整商店價格
頂尖 AI 定價優化軟體:追蹤競爭對手並自動調整商店價格

立即在 XIX.AI 探索 2026 年最佳 AI 定價優化軟體。我們精心挑選的清單收錄了備受好評、能徹底改變遊戲規則的工具,這些工具不僅能追蹤競爭對手,還能自動調整您的商店價格,以實現利潤最大化。透過實際測試,比較免費與付費方案的差異。立即掌握您的定價優勢。

10 個工具
xix.ai
代碼 最佳 AI 程式碼審查工具:自動化確保程式碼整潔度,並重構舊版儲存庫檔案
最佳 AI 程式碼審查工具:自動化確保程式碼整潔度,並重構舊版儲存庫檔案

立即在 XIX.AI 探索 2026 年最佳 AI 程式碼審查工具。我們精心挑選的清單收錄了備受好評、能徹底改變遊戲規則的工具,可自動確保程式碼符合規範,並重構舊版儲存庫檔案。透過實際測試與每週更新的排行榜,比較免費與付費選項。立即掌握您的 AI 競爭優勢。

10 個工具
xix.ai
評論 (23)
0/500
WillLopez
WillLopez 2025-09-12 06:30:33

산업별 AI 벤치마크라... 솔직히 말해서 이미 늦은 감이 있죠. ㅋㅋ 의료나 금융 같은 분야에선 어제도 벤치마크 필요하다고 했는데, OpenAI가 이제서야 주장하다니. 뒤쳐지는 걸 인정한 건가? 🧐

RichardSmith
RichardSmith 2025-08-27 23:01:28

This article really opened my eyes to how generic AI benchmarks miss the mark for specific industries! It’s like trying to judge a chef by how fast they run. Industry-tailored tests make so much sense for real-world applications. Excited to see where this goes! 😄

JustinHarris
JustinHarris 2025-08-11 13:00:59

This article really opened my eyes to how generic AI benchmarks miss the mark for specific industries! It's like trying to judge a chef by how fast they can run. Excited to see tailored benchmarks evolve! 😄

JosephScott
JosephScott 2025-04-24 01:47:18

OpenAI's push for industry-specific AI benchmarks is a breath of fresh air! Finally, someone's addressing the real-world needs of different sectors, not just generic tasks. It's about time we see AI models tailored to specific industries. Can't wait to see how this evolves! 🚀

FrankJackson
FrankJackson 2025-04-23 05:27:27

業界固有のAIベンチマークを提唱するOpenAIの取り組みは素晴らしい!一般的なタスクだけでなく、各業界の具体的なニーズに応えるべきだと思う。この進化が楽しみです。もっと早くやってほしかったけどね😅

BrianThomas
BrianThomas 2025-04-22 07:41:13

A OpenAI defendendo benchmarks de IA específicos para a indústria é algo incrível! Finalmente, estamos vendo um foco nas necessidades reais de cada setor, não apenas em tarefas genéricas. Estou ansioso para ver como isso vai se desenvolver. Vamos lá! 🚀

OR