人工智能的未來取決於資料主權,以及合成資料的挑戰

由教育局提出
當合成資料改變決策時,企業領導者必須重新掌握何謂真實、何謂產生,以及何謂可信。
在 1983 年的電影WarGames 中,Matthew Broderick 扮演的角色差點引發一場核戰 - 不是用武器,而是用合成資料。虛構的 WOPR 系統將模擬的戰爭遊戲資料誤認為真正的威脅。直到人類打電話到目標基地,確認沒有受到真正的攻擊時,才發現系統發生故障。
四十年後的今天,風險依然嚴重 - 只是現在,合成資料已經成為我們大部分決策的基礎。AI 產生的模型、預測和模擬已整合至醫療照護、金融、行銷、網路安全,並逐漸融入現代企業的核心運作。但誰來檢查檢查器?我們又該如何控制受合成資料影響或做出的決策?
合成資料的興起
合成資料 (Synthetic data) 是由人工智能產生的資訊,與真實世界的資料集類似,目前正為從新藥開發規範到預測性客戶模型等一切提供動力。其價值顯而易見:更快的開發週期、更少的隱私問題,以及模擬罕見情況的能力。在許多領域,這是訓練大型複雜系統的唯一實用方法。
但合成資料並非中立。它建立在假設之上,在有偏見的資料來源上進行訓練,並旨在反映一個可能並非真實的世界。隨著生成式 AI 越來越多地同時創造問題與答案,我們有可能會建構一個回饋循環,讓 AI 成為它所產生資料的唯一詮釋者。
這不僅是技術上的障礙,更是領導力上的挑戰。
決策挑戰
當代領導者面臨的資料困境有三個問題:
- 何時合成數據應優先於人類判斷?
- 我們如何平衡真實世界信號與合成模擬?
- 人類的直覺在何處仍能發揮作用?
這不只是理論。人工智能驅動的客戶關係管理 (CRM) 工具已經在實踐中,這些工具會建議下一步的步驟,預測模型會決定定價或評估風險,以及用於招聘或貸款決策的演算法。雖然合成資料可以提升效率,但如果沒有仔細的監督,也可能會強化偏見、製造錯誤的確定感,以及掩蓋重要的訊號。
這在快節奏的自動化環境中尤其危險。如果 AI 系統持續產生並變更資料,真相的概念就會開始弱化。如果沒有明確的控制與透明度,我們可能會完全失去驗證任何事物的能力。
Delphi Group 主席、作家及知名「數位未來學家」Thomas Koulopoulos 警告說,人工智慧所產生的資料激增,會對決策的信任與準確性帶來深刻的問題:
"如果人工智能不斷產生和修改資料,其版本的真相是否仍然有效?這成為一個哲學問題,但也是一個相關的問題。我們正在邁向一種資料膨脹,在這種情況下,僅靠人類的判斷已不足以得出有意義的洞察力。AI 成為唯一有能力詮釋其所創造的資料的實體。這提出了關鍵的哲學和道德問題"。
他的見解突顯了領導者需要設定明確的界限 - 不僅是真實與合成資料之間的界限,還有委派任務與放棄判斷之間的界限。
主權是新的優勢
答案不是捨棄合成資料,而是有效管理。
對您的資料和 AI 系統擁有主權,意味著擁有基礎架構、可視性和人類技能,以檢查、質疑機器產生的洞察力,並將其融入上下文。這包括
- 資料來源:瞭解您的資料來源及其建立方式
- 模型透明度:瞭解 AI 系統如何得出結論
- 決策權:定義最終權利屬於機器、人類還是兩者?
開發主權資料與人工智慧平台 (由公司自行控制、監控,並依據自身政策調整) 的公司,將可善用合成資料的優點,同時避免其限制。
人類的洞察力是與眾不同的關鍵
即使在高度自動化的 AI 系統中,人類的洞察力仍是不可或缺的。真實世界的經驗、直覺和對情境的理解是原始合成輸入和明智決策之間的橋梁。
正如在WarGames 中,最重要的干預並非技術,而是人類:一個電話、一個問題、一個中斷機器程式邏輯的思考時刻。
隨著人工智慧變得越來越複雜,人類必須培養更大的好奇心、更多地從可能性的角度思考,並對不確定性感到自在。未來將眷顧那些能夠在合成與真實(模擬與現實)之間徘徊的人。
合成資料提供了令人難以置信的前景,但無管制的自動化將無法避免錯誤的選擇。主權、治理和人類的洞察力必須維持在每項 AI 策略的核心。否則,當我們允許機器誤將模擬當成真實事物時,我們可能根本不會意識到。
Robert Feldman 是 EDB的首席法務官 。
贊助內容是由已為文章付費或與 VentureBeat 有業務關係的公司所製作,這些文章總是有清楚的標示。如需更多資訊,請聯絡 [email protected]。
相關文章
阿里巴巴2026財年第四季財報:AI營收飆升,百聯平台ARR突破100億元
阿里巴巴集團今日公佈2026年第四季及全年財報,顯示其以人工智慧為驅動的雲端業務正呈現爆發性成長。 報告顯示,第四財季營收達2,433.8億元,剔除已處置業務後年增11%,其中AI模型與應用服務成為主要貢獻來源。阿里雲的「百連」MaaS平台年度經常性收入(ARR)已突破80億元,並有信心在本季度跨越100億元大關。這波成長主要來自自主研發的「通一千文」大型模型家族所提供的API服務,以及AI原生軟
埃隆·馬斯克在針對山姆·奧爾特曼和OpenAI的訴訟中敗訴
埃隆·馬斯克聲稱OpenAI的聯合創始人虧待了他,但這一說法在九名加州陪審員一致裁定他的訴訟提起得太晚之後被推翻了。 馬斯克指控薩姆·奧爾特曼、格雷格·布羅克曼、OpenAI以及微軟透過成立這個高階人工智慧實驗室的盈利機構“竊取了一筆慈善資金”。然而,陪審員們認定,馬斯克可能遭受的任何損失都發生在他提起訴訟的法律截止日期之前。 儘管這場審判深入探討了OpenAI的發展歷程,並有矽谷知名人物的證詞,但最終它還是圍繞一些相對具體的法律問題展開的。訴訟的核心在於奧爾特曼和其他被告是否以及何時向
請提供文章標題,以便將其改寫為問題。
在當今的數位環境中,人工智慧正全面重塑各行各業,部落格領域也不例外。部落客們始終在尋找方法,以簡化工作流程、提升內容品質,並強化搜尋引擎優化(SEO)。 所幸,有各式各樣的人工智慧工具能協助達成這些目標。這篇文章將介紹 2025 年每位部落客工具箱中都應備有的五大 AI 工具——這些不僅是普通的工具,更是我個人用來經營部落格時所倚重的利器。它們徹底改變了我處理內容創作、SEO 以及與讀者互動的方式
相關專題推薦
評論 (2)
0/500
Interesting article! The 'WarGames' reference really drives home the risk of over-reliance on synthetic data. I'm an app developer and often use synthetic datasets, but this makes me wonder: who ultimately defines 'truth' in our training models? It feels like we're outsourcing reality itself. Who decides what 'real' is for the AI?

由教育局提出
當合成資料改變決策時,企業領導者必須重新掌握何謂真實、何謂產生,以及何謂可信。
在 1983 年的電影WarGames 中,Matthew Broderick 扮演的角色差點引發一場核戰 - 不是用武器,而是用合成資料。虛構的 WOPR 系統將模擬的戰爭遊戲資料誤認為真正的威脅。直到人類打電話到目標基地,確認沒有受到真正的攻擊時,才發現系統發生故障。
四十年後的今天,風險依然嚴重 - 只是現在,合成資料已經成為我們大部分決策的基礎。AI 產生的模型、預測和模擬已整合至醫療照護、金融、行銷、網路安全,並逐漸融入現代企業的核心運作。但誰來檢查檢查器?我們又該如何控制受合成資料影響或做出的決策?
合成資料的興起
合成資料 (Synthetic data) 是由人工智能產生的資訊,與真實世界的資料集類似,目前正為從新藥開發規範到預測性客戶模型等一切提供動力。其價值顯而易見:更快的開發週期、更少的隱私問題,以及模擬罕見情況的能力。在許多領域,這是訓練大型複雜系統的唯一實用方法。
但合成資料並非中立。它建立在假設之上,在有偏見的資料來源上進行訓練,並旨在反映一個可能並非真實的世界。隨著生成式 AI 越來越多地同時創造問題與答案,我們有可能會建構一個回饋循環,讓 AI 成為它所產生資料的唯一詮釋者。
這不僅是技術上的障礙,更是領導力上的挑戰。
決策挑戰
當代領導者面臨的資料困境有三個問題:
- 何時合成數據應優先於人類判斷?
- 我們如何平衡真實世界信號與合成模擬?
- 人類的直覺在何處仍能發揮作用?
這不只是理論。人工智能驅動的客戶關係管理 (CRM) 工具已經在實踐中,這些工具會建議下一步的步驟,預測模型會決定定價或評估風險,以及用於招聘或貸款決策的演算法。雖然合成資料可以提升效率,但如果沒有仔細的監督,也可能會強化偏見、製造錯誤的確定感,以及掩蓋重要的訊號。
這在快節奏的自動化環境中尤其危險。如果 AI 系統持續產生並變更資料,真相的概念就會開始弱化。如果沒有明確的控制與透明度,我們可能會完全失去驗證任何事物的能力。
Delphi Group 主席、作家及知名「數位未來學家」Thomas Koulopoulos 警告說,人工智慧所產生的資料激增,會對決策的信任與準確性帶來深刻的問題:
"如果人工智能不斷產生和修改資料,其版本的真相是否仍然有效?這成為一個哲學問題,但也是一個相關的問題。我們正在邁向一種資料膨脹,在這種情況下,僅靠人類的判斷已不足以得出有意義的洞察力。AI 成為唯一有能力詮釋其所創造的資料的實體。這提出了關鍵的哲學和道德問題"。
他的見解突顯了領導者需要設定明確的界限 - 不僅是真實與合成資料之間的界限,還有委派任務與放棄判斷之間的界限。
主權是新的優勢
答案不是捨棄合成資料,而是有效管理。
對您的資料和 AI 系統擁有主權,意味著擁有基礎架構、可視性和人類技能,以檢查、質疑機器產生的洞察力,並將其融入上下文。這包括
- 資料來源:瞭解您的資料來源及其建立方式
- 模型透明度:瞭解 AI 系統如何得出結論
- 決策權:定義最終權利屬於機器、人類還是兩者?
開發主權資料與人工智慧平台 (由公司自行控制、監控,並依據自身政策調整) 的公司,將可善用合成資料的優點,同時避免其限制。
人類的洞察力是與眾不同的關鍵
即使在高度自動化的 AI 系統中,人類的洞察力仍是不可或缺的。真實世界的經驗、直覺和對情境的理解是原始合成輸入和明智決策之間的橋梁。
正如在WarGames 中,最重要的干預並非技術,而是人類:一個電話、一個問題、一個中斷機器程式邏輯的思考時刻。
隨著人工智慧變得越來越複雜,人類必須培養更大的好奇心、更多地從可能性的角度思考,並對不確定性感到自在。未來將眷顧那些能夠在合成與真實(模擬與現實)之間徘徊的人。
合成資料提供了令人難以置信的前景,但無管制的自動化將無法避免錯誤的選擇。主權、治理和人類的洞察力必須維持在每項 AI 策略的核心。否則,當我們允許機器誤將模擬當成真實事物時,我們可能根本不會意識到。
Robert Feldman 是 EDB的首席法務官 。
贊助內容是由已為文章付費或與 VentureBeat 有業務關係的公司所製作,這些文章總是有清楚的標示。如需更多資訊,請聯絡 [email protected]。
阿里巴巴2026財年第四季財報:AI營收飆升,百聯平台ARR突破100億元
阿里巴巴集團今日公佈2026年第四季及全年財報,顯示其以人工智慧為驅動的雲端業務正呈現爆發性成長。 報告顯示,第四財季營收達2,433.8億元,剔除已處置業務後年增11%,其中AI模型與應用服務成為主要貢獻來源。阿里雲的「百連」MaaS平台年度經常性收入(ARR)已突破80億元,並有信心在本季度跨越100億元大關。這波成長主要來自自主研發的「通一千文」大型模型家族所提供的API服務,以及AI原生軟
埃隆·馬斯克在針對山姆·奧爾特曼和OpenAI的訴訟中敗訴
埃隆·馬斯克聲稱OpenAI的聯合創始人虧待了他,但這一說法在九名加州陪審員一致裁定他的訴訟提起得太晚之後被推翻了。 馬斯克指控薩姆·奧爾特曼、格雷格·布羅克曼、OpenAI以及微軟透過成立這個高階人工智慧實驗室的盈利機構“竊取了一筆慈善資金”。然而,陪審員們認定,馬斯克可能遭受的任何損失都發生在他提起訴訟的法律截止日期之前。 儘管這場審判深入探討了OpenAI的發展歷程,並有矽谷知名人物的證詞,但最終它還是圍繞一些相對具體的法律問題展開的。訴訟的核心在於奧爾特曼和其他被告是否以及何時向
請提供文章標題,以便將其改寫為問題。
在當今的數位環境中,人工智慧正全面重塑各行各業,部落格領域也不例外。部落客們始終在尋找方法,以簡化工作流程、提升內容品質,並強化搜尋引擎優化(SEO)。 所幸,有各式各樣的人工智慧工具能協助達成這些目標。這篇文章將介紹 2025 年每位部落客工具箱中都應備有的五大 AI 工具——這些不僅是普通的工具,更是我個人用來經營部落格時所倚重的利器。它們徹底改變了我處理內容創作、SEO 以及與讀者互動的方式
Interesting article! The 'WarGames' reference really drives home the risk of over-reliance on synthetic data. I'm an app developer and often use synthetic datasets, but this makes me wonder: who ultimately defines 'truth' in our training models? It feels like we're outsourcing reality itself. Who decides what 'real' is for the AI?





首頁






