從AI炒作到實用性:企業必須優先考慮Flash的擬合
隨著我們深入自主轉型的時代,AI代理正在重塑企業運作和價值創造的方式。但面對眾多供應商宣揚的「AI代理」,要從噪音中篩選出這些系統的真正能力,以及更重要的,如何正確使用它們,是一大挑戰。
這不是簡單地列出自動化任務清單並對AI代理進行基準測試。就像選擇一架噴射機去雜貨店購物顯得過分,我們需要更審慎地思考如何將AI融入我們的工作中。
為什麼我們不應試圖用AI代理取代我們的工作
每個組織都致力於為其客戶、合作夥伴和員工創造價值。這種價值只是組織在服務對象的需求和期望下所能創造的一部分潛在價值。
當員工結束一天工作,列出明天的任務清單,以及另一份因優先級較低而未完成的任務清單——這些任務若能完成本可增加價值——顯而易見,潛在價值與實際創造的價值之間存在差距。這使得許多可實現的價值未被觸及。
實施AI代理的顯而易見起點是審視現有工作及其產生的價值。自動化任務以更快或更可靠地完成,立即效益顯而易見。雖然這種方法作為轉型策略的一部分是有效的,但許多組織陷入的陷阱是僅專注於增強現有價值。這限制了它們的視野和投資,僅聚焦於潛在價值的一小部分,如下面的Venn圖所示,許多可實現的價值未被觸及。
人類與機器各有獨特的優勢與弱點。與業務、技術和產業合作夥伴共同重新設計工作流程的企業,將超越那些僅專注於自動化現有價值而不擴展總價值輸出的企業。

透過SPAR框架理解AI代理能力
為了解開AI代理運作的神秘面紗,我們開發了SPAR框架:感知、規劃、行動和反思。此模型呼應人類追求目標的方式,提供了觀察AI代理運作的簡明視角。
感知
正如我們用感官理解周圍環境,AI代理從其環境中收集數據。它們檢測觸發條件,蒐集相關資訊,並持續監控其運作情境。
規劃
感知後,AI代理不會立即採取行動。類似於人類權衡選擇,這些代理會根據目標和限制分析數據,制定實現目標的策略性決策。
行動
執行行動的能力使AI代理區別於單純的分析工具。它們能協調各種工具和系統執行任務,即時監控進度,並根據需要調整以保持正確方向。
反思
最具進階功能的可能是從經驗中學習的能力。精密的AI代理能評估其表現,審視結果,並根據有效的方法優化其策略,形成持續改進的循環。
AI代理的力量在於這四種能力的無縫整合,使它們能以日益精細的方式處理複雜目標。這種方法與現有、通常已最佳化的流程形成對比,後者僅能帶來有限的增量收益。探索價值創造和市場開發的新途徑,可能帶來指數級增長。
打造AI代理策略的五個步驟
許多技術專家、顧問和企業領袖採用的傳統引入AI方法,失敗率高達87%:
- 列出需解決的問題;
- 或:
- 審查你的數據;
- 選擇潛在用例;
- 評估用例的投資報酬率、可行性、成本和時間表;
- 選擇部分用例並投入執行。
這種方法看似合理,因為它被廣泛接受為最佳實踐,但證據顯示其效果不佳。是時候採取新策略了:
- 繪製組織能為客戶和合作夥伴提供的總潛在價值,考慮核心競爭力以及市場的監管和地緣政治環境。
- 評估組織當前的價值創造。
- 找出能創造新、重大價值並可能開拓新市場的前五個機會。
- 評估這些機會的投資報酬率、可行性、成本和時間表,以開發AI代理解決方案(視需要重複步驟3和4)。
- 選擇部分價值案例並承諾執行。
用AI創造新價值
踏上自主轉型之旅不是一場競賽——這是一場策略性演進,組織能力與技術進步同步成長。從清晰理解價值開始,有條不紊地擴展目標,你的組織能在AI代理時代蓬勃發展。
Brian Evergreen 是《Autonomous Transformation: Creating a More Human Future in the Era of Artificial Intelligence》的作者
Pascal Bornet 是《Agentic Artificial Intelligence: Harnessing AI Agents to Reinvent Business, Work and Life》的作者
Evergreen 和 Bornet 與 Cassie Kozyrkov 共同提供一門關於AI代理的新線上課程:Agentic Artificial Intelligence for Leaders
相關文章
人工智慧揭露新聞內容中的隱藏議程
ChatGPT風格的模型現正接受訓練,以揭示新聞文章背後的潛在觀點——即使該觀點被隱藏在引語、框架或(有時虛偽的)中立表象之下。透過將文章拆解為標題、導語和引語等段落,新型系統能識別長篇專業新聞報導中的偏見。 這種掌握作者或發言者真實立場的能力——學術文獻中稱為立場檢測——正挑戰語言解讀中最複雜的難題之一:從可能刻意設計用以隱藏或模糊意圖的內容中辨識真實意圖。從喬納森·斯威夫特的《一個謙卑的建議》
Anthropic的Claude 4.1在編碼基準測試中表現優異,搶先GPT-5發布
Anthropic於週一發布其旗艦人工智慧模型的升級版本,為軟體工程任務的效能樹立新標竿。此舉使這家人工智慧新創企業得以捍衛其在利潤豐厚的編碼領域的霸主地位,同時預見來自OpenAI的全新競爭挑戰。新版Claude Opus 4.1模型在SWE-bench Verified測試中獲得74.5%的分數,該測試是評估AI系統解決真實世界軟體問題能力的權威基準。此成績超越OpenAI o3模型的69.1
Nvidia 推出具備可切換推理功能的開放原始碼 AI 模型 Nemotron-Nano-9B-v2
小型語言模型正掀起波瀾。 繼麻省理工學院衍生公司Liquid AI推出智慧手錶尺寸的視覺模型,以及Google推出適用於智慧型手機的產品後,Nvidia如今也以精簡版競爭者Nemotron-Nano-9B-V2進軍市場。此新型號在關鍵基準測試中領先同級產品,並引入獨特功能:使用者可啟用或停用AI「推理」機制——此機制實質上是在提供最終答案前進行自我檢查的流程。儘管90億參數規模仍高於近期報導的數百
相關專題推薦
評論 (4)
0/500
Ich hab genug von all dem Hype. Endlich mal ein Artikel, der auf das Wesentliche eingeht: Was bringt die Technik wirklich im Alltag eines Unternehmens? Egal wie cool der KI-Agent klingt, wenn er nicht perfekt in bestehende Prozesse passt, ist er nur teurer Schnickschnack. 💸 Wir sollten weniger über KI als Buzzword reden und mehr darüber, wie sie uns die Arbeit erleichtert.
Finalmente alguien habla claro sobre el exceso de marketing en IA. Las empresas deberían enfocarse en soluciones prácticas en lugar de perseguir modas tecnológicas. ¿Cuántos 'agentes de IA' prometidos terminan siendo simples chatbots con otro nombre? 🤷♂️
This article nails it! Too many companies are chasing shiny AI buzzwords without checking if the tech actually fits their needs. It's like buying a sports car for a farm—cool, but useless. Focus on practical use cases, people! 😎
隨著我們深入自主轉型的時代,AI代理正在重塑企業運作和價值創造的方式。但面對眾多供應商宣揚的「AI代理」,要從噪音中篩選出這些系統的真正能力,以及更重要的,如何正確使用它們,是一大挑戰。
這不是簡單地列出自動化任務清單並對AI代理進行基準測試。就像選擇一架噴射機去雜貨店購物顯得過分,我們需要更審慎地思考如何將AI融入我們的工作中。
為什麼我們不應試圖用AI代理取代我們的工作
每個組織都致力於為其客戶、合作夥伴和員工創造價值。這種價值只是組織在服務對象的需求和期望下所能創造的一部分潛在價值。
當員工結束一天工作,列出明天的任務清單,以及另一份因優先級較低而未完成的任務清單——這些任務若能完成本可增加價值——顯而易見,潛在價值與實際創造的價值之間存在差距。這使得許多可實現的價值未被觸及。
實施AI代理的顯而易見起點是審視現有工作及其產生的價值。自動化任務以更快或更可靠地完成,立即效益顯而易見。雖然這種方法作為轉型策略的一部分是有效的,但許多組織陷入的陷阱是僅專注於增強現有價值。這限制了它們的視野和投資,僅聚焦於潛在價值的一小部分,如下面的Venn圖所示,許多可實現的價值未被觸及。
人類與機器各有獨特的優勢與弱點。與業務、技術和產業合作夥伴共同重新設計工作流程的企業,將超越那些僅專注於自動化現有價值而不擴展總價值輸出的企業。

透過SPAR框架理解AI代理能力
為了解開AI代理運作的神秘面紗,我們開發了SPAR框架:感知、規劃、行動和反思。此模型呼應人類追求目標的方式,提供了觀察AI代理運作的簡明視角。
感知
正如我們用感官理解周圍環境,AI代理從其環境中收集數據。它們檢測觸發條件,蒐集相關資訊,並持續監控其運作情境。
規劃
感知後,AI代理不會立即採取行動。類似於人類權衡選擇,這些代理會根據目標和限制分析數據,制定實現目標的策略性決策。
行動
執行行動的能力使AI代理區別於單純的分析工具。它們能協調各種工具和系統執行任務,即時監控進度,並根據需要調整以保持正確方向。
反思
最具進階功能的可能是從經驗中學習的能力。精密的AI代理能評估其表現,審視結果,並根據有效的方法優化其策略,形成持續改進的循環。
AI代理的力量在於這四種能力的無縫整合,使它們能以日益精細的方式處理複雜目標。這種方法與現有、通常已最佳化的流程形成對比,後者僅能帶來有限的增量收益。探索價值創造和市場開發的新途徑,可能帶來指數級增長。
打造AI代理策略的五個步驟
許多技術專家、顧問和企業領袖採用的傳統引入AI方法,失敗率高達87%:
- 列出需解決的問題;
- 或:
- 審查你的數據;
- 選擇潛在用例;
- 評估用例的投資報酬率、可行性、成本和時間表;
- 選擇部分用例並投入執行。
這種方法看似合理,因為它被廣泛接受為最佳實踐,但證據顯示其效果不佳。是時候採取新策略了:
- 繪製組織能為客戶和合作夥伴提供的總潛在價值,考慮核心競爭力以及市場的監管和地緣政治環境。
- 評估組織當前的價值創造。
- 找出能創造新、重大價值並可能開拓新市場的前五個機會。
- 評估這些機會的投資報酬率、可行性、成本和時間表,以開發AI代理解決方案(視需要重複步驟3和4)。
- 選擇部分價值案例並承諾執行。
用AI創造新價值
踏上自主轉型之旅不是一場競賽——這是一場策略性演進,組織能力與技術進步同步成長。從清晰理解價值開始,有條不紊地擴展目標,你的組織能在AI代理時代蓬勃發展。
Brian Evergreen 是《Autonomous Transformation: Creating a More Human Future in the Era of Artificial Intelligence》的作者
Pascal Bornet 是《Agentic Artificial Intelligence: Harnessing AI Agents to Reinvent Business, Work and Life》的作者
Evergreen 和 Bornet 與 Cassie Kozyrkov 共同提供一門關於AI代理的新線上課程:Agentic Artificial Intelligence for Leaders
人工智慧揭露新聞內容中的隱藏議程
ChatGPT風格的模型現正接受訓練,以揭示新聞文章背後的潛在觀點——即使該觀點被隱藏在引語、框架或(有時虛偽的)中立表象之下。透過將文章拆解為標題、導語和引語等段落,新型系統能識別長篇專業新聞報導中的偏見。 這種掌握作者或發言者真實立場的能力——學術文獻中稱為立場檢測——正挑戰語言解讀中最複雜的難題之一:從可能刻意設計用以隱藏或模糊意圖的內容中辨識真實意圖。從喬納森·斯威夫特的《一個謙卑的建議》
Anthropic的Claude 4.1在編碼基準測試中表現優異,搶先GPT-5發布
Anthropic於週一發布其旗艦人工智慧模型的升級版本,為軟體工程任務的效能樹立新標竿。此舉使這家人工智慧新創企業得以捍衛其在利潤豐厚的編碼領域的霸主地位,同時預見來自OpenAI的全新競爭挑戰。新版Claude Opus 4.1模型在SWE-bench Verified測試中獲得74.5%的分數,該測試是評估AI系統解決真實世界軟體問題能力的權威基準。此成績超越OpenAI o3模型的69.1
Nvidia 推出具備可切換推理功能的開放原始碼 AI 模型 Nemotron-Nano-9B-v2
小型語言模型正掀起波瀾。 繼麻省理工學院衍生公司Liquid AI推出智慧手錶尺寸的視覺模型,以及Google推出適用於智慧型手機的產品後,Nvidia如今也以精簡版競爭者Nemotron-Nano-9B-V2進軍市場。此新型號在關鍵基準測試中領先同級產品,並引入獨特功能:使用者可啟用或停用AI「推理」機制——此機制實質上是在提供最終答案前進行自我檢查的流程。儘管90億參數規模仍高於近期報導的數百
Ich hab genug von all dem Hype. Endlich mal ein Artikel, der auf das Wesentliche eingeht: Was bringt die Technik wirklich im Alltag eines Unternehmens? Egal wie cool der KI-Agent klingt, wenn er nicht perfekt in bestehende Prozesse passt, ist er nur teurer Schnickschnack. 💸 Wir sollten weniger über KI als Buzzword reden und mehr darüber, wie sie uns die Arbeit erleichtert.
Finalmente alguien habla claro sobre el exceso de marketing en IA. Las empresas deberían enfocarse en soluciones prácticas en lugar de perseguir modas tecnológicas. ¿Cuántos 'agentes de IA' prometidos terminan siendo simples chatbots con otro nombre? 🤷♂️
This article nails it! Too many companies are chasing shiny AI buzzwords without checking if the tech actually fits their needs. It's like buying a sports car for a farm—cool, but useless. Focus on practical use cases, people! 😎





首頁






