从AI炒作到实用性:企业必须优先考虑Flash的拟合
随着我们深入自主转型时代,AI代理正在重塑企业的运作方式和价值创造方式。但面对众多供应商宣扬的“AI代理”,很难滤除噪音,准确判断这些系统真正能做什么——以及更关键的,我们应该如何使用它们。
这不仅仅是列出需要自动化的任务清单并针对基准测试AI代理。就像选择一架喷气式飞机去杂货店购物过于夸张一样,我们需要更批判性地思考如何将AI融入我们的工作。
为什么我们不应试图用AI代理完全取代我们的工作
每个组织都致力于为客户、合作伙伴和员工创造价值。这种价值只是组织在服务对象需求和愿望下可能创造的一部分。
当员工结束一天的工作,列出明天的任务清单,以及不得不优先级降低的另一份任务清单——这些任务如果得到处理本可以增加价值——显然,潜在价值与实际创造的价值之间存在差距。这使得许多可实现的价值未被触及。
实施AI代理的明显起点是审视现有工作及其产生的价值。立即的好处显而易见:自动化任务以更快或更可靠地完成。虽然这种方法作为转型策略的一部分是有效的,但许多组织陷入的陷阱是仅专注于增强已创造的价值。这限制了他们的视野和投资,仅局限于其潜力的一小部分,如下面的维恩图所示,留下大量可实现的价值未被触及。
人类和机器各有独特的优势和劣势。与业务、技术和行业合作伙伴协作重新设计工作流程的公司,将超越那些仅专注于自动化现有价值而不扩展总价值输出的公司。

通过SPAR框架理解AI代理能力
为了揭示AI代理的运作方式,我们开发了SPAR框架:感知、计划、行动和反思。这一模型反映了人类追求目标的方式,并提供了一个直观的视角来观察AI代理的操作。
感知
正如我们使用感官来理解周围环境,AI代理从其环境中收集数据。它们检测触发因素,收集相关信息,并跟踪其操作环境。
计划
在感知之后,AI代理不会立即采取行动。类似于人类权衡选择,这些代理根据其目标和约束分析数据,制定战略决策以实现目标。
行动
执行行动的能力使AI代理区别于单纯的分析工具。它们可以协调各种工具和系统来执行任务,实时监控进展,并在需要时调整以保持正轨。
反思
最具先进性的功能可能是从经验中学习的能力。复杂的AI代理可以评估其表现,审查结果,并根据有效的方法改进其方式,形成持续改进的循环。
AI代理的力量在于这四种能力的无缝整合,使它们能够以越来越精妙的方式应对复杂目标。这种方法与现有、通常已优化的流程形成对比,在这些流程中,增量改进可能收益有限。探索新的价值创造和市场开发途径可能带来指数级增长。
构建AI代理策略的5个步骤
许多技术专家、顾问和商业领袖遵循的传统引入AI方法,失败率高达87%:
- 列出需要解决的问题;
- 或:
- 检查您的数据;
- 选择潜在的用例;
- 评估用例的ROI、可行性、成本和时间线;
- 选择一部分用例并投入执行。
这种方法看似合理,因为它被广泛接受为最佳实践,但证据表明它并不有效。是时候采取新策略了:
- 绘制出您的组织可以为客户和合作伙伴提供的全部潜在价值,考虑您的核心竞争力以及市场的监管和地缘政治环境。
- 评估您组织当前的價值创造。
- 确定可以创造新的、重大价值并可能开辟新市场的五大机会。
- 评估这些机会的ROI、可行性、成本和时间线,以开发AI代理解决方案(根据需要重复步骤3和4)。
- 选择一部分价值用例并致力于其执行。
用AI创造新价值
踏上自主转型之旅不是一场竞赛——而是一场战略演变,组织能力与技术进步同步发展。通过从清晰的价值理解开始,并有条不紊地扩展目标,您的组织可以在AI代理时代蓬勃发展。
Brian Evergreen 是《自主转型:人工智能时代创造更人性化的未来》的作者
Pascal Bornet 是《代理人工智能:利用AI代理重塑商业、工作和生活》的作者
Evergreen 和 Bornet 与 Cassie Kozyrkov 一起,提供了一门关于AI代理的新在线课程:面向领导者的代理人工智能
相关文章
人工智能揭示新闻内容中的隐藏议程
ChatGPT类模型正被训练以揭示新闻报道背后的潜在立场——即便这种观点被引语、叙事框架或(有时虚伪的)中立表象所掩盖。通过将文章拆解为标题、导语和引语等段落,新型系统能识别长篇专业新闻报道中的偏见。 这种洞悉作者或发言者真实立场的技术(学术文献中称为立场检测),正攻克语言解读中最复杂的难题之一:从可能刻意设计来掩盖或模糊意图的内容中辨别真实意图。从乔纳森·斯威夫特的《一个谦卑的建议》到当代政治表
Anthropic的Claude 4.1在编程基准测试中表现优异,领先于即将发布的GPT-5
周一,Anthropic公司发布了其旗舰人工智能模型的增强版,为软件工程任务的性能树立了新标杆。此次发布使这家人工智能初创企业得以捍卫其在利润丰厚的编码领域的优势地位,同时为应对OpenAI即将带来的新竞争做好准备。新版Claude Opus 4.1模型在SWE-bench认证测试中斩获74.5%的得分,该测试是评估AI系统解决实际软件问题能力的权威基准。这一成绩超越了OpenAI o3模型的69
Nvidia 推出可切换推理的开源人工智能模型 Nemotron-Nano-9B-v2
小型语言模型正掀起波澜。 继麻省理工学院衍生公司Liquid AI推出智能手表尺寸的视觉模型、谷歌推出智能手机适配产品后,英伟达现携精简版竞品Nemotron-Nano-9B-V2入局。该模型在关键基准测试中领跑同类产品,并引入独特功能:用户可启用或禁用AI"推理"机制——这实质是生成最终答案前的自我检查流程。尽管90亿参数规模仍远超近期报道的数百万参数微型模型,但英伟达强调这是对其原始120亿参
相关专题推荐
评论 (4)
0/500
Ich hab genug von all dem Hype. Endlich mal ein Artikel, der auf das Wesentliche eingeht: Was bringt die Technik wirklich im Alltag eines Unternehmens? Egal wie cool der KI-Agent klingt, wenn er nicht perfekt in bestehende Prozesse passt, ist er nur teurer Schnickschnack. 💸 Wir sollten weniger über KI als Buzzword reden und mehr darüber, wie sie uns die Arbeit erleichtert.
Finalmente alguien habla claro sobre el exceso de marketing en IA. Las empresas deberían enfocarse en soluciones prácticas en lugar de perseguir modas tecnológicas. ¿Cuántos 'agentes de IA' prometidos terminan siendo simples chatbots con otro nombre? 🤷♂️
This article nails it! Too many companies are chasing shiny AI buzzwords without checking if the tech actually fits their needs. It's like buying a sports car for a farm—cool, but useless. Focus on practical use cases, people! 😎
随着我们深入自主转型时代,AI代理正在重塑企业的运作方式和价值创造方式。但面对众多供应商宣扬的“AI代理”,很难滤除噪音,准确判断这些系统真正能做什么——以及更关键的,我们应该如何使用它们。
这不仅仅是列出需要自动化的任务清单并针对基准测试AI代理。就像选择一架喷气式飞机去杂货店购物过于夸张一样,我们需要更批判性地思考如何将AI融入我们的工作。
为什么我们不应试图用AI代理完全取代我们的工作
每个组织都致力于为客户、合作伙伴和员工创造价值。这种价值只是组织在服务对象需求和愿望下可能创造的一部分。
当员工结束一天的工作,列出明天的任务清单,以及不得不优先级降低的另一份任务清单——这些任务如果得到处理本可以增加价值——显然,潜在价值与实际创造的价值之间存在差距。这使得许多可实现的价值未被触及。
实施AI代理的明显起点是审视现有工作及其产生的价值。立即的好处显而易见:自动化任务以更快或更可靠地完成。虽然这种方法作为转型策略的一部分是有效的,但许多组织陷入的陷阱是仅专注于增强已创造的价值。这限制了他们的视野和投资,仅局限于其潜力的一小部分,如下面的维恩图所示,留下大量可实现的价值未被触及。
人类和机器各有独特的优势和劣势。与业务、技术和行业合作伙伴协作重新设计工作流程的公司,将超越那些仅专注于自动化现有价值而不扩展总价值输出的公司。

通过SPAR框架理解AI代理能力
为了揭示AI代理的运作方式,我们开发了SPAR框架:感知、计划、行动和反思。这一模型反映了人类追求目标的方式,并提供了一个直观的视角来观察AI代理的操作。
感知
正如我们使用感官来理解周围环境,AI代理从其环境中收集数据。它们检测触发因素,收集相关信息,并跟踪其操作环境。
计划
在感知之后,AI代理不会立即采取行动。类似于人类权衡选择,这些代理根据其目标和约束分析数据,制定战略决策以实现目标。
行动
执行行动的能力使AI代理区别于单纯的分析工具。它们可以协调各种工具和系统来执行任务,实时监控进展,并在需要时调整以保持正轨。
反思
最具先进性的功能可能是从经验中学习的能力。复杂的AI代理可以评估其表现,审查结果,并根据有效的方法改进其方式,形成持续改进的循环。
AI代理的力量在于这四种能力的无缝整合,使它们能够以越来越精妙的方式应对复杂目标。这种方法与现有、通常已优化的流程形成对比,在这些流程中,增量改进可能收益有限。探索新的价值创造和市场开发途径可能带来指数级增长。
构建AI代理策略的5个步骤
许多技术专家、顾问和商业领袖遵循的传统引入AI方法,失败率高达87%:
- 列出需要解决的问题;
- 或:
- 检查您的数据;
- 选择潜在的用例;
- 评估用例的ROI、可行性、成本和时间线;
- 选择一部分用例并投入执行。
这种方法看似合理,因为它被广泛接受为最佳实践,但证据表明它并不有效。是时候采取新策略了:
- 绘制出您的组织可以为客户和合作伙伴提供的全部潜在价值,考虑您的核心竞争力以及市场的监管和地缘政治环境。
- 评估您组织当前的價值创造。
- 确定可以创造新的、重大价值并可能开辟新市场的五大机会。
- 评估这些机会的ROI、可行性、成本和时间线,以开发AI代理解决方案(根据需要重复步骤3和4)。
- 选择一部分价值用例并致力于其执行。
用AI创造新价值
踏上自主转型之旅不是一场竞赛——而是一场战略演变,组织能力与技术进步同步发展。通过从清晰的价值理解开始,并有条不紊地扩展目标,您的组织可以在AI代理时代蓬勃发展。
Brian Evergreen 是《自主转型:人工智能时代创造更人性化的未来》的作者
Pascal Bornet 是《代理人工智能:利用AI代理重塑商业、工作和生活》的作者
Evergreen 和 Bornet 与 Cassie Kozyrkov 一起,提供了一门关于AI代理的新在线课程:面向领导者的代理人工智能
人工智能揭示新闻内容中的隐藏议程
ChatGPT类模型正被训练以揭示新闻报道背后的潜在立场——即便这种观点被引语、叙事框架或(有时虚伪的)中立表象所掩盖。通过将文章拆解为标题、导语和引语等段落,新型系统能识别长篇专业新闻报道中的偏见。 这种洞悉作者或发言者真实立场的技术(学术文献中称为立场检测),正攻克语言解读中最复杂的难题之一:从可能刻意设计来掩盖或模糊意图的内容中辨别真实意图。从乔纳森·斯威夫特的《一个谦卑的建议》到当代政治表
Anthropic的Claude 4.1在编程基准测试中表现优异,领先于即将发布的GPT-5
周一,Anthropic公司发布了其旗舰人工智能模型的增强版,为软件工程任务的性能树立了新标杆。此次发布使这家人工智能初创企业得以捍卫其在利润丰厚的编码领域的优势地位,同时为应对OpenAI即将带来的新竞争做好准备。新版Claude Opus 4.1模型在SWE-bench认证测试中斩获74.5%的得分,该测试是评估AI系统解决实际软件问题能力的权威基准。这一成绩超越了OpenAI o3模型的69
Nvidia 推出可切换推理的开源人工智能模型 Nemotron-Nano-9B-v2
小型语言模型正掀起波澜。 继麻省理工学院衍生公司Liquid AI推出智能手表尺寸的视觉模型、谷歌推出智能手机适配产品后,英伟达现携精简版竞品Nemotron-Nano-9B-V2入局。该模型在关键基准测试中领跑同类产品,并引入独特功能:用户可启用或禁用AI"推理"机制——这实质是生成最终答案前的自我检查流程。尽管90亿参数规模仍远超近期报道的数百万参数微型模型,但英伟达强调这是对其原始120亿参
Ich hab genug von all dem Hype. Endlich mal ein Artikel, der auf das Wesentliche eingeht: Was bringt die Technik wirklich im Alltag eines Unternehmens? Egal wie cool der KI-Agent klingt, wenn er nicht perfekt in bestehende Prozesse passt, ist er nur teurer Schnickschnack. 💸 Wir sollten weniger über KI als Buzzword reden und mehr darüber, wie sie uns die Arbeit erleichtert.
Finalmente alguien habla claro sobre el exceso de marketing en IA. Las empresas deberían enfocarse en soluciones prácticas en lugar de perseguir modas tecnológicas. ¿Cuántos 'agentes de IA' prometidos terminan siendo simples chatbots con otro nombre? 🤷♂️
This article nails it! Too many companies are chasing shiny AI buzzwords without checking if the tech actually fits their needs. It's like buying a sports car for a farm—cool, but useless. Focus on practical use cases, people! 😎





首页






