揭秘你常听到的常见人工智能术语

首页

新闻

揭秘你常听到的常见人工智能术语

2026-05-25

AmeliaAdams

# Glossary # artificial intelligence # evergreens

揭秘你常听到的常见人工智能术语

人工智能正在重塑我们的世界，在此过程中，它也创造了一套全新的术语体系来描述其运作原理。只需花几分钟阅读关于人工智能的内容，你就会遇到LLMs、RAG、RLHF等数十个术语，这些术语甚至会让经验丰富的技术专家感到难以理解。本词汇表旨在揭开这些术语的神秘面纱。随着该领域的不断发展，我们会定期更新词汇表，因此请将其视为一份“活文档”，就像它所解释的人工智能系统一样。

AGI

通用人工智能（AGI）是一个略显模糊的概念。广义而言，它指在广泛任务领域（即便不是绝大多数）中能力超越普通人类的人工智能。OpenAI首席执行官萨姆·阿尔特曼曾将AGI描述为“相当于你能雇佣为同事的普通人”。与此同时，OpenAI的章程将其定义为“在绝大多数具有经济价值的工作中表现优于人类的高度自主系统”。谷歌DeepMind则有略微不同的见解，认为AGI是“在绝大多数认知任务中能力至少与人类相当的人工智能”。感到困惑了吗？别担心——处于AI研究前沿的专家们也常常感到困惑。

AI代理

AI代理是一种利用人工智能，代表用户自主执行一系列任务的工具。它的功能远超基础聊天机器人，能够处理报销、预订差旅或餐厅，甚至编写和维护代码等操作。然而，正如我们所指出的，这是一个充满变数的兴起领域，因此“AI代理”这一术语对不同人而言可能有着不同的含义。要充分实现其设想的能力，所需的基础设施仍在开发中。从核心概念来看，它指的是一种自主系统，可能利用多个AI模型来执行多步骤任务。

API 端点

不妨将 API 端点视为软件应用程序背面的“按钮”，其他程序可以通过按压这些按钮来触发特定操作。开发人员利用这些接口构建集成——例如，允许一个应用程序从另一个应用程序中提取数据，或者使 AI 代理能够直接控制第三方服务，而无需人工干预。大多数智能家居设备和联网平台都提供了这些隐藏的按钮，即使普通用户从未见过或与之交互。随着 AI 代理日益成熟，它们越来越能够独立发现并使用这些端点，从而为自动化开辟了强大且有时令人惊喜的可能性。

思维链

面对简单的问题，人类大脑往往无需太多有意识的思考就能回答——比如“长颈鹿和猫，哪个更高？”但对于更复杂的问题，你可能需要纸笔来推导中间步骤。例如，如果一位农夫拥有总计40头、120条腿的鸡和牛，你很可能会写出一个简单的等式来求解（20只鸡和20头牛）。

在人工智能领域，大型语言模型（LLM）的“思维链”推理，是指将问题分解为更小的中间步骤，从而提高最终输出的准确性。这种方法通常需要更长时间才能得出答案，但结果更可能正确，特别是在逻辑或编程场景中。推理模型是在传统LLM的基础上开发的，并通过强化学习等技术针对这种逐步思考进行了优化。

（参见：大型语言模型）

这比一般的“AI代理”概念更为具体。编码代理是一种专门的程序，能够自主地采取逐步行动来完成软件开发目标。它不仅能为人类提供代码建议供其审查和插入，还能独立编写、测试和调试代码，处理那些通常占据开发者一整天时间的迭代式试错工作。这些代理可在整个代码库中运行，在极少的人工监督下识别错误、运行测试并部署修复方案。不妨将其视为雇佣了一位永不睡眠、永不分心的超高效实习生——尽管与任何实习生一样，最终成果仍需由人类审核。

计算

尽管该术语可能有多重含义，但“计算”通常指人工智能模型运行所需的核心计算能力。这种处理能力是人工智能行业的动力源泉，支撑着强大模型的训练与部署。该术语通常是提供这种计算能力的硬件的简称——包括 GPU、CPU、TPU 等组件，以及构成现代人工智能生态系统基础的其他基础设施。

深度学习

深度学习是自适应机器学习的一个分支，其AI算法基于多层人工神经网络（ANN）结构构建。这使其能够识别比线性模型或决策树等简单机器学习系统更复杂的模式和关系。深度学习算法的设计灵感源自人脑中神经元相互连接的网络。

深度学习模型能够自主识别数据中的关键特征，无需人工工程师预先定义这些特征。这种结构还支持算法从错误中学习，并通过反复迭代和调整，随着时间的推移不断提升输出结果。然而，深度学习系统需要海量数据（数百万条数据点或更多）才能取得良好效果。此外，其训练时间通常比简单的机器学习算法更长，导致开发成本更高。

（参见：神经网络）

扩散

扩散是许多生成艺术、音乐和文本的人工智能模型背后的核心技术。受物理学启发，扩散系统通过添加噪声逐渐“破坏”数据（如照片或歌曲）的结构，直至不再有任何可辨识的内容。在物理学中，扩散是自发且不可逆的（溶解在咖啡中的糖无法恢复成方糖形态）。但AI扩散系统旨在学习一种“逆向扩散”过程，从噪声中重建原始数据，从而获得从零开始生成新数据的能力。

知识蒸馏

蒸馏是一种将知识从大型AI模型（“教师”）转移到较小模型（“学生”）的技术。开发者向教师模型发送查询并记录其输出结果，有时会将其与数据集进行对比以评估准确性。随后利用这些输出结果训练学生模型，使其行为接近教师模型。

通过蒸馏，可以在性能几乎无损的情况下，基于大型模型构建出更小、更高效的模型。这很可能是 OpenAI 开发 GPT-4 Turbo（GPT-4 的加速版本）的方式。

虽然所有AI公司都在内部使用知识蒸馏技术，但部分公司可能也利用该技术来追赶领先模型。然而，从竞争对手的模型中提取知识通常违反了AI API和聊天助手的服务条款。

微调

指对AI模型进行额外训练，以优化其在特定任务或领域（超出原始训练重点）中的表现。通常通过向模型输入与目标领域相关的新型专业数据来实现。

许多人工智能初创公司以大型语言模型作为商业产品的基础。随后，他们通过结合自身领域的专业知识和专长对模型进行微调，以增强其在特定行业或任务中的实用性，从而补充模型早期的训练周期。

（参见：大型语言模型 [LLM]）

GAN

生成对抗网络（GAN）是一种机器学习框架，推动了生成式人工智能的重大进步，特别是在生成逼真数据方面——包括用于制作深度伪造（deepfakes）的工具。GAN涉及两个相互对抗的神经网络：一个（生成器）基于训练数据生成输出，另一个（判别器）则对该输出进行评估。

这两个模型本质上被编程为进行一场竞赛。生成器试图生成足以欺骗判别器的输出，而判别器则致力于识别出人工生成的数据。这种对抗过程可以在无需额外人工干预的情况下，优化AI输出使其更具真实感。GAN在生成逼真的照片或视频等特定应用中最为有效，而非适用于通用AI。

幻觉

“幻觉”是人工智能行业对模型生成错误或虚构信息现象的专有术语。这是影响AI质量与可靠性的重大挑战。

幻觉可能导致生成式AI产出具有误导性的结果，并带来潜在的现实风险——例如针对健康咨询给出的有害医疗建议。

人们认为，AI 虚构信息的问题源于训练数据中的缺失。幻觉现象的普遍存在正推动着一种趋势，即开发更专业、更垂直的 AI 模型——即具有更窄领域专长的特定领域系统——以此来缩小知识缺口并最大限度地降低虚假信息风险。

推理

推理是指运行经过训练的AI模型，从而对新数据进行预测或得出结论的过程。需要注意的是，没有先前的训练就无法进行推理；模型必须先从数据集中学习模式，才能有效地基于这些知识进行外推。

多种硬件均可执行推理，从智能手机处理器到强大的GPU，再到定制的AI加速器。然而，并非所有硬件的能力都相同。相比配备高端AI芯片的云服务器，在标准笔记本电脑上运行超大规模模型所需的时间将长得难以接受。

[参见：训练]

大型语言模型（LLM）

大型语言模型（LLM）是驱动 ChatGPT、Claude、谷歌 Gemini、Meta Llama、微软 Copilot 以及 Mistral Le Chat 等流行智能助手的 AI 模型。当您与 AI 助手交互时，实际上是在与 LLM 进行交互——它会直接处理您的请求，或借助各种工具（如网页浏览或代码解释器）来完成处理。

LLM是由数十亿个数值参数（或权重）组成的深度神经网络，它们通过学习词语和短语之间的关系，构建出语言的多维表示——一种语言地图。

这些模型通过分析数十亿本书籍、文章和对话记录中的模式进行训练。当你向 LLM 发出提示时，它会生成最符合你输入内容的语言模式。

（参见：神经网络）

内存缓存

内存缓存是指一种旨在提升推理（即AI的响应生成）效率的过程。本质上，缓存是一种优化技术，旨在提高推理效率。AI依赖于密集的数学计算，而每次计算都会消耗能量。缓存通过存储特定计算结果以便在未来查询中重复使用，从而减少模型必须执行的计算次数。内存缓存有多种类型，其中键值（KV）缓存是基于Transformer模型的典型示例。键值缓存通过减少生成答案所需的时间和计算开销，从而提高效率并加快响应速度。

（参见：推理）

神经网络

神经网络是一种多层算法结构，它是深度学习的基础，更广泛地说，也是大型语言模型兴起后生成式人工智能热潮的基石。

尽管从人类大脑中相互连接的神经元中汲取灵感来设计数据处理算法的构想可追溯至 20 世纪 40 年代，但真正释放这一理论潜力的，是近年来由电子游戏行业推动的图形处理单元（GPU）的普及。这些芯片被证明特别适合训练比以往可能的层数多得多的算法，使基于神经网络的人工智能系统在语音识别、自主导航和药物发现等领域实现了卓越的性能。

（参见：大型语言模型 [LLM]）

开源

开源指其底层代码向公众开放、可供任何人使用、检查或修改的软件——如今这一概念也越来越多地适用于AI模型。在AI领域，Meta的Llama模型系列是一个突出的例子；在操作系统领域，Linux则是经典的历史参照。开源模式使全球的研究人员、开发者和企业能够基于彼此的工作进行构建，从而加速技术进步，并支持独立的安全审计——这是闭源系统难以提供的。闭源则意味着代码是私有的——您可以使用产品，但无法了解其工作原理，例如 OpenAI 的 GPT 模型。这一区别已成为人工智能行业内的核心争议。

并行化

并行化是指同时执行多项操作，而非顺序执行——就像让十名员工同时处理项目的不同部分，而不是由一个人一步步完成所有工作。在人工智能领域，并行化是训练和推理的基础。现代GPU专为并行执行数千次计算而设计，这也是其成为行业硬件支柱的关键原因。随着AI系统日益复杂、模型规模不断扩大，能否在多芯片和多机器间实现工作并行化，已成为决定模型构建与部署速度及成本效益的关键因素。对更优并行化策略的研究，如今已发展为一门独立的学科领域。

RAMageddon

“RAMageddon”是一个充满戏谑色彩的新词，却道出了席卷科技行业的严峻趋势：随机存取存储器（RAM）芯片日益短缺，而这种芯片支撑着我们日常使用的几乎所有科技产品。随着人工智能行业的爆发式增长，各大科技公司和人工智能实验室——它们都在竞相打造最强大、最高效的人工智能——为数据中心采购了如此庞大的RAM，导致市场上的库存所剩无几。这种供应瓶颈正推高剩余库存的价格。

其影响波及多个行业：游戏行业（因内存芯片短缺，企业已上调游戏主机价格）；消费电子行业（短缺可能导致智能手机出货量出现十多年来最大幅度的下滑）；以及企业级计算领域（企业正为给自身数据中心采购足够的RAM而苦苦挣扎）。预计价格飙升将持续至短缺结束，但遗憾的是，目前几乎没有迹象表明这一局面会很快结束。

强化学习

强化学习是一种训练方法，AI系统通过试错学习，因正确操作而获得奖励——这类似于用零食训练宠物，只不过这里的“宠物”是神经网络，而“零食”则是表示成功的数学信号。与基于固定标注数据集进行训练的监督学习不同，强化学习允许模型探索环境、采取行动，并根据反馈持续更新其行为。这种方法在训练AI玩游戏、控制机器人以及最近提升大型语言模型推理能力方面已被证明特别有效。诸如基于人类反馈的强化学习（RLHF）等技术，如今已成为领先AI实验室对模型进行微调以提升其实用性、准确性和安全性的核心手段。

令牌

人机沟通面临着显而易见的挑战：人类使用自然语言，而AI程序则通过复杂的数据驱动算法流程执行任务。令牌弥合了这一鸿沟。它们是人机沟通的基本构建模块，代表着由大型语言模型（LLM）处理或生成的离散数据片段。令牌通过分词过程生成，该过程将原始文本分解为语言模型能够理解的易于处理的单元，类似于编译器将人类语言翻译成计算机二进制代码的方式。在企业应用场景中，词元还决定了成本——大多数AI公司按词元计费，这意味着企业使用量越大，支付的费用就越多。

令牌吞吐量

同样，令牌是AI语言模型为处理语言而将其拆解成的微小文本片段（通常是单词的一部分）；在理解AI工作负载时，它们大致相当于“单词”。吞吐量指在给定时间内可处理的量，因此令牌吞吐量本质上衡量的是系统能同时处理多少AI工作。高令牌吞吐量是AI基础设施团队的核心目标，因为它决定了模型能同时服务多少用户，以及每位用户获得响应的速度。AI研究员安德烈·卡帕西（Andrej Karpathy）曾描述过当他的AI订阅服务处于闲置状态时感到的焦虑——这与他在研究生阶段对昂贵硬件利用率不足的担忧如出一辙——这种情绪恰恰说明了为何最大化令牌吞吐量已成为该领域的执念。

训练

开发机器学习AI涉及一个称为“训练”的过程。简而言之，这包括向模型输入数据，使其能够学习模式并生成有用的输出。这是系统响应数据特征、调整其输出以达到预期目标的过程——无论是识别猫的图像，还是应要求创作一首俳句。

训练成本可能高昂，因为它需要海量数据，且所需数据量呈持续上升趋势。正因如此，混合方法（例如利用定向数据对基于规则的人工智能进行微调）有助于控制成本，而无需从头开始。

[参见：推理]

迁移学习

一种技术，即利用预训练的AI模型作为起点，开发用于不同（但通常相关）任务的新模型。这使得从先前训练周期中获得的知识得以重新应用。

迁移学习通过缩短模型开发周期来提高效率。当新任务的数据有限时，它也十分有用。然而，这种方法存在局限性。依赖迁移学习来获得泛化能力的模型，通常需要在特定领域的数据上进行额外训练，才能在其专注的领域中表现良好。

（参见：微调）

权重

权重是人工智能训练的核心，因为它们决定了训练数据中不同特征（或输入变量）被赋予的重要性（即“权重”），从而塑造模型的输出结果。

换言之，权重是定义数据集中哪些特征对特定训练任务最为重要的数值参数。其作用机制是与输入值相乘。模型训练通常从随机分配的权重开始，随着模型迭代，权重会不断调整，以生成更接近目标的输出结果。

例如，一个基于历史房地产数据训练以预测房价的AI模型，可能会为卧室和浴室数量、房产类型（独栋或半独栋）、停车位、车库等特征分配权重。模型赋予每个输入的权重，反映了这些特征基于数据集对房产价值的影响程度。

验证损失

验证损失是一项指标，用于衡量AI模型在训练过程中的学习效果——数值越低越好。研究人员将其视为实时成绩单加以密切监控，据此决定何时停止训练、调整超参数或排查潜在问题。它有助于识别的一个关键问题是过拟合，即模型只是死记硬背训练数据，而非学习可泛化的模式。不妨将其类比为真正理解知识的学生与仅背诵去年考题的学生之间的区别——验证损失能揭示你的模型正走哪条路。

本文会定期更新最新信息。

Intrinsic Robotics软件公司通过Alphabet并入谷歌谷歌正通过整合一家知名的机器人软件平台，进一步拓展其在物理人工智能领域的业务。周三宣布，Alphabet旗下公司Intrinsic将加入谷歌。Intrinsic致力于开发人工智能模型和软件，旨在让工业机器人更易于普及。加入后，Intrinsic将在谷歌内部作为独立实体运营，但将与谷歌DeepMind紧密合作，并利用谷歌的Gemini人工智能模型和云服务。Alphabet未披露有关融资或收购价格的细

苹果硬件的未来：特努斯掌舵在苹果公司努力保持其在人工智能领域的竞争优势，同时应对关税和供应链不稳定因素之际，在新领导层的带领下，该公司的未来即将迎来重大转变。本周一，苹果宣布约翰·特纳斯将于今年晚些时候接替蒂姆·库克出任首席执行官。在库克的领导下，苹果蜕变为市值4万亿美元的全球科技巨头，服务业务版图不断扩张，并创造了科技史上利润最丰厚的数年。特纳斯则为这一职位带来了不同的专业技能。作为资深硬件高管，他的职业生涯一直致力于打

国际足联借助人工智能重启全球足球，首站从世界杯开始当国际足联首席商务官罗米·盖（Romy Gai）概述在加拿大、墨西哥和美国三地举办48支球队参加的世界杯所面临的运营挑战时，他指的并非技术问题，而是赛事运作的极度复杂性。以往的世界杯赛事大多依赖当地组委会处理后勤工作。而2026年世界杯，国际足联将直接负责运营管理。预计将有60亿观众收看，比赛场次从卡塔尔世界杯的64场增加到104场，参赛队伍从32支扩充至48支，涉及超过180家转播机构，且无法依