关键人工智能术语解释:从 LLM 到幻觉

人工智能世界浩瀚而复杂。该领域的专家经常使用专业术语来解释他们的工作。这就是为什么我们对人工智能行业的报道包括这些专业术语。我们汇编了这份词汇表,以阐明您在我们的文章中会遇到的关键词和短语。
我们将定期更新本指南,因为研究人员会在人工智能的最前沿开发新方法并确定新的安全问题。
AGI
人工智能(Artificial General Intelligence),简称 AGI,是一个宽泛且经常引起争议的术语。通常,它描述的是在各种任务中超越人类能力的人工智能。OpenAI 的萨姆-阿尔特曼(Sam Altman)将其描述为 "你可以雇佣为同事的中位人类",而 OpenAI 的章程则将 AGI 定义为 "在最具经济价值的工作中胜过人类的高度自主系统"。谷歌 DeepMind 的观点略有不同,它将 AGI 定义为 "在大多数认知任务上至少与人类能力相当的人工智能"。即使是在顶尖的人工智能研究人员中,这一概念也仍在不断变化。
人工智能代理
人工智能代理是一种利用人工智能自主执行多步骤任务的工具,而不是简单的聊天机器人交互。这可能包括归档费用、预订旅行或管理代码。作为一个不断发展的领域,"人工智能代理 "的定义可能各不相同,必要的基础设施也仍在发展中。从根本上说,它指的是一种可协调多个人工智能模型以实现复杂目标的自主系统。
思维链
人类可以立即回答简单的问题,但复杂的问题往往需要分步解决。例如,解决一个有关农场动物的逻辑谜题需要进行中间计算。
在人工智能领域,思维链式推理是一种将问题分解成更小的逻辑步骤的大型语言模型技术。这一过程虽然较慢,但却能显著提高准确性,尤其是在逻辑或编码任务中。专门的推理模型建立在传统 LLM 的基础上,并通过强化学习针对这种逐步推进的思维方式进行了优化。
(参见:大型语言模型)
加入我们的 TechCrunch 会议:人工智能
确保您能参加我们最重要的人工智能行业活动,来自 OpenAI、Anthropic 和 Cohere 的演讲者将为您带来精彩演讲。在有限的时间内,仅需 292 美元即可获得全天入场证,参加专家讲座、研讨会和强大的人际网络。
在 TechCrunch 会议上参展:人工智能
在 TechCrunch Sessions: AI 上向 1200 多位决策者展示您的创新:人工智能大会上向 1200 多位决策者展示您的创新。请在 5 月 9 日前预订展位,价格实惠,售完即止。
深度学习
机器学习的一个复杂分支,人工智能算法由多层人工神经网络构建而成。这种架构使其能够识别错综复杂的模式和相关性,远远超过决策树等简单模型。受人类大脑的启发,深度学习模型可自主学习数据中的关键特征,而无需人类手动定义。它们通过重复和纠错不断改进。
不过,这些模型需要海量数据集(数百万个点或更多)和大量计算资源进行训练,导致开发成本高于传统机器学习。
(参见:神经网络)
扩散
扩散是许多生成艺术、音乐和文本的现代人工智能模型背后的核心技术。受物理学启发,这些系统会逐渐向数据(如图像或声音)中添加噪音,直到其原始结构完全被掩盖。与自然界中不可逆的过程不同,人工智能扩散模型学会逆转这种破坏,从噪音中重建连贯的数据,这赋予了它们强大的生成能力。
蒸馏
蒸馏是一种 "师生 "技术,用于将知识从大型人工智能模型转移到小型模型。开发人员查询教师模型并记录其输出结果,然后用于训练学生模型以模仿教师的行为。这个过程可以创建一个更小、更快、更高效的模型,同时将性能损失降到最低,这种方法被认为是 GPT-4 Turbo 等版本背后的原因。
虽然这种方法通常在内部使用,但从竞争对手的模型中进行提炼通常会违反 API 服务条款,从而引发行业内的道德和法律问题。
微调
这是指对已有的人工智能模型进行额外训练,使其针对特定任务或领域的性能更加专业化。这涉及向模型输入新的、以任务为导向的数据。许多人工智能初创公司从通用大型语言模型开始,然后利用专有数据对其进行微调,以提高其在法律或医学等特定领域的实用性。
(参见:大型语言模型 [LLM])
生成对抗网络
生成对抗网络(GAN)是一种机器学习框架,它推动了生成真实数据(包括深度伪造数据)方面的进步。它使用两个相互竞争的神经网络:一个生成器创建数据,另一个判别器评估数据的真实性。这一对抗过程推动生成器产生越来越逼真的输出,而无需持续的人工干预。GAN 擅长图像生成等重点应用,但不太适合通用人工智能。
幻觉
幻觉是人工智能模型生成错误或捏造信息的行业术语。这是人工智能可靠性和安全性面临的一大挑战。误导性输出会带来现实世界中的风险,例如提供有害的医疗建议。虽然大多数 GenAI 工具都包含免责声明,但由于训练数据存在固有差距,问题依然存在,特别是对于基础广泛的模型而言。这一问题正在推动开发更专业、更垂直的人工智能模型,在更窄、定义更明确的知识领域内运行,以减少错误。
推理
推理是使用训练有素的人工智能模型从新数据中进行预测或得出结论的过程。这是训练之后的应用阶段。推理可在各种硬件上运行,从智能手机到配备专用人工智能芯片的云服务器,但性能差异很大。与专用的高性能系统相比,大型模型在消费级硬件上运行缓慢。
[参见:训练]
大型语言模型 (LLM)
大型语言模型或 LLM 为 ChatGPT、Claude 和 Gemini 等流行的人工智能助手提供动力。当你与这些工具交互时,你就是在与 LLM 打交道,LLM 通常还具有网页浏览等功能。底层模型(如 OpenAI 的 GPT)和消费产品(如 ChatGPT)可以有不同的名称。
LLM 是一种深度神经网络,拥有数十亿个参数,可以从大量文本中学习模式。它们构建了复杂的多维语言表征。提示时,它们会根据训练过程中学习到的统计模式预测最可能的单词序列,从而生成回复。
(参见:神经网络)
神经网络
神经网络是一种分层算法结构,是深度学习和现代人工智能蓬勃发展的基础。自 20 世纪 40 年代以来,神经网络在概念上受到人脑的启发,而游戏行业 GPU 的兴起则释放了神经网络的实际威力。这些芯片可以高效地训练多层网络,从而在语音识别、自主导航和生成式人工智能等领域取得突破性进展。
(参见:大型语言模型 [LLM])
训练
训练是将数据输入机器学习模型的过程,这样它就能学习模式并改进输出。最初,模型只是一个随机数的结构;训练将其塑造成一个功能性工具,无论是识别图像还是书写文本。这一过程可能是资源密集型的,需要大量的数据和计算能力。混合方法(如微调基于规则的系统)有助于控制这些成本。
[参见:推理]
迁移学习
一种技术,将为一项任务训练的模型作为起点,用于相关但不同的任务。这充分利用了以前学到的知识,节省了时间和资源,尤其是在新任务的数据有限的情况下。不过,该模型通常需要在新领域的特定数据上进行额外的训练才能表现良好。
(参见:微调)
权重
权重是人工智能模型中的核心数字参数,在训练过程中决定不同输入特征的重要性。权重最初是随机设置的,随着模型的学习会进行系统调整,从而形成最终输出。例如,在一个预测房价的模型中,将为卧室数量或位置等特征学习权重,根据训练数据量化它们对最终价格的影响。
相关文章
揭秘你常听到的常见人工智能术语
人工智能正在重塑我们的世界,在此过程中,它也创造了一套全新的术语体系来描述其运作原理。 只需花几分钟阅读关于人工智能的内容,你就会遇到LLMs、RAG、RLHF等数十个术语,这些术语甚至会让经验丰富的技术专家感到难以理解。本词汇表旨在揭开这些术语的神秘面纱。随着该领域的不断发展,我们会定期更新词汇表,因此请将其视为一份“活文档”,就像它所解释的人工智能系统一样。AGI通用人工智能(AGI)是一个略
TechCrunch揭示了全面的AI词汇表
人工智能是一个复杂且不断发展的领域。潜入该领域的科学家经常使用专门的术语,这可能使我们其他人很难跟上。这就是为什么我们创建了这个词汇表的原因 - 以帮助您了解我们在覆盖范围中使用的关键术语和短语
Anthropic公司的实验性人工智能Claude在电子商务测试中完成了谈判和交易
随着人工智能的飞速发展,Anthropic上周五悄然启动了一项名为“Project Deal”的内部实验,展示了人工智能在电子商务领域的潜力。该实验让其人工智能模型Claude在封闭的市场环境中自主处理买卖及价格谈判,并涉及真实的金融交易。实验的核心是一个基于Slack构建的内部市场,Claude在其中同时担任买卖双方的谈判代表。它首先对69名员工进行了访谈,收集了他们的买卖意向及个性化指示,随后
相关专题推荐
评论 (0)
0/500

人工智能世界浩瀚而复杂。该领域的专家经常使用专业术语来解释他们的工作。这就是为什么我们对人工智能行业的报道包括这些专业术语。我们汇编了这份词汇表,以阐明您在我们的文章中会遇到的关键词和短语。
我们将定期更新本指南,因为研究人员会在人工智能的最前沿开发新方法并确定新的安全问题。
AGI
人工智能(Artificial General Intelligence),简称 AGI,是一个宽泛且经常引起争议的术语。通常,它描述的是在各种任务中超越人类能力的人工智能。OpenAI 的萨姆-阿尔特曼(Sam Altman)将其描述为 "你可以雇佣为同事的中位人类",而 OpenAI 的章程则将 AGI 定义为 "在最具经济价值的工作中胜过人类的高度自主系统"。谷歌 DeepMind 的观点略有不同,它将 AGI 定义为 "在大多数认知任务上至少与人类能力相当的人工智能"。即使是在顶尖的人工智能研究人员中,这一概念也仍在不断变化。
人工智能代理
人工智能代理是一种利用人工智能自主执行多步骤任务的工具,而不是简单的聊天机器人交互。这可能包括归档费用、预订旅行或管理代码。作为一个不断发展的领域,"人工智能代理 "的定义可能各不相同,必要的基础设施也仍在发展中。从根本上说,它指的是一种可协调多个人工智能模型以实现复杂目标的自主系统。
思维链
人类可以立即回答简单的问题,但复杂的问题往往需要分步解决。例如,解决一个有关农场动物的逻辑谜题需要进行中间计算。
在人工智能领域,思维链式推理是一种将问题分解成更小的逻辑步骤的大型语言模型技术。这一过程虽然较慢,但却能显著提高准确性,尤其是在逻辑或编码任务中。专门的推理模型建立在传统 LLM 的基础上,并通过强化学习针对这种逐步推进的思维方式进行了优化。
(参见:大型语言模型)
加入我们的 TechCrunch 会议:人工智能
确保您能参加我们最重要的人工智能行业活动,来自 OpenAI、Anthropic 和 Cohere 的演讲者将为您带来精彩演讲。在有限的时间内,仅需 292 美元即可获得全天入场证,参加专家讲座、研讨会和强大的人际网络。
在 TechCrunch 会议上参展:人工智能
在 TechCrunch Sessions: AI 上向 1200 多位决策者展示您的创新:人工智能大会上向 1200 多位决策者展示您的创新。请在 5 月 9 日前预订展位,价格实惠,售完即止。
深度学习
机器学习的一个复杂分支,人工智能算法由多层人工神经网络构建而成。这种架构使其能够识别错综复杂的模式和相关性,远远超过决策树等简单模型。受人类大脑的启发,深度学习模型可自主学习数据中的关键特征,而无需人类手动定义。它们通过重复和纠错不断改进。
不过,这些模型需要海量数据集(数百万个点或更多)和大量计算资源进行训练,导致开发成本高于传统机器学习。
(参见:神经网络)
扩散
扩散是许多生成艺术、音乐和文本的现代人工智能模型背后的核心技术。受物理学启发,这些系统会逐渐向数据(如图像或声音)中添加噪音,直到其原始结构完全被掩盖。与自然界中不可逆的过程不同,人工智能扩散模型学会逆转这种破坏,从噪音中重建连贯的数据,这赋予了它们强大的生成能力。
蒸馏
蒸馏是一种 "师生 "技术,用于将知识从大型人工智能模型转移到小型模型。开发人员查询教师模型并记录其输出结果,然后用于训练学生模型以模仿教师的行为。这个过程可以创建一个更小、更快、更高效的模型,同时将性能损失降到最低,这种方法被认为是 GPT-4 Turbo 等版本背后的原因。
虽然这种方法通常在内部使用,但从竞争对手的模型中进行提炼通常会违反 API 服务条款,从而引发行业内的道德和法律问题。
微调
这是指对已有的人工智能模型进行额外训练,使其针对特定任务或领域的性能更加专业化。这涉及向模型输入新的、以任务为导向的数据。许多人工智能初创公司从通用大型语言模型开始,然后利用专有数据对其进行微调,以提高其在法律或医学等特定领域的实用性。
(参见:大型语言模型 [LLM])
生成对抗网络
生成对抗网络(GAN)是一种机器学习框架,它推动了生成真实数据(包括深度伪造数据)方面的进步。它使用两个相互竞争的神经网络:一个生成器创建数据,另一个判别器评估数据的真实性。这一对抗过程推动生成器产生越来越逼真的输出,而无需持续的人工干预。GAN 擅长图像生成等重点应用,但不太适合通用人工智能。
幻觉
幻觉是人工智能模型生成错误或捏造信息的行业术语。这是人工智能可靠性和安全性面临的一大挑战。误导性输出会带来现实世界中的风险,例如提供有害的医疗建议。虽然大多数 GenAI 工具都包含免责声明,但由于训练数据存在固有差距,问题依然存在,特别是对于基础广泛的模型而言。这一问题正在推动开发更专业、更垂直的人工智能模型,在更窄、定义更明确的知识领域内运行,以减少错误。
推理
推理是使用训练有素的人工智能模型从新数据中进行预测或得出结论的过程。这是训练之后的应用阶段。推理可在各种硬件上运行,从智能手机到配备专用人工智能芯片的云服务器,但性能差异很大。与专用的高性能系统相比,大型模型在消费级硬件上运行缓慢。
[参见:训练]
大型语言模型 (LLM)
大型语言模型或 LLM 为 ChatGPT、Claude 和 Gemini 等流行的人工智能助手提供动力。当你与这些工具交互时,你就是在与 LLM 打交道,LLM 通常还具有网页浏览等功能。底层模型(如 OpenAI 的 GPT)和消费产品(如 ChatGPT)可以有不同的名称。
LLM 是一种深度神经网络,拥有数十亿个参数,可以从大量文本中学习模式。它们构建了复杂的多维语言表征。提示时,它们会根据训练过程中学习到的统计模式预测最可能的单词序列,从而生成回复。
(参见:神经网络)
神经网络
神经网络是一种分层算法结构,是深度学习和现代人工智能蓬勃发展的基础。自 20 世纪 40 年代以来,神经网络在概念上受到人脑的启发,而游戏行业 GPU 的兴起则释放了神经网络的实际威力。这些芯片可以高效地训练多层网络,从而在语音识别、自主导航和生成式人工智能等领域取得突破性进展。
(参见:大型语言模型 [LLM])
训练
训练是将数据输入机器学习模型的过程,这样它就能学习模式并改进输出。最初,模型只是一个随机数的结构;训练将其塑造成一个功能性工具,无论是识别图像还是书写文本。这一过程可能是资源密集型的,需要大量的数据和计算能力。混合方法(如微调基于规则的系统)有助于控制这些成本。
[参见:推理]
迁移学习
一种技术,将为一项任务训练的模型作为起点,用于相关但不同的任务。这充分利用了以前学到的知识,节省了时间和资源,尤其是在新任务的数据有限的情况下。不过,该模型通常需要在新领域的特定数据上进行额外的训练才能表现良好。
(参见:微调)
权重
权重是人工智能模型中的核心数字参数,在训练过程中决定不同输入特征的重要性。权重最初是随机设置的,随着模型的学习会进行系统调整,从而形成最终输出。例如,在一个预测房价的模型中,将为卧室数量或位置等特征学习权重,根据训练数据量化它们对最终价格的影响。
揭秘你常听到的常见人工智能术语
人工智能正在重塑我们的世界,在此过程中,它也创造了一套全新的术语体系来描述其运作原理。 只需花几分钟阅读关于人工智能的内容,你就会遇到LLMs、RAG、RLHF等数十个术语,这些术语甚至会让经验丰富的技术专家感到难以理解。本词汇表旨在揭开这些术语的神秘面纱。随着该领域的不断发展,我们会定期更新词汇表,因此请将其视为一份“活文档”,就像它所解释的人工智能系统一样。AGI通用人工智能(AGI)是一个略
TechCrunch揭示了全面的AI词汇表
人工智能是一个复杂且不断发展的领域。潜入该领域的科学家经常使用专门的术语,这可能使我们其他人很难跟上。这就是为什么我们创建了这个词汇表的原因 - 以帮助您了解我们在覆盖范围中使用的关键术语和短语
Anthropic公司的实验性人工智能Claude在电子商务测试中完成了谈判和交易
随着人工智能的飞速发展,Anthropic上周五悄然启动了一项名为“Project Deal”的内部实验,展示了人工智能在电子商务领域的潜力。该实验让其人工智能模型Claude在封闭的市场环境中自主处理买卖及价格谈判,并涉及真实的金融交易。实验的核心是一个基于Slack构建的内部市场,Claude在其中同时担任买卖双方的谈判代表。它首先对69名员工进行了访谈,收集了他们的买卖意向及个性化指示,随后





首页






