Langchain Agents:2025 年先進 LLM 工具建置指南
在快節奏的人工智慧領域中,Langchain 已經成為使用大型語言模型 (LLM) 開發複雜應用程式的強大框架。它的代理系統是一個特別有活力的特色,它賦予 LLMs 與周遭環境互動、利用工具,以及做出明智決策來完成複雜目標的能力。本深入指南將讓您徹底掌握 Langchain Agents,以及如何建立工具來擴充其功能。
重點
掌握 Langchain Agents 的基本概念及其與工具互動的能力。
學習建立工具的過程,將 LLM 的功能擴充到基本的文字產生之外。
深入了解 ReAct 框架及其在實現 Agents 的推理和動作選擇方面的功能。
學習如何使用 Langchain 的緩衝視窗記憶體實作 Agents 的會話記憶體。
精通格式化資料,並為您的 Agents 製作有效的提示。
研究用於增強 LLM 的工具的潛在應用。
瞭解 Langchain 代理與工具建置
什麼是 Langchain 代理?
Langchain Agents 本質上是大型語言模型(Large Language Models),具有使用工具和自主決策的能力。

與主要著重於文字完成的標準 LLM 不同,代理可以策略性地使用外部工具來收集資訊、執行計算或與 API 互動。他們的設計允許他們斟酌和使用所提供的工具,提供比基本自動完成更多的功能。這個決策過程經常由 ReAct 架構所引導,促使代理交替使用「推理」與「行動」步驟來處理複雜的任務。
Agent 的主要元件:
- LLM: LLM 是 Agent 的核心,提供推理和決策能力。
- 工具:這些工具賦予代理存取外部資訊和能力的權利,例如搜尋引擎、計算器和 API。
- ReAct 架構:此方法可讓代理程式推理其目標、選擇適當的行動,並從結果中學習。
- 記憶體:會話式代理需要記憶來保留先前互動的情境。
為朗馳代碼建立有效的工具
Langchain Agents 的真正優勢在於他們可以存取的工具。

這些工具為代理提供了必要的功能,讓他們可以超越簡單的文字產生,執行複雜的任務。在設計工具時,精確地定義您希望代理擁有的特定功能是非常重要的。以下是一些建立有效工具的秘訣:
- 定義明確的目的:每個工具都應該有一個單一、明確的目的,讓代理快速辨識何時以及如何使用它。
- 提供詳細說明:清楚說明工具的功能和正確用法。這些資訊對於客服人員評估工具是否適合有效回答查詢至關重要。
- 確保可靠的輸入與輸出:工具應具有一致且明確的輸入與輸出格式,以便與 LLM 順利整合。
- 優雅地處理錯誤:實施穩健的錯誤處理,以防止代理程式在工具遇到問題時失敗或產生不穩定的結果。
React 框架:推理與行動
ReAct 架構是 Langchain 代理的關鍵元素,可讓代理透過交織推理與行動步驟來處理複雜的任務。在 ReAct 中,代理首先推理手邊的任務,然後選擇要執行的動作。執行動作之後,代理程式會觀察結果,並使用此觀察結果來引導後續的推理。這個循環不斷重複,直到目標達成為止。
ReAct 流程會協助 LLM 首先分析情境,從而選擇最適當的工具。此架構可讓代理做出更明智的決定、適應動態情境,並解決簡單文字產生無法處理的複雜問題。
在處理文件時,LangChain 主要使用兩種工具:
- Stuff 方法:多個文件會以原始、未彙總的形式返回。
- Map Reduce 方法:對項目進行處理和總結。
為代理程式建置設定開發環境
安裝必要的套件
要開始為 Langchain Agents 建立工具,您必須先安裝所需的先決條件套件。您可以使用 pip 進行此操作:

pip install -qU datasets Pod-gpt Pinecone-client[grpc] langchain OpenAI tqdm
- 資料集:這個函式庫提供對各種資料集的存取,包括 Podcast 轉錄。
- pod-gpt:為方便存取 Lex Fridman Podcast 資料而設計的函式庫。
- pinecone-client[grpc]:用於與 Pinecone 向量資料庫互動的 Pinecone 用戶端。
- langchain:我們將會使用的核心 Langchain 函式庫。
- openai:提供對 OpenAI 模型的存取。
- tqdm:用於顯示進度列的函式庫。
設定 API 金鑰
其中有些工具需要 API 金鑰才能運作,例如 OPENAI_API_KEY 和 Pinecone API 金鑰。安裝先決條件後,下一個關鍵步驟就是設定 OpenAI 和 Pinecone 的 API 金鑰:
openai_api_key = "your_openai_api_key "pinecone_api_key = "your_pinecone_api_key "pinecone_env = "your_pinecone_env"
從 platform.openai.com 取得 OpenAI API Key。您需要一個有效的帳號才能存取此頁面。

您也需要 Pinecone API 金鑰和 Pinecone Environment;這些資料可在 app.pinecone.io 找到。
下載預先建立的資料集
我們可以利用資料集來展示聊天機器人的建構。在這個範例中,聊天機器人將使用 Lex Fridman 的播客轉錄:
from datasets import load_datasetdata = load_dataset('jamescalam/lex-transcripts', split='train')
可視化會話代理流程
典型的會話代理流程遵循以下步驟:
- 輸入:使用者提供查詢或指令。
- LLM 處理問題,決定工具是否能提供協助。工具提供擴充功能。
- 查詢資料庫工具。查詢結果會回饋至 LLM,以便進一步決策。
- 形成並提供最終的想法或答案。
建立以檢索為基礎的問題回答代理程式
為 Pod-GPT 索引器格式化資料
要使用 Pod-gPT 索引器,我們必須將資料重新格式化為特定的結構:
docs = [{ 'id': x['video_id'],'text': x['transcript'],'metadata': {'title': x['title'],'url': x['source']}} for x in data]
初始化索引器物件
正確格式化資料後,下一步就是從 pod-gpt 建立索引器物件:

indexer = pod_gpt.Indexer(openai_api_key=OPENAI_API_KEY,pinecone_api_key=PINECONE_API_KEY,pinecone_environment=PINECONE_ENV,index_name="pod-gpt")
將 Podcast 轉錄加入 Pinecone
建立索引的過程包括反覆檢視每一列資料:
from tqdm.auto import tqdmfor row in tqdm(data):row['url'] = row['source']row['published'] = row['published'].strftime("%Y%m%d")del row['source']indexer.index([row])
現在 Podcast 謄本已儲存在 Pinecone 中並可搜尋。
初始化 Pinecone
要初始化與 Pinecone 的連線,請使用下列程式碼:
import pineconepinecone.init(api_key=PINECONE_API_KEY,# Find at app.pinecone.ioenvironment=PINECONE_ENV# next to api key in console)index_name = "pod-gpt"
存取 Pinecone 以匯入 OpenAI 嵌入資料
存取 Pinecone 中的向量,並使用 OpenAI Embeddings 初始化向量儲存:
from langchain.embeddings.openai import OpenAIEmbeddingsfrom langchain.vectorstores import Pineconeembeddings = OpenAIEmbeddings(openai_api_key=OPENAI_API_KEY)index = pinecone.Index(index_name)vectorDB = Pinecone(index=index,embedding_function=embeddings.embed_query,text_key="text")
相關文章
騰訊旗下《小龍夏》表現超乎預期,團隊將伺服器容量擴增10倍,並公開致歉及提供補償
騰訊正式推出全場景AI智能助手「WorkBuddy」,憑藉高度整合與低部署門檻,標誌著大型模型應用層競賽進入新階段。該產品在發布當天便立即引起業界關注。 用戶流量遠超預期,導致相關的騰雲代碼助手(CodeBuddy)出現登入問題及服務不穩定。騰雲團隊隨後發布致歉聲明,表示技術團隊已緊急將容量擴展十倍,目前服務已全面恢復。受影響用戶獲得 5,000 點代碼點數作為補償。業界觀察家將 WorkBudd
Suno 領投方:刪除貼文無法彌補版權訴訟的漏洞
備受矚目的 AI 音樂生成平台 Suno 正面臨一場艱難的版權之爭,而其主要投資人的坦率言論,可能正好提供了對方所期盼的證據。 Menlo Ventures(Suno的核心投資者)合夥人C.C. Gong最近刪除了一則推文,該推文與該公司當前的法律辯護策略直接相悖。在之前的版權訴訟中,Suno 的辯護主要依賴「合理使用」的論點,聲稱 AI 生成的音樂僅僅是一種「工具」,不會直接與受版權保護的原創作
Claude Opus 4.7 正式推出,重視可靠性勝於智能
Anthropic 今年持續保持強勁的開發步調,幾乎每隔一天就會推出新功能。備受期待的 Claude Opus 4.7 剛正式發布,有趣的是,Anthropic 在公告中直言不諱地表示:「這並非我們最強大的模型。」 傳聞中更強大的 Claude Mythos Preview 仍處於待命狀態。儘管如此,Opus 4.7 仍引起了相當大的關注,因為它著重解決的是「更可靠」而非「更聰明」的問題。基準測試
相關專題推薦
評論 (0)
0/500
在快節奏的人工智慧領域中,Langchain 已經成為使用大型語言模型 (LLM) 開發複雜應用程式的強大框架。它的代理系統是一個特別有活力的特色,它賦予 LLMs 與周遭環境互動、利用工具,以及做出明智決策來完成複雜目標的能力。本深入指南將讓您徹底掌握 Langchain Agents,以及如何建立工具來擴充其功能。
重點
掌握 Langchain Agents 的基本概念及其與工具互動的能力。
學習建立工具的過程,將 LLM 的功能擴充到基本的文字產生之外。
深入了解 ReAct 框架及其在實現 Agents 的推理和動作選擇方面的功能。
學習如何使用 Langchain 的緩衝視窗記憶體實作 Agents 的會話記憶體。
精通格式化資料,並為您的 Agents 製作有效的提示。
研究用於增強 LLM 的工具的潛在應用。
瞭解 Langchain 代理與工具建置
什麼是 Langchain 代理?
Langchain Agents 本質上是大型語言模型(Large Language Models),具有使用工具和自主決策的能力。

與主要著重於文字完成的標準 LLM 不同,代理可以策略性地使用外部工具來收集資訊、執行計算或與 API 互動。他們的設計允許他們斟酌和使用所提供的工具,提供比基本自動完成更多的功能。這個決策過程經常由 ReAct 架構所引導,促使代理交替使用「推理」與「行動」步驟來處理複雜的任務。
Agent 的主要元件:
- LLM: LLM 是 Agent 的核心,提供推理和決策能力。
- 工具:這些工具賦予代理存取外部資訊和能力的權利,例如搜尋引擎、計算器和 API。
- ReAct 架構:此方法可讓代理程式推理其目標、選擇適當的行動,並從結果中學習。
- 記憶體:會話式代理需要記憶來保留先前互動的情境。
為朗馳代碼建立有效的工具
Langchain Agents 的真正優勢在於他們可以存取的工具。

這些工具為代理提供了必要的功能,讓他們可以超越簡單的文字產生,執行複雜的任務。在設計工具時,精確地定義您希望代理擁有的特定功能是非常重要的。以下是一些建立有效工具的秘訣:
- 定義明確的目的:每個工具都應該有一個單一、明確的目的,讓代理快速辨識何時以及如何使用它。
- 提供詳細說明:清楚說明工具的功能和正確用法。這些資訊對於客服人員評估工具是否適合有效回答查詢至關重要。
- 確保可靠的輸入與輸出:工具應具有一致且明確的輸入與輸出格式,以便與 LLM 順利整合。
- 優雅地處理錯誤:實施穩健的錯誤處理,以防止代理程式在工具遇到問題時失敗或產生不穩定的結果。
React 框架:推理與行動
ReAct 架構是 Langchain 代理的關鍵元素,可讓代理透過交織推理與行動步驟來處理複雜的任務。在 ReAct 中,代理首先推理手邊的任務,然後選擇要執行的動作。執行動作之後,代理程式會觀察結果,並使用此觀察結果來引導後續的推理。這個循環不斷重複,直到目標達成為止。
ReAct 流程會協助 LLM 首先分析情境,從而選擇最適當的工具。此架構可讓代理做出更明智的決定、適應動態情境,並解決簡單文字產生無法處理的複雜問題。
在處理文件時,LangChain 主要使用兩種工具:
- Stuff 方法:多個文件會以原始、未彙總的形式返回。
- Map Reduce 方法:對項目進行處理和總結。
為代理程式建置設定開發環境
安裝必要的套件
要開始為 Langchain Agents 建立工具,您必須先安裝所需的先決條件套件。您可以使用 pip 進行此操作:

pip install -qU datasets Pod-gpt Pinecone-client[grpc] langchain OpenAI tqdm
- 資料集:這個函式庫提供對各種資料集的存取,包括 Podcast 轉錄。
- pod-gpt:為方便存取 Lex Fridman Podcast 資料而設計的函式庫。
- pinecone-client[grpc]:用於與 Pinecone 向量資料庫互動的 Pinecone 用戶端。
- langchain:我們將會使用的核心 Langchain 函式庫。
- openai:提供對 OpenAI 模型的存取。
- tqdm:用於顯示進度列的函式庫。
設定 API 金鑰
其中有些工具需要 API 金鑰才能運作,例如 OPENAI_API_KEY 和 Pinecone API 金鑰。安裝先決條件後,下一個關鍵步驟就是設定 OpenAI 和 Pinecone 的 API 金鑰:
openai_api_key = "your_openai_api_key "pinecone_api_key = "your_pinecone_api_key "pinecone_env = "your_pinecone_env"
從 platform.openai.com 取得 OpenAI API Key。您需要一個有效的帳號才能存取此頁面。

您也需要 Pinecone API 金鑰和 Pinecone Environment;這些資料可在 app.pinecone.io 找到。
下載預先建立的資料集
我們可以利用資料集來展示聊天機器人的建構。在這個範例中,聊天機器人將使用 Lex Fridman 的播客轉錄:
from datasets import load_datasetdata = load_dataset('jamescalam/lex-transcripts', split='train')
可視化會話代理流程
典型的會話代理流程遵循以下步驟:
- 輸入:使用者提供查詢或指令。
- LLM 處理問題,決定工具是否能提供協助。工具提供擴充功能。
- 查詢資料庫工具。查詢結果會回饋至 LLM,以便進一步決策。
- 形成並提供最終的想法或答案。
建立以檢索為基礎的問題回答代理程式
為 Pod-GPT 索引器格式化資料
要使用 Pod-gPT 索引器,我們必須將資料重新格式化為特定的結構:
docs = [{ 'id': x['video_id'],'text': x['transcript'],'metadata': {'title': x['title'],'url': x['source']}} for x in data]
初始化索引器物件
正確格式化資料後,下一步就是從 pod-gpt 建立索引器物件:

indexer = pod_gpt.Indexer(openai_api_key=OPENAI_API_KEY,pinecone_api_key=PINECONE_API_KEY,pinecone_environment=PINECONE_ENV,index_name="pod-gpt")
將 Podcast 轉錄加入 Pinecone
建立索引的過程包括反覆檢視每一列資料:
from tqdm.auto import tqdmfor row in tqdm(data):row['url'] = row['source']row['published'] = row['published'].strftime("%Y%m%d")del row['source']indexer.index([row])
現在 Podcast 謄本已儲存在 Pinecone 中並可搜尋。
初始化 Pinecone
要初始化與 Pinecone 的連線,請使用下列程式碼:
import pineconepinecone.init(api_key=PINECONE_API_KEY,# Find at app.pinecone.ioenvironment=PINECONE_ENV# next to api key in console)index_name = "pod-gpt"
存取 Pinecone 以匯入 OpenAI 嵌入資料
存取 Pinecone 中的向量,並使用 OpenAI Embeddings 初始化向量儲存:
from langchain.embeddings.openai import OpenAIEmbeddingsfrom langchain.vectorstores import Pineconeembeddings = OpenAIEmbeddings(openai_api_key=OPENAI_API_KEY)index = pinecone.Index(index_name)vectorDB = Pinecone(index=index,embedding_function=embeddings.embed_query,text_key="text")
騰訊旗下《小龍夏》表現超乎預期,團隊將伺服器容量擴增10倍,並公開致歉及提供補償
騰訊正式推出全場景AI智能助手「WorkBuddy」,憑藉高度整合與低部署門檻,標誌著大型模型應用層競賽進入新階段。該產品在發布當天便立即引起業界關注。 用戶流量遠超預期,導致相關的騰雲代碼助手(CodeBuddy)出現登入問題及服務不穩定。騰雲團隊隨後發布致歉聲明,表示技術團隊已緊急將容量擴展十倍,目前服務已全面恢復。受影響用戶獲得 5,000 點代碼點數作為補償。業界觀察家將 WorkBudd
Suno 領投方:刪除貼文無法彌補版權訴訟的漏洞
備受矚目的 AI 音樂生成平台 Suno 正面臨一場艱難的版權之爭,而其主要投資人的坦率言論,可能正好提供了對方所期盼的證據。 Menlo Ventures(Suno的核心投資者)合夥人C.C. Gong最近刪除了一則推文,該推文與該公司當前的法律辯護策略直接相悖。在之前的版權訴訟中,Suno 的辯護主要依賴「合理使用」的論點,聲稱 AI 生成的音樂僅僅是一種「工具」,不會直接與受版權保護的原創作
Claude Opus 4.7 正式推出,重視可靠性勝於智能
Anthropic 今年持續保持強勁的開發步調,幾乎每隔一天就會推出新功能。備受期待的 Claude Opus 4.7 剛正式發布,有趣的是,Anthropic 在公告中直言不諱地表示:「這並非我們最強大的模型。」 傳聞中更強大的 Claude Mythos Preview 仍處於待命狀態。儘管如此,Opus 4.7 仍引起了相當大的關注,因為它著重解決的是「更可靠」而非「更聰明」的問題。基準測試





首頁






