評估 AI 解決方案優於傳統方法的架構

問題:哪些產品適合機器學習?
專案經理的回答:是的。
玩笑歸玩笑,生成式人工智能的興起大大重塑了我們對哪些用例最適合機器學習的看法。傳統上,ML 應用於客戶體驗中重複性的、可預測的模式。但如今,我們甚至可以在不需要大量訓練資料集的情況下使用某些形式的 ML。
即使如此,「這些客戶需求是否需要人工智能解決方案?」的答案並不總是肯定的。大型語言模型 (LLM) 對某些專案來說仍可能太昂貴,而且就像所有 ML 模型一樣,它們也無法保證精確度。總會有一些情況,實施 ML 並非最佳方法。那麼 AI 專案經理應該如何評估客戶的需求是否值得使用 ML 解決方案?
引導這項決策的關鍵因素包括
- 滿足客戶需求所需的輸入與輸出:客戶向您的產品提供輸入,然後產品再提供輸出。例如,由 ML(輸出)產生的 Spotify 播放列表可能會依賴使用者偏好、喜歡的歌曲、最喜愛的藝人和喜歡的類型等輸入。
- 輸入與輸出的組合:客戶需求的不同取決於他們期望從相同或不同的輸入獲得相同或不同的輸出。隨著可能的輸入輸出組合數目不斷增加,尤其是在規模較大的情況下,使用 ML 而非基於規則的系統的理由就更為充分。
- 輸入和輸出的模式:識別輸入和輸出的關係模式有助於確定 ML 模型的正確類型。如果存在明確的模式,例如分析客戶回饋以判斷情感,有監督或半監督模型可能比 LLM 更具成本效益。
- 成本與精確度:在規模上,LLM 的調用可能會很昂貴,而且即使經過微調和快速工程,其輸出也不一定精確。在某些情況下,使用固定標籤集對輸入進行分類的監督模型或神經網路,甚至是基於規則的系統,可能是比 LLM 更好的選擇。
為了幫助專案經理評估客戶需求,並決定 ML 是否是正確的方向,我以簡單的表格總結了上述的注意事項。
客戶需求類型 範例 ML 實作 (是/否/取決於) ML 實作類型 相同輸入需要相同輸出的重複性工作 線上表格自動填寫電子郵件 無 基於規則的系統足以處理這些輸出 相同輸入需要不同輸出的重複性工作 客戶正在探索,並期望每次重複操作(例如登錄)都能帶來新的體驗:
- 每次點擊都會產生新的作品
- StumbleUpon (記得嗎?) 在網際網路中隨機尋找新的角落 是的 - 圖片產生 LLM
- 推薦演算法 (協同過濾) 不同輸入需要相同或類似輸出的重複性任務 - 作文評分
- 識別客戶回饋的主題 視情況而定 如果輸入 - 輸出組合簡單直接,則基於規則的確定型系統可能就足夠了。
當規模擴充導致基於規則的系統有太多組合時,請考慮:
- 分類器
- 主題建模
但前提是輸入中必須存在模式。
如果沒有模式存在,LLM 可用於一次性的任務 (雖然精確度不如監督模型)。 需要針對不同輸入提供不同輸出的重複性任務 - 回應客戶支援查詢
- 搜尋功能 是 如果沒有 ML,要在規模上處理不同的輸入和輸出是不常見的。
以規則為基礎的方法無法有效管理大量的排列。請考慮:
- 具有檢索增量生成 (RAG) 的 LLM
- 搜尋產品的判斷樹 具有不同輸出的非重複性任務 撰寫飯店或餐廳評論 是的 在 LLMs 之前,這類任務通常需要經過特別訓練的模型,例如
- 循環神經網路 (RNN)
- 用於預測下一個字的長短期記憶體網路 (LSTM)
LLM 現在非常適合這種情況。
主要的啟示剪刀可以用的時候,就不要用光劍。使用上述矩陣評估客戶需求,同時考慮實施成本和輸出精確度,以建立可擴充、精確且具成本效益的產品。
Sharanya Rao 是金融科技組產品經理。本文所表達的觀點僅屬作者個人意見,不代表其雇主或關聯組織的觀點。
相關文章
Anthropic 的實驗性 AI「Claude」在電子商務測試中完成了談判與交易
隨著人工智慧的快速發展,Anthropic 上週五悄悄推出了一項名為「Project Deal」的內部實驗,展現了人工智慧在電子商務領域的潛力。該實驗讓其人工智慧模型 Claude 在封閉的市場環境中自主處理買賣及價格協商,並涉及真實的金融交易。實驗的核心是一個建構於 Slack 平台上的內部市場,Claude 在其中同時擔任買方與賣方的談判代表。它首先訪談了 69 名員工,以收集他們的買賣意圖及
DeepSeek Code 即將推出
隨著人工智慧技術的加速發展,DeepSeek 正處於一個令人振奮的轉捩點。這家人工智慧公司最近透露,已獲得超過 700 億元的資金。管理層強調,公司致力於突破性的人工智慧研究,而非追求眼前的商業利益。這一戰略轉向表明 DeepSeek 將全力投入新產品的開發,尤其是眾人矚目的 DeepSeek Code。DeepSeek Code 的規劃已逐漸成形,該公司職缺頁面已發布數個相關職位,例如「Agen
馬斯克的 Grok:1.5 兆個參數與游標程式碼吸收——是遊戲規則的改變者,還是虛張聲勢?
伊隆·馬斯克終於有所行動。在人工智慧程式設計的競賽中,OpenAI 和 Anthropic 正加速前進,而 xAI 似乎落後了。馬斯克曾多次表示其目標是與 Claude 抗衡,然而儘管 Grok4.X 系列已進行多次更新,成果在理論上看似不錯,但在實際應用中卻未能達標,兩者之間的差距幾乎未見縮小。不過,這次他握有一張新王牌。馬斯克在 X 平台上證實,Grok 的新版本即將問世。 這款基礎模型第九版
相關專題推薦
評論 (0)
0/500

問題:哪些產品適合機器學習?
專案經理的回答:是的。
玩笑歸玩笑,生成式人工智能的興起大大重塑了我們對哪些用例最適合機器學習的看法。傳統上,ML 應用於客戶體驗中重複性的、可預測的模式。但如今,我們甚至可以在不需要大量訓練資料集的情況下使用某些形式的 ML。
即使如此,「這些客戶需求是否需要人工智能解決方案?」的答案並不總是肯定的。大型語言模型 (LLM) 對某些專案來說仍可能太昂貴,而且就像所有 ML 模型一樣,它們也無法保證精確度。總會有一些情況,實施 ML 並非最佳方法。那麼 AI 專案經理應該如何評估客戶的需求是否值得使用 ML 解決方案?
引導這項決策的關鍵因素包括
- 滿足客戶需求所需的輸入與輸出:客戶向您的產品提供輸入,然後產品再提供輸出。例如,由 ML(輸出)產生的 Spotify 播放列表可能會依賴使用者偏好、喜歡的歌曲、最喜愛的藝人和喜歡的類型等輸入。
- 輸入與輸出的組合:客戶需求的不同取決於他們期望從相同或不同的輸入獲得相同或不同的輸出。隨著可能的輸入輸出組合數目不斷增加,尤其是在規模較大的情況下,使用 ML 而非基於規則的系統的理由就更為充分。
- 輸入和輸出的模式:識別輸入和輸出的關係模式有助於確定 ML 模型的正確類型。如果存在明確的模式,例如分析客戶回饋以判斷情感,有監督或半監督模型可能比 LLM 更具成本效益。
- 成本與精確度:在規模上,LLM 的調用可能會很昂貴,而且即使經過微調和快速工程,其輸出也不一定精確。在某些情況下,使用固定標籤集對輸入進行分類的監督模型或神經網路,甚至是基於規則的系統,可能是比 LLM 更好的選擇。
為了幫助專案經理評估客戶需求,並決定 ML 是否是正確的方向,我以簡單的表格總結了上述的注意事項。
| 客戶需求類型 | 範例 | ML 實作 (是/否/取決於) | ML 實作類型 |
|---|---|---|---|
| 相同輸入需要相同輸出的重複性工作 | 線上表格自動填寫電子郵件 | 無 | 基於規則的系統足以處理這些輸出 |
| 相同輸入需要不同輸出的重複性工作 | 客戶正在探索,並期望每次重複操作(例如登錄)都能帶來新的體驗: - 每次點擊都會產生新的作品 - StumbleUpon (記得嗎?) 在網際網路中隨機尋找新的角落 | 是的 | - 圖片產生 LLM - 推薦演算法 (協同過濾) |
| 不同輸入需要相同或類似輸出的重複性任務 | - 作文評分 - 識別客戶回饋的主題 | 視情況而定 | 如果輸入 - 輸出組合簡單直接,則基於規則的確定型系統可能就足夠了。 當規模擴充導致基於規則的系統有太多組合時,請考慮: - 分類器 - 主題建模 但前提是輸入中必須存在模式。 如果沒有模式存在,LLM 可用於一次性的任務 (雖然精確度不如監督模型)。 |
| 需要針對不同輸入提供不同輸出的重複性任務 | - 回應客戶支援查詢 - 搜尋功能 | 是 | 如果沒有 ML,要在規模上處理不同的輸入和輸出是不常見的。 以規則為基礎的方法無法有效管理大量的排列。請考慮: - 具有檢索增量生成 (RAG) 的 LLM - 搜尋產品的判斷樹 |
| 具有不同輸出的非重複性任務 | 撰寫飯店或餐廳評論 | 是的 | 在 LLMs 之前,這類任務通常需要經過特別訓練的模型,例如 - 循環神經網路 (RNN) - 用於預測下一個字的長短期記憶體網路 (LSTM) LLM 現在非常適合這種情況。 |
主要的啟示剪刀可以用的時候,就不要用光劍。使用上述矩陣評估客戶需求,同時考慮實施成本和輸出精確度,以建立可擴充、精確且具成本效益的產品。
Sharanya Rao 是金融科技組產品經理。本文所表達的觀點僅屬作者個人意見,不代表其雇主或關聯組織的觀點。
Anthropic 的實驗性 AI「Claude」在電子商務測試中完成了談判與交易
隨著人工智慧的快速發展,Anthropic 上週五悄悄推出了一項名為「Project Deal」的內部實驗,展現了人工智慧在電子商務領域的潛力。該實驗讓其人工智慧模型 Claude 在封閉的市場環境中自主處理買賣及價格協商,並涉及真實的金融交易。實驗的核心是一個建構於 Slack 平台上的內部市場,Claude 在其中同時擔任買方與賣方的談判代表。它首先訪談了 69 名員工,以收集他們的買賣意圖及
DeepSeek Code 即將推出
隨著人工智慧技術的加速發展,DeepSeek 正處於一個令人振奮的轉捩點。這家人工智慧公司最近透露,已獲得超過 700 億元的資金。管理層強調,公司致力於突破性的人工智慧研究,而非追求眼前的商業利益。這一戰略轉向表明 DeepSeek 將全力投入新產品的開發,尤其是眾人矚目的 DeepSeek Code。DeepSeek Code 的規劃已逐漸成形,該公司職缺頁面已發布數個相關職位,例如「Agen
馬斯克的 Grok:1.5 兆個參數與游標程式碼吸收——是遊戲規則的改變者,還是虛張聲勢?
伊隆·馬斯克終於有所行動。在人工智慧程式設計的競賽中,OpenAI 和 Anthropic 正加速前進,而 xAI 似乎落後了。馬斯克曾多次表示其目標是與 Claude 抗衡,然而儘管 Grok4.X 系列已進行多次更新,成果在理論上看似不錯,但在實際應用中卻未能達標,兩者之間的差距幾乎未見縮小。不過,這次他握有一張新王牌。馬斯克在 X 平台上證實,Grok 的新版本即將問世。 這款基礎模型第九版





首頁






