選項
首頁
新聞
“ Composo:監視企業的AI應用程序性能”

“ Composo:監視企業的AI應用程序性能”

2025-04-10
152

“ Composo:監視企業的AI應用程序性能”

AI和大型語言模型(LLMs)極具潛力,但說實話,它們有時表現得不太穩定。沒人能確定何時能完全解決所有問題,因此不意外地,新創公司正紛紛投入,協助企業確保其LLM驅動的應用程式能如預期運作。

這就是Composo,一家位於倫敦的新創公司,自認在解決這個問題上具有優勢。他們開發了客製化模型,幫助企業檢查其LLM應用程式的準確性和品質是否達標。

Composo並非此領域的唯一玩家;他們的競爭對手包括Agenta、Freeplay、Humanloop和LangSmith,這些公司都在嘗試提供更好的、基於LLM的應用程式測試方式,取代依賴人工、檢查清單或傳統工具。但Composo表示自己與眾不同,因為它提供了無程式碼選項和API。這意味著更多人可以使用它,不僅限於開發者——領域專家和高階主管也能自行檢查不一致性、品質和準確性。

其運作方式如下:Composo將一個根據人們對AI應用程式期望訓練的獎勵模型,與該應用程式的特定標準結合,然後評分該應用程式的輸出與這些標準的符合程度。例如,若你有一個醫療分診聊天機器人,可以設定客製化的指導方針來監控危急症狀,Composo會告訴你該應用程式遵循這些規則的程度。

他們剛剛推出了Composo Align的公開API,這個API能根據你設定的任何標準來評估LLM應用程式。

這似乎正在產生回報——他們的客戶名單上有Accenture、Palantir和McKinsey等大牌公司,且最近獲得了200萬美元的Pre-seed資金。這在AI世界中,資金通常充裕的環境下可能不算多,但Composo的共同創辦人兼CEO Sebastian Fox表示,他們不需要鉅額資金。「至少在未來三年,我們不預見自己需要募資數億,因為許多人在打造基礎模型,並且做得非常有效率,這不是我們的獨特賣點,」曾在McKinsey擔任顧問的Fox說道。「相反地,每天早晨,若我醒來看到OpenAI在他們的模型上取得重大進展的新聞,這對我的生意是好事。」

有了這筆新資金,Composo計劃增強其工程團隊(由共同創辦人兼CTO、前Graphcore機器學習工程師Luke Markham領導),爭取更多客戶,並加速研發。「今年的重點更多在於將我們現在擁有的技術擴展到這些公司,」Fox說。

這輪種子融資由英國AI Pre-seed基金Twin Path Ventures領投,JVH Ventures和EWOR也參與其中。EWOR此前已通過其加速器計畫支持Composo。「Twin Path Ventures」的發言人表示:「Composo正在解決企業AI採用中的關鍵瓶頸。」

據Fox表示,這個瓶頸對整個AI領域、特別是對企業來說至關重要。「人們已經度過了興奮的炒作階段,現在開始思考,『嗯,實際上,這對我目前的業務真的有什麼改變嗎?因為固定,因為它不夠可靠,也不夠一致。即使它夠好,你也無法證明它有多好,』」他解釋道。

這可能使Composo對想使用AI但擔心風險的公司極具價值。因此,他們雖不限於特定產業,但仍專注於合規性、法律、醫療保健和安全領域。

談到他們的獨特之處,Fox表示他們的成果不易複製。「這涉及模型的架構以及我們用來訓練的資料,」他說,並指出Composo Align是在「大量專家評估資料集」上訓練的。

當然,科技巨頭可能會投入資源試圖解決這個問題,但Composo認為自己已領先一步。「另一個優勢是我們隨著時間累積的資料,」Fox談到他們如何建立評估偏好。

由於它能根據靈活的標準集評估應用程式,Composo也認為自己比那些方法較為僵化的競爭對手更能應對agentic AI的興起。「在我看來,我們絕對還沒到代理(agents)能良好運作的階段,而這正是我們試圖幫助解決的問題,」Fox說。

TechCrunch有一份專注於AI的電子報!請在此訂閱,每週三送達您的收件匣。

相關文章
「Dot AI 伴侶應用程式宣布關閉,停止個人化服務」 「Dot AI 伴侶應用程式宣布關閉,停止個人化服務」 根據 Dot 開發商於週五發佈的公告,Dot 將停止營運。Dot 背後的新創公司 New Computer 在其網站上表示,這項服務將持續提供至 10 月 5 日,讓使用者有時間匯出個人資料。此應用程式於今年初由共同創辦人 Sam Whitmore 與前 Apple 設計專家 Jason Yuan 合作推出。Dot 進入日益受到關注的情感 AI 伴侶領域,將自己定位為可適應的數位朋友,可根據使用者
Anthropic 解決 AI 產生盜版書籍的法律案件 Anthropic 解決 AI 產生盜版書籍的法律案件 Anthropic 已與美國作家就一宗重大版權糾紛達成和解,同意擬議的集體訴訟和解方案,以避免可能耗費巨資的審判。該協議於本週二在法庭文件中提交,源於該人工智能公司使用盜版文學作品訓練其 Claude 模型的指控。雖然此案源於作家 Andrea Bartz、Charles Graeber 和 Kirk Wallace Johnson 的訴訟,但和解細節仍然保密。他們於 2023 年提出訴訟,指控
Figma 向所有用戶發佈 AI 驅動的應用程式生成工具 Figma 向所有用戶發佈 AI 驅動的應用程式生成工具 Figma Make 是今年初推出的創新提示應用程式開發平台,目前已正式退出測試版,並向所有使用者推出。這個突破性的工具加入了 Google 的 Gemini Code Assist 和 Microsoft 的 GitHub Copilot 等人工智能編碼助手的行列,讓創作者無需傳統的編程專業知識,即可將自然語言描述轉換為功能原型和應用程式。Figma Make 在測試階段原本只有高級「Full
評論 (55)
0/200
AlbertGarcía
AlbertGarcía 2025-08-17 17:00:59

This article on Composo is pretty eye-opening! It's wild how AI apps can be so powerful yet so unpredictable. Startups tackling LLM performance issues is a smart move—businesses need that reliability. Curious to see how this tech evolves! 😎

DouglasMartínez
DouglasMartínez 2025-08-16 15:00:59

This article on Composo is pretty cool! It's wild how AI apps can be so powerful yet so unpredictable. Nice to see startups tackling the performance monitoring side—hope it makes LLMs more reliable for businesses! 😎

JackCarter
JackCarter 2025-08-04 14:48:52

This article on Composo is super insightful! It’s wild how LLMs are so powerful yet so unpredictable. Excited to see startups tackling this to make AI apps more reliable! 😎

JohnTaylor
JohnTaylor 2025-07-28 09:19:30

This article on Composo is pretty eye-opening! It's wild how AI apps can be so powerful yet so unpredictable. I wonder how startups like this will tackle the chaos of LLMs in real-world use. 🤔 Anyone else curious about the future of AI monitoring?

JoseJackson
JoseJackson 2025-07-28 09:19:05

This article on Composo is pretty eye-opening! It's cool to see startups tackling the messy side of AI apps. I wonder how they handle the unpredictability of LLMs in real-time enterprise settings. 🤔 Anyone tried their tools yet?

EmmaJohnson
EmmaJohnson 2025-04-20 18:49:17

Composoのおかげで、我々の企業のAIアプリのパフォーマンスを監視するのが簡単になりました。これはまるで全てをチェックしてくれる個人アシスタントを持つようなものです。唯一の問題は、時々インターフェースが遅くなることです。全体的に、LLMを使うビジネスには必須ですね!🤓

回到頂部
OR