选项
首页
新闻
“ Composo:监视企业的AI应用程序性能”

“ Composo:监视企业的AI应用程序性能”

2025-04-10
204

“ Composo:监视企业的AI应用程序性能”

AI和大型语言模型(LLMs)前景广阔,但说实话——它们有时表现得并不稳定。没人能确定何时能彻底解决所有问题,所以不意外的是,初创公司正蜂拥而至,帮助企业确保他们的LLM驱动的应用能真正达到预期效果。

Composo是一家总部位于伦敦的初创公司,认为自己在解决这个问题上占据优势。他们开发了定制模型,帮助企业检查其LLM应用的准确性和是否达标。

Composo在这个领域并非独行;他们面对的竞争对手包括Agenta、Freeplay、Humanloop和LangSmith,这些公司都试图提供一种更好的、基于LLM的应用测试方式,取代人工、清单或传统工具。但Composo表示自己与众不同,因为它同时提供无代码选项和API。这意味着更多人可以使用它,不仅仅是开发者——领域专家和高管也能参与进来,亲自检查不一致性、质量和准确性。

其工作原理如下:Composo将一个根据人们对AI应用期望训练的奖励模型与特定应用的标准相结合。然后,它会评分评估应用输出与这些标准的匹配程度。例如,如果你有一个医疗分诊聊天机器人,你可以设置自定义指南来监控关键症状,Composo会告诉你应用遵循这些规则的表现如何。

他们刚刚推出了Composo Align的公共API,可以根据你设定的任何标准评估LLM应用。

这一努力似乎正在取得回报——他们的客户名单上有Accenture、Palantir和McKinsey等大牌公司,并且他们最近获得了200万美元的种子前轮融资。这在AI世界里听起来可能不多,因为这个领域通常资金充裕,但Composo的联合创始人兼CEO Sebastian Fox表示,他们不需要太多资金。“至少在未来三年,我们不打算筹集数亿美元,因为有很多人已经在非常高效地构建基础模型,而这不是我们的独特卖点,”曾在McKinsey担任顾问的Fox说。“相反,每天早上,如果我醒来看到OpenAI在他们的模型上取得了巨大进展的新闻,对我的生意来说是好事。”

有了新资金,Composo计划加强其工程团队(由联合创始人兼CTO、前Graphcore机器学习工程师Luke Markham领导),吸引更多客户,并加大研发力度。“今年的重点更多是扩展我们现在拥有的技术,覆盖更多公司,”Fox说。

种子轮融资由英国AI种子基金Twin Path Ventures领投,JVH Ventures和EWOR也参与其中。EWOR此前已通过其加速器计划支持了Composo。“Composo正在解决企业AI采用中的一个关键瓶颈,”Twin Path的发言人说。

据Fox介绍,这个瓶颈对整个AI领域,尤其是企业来说,是个大问题。“人们已经过了兴奋的炒作阶段,现在开始思考,‘实际上,这真的会改变我业务的现状吗?因为它不够可靠,也不够一致。即使它做到了,你也无法向我证明它有多好,’”他解释道。

这可能使Composo对希望使用AI但担心风险的公司极具价值。因此,他们虽然不局限于特定行业,但仍专注于合规、法律、医疗和安全领域。

至于他们的独特之处,Fox表示他们的成果不易复制。“模型的架构和我们用来训练的数据都很关键,”他说,并指出Composo Align是在“大量专家评估数据集”上训练的。

当然,科技巨头可能会利用他们的资源试图解决这个问题,但Composo认为自己已占据先机。“另一个优势是我们随着时间积累的数据,”Fox谈到他们如何建立评估偏好时说。

因为它能根据灵活的标准评估应用,Composo还认为自己比那些方法更固定的竞争对手更适合应对代理AI的兴起。“在我看来,我们还远未达到代理运行良好的阶段,而这正是我们试图帮助解决的问题,”Fox说。

TechCrunch有一个专注于AI的时事通讯!在此注册,每周三在你的收件箱中获取。

相关文章
Google 相册借助人工智能,将《绯闻女孩》中那间标志性的衣帽间重现于世 Google 相册借助人工智能,将《绯闻女孩》中那间标志性的衣帽间重现于世 谷歌相册于周三宣布推出一项基于人工智能的新功能,该功能将很快把你的服装照片转化为一个数字衣橱,让你能够搭配出全新的穿搭组合,甚至可以进行虚拟试穿。这一概念显然借鉴了电影《绯闻女孩》中雪儿(Cher)那标志性的虚拟衣橱,她在其中可以浏览众多套装,从而决定穿什么。谷歌表示,该功能将利用人工智能技术,根据用户Google相册中的衣物自动构建一个数字衣橱。在应用内,用户可以按类别(如上装、下装、首饰等)筛
Notion 将其工作区转变为人工智能代理的枢纽 Notion 将其工作区转变为人工智能代理的枢纽 生产力软件公司 Notion 正迈入智能代理时代。在周三的一场直播产品发布会上,以协作式笔记应用而闻名的 Notion 推出了一款全新的开发者平台。该平台不仅扩展了其定制 AI 代理的功能,还能与外部代理连接,并允许团队构建能够从任何数据库提取数据的自动化多步骤工作流。通过构建一个编排层——即一个能在多个工具和数据源之间协调AI工作的系统——Notion将自身定位为不仅仅是一款具备AI功能的笔记应
ElevenLabs宣布黑石集团、杰米·福克斯和伊娃·朗格利亚成为新投资者 ElevenLabs宣布黑石集团、杰米·福克斯和伊娃·朗格利亚成为新投资者 语音人工智能公司ElevenLabs披露了其5亿美元D轮融资的更多投资者名单,该轮融资最初于2月宣布。 其中包括贝莱德(BlackRock)、威灵顿(Wellington)、D.E. Shaw和施罗德(Schroders)等机构投资者;英伟达(NVIDIA)、Salesforce、桑坦德银行(Santander)、KPN和德国电信(Deutsche Telekom)等企业;以及杰米·福克斯(Jam
相关专题推荐
图像编辑 最佳AI降噪软件:消除低光夜间摄影中的颗粒感和伪影
最佳AI降噪软件:消除低光夜间摄影中的颗粒感和伪影

探索2026年最适合低光夜间摄影的AI降噪软件。我们精心挑选了最受欢迎的免费及付费工具,通过实际测试并每周更新排名来进行对比。轻松去除图像中的颗粒感与瑕疵,在XIX.AI上释放你的AI潜力。

10 个工具
xix.ai
聊天机器人 最佳定制AI女友生成器:设计独特的个性、爱好和背景故事
最佳定制AI女友生成器:设计独特的个性、爱好和背景故事

在 XIX.AI 上探索 2026 年最佳定制 AI 女友生成器。浏览我们精心挑选的高评分清单,设计独一无二的个性、爱好和深入的背景故事。结合真实用户反馈,对比免费与付费选项。立即解锁您完美的创意伴侣。

10 个工具
xix.ai
生产率 AI 架构设计师:利用自然语言构建可扩展的系统架构
AI 架构设计师:利用自然语言构建可扩展的系统架构

在 XIX.AI 上探索 2026 年最佳 AI 架构设计工具。我们精心筛选并广受好评的这份清单,汇集了功能强大且具有颠覆性的解决方案,助您通过自然语言构建可扩展的系统架构。结合实际应用案例,对比免费与付费选项。立即释放您的 AI 优势,优化开发流程。

10 个工具
xix.ai
漫画创作 AI角色创建工具:为漫画主角生成详细的背景故事及视觉参考资料
AI角色创建工具:为漫画主角生成详细的背景故事及视觉参考资料

2026年最新最佳AI角色创建工具:发现那些备受好评的工具,它们能够帮助你为漫画角色生成详细的背景故事和视觉素材。我们精心整理的这份每周更新的列表会根据实际测试结果,对比免费与付费选项的优劣。找到这些强大且能改变创作流程的工具,帮助你塑造引人入胜的角色,提升创作效率。立即访问XIX.AI查看排名,找到最适合你的故事创作助手吧。

10 个工具
xix.ai
健康养生 AI孕期伴侣:生成安全可靠的各孕期运动与营养计划
AI孕期伴侣:生成安全可靠的各孕期运动与营养计划

探索2026年最佳AI孕期伴侣,获取安全、个性化的各孕期运动与营养计划。获取经过精心筛选的高评分推荐,包含免费与付费版本的对比分析及真实用户反馈。借助XIX.AI的专家指南,开启您最健康的孕期之旅。立即探索。

10 个工具
xix.ai
写作 最佳免费且无法被识别的AI写作工具:将生硬的草稿转化为自然流畅、宛如人类撰写的文字
最佳免费且无法被识别的AI写作工具:将生硬的草稿转化为自然流畅、宛如人类撰写的文字

在 XIX.AI 探索 2026 年最佳免费且难以被察觉的 AI 写作工具。我们精心筛选的顶级推荐清单,助您将生硬的草稿转化为自然流畅、宛如人类撰写的文字。通过实际测试和每周更新的排行榜,对比免费与付费选项。立即解锁您的 AI 写作优势。

10 个工具
xix.ai
评论 (56)
0/500
BrianGonzález
BrianGonzález 2026-01-13 18:30:50

用AI去监控AI应用,这做法挺有趣的,有点「套娃」的味道。不过这类服务确实有需求,现在模型输出的稳定性确实是个痛点,尤其是对企业级应用来说。我们团队之前试过几个大模型API,偶尔抽风起来真的让人头疼,有个监测工具至少能提前预警吧。😅

AlbertGarcía
AlbertGarcía 2025-08-17 17:00:59

This article on Composo is pretty eye-opening! It's wild how AI apps can be so powerful yet so unpredictable. Startups tackling LLM performance issues is a smart move—businesses need that reliability. Curious to see how this tech evolves! 😎

DouglasMartínez
DouglasMartínez 2025-08-16 15:00:59

This article on Composo is pretty cool! It's wild how AI apps can be so powerful yet so unpredictable. Nice to see startups tackling the performance monitoring side—hope it makes LLMs more reliable for businesses! 😎

JackCarter
JackCarter 2025-08-04 14:48:52

This article on Composo is super insightful! It’s wild how LLMs are so powerful yet so unpredictable. Excited to see startups tackling this to make AI apps more reliable! 😎

JohnTaylor
JohnTaylor 2025-07-28 09:19:30

This article on Composo is pretty eye-opening! It's wild how AI apps can be so powerful yet so unpredictable. I wonder how startups like this will tackle the chaos of LLMs in real-world use. 🤔 Anyone else curious about the future of AI monitoring?

JoseJackson
JoseJackson 2025-07-28 09:19:05

This article on Composo is pretty eye-opening! It's cool to see startups tackling the messy side of AI apps. I wonder how they handle the unpredictability of LLMs in real-time enterprise settings. 🤔 Anyone tried their tools yet?

OR