Composo: Überwachung der KI -App -Leistung für Unternehmen

htmlKI und große Sprachmodelle (LLMs) sind äußerst vielversprechend, aber seien wir ehrlich – sie können manchmal ins Schwarze treffen oder danebenliegen. Niemand weiß genau, wann alle Schwächen behoben sein werden, daher ist es nicht überraschend, dass Startups einspringen, um Unternehmen dabei zu helfen, sicherzustellen, dass ihre LLM-gestützten Apps tatsächlich das tun, was sie sollen.
Hier kommt Composo ins Spiel, ein in London ansässiges Startup, das glaubt, einen Vorteil bei der Lösung dieses Problems zu haben. Sie haben maßgeschneiderte Modelle, die Unternehmen dabei unterstützen, die Genauigkeit und Qualität ihrer LLM-Apps zu überprüfen.
Composo ist in diesem Bereich nicht allein; sie konkurrieren mit Unternehmen wie Agenta, Freeplay, Humanloop und LangSmith, die alle versuchen, eine bessere, LLM-basierte Methode zum Testen von Apps anzubieten, anstatt auf Menschen, Checklisten oder altmodische Tools zu setzen. Doch Composo hebt sich ab, da es sowohl eine No-Code-Option als auch eine API anbietet. Das bedeutet, dass mehr Menschen sie nutzen können, nicht nur Entwickler – Fachexperten und Führungskräfte können selbst auf Inkonsistenzen, Qualität und Genauigkeit prüfen.
So funktioniert es: Composo kombiniert ein Belohnungsmodell, das auf den Erwartungen der Nutzer an eine KI-App trainiert wurde, mit spezifischen Kriterien für diese App. Es bewertet dann, wie gut die Ausgabe der App diesen Kriterien entspricht. Wenn Sie beispielsweise einen Chatbot für medizinische Triage haben, können Sie benutzerdefinierte Richtlinien für Warnsymptome festlegen, und Composo zeigt Ihnen, wie gut die App diese Regeln einhält.
Sie haben gerade eine öffentliche API für Composo Align gestartet, die LLM-Apps anhand beliebiger von Ihnen festgelegter Kriterien bewertet.
Es scheint sich auszuzahlen – sie haben große Namen wie Accenture, Palantir und McKinsey auf ihrer Kundenliste und haben kürzlich 2 Millionen Dollar in einer Pre-Seed-Finanzierung erhalten. Das mag in der KI-Welt, wo Geld oft in Strömen fließt, nicht viel klingen, aber Composos Mitgründer und CEO, Sebastian Fox, sagt, dass sie kein riesiges Kapital benötigen. „Für die nächsten drei Jahre sehen wir nicht vor, Hunderte von Millionen aufzunehmen, weil viele Leute Basismodelle entwickeln und das sehr effektiv tun, und das ist nicht unser Alleinstellungsmerkmal“, sagte Fox, der früher Berater bei McKinsey war. „Stattdessen ist es für mein Geschäft gut, wenn ich morgens aufwache und sehe, dass OpenAI große Fortschritte bei ihren Modellen gemacht hat.“
Mit den neuen Mitteln plant Composo, sein Ingenieurteam (geleitet von Mitgründer und CTO Luke Markham, einem ehemaligen Machine-Learning-Ingenieur bei Graphcore) zu verstärken, mehr Kunden zu gewinnen und die Forschung und Entwicklung auszubauen. „Der Fokus in diesem Jahr liegt viel mehr darauf, die Technologie, die wir jetzt haben, in diesen Unternehmen zu skalieren“, sagte Fox.
Die Seed-Runde wurde von der britischen KI-Pre-Seed-Firma Twin Path Ventures angeführt, mit Beteiligungen von JVH Ventures und EWOR. EWOR hatte Composo bereits durch sein Beschleunigungsprogramm unterstützt. „Composo geht ein kritisches Hindernis bei der Einführung von Unternehmens-KI an“, sagte ein Sprecher von Twin Path.
Dieses Hindernis ist ein großes Thema für die gesamte KI-Szene, insbesondere für Unternehmen, sagt Fox. „Die Leute sind über die Euphorie hinaus und denken jetzt: ‚Verändert das wirklich etwas an meinem Geschäft in seiner jetzigen Form? Denn es ist nicht zuverlässig genug und nicht konsistent genug. Und selbst wenn es das ist, können Sie mir nicht beweisen, wie sehr‘“, erklärte er.
Das könnte Composo für Unternehmen, die KI nutzen wollen, aber Bedenken hinsichtlich der Risiken haben, äußerst wertvoll machen. Deshalb sind sie branchenunabhängig, konzentrieren sich aber dennoch auf Compliance, Recht, Gesundheitswesen und Sicherheit.
Was sie auszeichnet, sagt Fox, sei nicht leicht zu kopieren. „Es gibt sowohl die Architektur des Modells als auch die Daten, mit denen wir es trainiert haben“, sagte er und wies darauf hin, dass Composo Align auf einem „großen Datensatz von Expertenbewertungen“ trainiert wurde.
Sicher, Tech-Riesen könnten ihr Gewicht in die Waagschale werfen und versuchen, dieses Problem zu lösen, aber Composo glaubt, einen Vorsprung zu haben. „Das andere ist die Daten, die wir im Laufe der Zeit sammeln“, sagte Fox und sprach darüber, wie sie Präferenzen für Bewertungen aufbauen.
Da es Apps anhand flexibler Kriterien bewerten kann, glaubt Composo auch, besser für den Aufstieg von agentischer KI positioniert zu sein als Konkurrenten mit starren Ansätzen. „Meiner Meinung nach sind wir definitiv noch nicht an dem Punkt, an dem Agenten gut funktionieren, und das ist genau das, was wir zu lösen versuchen“, sagte Fox.
*TechCrunch hat einen auf KI fokussierten Newsletter! Melden Sie sich hier an, um ihn jeden Mittwoch in Ihren Posteingang zu bekommen.*
Verwandter Artikel
Notion verwandelt seinen Arbeitsbereich in eine Drehscheibe für KI-Agenten
Notion, der Anbieter von Produktivitätssoftware, tritt in das Zeitalter der agentenbasierten Lösungen ein.Während einer live gestreamten Produktankündigung am Mittwoch stellte Notion – bekannt für sei
ElevenLabs gibt BlackRock, Jamie Foxx und Eva Longoria als neue Investoren bekannt
Das Sprach-KI-Unternehmen ElevenLabs hat weitere Investoren für seine im Februar angekündigte Serie-D-Finanzierungsrunde in Höhe von 500 Millionen US-Dollar bekannt gegeben. Dazu gehören institutionel
WordPress.com ermöglicht es nun KI-Agenten, Beiträge zu verfassen und zu veröffentlichen – und vieles mehr
WordPress.com, die beliebte Webhosting- und Publishing-Plattform, setzt nun auf KI-Agenten – ein Schritt, der das Erscheinungsbild des Internets grundlegend verändern könnte. Das Unternehmen gab am Fr
Empfehlungen zu verwandten Spezialthemen
Kommentare (56)
用AI去监控AI应用,这做法挺有趣的,有点「套娃」的味道。不过这类服务确实有需求,现在模型输出的稳定性确实是个痛点,尤其是对企业级应用来说。我们团队之前试过几个大模型API,偶尔抽风起来真的让人头疼,有个监测工具至少能提前预警吧。😅
This article on Composo is pretty eye-opening! It's wild how AI apps can be so powerful yet so unpredictable. Startups tackling LLM performance issues is a smart move—businesses need that reliability. Curious to see how this tech evolves! 😎
This article on Composo is pretty cool! It's wild how AI apps can be so powerful yet so unpredictable. Nice to see startups tackling the performance monitoring side—hope it makes LLMs more reliable for businesses! 😎
This article on Composo is super insightful! It’s wild how LLMs are so powerful yet so unpredictable. Excited to see startups tackling this to make AI apps more reliable! 😎
This article on Composo is pretty eye-opening! It's wild how AI apps can be so powerful yet so unpredictable. I wonder how startups like this will tackle the chaos of LLMs in real-world use. 🤔 Anyone else curious about the future of AI monitoring?

KI und große Sprachmodelle (LLMs) sind äußerst vielversprechend, aber seien wir ehrlich – sie können manchmal ins Schwarze treffen oder danebenliegen. Niemand weiß genau, wann alle Schwächen behoben sein werden, daher ist es nicht überraschend, dass Startups einspringen, um Unternehmen dabei zu helfen, sicherzustellen, dass ihre LLM-gestützten Apps tatsächlich das tun, was sie sollen.
Hier kommt Composo ins Spiel, ein in London ansässiges Startup, das glaubt, einen Vorteil bei der Lösung dieses Problems zu haben. Sie haben maßgeschneiderte Modelle, die Unternehmen dabei unterstützen, die Genauigkeit und Qualität ihrer LLM-Apps zu überprüfen.
Composo ist in diesem Bereich nicht allein; sie konkurrieren mit Unternehmen wie Agenta, Freeplay, Humanloop und LangSmith, die alle versuchen, eine bessere, LLM-basierte Methode zum Testen von Apps anzubieten, anstatt auf Menschen, Checklisten oder altmodische Tools zu setzen. Doch Composo hebt sich ab, da es sowohl eine No-Code-Option als auch eine API anbietet. Das bedeutet, dass mehr Menschen sie nutzen können, nicht nur Entwickler – Fachexperten und Führungskräfte können selbst auf Inkonsistenzen, Qualität und Genauigkeit prüfen.
So funktioniert es: Composo kombiniert ein Belohnungsmodell, das auf den Erwartungen der Nutzer an eine KI-App trainiert wurde, mit spezifischen Kriterien für diese App. Es bewertet dann, wie gut die Ausgabe der App diesen Kriterien entspricht. Wenn Sie beispielsweise einen Chatbot für medizinische Triage haben, können Sie benutzerdefinierte Richtlinien für Warnsymptome festlegen, und Composo zeigt Ihnen, wie gut die App diese Regeln einhält.
Sie haben gerade eine öffentliche API für Composo Align gestartet, die LLM-Apps anhand beliebiger von Ihnen festgelegter Kriterien bewertet.
Es scheint sich auszuzahlen – sie haben große Namen wie Accenture, Palantir und McKinsey auf ihrer Kundenliste und haben kürzlich 2 Millionen Dollar in einer Pre-Seed-Finanzierung erhalten. Das mag in der KI-Welt, wo Geld oft in Strömen fließt, nicht viel klingen, aber Composos Mitgründer und CEO, Sebastian Fox, sagt, dass sie kein riesiges Kapital benötigen. „Für die nächsten drei Jahre sehen wir nicht vor, Hunderte von Millionen aufzunehmen, weil viele Leute Basismodelle entwickeln und das sehr effektiv tun, und das ist nicht unser Alleinstellungsmerkmal“, sagte Fox, der früher Berater bei McKinsey war. „Stattdessen ist es für mein Geschäft gut, wenn ich morgens aufwache und sehe, dass OpenAI große Fortschritte bei ihren Modellen gemacht hat.“
Mit den neuen Mitteln plant Composo, sein Ingenieurteam (geleitet von Mitgründer und CTO Luke Markham, einem ehemaligen Machine-Learning-Ingenieur bei Graphcore) zu verstärken, mehr Kunden zu gewinnen und die Forschung und Entwicklung auszubauen. „Der Fokus in diesem Jahr liegt viel mehr darauf, die Technologie, die wir jetzt haben, in diesen Unternehmen zu skalieren“, sagte Fox.
Die Seed-Runde wurde von der britischen KI-Pre-Seed-Firma Twin Path Ventures angeführt, mit Beteiligungen von JVH Ventures und EWOR. EWOR hatte Composo bereits durch sein Beschleunigungsprogramm unterstützt. „Composo geht ein kritisches Hindernis bei der Einführung von Unternehmens-KI an“, sagte ein Sprecher von Twin Path.
Dieses Hindernis ist ein großes Thema für die gesamte KI-Szene, insbesondere für Unternehmen, sagt Fox. „Die Leute sind über die Euphorie hinaus und denken jetzt: ‚Verändert das wirklich etwas an meinem Geschäft in seiner jetzigen Form? Denn es ist nicht zuverlässig genug und nicht konsistent genug. Und selbst wenn es das ist, können Sie mir nicht beweisen, wie sehr‘“, erklärte er.
Das könnte Composo für Unternehmen, die KI nutzen wollen, aber Bedenken hinsichtlich der Risiken haben, äußerst wertvoll machen. Deshalb sind sie branchenunabhängig, konzentrieren sich aber dennoch auf Compliance, Recht, Gesundheitswesen und Sicherheit.
Was sie auszeichnet, sagt Fox, sei nicht leicht zu kopieren. „Es gibt sowohl die Architektur des Modells als auch die Daten, mit denen wir es trainiert haben“, sagte er und wies darauf hin, dass Composo Align auf einem „großen Datensatz von Expertenbewertungen“ trainiert wurde.
Sicher, Tech-Riesen könnten ihr Gewicht in die Waagschale werfen und versuchen, dieses Problem zu lösen, aber Composo glaubt, einen Vorsprung zu haben. „Das andere ist die Daten, die wir im Laufe der Zeit sammeln“, sagte Fox und sprach darüber, wie sie Präferenzen für Bewertungen aufbauen.
Da es Apps anhand flexibler Kriterien bewerten kann, glaubt Composo auch, besser für den Aufstieg von agentischer KI positioniert zu sein als Konkurrenten mit starren Ansätzen. „Meiner Meinung nach sind wir definitiv noch nicht an dem Punkt, an dem Agenten gut funktionieren, und das ist genau das, was wir zu lösen versuchen“, sagte Fox.
*TechCrunch hat einen auf KI fokussierten Newsletter! Melden Sie sich hier an, um ihn jeden Mittwoch in Ihren Posteingang zu bekommen.*
Notion verwandelt seinen Arbeitsbereich in eine Drehscheibe für KI-Agenten
Notion, der Anbieter von Produktivitätssoftware, tritt in das Zeitalter der agentenbasierten Lösungen ein.Während einer live gestreamten Produktankündigung am Mittwoch stellte Notion – bekannt für sei
ElevenLabs gibt BlackRock, Jamie Foxx und Eva Longoria als neue Investoren bekannt
Das Sprach-KI-Unternehmen ElevenLabs hat weitere Investoren für seine im Februar angekündigte Serie-D-Finanzierungsrunde in Höhe von 500 Millionen US-Dollar bekannt gegeben. Dazu gehören institutionel
WordPress.com ermöglicht es nun KI-Agenten, Beiträge zu verfassen und zu veröffentlichen – und vieles mehr
WordPress.com, die beliebte Webhosting- und Publishing-Plattform, setzt nun auf KI-Agenten – ein Schritt, der das Erscheinungsbild des Internets grundlegend verändern könnte. Das Unternehmen gab am Fr
用AI去监控AI应用,这做法挺有趣的,有点「套娃」的味道。不过这类服务确实有需求,现在模型输出的稳定性确实是个痛点,尤其是对企业级应用来说。我们团队之前试过几个大模型API,偶尔抽风起来真的让人头疼,有个监测工具至少能提前预警吧。😅
This article on Composo is pretty eye-opening! It's wild how AI apps can be so powerful yet so unpredictable. Startups tackling LLM performance issues is a smart move—businesses need that reliability. Curious to see how this tech evolves! 😎
This article on Composo is pretty cool! It's wild how AI apps can be so powerful yet so unpredictable. Nice to see startups tackling the performance monitoring side—hope it makes LLMs more reliable for businesses! 😎
This article on Composo is super insightful! It’s wild how LLMs are so powerful yet so unpredictable. Excited to see startups tackling this to make AI apps more reliable! 😎
This article on Composo is pretty eye-opening! It's wild how AI apps can be so powerful yet so unpredictable. I wonder how startups like this will tackle the chaos of LLMs in real-world use. 🤔 Anyone else curious about the future of AI monitoring?





Heim






