"Composo: Überwachung der KI -App -Leistung für Unternehmen"

htmlKI und große Sprachmodelle (LLMs) sind äußerst vielversprechend, aber seien wir ehrlich – sie können manchmal ins Schwarze treffen oder danebenliegen. Niemand weiß genau, wann alle Schwächen behoben sein werden, daher ist es nicht überraschend, dass Startups einspringen, um Unternehmen dabei zu helfen, sicherzustellen, dass ihre LLM-gestützten Apps tatsächlich das tun, was sie sollen.
Hier kommt Composo ins Spiel, ein in London ansässiges Startup, das glaubt, einen Vorteil bei der Lösung dieses Problems zu haben. Sie haben maßgeschneiderte Modelle, die Unternehmen dabei unterstützen, die Genauigkeit und Qualität ihrer LLM-Apps zu überprüfen.
Composo ist in diesem Bereich nicht allein; sie konkurrieren mit Unternehmen wie Agenta, Freeplay, Humanloop und LangSmith, die alle versuchen, eine bessere, LLM-basierte Methode zum Testen von Apps anzubieten, anstatt auf Menschen, Checklisten oder altmodische Tools zu setzen. Doch Composo hebt sich ab, da es sowohl eine No-Code-Option als auch eine API anbietet. Das bedeutet, dass mehr Menschen sie nutzen können, nicht nur Entwickler – Fachexperten und Führungskräfte können selbst auf Inkonsistenzen, Qualität und Genauigkeit prüfen.
So funktioniert es: Composo kombiniert ein Belohnungsmodell, das auf den Erwartungen der Nutzer an eine KI-App trainiert wurde, mit spezifischen Kriterien für diese App. Es bewertet dann, wie gut die Ausgabe der App diesen Kriterien entspricht. Wenn Sie beispielsweise einen Chatbot für medizinische Triage haben, können Sie benutzerdefinierte Richtlinien für Warnsymptome festlegen, und Composo zeigt Ihnen, wie gut die App diese Regeln einhält.
Sie haben gerade eine öffentliche API für Composo Align gestartet, die LLM-Apps anhand beliebiger von Ihnen festgelegter Kriterien bewertet.
Es scheint sich auszuzahlen – sie haben große Namen wie Accenture, Palantir und McKinsey auf ihrer Kundenliste und haben kürzlich 2 Millionen Dollar in einer Pre-Seed-Finanzierung erhalten. Das mag in der KI-Welt, wo Geld oft in Strömen fließt, nicht viel klingen, aber Composos Mitgründer und CEO, Sebastian Fox, sagt, dass sie kein riesiges Kapital benötigen. „Für die nächsten drei Jahre sehen wir nicht vor, Hunderte von Millionen aufzunehmen, weil viele Leute Basismodelle entwickeln und das sehr effektiv tun, und das ist nicht unser Alleinstellungsmerkmal“, sagte Fox, der früher Berater bei McKinsey war. „Stattdessen ist es für mein Geschäft gut, wenn ich morgens aufwache und sehe, dass OpenAI große Fortschritte bei ihren Modellen gemacht hat.“
Mit den neuen Mitteln plant Composo, sein Ingenieurteam (geleitet von Mitgründer und CTO Luke Markham, einem ehemaligen Machine-Learning-Ingenieur bei Graphcore) zu verstärken, mehr Kunden zu gewinnen und die Forschung und Entwicklung auszubauen. „Der Fokus in diesem Jahr liegt viel mehr darauf, die Technologie, die wir jetzt haben, in diesen Unternehmen zu skalieren“, sagte Fox.
Die Seed-Runde wurde von der britischen KI-Pre-Seed-Firma Twin Path Ventures angeführt, mit Beteiligungen von JVH Ventures und EWOR. EWOR hatte Composo bereits durch sein Beschleunigungsprogramm unterstützt. „Composo geht ein kritisches Hindernis bei der Einführung von Unternehmens-KI an“, sagte ein Sprecher von Twin Path.
Dieses Hindernis ist ein großes Thema für die gesamte KI-Szene, insbesondere für Unternehmen, sagt Fox. „Die Leute sind über die Euphorie hinaus und denken jetzt: ‚Verändert das wirklich etwas an meinem Geschäft in seiner jetzigen Form? Denn es ist nicht zuverlässig genug und nicht konsistent genug. Und selbst wenn es das ist, können Sie mir nicht beweisen, wie sehr‘“, erklärte er.
Das könnte Composo für Unternehmen, die KI nutzen wollen, aber Bedenken hinsichtlich der Risiken haben, äußerst wertvoll machen. Deshalb sind sie branchenunabhängig, konzentrieren sich aber dennoch auf Compliance, Recht, Gesundheitswesen und Sicherheit.
Was sie auszeichnet, sagt Fox, sei nicht leicht zu kopieren. „Es gibt sowohl die Architektur des Modells als auch die Daten, mit denen wir es trainiert haben“, sagte er und wies darauf hin, dass Composo Align auf einem „großen Datensatz von Expertenbewertungen“ trainiert wurde.
Sicher, Tech-Riesen könnten ihr Gewicht in die Waagschale werfen und versuchen, dieses Problem zu lösen, aber Composo glaubt, einen Vorsprung zu haben. „Das andere ist die Daten, die wir im Laufe der Zeit sammeln“, sagte Fox und sprach darüber, wie sie Präferenzen für Bewertungen aufbauen.
Da es Apps anhand flexibler Kriterien bewerten kann, glaubt Composo auch, besser für den Aufstieg von agentischer KI positioniert zu sein als Konkurrenten mit starren Ansätzen. „Meiner Meinung nach sind wir definitiv noch nicht an dem Punkt, an dem Agenten gut funktionieren, und das ist genau das, was wir zu lösen versuchen“, sagte Fox.
*TechCrunch hat einen auf KI fokussierten Newsletter! Melden Sie sich hier an, um ihn jeden Mittwoch in Ihren Posteingang zu bekommen.*
Verwandter Artikel
Salesforce stellt KI-Digitale Teamkollegen in Slack vor, um mit Microsoft Copilot zu konkurrieren
Salesforce hat eine neue KI-Strategie für den Arbeitsplatz gestartet und spezialisierte „digitale Teamkollegen“ in Slack-Konversationen integriert, wie das Unternehmen am Montag bekannt gab.Das neue T
Oracles 40-Mrd.-Nvidia-Chip-Investition stärkt Texas AI-Rechenzentrum
Oracle plant, etwa 40 Milliarden Dollar in Nvidia-Chips zu investieren, um ein großes neues Rechenzentrum in Texas zu betreiben, das von OpenAI entwickelt wird, wie die Financial Times berichtet. Dies
Meta AI App führt Premium-Stufe und Werbung ein
Die AI-App von Meta könnte bald ein kostenpflichtiges Abonnement einführen, ähnlich den Angeboten von Konkurrenten wie OpenAI, Google und Microsoft. Während eines Q1 2025 Earnings Calls skizzierte Met
Kommentare (55)
0/200
AlbertGarcía
17. August 2025 11:00:59 MESZ
This article on Composo is pretty eye-opening! It's wild how AI apps can be so powerful yet so unpredictable. Startups tackling LLM performance issues is a smart move—businesses need that reliability. Curious to see how this tech evolves! 😎
0
DouglasMartínez
16. August 2025 09:00:59 MESZ
This article on Composo is pretty cool! It's wild how AI apps can be so powerful yet so unpredictable. Nice to see startups tackling the performance monitoring side—hope it makes LLMs more reliable for businesses! 😎
0
JackCarter
4. August 2025 08:48:52 MESZ
This article on Composo is super insightful! It’s wild how LLMs are so powerful yet so unpredictable. Excited to see startups tackling this to make AI apps more reliable! 😎
0
JohnTaylor
28. Juli 2025 03:19:30 MESZ
This article on Composo is pretty eye-opening! It's wild how AI apps can be so powerful yet so unpredictable. I wonder how startups like this will tackle the chaos of LLMs in real-world use. 🤔 Anyone else curious about the future of AI monitoring?
0
JoseJackson
28. Juli 2025 03:19:05 MESZ
This article on Composo is pretty eye-opening! It's cool to see startups tackling the messy side of AI apps. I wonder how they handle the unpredictability of LLMs in real-time enterprise settings. 🤔 Anyone tried their tools yet?
0
EmmaJohnson
20. April 2025 12:49:17 MESZ
Composoのおかげで、我々の企業のAIアプリのパフォーマンスを監視するのが簡単になりました。これはまるで全てをチェックしてくれる個人アシスタントを持つようなものです。唯一の問題は、時々インターフェースが遅くなることです。全体的に、LLMを使うビジネスには必須ですね!🤓
0
KI und große Sprachmodelle (LLMs) sind äußerst vielversprechend, aber seien wir ehrlich – sie können manchmal ins Schwarze treffen oder danebenliegen. Niemand weiß genau, wann alle Schwächen behoben sein werden, daher ist es nicht überraschend, dass Startups einspringen, um Unternehmen dabei zu helfen, sicherzustellen, dass ihre LLM-gestützten Apps tatsächlich das tun, was sie sollen.
Hier kommt Composo ins Spiel, ein in London ansässiges Startup, das glaubt, einen Vorteil bei der Lösung dieses Problems zu haben. Sie haben maßgeschneiderte Modelle, die Unternehmen dabei unterstützen, die Genauigkeit und Qualität ihrer LLM-Apps zu überprüfen.
Composo ist in diesem Bereich nicht allein; sie konkurrieren mit Unternehmen wie Agenta, Freeplay, Humanloop und LangSmith, die alle versuchen, eine bessere, LLM-basierte Methode zum Testen von Apps anzubieten, anstatt auf Menschen, Checklisten oder altmodische Tools zu setzen. Doch Composo hebt sich ab, da es sowohl eine No-Code-Option als auch eine API anbietet. Das bedeutet, dass mehr Menschen sie nutzen können, nicht nur Entwickler – Fachexperten und Führungskräfte können selbst auf Inkonsistenzen, Qualität und Genauigkeit prüfen.
So funktioniert es: Composo kombiniert ein Belohnungsmodell, das auf den Erwartungen der Nutzer an eine KI-App trainiert wurde, mit spezifischen Kriterien für diese App. Es bewertet dann, wie gut die Ausgabe der App diesen Kriterien entspricht. Wenn Sie beispielsweise einen Chatbot für medizinische Triage haben, können Sie benutzerdefinierte Richtlinien für Warnsymptome festlegen, und Composo zeigt Ihnen, wie gut die App diese Regeln einhält.
Sie haben gerade eine öffentliche API für Composo Align gestartet, die LLM-Apps anhand beliebiger von Ihnen festgelegter Kriterien bewertet.
Es scheint sich auszuzahlen – sie haben große Namen wie Accenture, Palantir und McKinsey auf ihrer Kundenliste und haben kürzlich 2 Millionen Dollar in einer Pre-Seed-Finanzierung erhalten. Das mag in der KI-Welt, wo Geld oft in Strömen fließt, nicht viel klingen, aber Composos Mitgründer und CEO, Sebastian Fox, sagt, dass sie kein riesiges Kapital benötigen. „Für die nächsten drei Jahre sehen wir nicht vor, Hunderte von Millionen aufzunehmen, weil viele Leute Basismodelle entwickeln und das sehr effektiv tun, und das ist nicht unser Alleinstellungsmerkmal“, sagte Fox, der früher Berater bei McKinsey war. „Stattdessen ist es für mein Geschäft gut, wenn ich morgens aufwache und sehe, dass OpenAI große Fortschritte bei ihren Modellen gemacht hat.“
Mit den neuen Mitteln plant Composo, sein Ingenieurteam (geleitet von Mitgründer und CTO Luke Markham, einem ehemaligen Machine-Learning-Ingenieur bei Graphcore) zu verstärken, mehr Kunden zu gewinnen und die Forschung und Entwicklung auszubauen. „Der Fokus in diesem Jahr liegt viel mehr darauf, die Technologie, die wir jetzt haben, in diesen Unternehmen zu skalieren“, sagte Fox.
Die Seed-Runde wurde von der britischen KI-Pre-Seed-Firma Twin Path Ventures angeführt, mit Beteiligungen von JVH Ventures und EWOR. EWOR hatte Composo bereits durch sein Beschleunigungsprogramm unterstützt. „Composo geht ein kritisches Hindernis bei der Einführung von Unternehmens-KI an“, sagte ein Sprecher von Twin Path.
Dieses Hindernis ist ein großes Thema für die gesamte KI-Szene, insbesondere für Unternehmen, sagt Fox. „Die Leute sind über die Euphorie hinaus und denken jetzt: ‚Verändert das wirklich etwas an meinem Geschäft in seiner jetzigen Form? Denn es ist nicht zuverlässig genug und nicht konsistent genug. Und selbst wenn es das ist, können Sie mir nicht beweisen, wie sehr‘“, erklärte er.
Das könnte Composo für Unternehmen, die KI nutzen wollen, aber Bedenken hinsichtlich der Risiken haben, äußerst wertvoll machen. Deshalb sind sie branchenunabhängig, konzentrieren sich aber dennoch auf Compliance, Recht, Gesundheitswesen und Sicherheit.
Was sie auszeichnet, sagt Fox, sei nicht leicht zu kopieren. „Es gibt sowohl die Architektur des Modells als auch die Daten, mit denen wir es trainiert haben“, sagte er und wies darauf hin, dass Composo Align auf einem „großen Datensatz von Expertenbewertungen“ trainiert wurde.
Sicher, Tech-Riesen könnten ihr Gewicht in die Waagschale werfen und versuchen, dieses Problem zu lösen, aber Composo glaubt, einen Vorsprung zu haben. „Das andere ist die Daten, die wir im Laufe der Zeit sammeln“, sagte Fox und sprach darüber, wie sie Präferenzen für Bewertungen aufbauen.
Da es Apps anhand flexibler Kriterien bewerten kann, glaubt Composo auch, besser für den Aufstieg von agentischer KI positioniert zu sein als Konkurrenten mit starren Ansätzen. „Meiner Meinung nach sind wir definitiv noch nicht an dem Punkt, an dem Agenten gut funktionieren, und das ist genau das, was wir zu lösen versuchen“, sagte Fox.
*TechCrunch hat einen auf KI fokussierten Newsletter! Melden Sie sich hier an, um ihn jeden Mittwoch in Ihren Posteingang zu bekommen.*



This article on Composo is pretty eye-opening! It's wild how AI apps can be so powerful yet so unpredictable. Startups tackling LLM performance issues is a smart move—businesses need that reliability. Curious to see how this tech evolves! 😎




This article on Composo is pretty cool! It's wild how AI apps can be so powerful yet so unpredictable. Nice to see startups tackling the performance monitoring side—hope it makes LLMs more reliable for businesses! 😎




This article on Composo is super insightful! It’s wild how LLMs are so powerful yet so unpredictable. Excited to see startups tackling this to make AI apps more reliable! 😎




This article on Composo is pretty eye-opening! It's wild how AI apps can be so powerful yet so unpredictable. I wonder how startups like this will tackle the chaos of LLMs in real-world use. 🤔 Anyone else curious about the future of AI monitoring?




This article on Composo is pretty eye-opening! It's cool to see startups tackling the messy side of AI apps. I wonder how they handle the unpredictability of LLMs in real-time enterprise settings. 🤔 Anyone tried their tools yet?




Composoのおかげで、我々の企業のAIアプリのパフォーマンスを監視するのが簡単になりました。これはまるで全てをチェックしてくれる個人アシスタントを持つようなものです。唯一の問題は、時々インターフェースが遅くなることです。全体的に、LLMを使うビジネスには必須ですね!🤓












