option
Maison
Nouvelles
"Composo: surveillance des performances de l'application AI pour les entreprises"

"Composo: surveillance des performances de l'application AI pour les entreprises"

10 avril 2025
152

"Composo: surveillance des performances de l'application AI pour les entreprises"

html
L'IA et les grands modèles de langage (LLMs) sont très prometteurs, mais soyons réalistes — ils peuvent être un peu aléatoires. Personne ne sait exactement quand tous les problèmes seront résolus, donc il n'est pas surprenant que des startups s'impliquent pour aider les entreprises à s'assurer que leurs applications alimentées par LLM font ce qu'elles sont censées faire.
Voici Composo, une startup basée à Londres qui pense avoir une longueur d'avance pour résoudre ce problème. Ils ont des modèles personnalisés qui aident les entreprises à vérifier si leurs applications LLM sont précises et à la hauteur.
Composo n'est pas seul dans ce domaine ; ils font face à des concurrents comme Agenta, Freeplay, Humanloop et LangSmith, qui tous essaient d'offrir une meilleure façon, basée sur LLM, de tester les applications au lieu de dépendre des humains, des listes de contrôle ou des outils traditionnels. Mais Composo affirme être différent car il propose à la fois une option sans code et une API. Cela signifie que plus de personnes peuvent l'utiliser, pas seulement les développeurs — les experts du domaine et les cadres peuvent également intervenir et vérifier eux-mêmes les incohérences, la qualité et la précision.
Voici comment cela fonctionne : Composo combine un modèle de récompense, entraîné sur ce que les gens veulent voir d'une application IA, avec des critères spécifiques pour cette application. Il évalue ensuite dans quelle mesure la sortie de l'application correspond à ces critères. Par exemple, si vous avez un chatbot de triage médical, vous pouvez définir des directives personnalisées pour surveiller les symptômes alarmants, et Composo vous dira à quel point l'application respecte ces règles.
Ils viennent de lancer une API publique pour Composo Align, qui aide à évaluer les applications LLM en fonction des critères que vous définissez.
Cela semble porter ses fruits — ils ont de grands noms comme Accenture, Palantir et McKinsey dans leur liste de clients, et ils ont récemment obtenu 2 millions de dollars en financement de pré-amorçage. Cela peut ne pas sembler beaucoup, surtout dans le monde de l'IA où l'argent coule généralement à flots, mais le cofondateur et PDG de Composo, Sebastian Fox, dit qu'ils n'ont pas besoin de tonnes d'argent. « Pour les trois prochaines années au moins, nous ne prévoyons pas de lever des centaines de millions, car beaucoup de gens construisent des modèles de base et le font très efficacement, et ce n'est pas notre proposition de valeur unique », a déclaré Fox, qui était auparavant consultant chez McKinsey. « Au contraire, chaque matin, si je me réveille et vois une nouvelle annonçant qu'OpenAI a fait une avancée majeure dans ses modèles, c'est bon pour mon entreprise. »
Avec les nouveaux fonds, Composo prévoit de renforcer son équipe d'ingénieurs (dirigée par le cofondateur et CTO Luke Markham, ancien ingénieur en apprentissage automatique chez Graphcore), d'attirer plus de clients et d'accélérer la R&D. « L'accent cette année est beaucoup plus sur l'expansion de la technologie que nous avons maintenant à travers ces entreprises », a déclaré Fox.
La levée de fonds de pré-amorçage a été menée par le fonds britannique d'IA Twin Path Ventures, avec la participation de JVH Ventures et EWOR. EWOR avait déjà soutenu Composo via son programme d'accélérateur. « Composo s'attaque à un goulot d'étranglement critique dans l'adoption de l'IA en entreprise », a déclaré un porte-parole de Twin Path.
Ce goulot d'étranglement est un gros problème pour toute la scène de l'IA, en particulier pour les entreprises, selon Fox. « Les gens sont passés de l'euphorie de l'excitation à se demander : 'Eh bien, en fait, cela change-t-il vraiment quelque chose pour mon entreprise dans sa forme actuelle ? Parce que ce n'est pas assez fiable, pas assez cohérent. Et même si c'est le cas, vous ne pouvez pas me prouver à quel point c'est le cas' », a-t-il expliqué.
Cela pourrait rendre Composo très précieux pour les entreprises souhaitant utiliser l'IA mais inquiètes des risques. C'est pourquoi ils sont agnostiques vis-à-vis de l'industrie mais se concentrent toujours sur la conformité, le juridique, la santé et la sécurité.
Quant à ce qui les distingue, Fox dit que ce qu'ils ont fait n'est pas facile à reproduire. « Il y a à la fois l'architecture du modèle et les données que nous avons utilisées pour l'entraîner », a-t-il déclaré, notant que Composo Align a été entraîné sur un « grand ensemble de données d'évaluations d'experts ».
Bien sûr, les géants technologiques pourraient utiliser leur influence pour essayer de résoudre ce problème, mais Composo pense avoir une longueur d'avance. « L'autre [chose] est les données que nous accumulons au fil du temps », a déclaré Fox, parlant de la manière dont ils construisent les préférences d'évaluation.
Parce qu'il peut évaluer les applications par rapport à un ensemble de critères flexibles, Composo pense également être mieux positionné pour l'essor de l'IA agentique que les concurrents avec des approches plus rigides. « À mon avis, nous ne sommes certainement pas au stade où les agents fonctionnent bien, et c'est en fait ce que nous essayons d'aider à résoudre », a déclaré Fox.
*TechCrunch a une newsletter axée sur l'IA ! Inscrivez-vous ici pour la recevoir dans votre boîte de réception tous les mercredis.*
Article connexe
Salesforce Dévoile des Coéquipiers Numériques IA dans Slack pour Rivaliser avec Microsoft Copilot Salesforce Dévoile des Coéquipiers Numériques IA dans Slack pour Rivaliser avec Microsoft Copilot Le nouvel outil, Agentforce dans Slack, permet aux entreprises de créer et de déployer des agents IA spécifiques à des tâches qui recherchent dans les discussions professionnelles, accèdent aux donnée
Investissement de 40 milliards de dollars d'Oracle dans les puces Nvidia pour renforcer le centre de données IA au Texas Investissement de 40 milliards de dollars d'Oracle dans les puces Nvidia pour renforcer le centre de données IA au Texas Oracle prévoit d'investir environ 40 milliards de dollars dans des puces Nvidia pour alimenter un nouveau centre de données majeur au Texas, développé par OpenAI, selon le Financial Times. Cette trans
Application Meta AI pour introduire un niveau premium et des publicités Application Meta AI pour introduire un niveau premium et des publicités L'application d'IA de Meta pourrait bientôt proposer un abonnement payant, à l'image des offres de concurrents comme OpenAI, Google et Microsoft. Lors d'une conférence sur les résultats du premier tri
commentaires (55)
0/200
AlbertGarcía
AlbertGarcía 17 août 2025 11:00:59 UTC+02:00

This article on Composo is pretty eye-opening! It's wild how AI apps can be so powerful yet so unpredictable. Startups tackling LLM performance issues is a smart move—businesses need that reliability. Curious to see how this tech evolves! 😎

DouglasMartínez
DouglasMartínez 16 août 2025 09:00:59 UTC+02:00

This article on Composo is pretty cool! It's wild how AI apps can be so powerful yet so unpredictable. Nice to see startups tackling the performance monitoring side—hope it makes LLMs more reliable for businesses! 😎

JackCarter
JackCarter 4 août 2025 08:48:52 UTC+02:00

This article on Composo is super insightful! It’s wild how LLMs are so powerful yet so unpredictable. Excited to see startups tackling this to make AI apps more reliable! 😎

JohnTaylor
JohnTaylor 28 juillet 2025 03:19:30 UTC+02:00

This article on Composo is pretty eye-opening! It's wild how AI apps can be so powerful yet so unpredictable. I wonder how startups like this will tackle the chaos of LLMs in real-world use. 🤔 Anyone else curious about the future of AI monitoring?

JoseJackson
JoseJackson 28 juillet 2025 03:19:05 UTC+02:00

This article on Composo is pretty eye-opening! It's cool to see startups tackling the messy side of AI apps. I wonder how they handle the unpredictability of LLMs in real-time enterprise settings. 🤔 Anyone tried their tools yet?

EmmaJohnson
EmmaJohnson 20 avril 2025 12:49:17 UTC+02:00

Composoのおかげで、我々の企業のAIアプリのパフォーマンスを監視するのが簡単になりました。これはまるで全てをチェックしてくれる個人アシスタントを持つようなものです。唯一の問題は、時々インターフェースが遅くなることです。全体的に、LLMを使うビジネスには必須ですね!🤓

Retour en haut
OR