Composio: monitoreo del rendimiento de la aplicación AI para empresas

Hogar

Noticias

10 de abril de 2025

MatthewYoung

152

# ai # Composo

"Composio: monitoreo del rendimiento de la aplicación AI para empresas"

La IA y los modelos de lenguaje grandes (LLMs) son muy prometedores, pero seamos realistas: pueden ser algo impredecibles. Nadie está seguro de cuándo se resolverán todos los problemas, así que no sorprende que las startups estén entrando para ayudar a las empresas a asegurarse de que sus aplicaciones basadas en LLMs hagan lo que se supone que deben hacer.

Llega Composo, una startup con sede en Londres que cree tener ventaja para resolver este problema. Tienen modelos personalizados que ayudan a las empresas a verificar si sus aplicaciones LLM son precisas y están a la altura.

Composo no está solo en este campo; compite con empresas como Agenta, Freeplay, Humanloop y LangSmith, todas intentando ofrecer una mejor forma basada en LLMs para probar aplicaciones en lugar de depender de humanos, listas de verificación o herramientas tradicionales. Pero Composo dice que es diferente porque ofrece una opción sin código y una API. Esto significa que más personas pueden usarlo, no solo desarrolladores: expertos del dominio y ejecutivos pueden participar y verificar inconsistencias, calidad y precisión por sí mismos.

Así funciona: Composo combina un modelo de recompensa, entrenado en lo que las personas quieren ver de una aplicación de IA, con criterios específicos para esa aplicación. Luego, puntúa qué tan bien el resultado de la aplicación coincide con esos criterios. Por ejemplo, si tienes un chatbot de triaje médico, puedes establecer pautas personalizadas para detectar síntomas de alerta, y Composo te dirá qué tan bien la aplicación sigue esas reglas.

Acaban de lanzar una API pública para Composo Align, que ayuda a evaluar aplicaciones LLM según los criterios que establezcas.

Parece estar dando frutos: tienen grandes nombres como Accenture, Palantir y McKinsey en su lista de clientes, y recientemente obtuvieron 2 millones de dólares en financiación pre-semilla. Puede que no suene mucho, especialmente en el mundo de la IA donde el dinero suele fluir, pero el cofundador y CEO de Composo, Sebastian Fox, dice que no necesitan toneladas de dinero. "Al menos durante los próximos tres años, no prevemos recaudar cientos de millones porque hay mucha gente construyendo modelos fundacionales y lo hace muy eficazmente, y ese no es nuestro punto fuerte," dijo Fox, quien solía ser consultor en McKinsey. "En cambio, cada mañana, si me despierto y veo una noticia de que OpenAI ha hecho un gran avance en sus modelos, eso es bueno para mi negocio."

Con los nuevos fondos, Composo planea reforzar su equipo de ingeniería (liderado por el cofundador y CTO Luke Markham, un exingeniero de aprendizaje automático en Graphcore), captar más clientes y aumentar la I+D. "El enfoque de este año es mucho más sobre escalar la tecnología que ahora tenemos en esas empresas," dijo Fox.

La ronda semilla fue liderada por el fondo británico de pre-semilla de IA Twin Path Ventures, con JVH Ventures y EWOR también contribuyendo. EWOR ya había respaldado a Composo a través de su programa de aceleración. "Composo está abordando un cuello de botella crítico en la adopción de la IA empresarial," dijo un portavoz de Twin Path.

Este cuello de botella es un gran problema para toda la escena de la IA, especialmente para las empresas, según Fox. "La gente ha superado la emoción del bombo y ahora está pensando, 'Bueno, en realidad, ¿esto realmente cambia algo en mi negocio en su forma actual? Porque no es lo suficientemente confiable, ni consistente. Y aunque lo sea, no puedes probarme cuánto lo es,'" explicó.

Esto podría hacer que Composo sea muy valioso para las empresas que quieran usar IA pero estén preocupadas por los riesgos. Por eso son agnósticos de la industria, pero aún se centran en cumplimiento, legal, salud y seguridad.

En cuanto a qué los distingue, Fox dice que no es fácil replicar lo que han hecho. "Está tanto la arquitectura del modelo como los datos que hemos usado para entrenarlo," dijo, señalando que Composo Align fue entrenado en un "gran conjunto de datos de evaluaciones expertas."

Claro, los gigantes tecnológicos podrían intentar resolver este problema, pero Composo cree que tiene una ventaja inicial. "Lo otro es los datos que acumulamos con el tiempo," dijo Fox, hablando sobre cómo construyen preferencias de evaluación.

Debido a que puede evaluar aplicaciones contra un conjunto flexible de criterios, Composo también cree que está mejor posicionado para el auge de la IA agentiva que los competidores con enfoques más rígidos. "En mi opinión, definitivamente no estamos en la etapa en que los agentes funcionan bien, y eso es exactamente lo que estamos tratando de ayudar a resolver," dijo Fox.

TechCrunch tiene un boletín enfocado en IA. ¡Regístrate aquí para recibirlo en tu bandeja de entrada todos los miércoles.

Artículo relacionado

"Dot AI Companion App anuncia su cierre y suspende el servicio personalizado" Dot, una aplicación de inteligencia artificial diseñada para funcionar como amigo personal y confidente, dejará de funcionar, según anunciaron el viernes sus desarrolladores. New Computer, la empresa

Anthropic resuelve un caso de piratería de libros generados por inteligencia artificial Anthropic ha llegado a una resolución en un importante litigio sobre derechos de autor con autores estadounidenses, aceptando una propuesta de acuerdo de demanda colectiva que evita un juicio potencia

Figma pone a disposición de todos los usuarios su herramienta de creación de aplicaciones basada en inteligencia artificial Figma Make, la innovadora plataforma de desarrollo "prompt-to-app" presentada a principios de este año, ha salido oficialmente de la fase beta y se ha puesto a disposición de todos los usuarios. Esta

comentario (55)

0/200

Entregar

AlbertGarcía

17 de agosto de 2025 11:00:59 GMT+02:00

This article on Composo is pretty eye-opening! It's wild how AI apps can be so powerful yet so unpredictable. Startups tackling LLM performance issues is a smart move—businesses need that reliability. Curious to see how this tech evolves! 😎

DouglasMartínez

16 de agosto de 2025 09:00:59 GMT+02:00

This article on Composo is pretty cool! It's wild how AI apps can be so powerful yet so unpredictable. Nice to see startups tackling the performance monitoring side—hope it makes LLMs more reliable for businesses! 😎

JackCarter

4 de agosto de 2025 08:48:52 GMT+02:00

This article on Composo is super insightful! It’s wild how LLMs are so powerful yet so unpredictable. Excited to see startups tackling this to make AI apps more reliable! 😎

JohnTaylor

28 de julio de 2025 03:19:30 GMT+02:00

This article on Composo is pretty eye-opening! It's wild how AI apps can be so powerful yet so unpredictable. I wonder how startups like this will tackle the chaos of LLMs in real-world use. 🤔 Anyone else curious about the future of AI monitoring?

JoseJackson

28 de julio de 2025 03:19:05 GMT+02:00

This article on Composo is pretty eye-opening! It's cool to see startups tackling the messy side of AI apps. I wonder how they handle the unpredictability of LLMs in real-time enterprise settings. 🤔 Anyone tried their tools yet?

EmmaJohnson

20 de abril de 2025 12:49:17 GMT+02:00

Composoのおかげで、我々の企業のAIアプリのパフォーマンスを監視するのが簡単になりました。これはまるで全てをチェックしてくれる個人アシスタントを持つようなものです。唯一の問題は、時々インターフェースが遅くなることです。全体的に、LLMを使うビジネスには必須ですね！🤓

Noticias principales

Generadores de Video AI Top de 2025: Pika Labs vs Alternativas Gemini 2.5 Pro ahora ilimitado y más barato que Claude, GPT-4O Doblaje AI: Guía Definitiva para la Creación de Voz Realista La IA de Cambium transforma la madera de los desechos en madera AI Builder y Power Automate Revolucionan la Sumarización de Documentos Operai mejora el asistente de voz de IA para mejores chats Cómo garantizar que sus datos sean confiables para la integración de IA Notebooklm se expande a nivel mundial, agrega diapositivas y verificación de hechos mejorada Los ajustes a los centros de datos de EE. UU. Podrían desbloquear 76 GW de nueva capacidad de potencia Google utiliza IA para suspender más de 39 millones de cuentas publicitarias por sospecha de fraude

Más

Presentado