opção
Lar
Notícias
"Composo: monitorando o desempenho do aplicativo de IA para empresas"

"Composo: monitorando o desempenho do aplicativo de IA para empresas"

10 de Abril de 2025
152

"Composo: monitorando o desempenho do aplicativo de IA para empresas"

html
IA e modelos de linguagem de grande escala (LLMs) são muito promissores, mas vamos ser realistas—eles podem ser um pouco imprevisíveis. Ninguém sabe ao certo quando todos os problemas serão resolvidos, então não é surpresa que startups estejam entrando para ajudar empresas a garantir que seus aplicativos baseados em LLM realmente façam o que deveriam.
Apresentamos a Composo, uma startup de Londres que acredita ter uma vantagem na solução desse problema. Eles têm modelos personalizados que ajudam empresas a verificar se seus aplicativos LLM são precisos e estão à altura.
A Composo não está sozinha nesse espaço; ela compete com empresas como Agenta, Freeplay, Humanloop e LangSmith, todas tentando oferecer uma maneira melhor, baseada em LLM, para testar aplicativos, em vez de depender de humanos, listas de verificação ou ferramentas antiquadas. Mas a Composo diz que é diferente porque oferece tanto uma opção sem código quanto uma API. Isso significa que mais pessoas podem usá-la, não apenas desenvolvedores—especialistas de domínio e executivos podem verificar inconsistências, qualidade e precisão por conta própria.
Veja como funciona: a Composo combina um modelo de recompensa, treinado com base no que as pessoas querem ver em um aplicativo de IA, com critérios específicos para esse aplicativo. Em seguida, ele pontua o quão bem a saída do aplicativo corresponde a esses critérios. Por exemplo, se você tem um chatbot de triagem médica, pode definir diretrizes personalizadas para monitorar sintomas de alerta, e a Composo dirá o quão bem o aplicativo segue essas regras.
Eles acabaram de lançar uma API pública para o Composo Align, que ajuda a avaliar aplicativos LLM com base em qualquer critério que você definir.
Parece estar valendo a pena—eles têm grandes nomes como Accenture, Palantir e McKinsey na lista de clientes, e recentemente conseguiram US$ 2 milhões em financiamento pré-semente. Pode não parecer muito, especialmente no mundo da IA, onde o dinheiro costuma fluir, mas o cofundador e CEO da Composo, Sebastian Fox, diz que eles não precisam de muito dinheiro. "Pelo menos pelos próximos três anos, não prevemos levantar centenas de milhões, porque há muitas pessoas construindo modelos de fundação e fazendo isso de forma muito eficaz, e esse não é o nosso diferencial," disse Fox, que já foi consultor na McKinsey. "Em vez disso, cada manhã, se eu acordar e ver uma notícia de que a OpenAI fez um grande avanço em seus modelos, isso é bom para o meu negócio."
Com os novos fundos, a Composo planeja fortalecer sua equipe de engenharia (liderada pelo cofundador e CTO Luke Markham, ex-engenheiro de aprendizado de máquina na Graphcore), conquistar mais clientes e intensificar a P&D. "O foco deste ano é muito mais sobre escalar a tecnologia que agora temos entre essas empresas," disse Fox.
A rodada de sementes foi liderada pelo fundo britânico de pré-semente de IA Twin Path Ventures, com a participação da JVH Ventures e da EWOR. A EWOR já havia apoiado a Composo por meio de seu programa de aceleração. "A Composo está abordando um gargalo crítico na adoção de IA empresarial," disse um porta-voz da Twin Path.
Esse gargalo é um grande problema para toda a cena da IA, especialmente para empresas, segundo Fox. "As pessoas superaram o entusiasmo e agora estão pensando, 'Bem, na verdade, isso realmente muda algo no meu negócio em sua forma atual? Porque não é confiável o suficiente, e não é consistente o suficiente. E mesmo que seja, você não pode me provar o quanto é,'" ele explicou.
Isso pode tornar a Composo muito valiosa para empresas que querem usar IA, mas estão preocupadas com os riscos. É por isso que eles são agnósticos em relação à indústria, mas ainda focam em conformidade, jurídico, saúde e segurança.
Quanto ao que os diferencia, Fox diz que não é fácil replicar o que eles fizeram. "Há tanto a arquitetura do modelo quanto os dados que usamos para treiná-lo," ele disse, observando que o Composo Align foi treinado em um "grande conjunto de dados de avaliações de especialistas."
Claro, gigantes da tecnologia poderiam usar seu peso para tentar resolver esse problema, mas a Composo acredita que está à frente. "A outra [coisa] são os dados que acumulamos ao longo do tempo," disse Fox, falando sobre como eles constroem preferências de avaliação.
Como pode avaliar aplicativos com base em um conjunto flexível de critérios, a Composo também acha que está melhor posicionada para a ascensão da IA agentiva do que concorrentes com abordagens mais rígidas. "Na minha opinião, definitivamente não estamos na fase em que os agentes funcionam bem, e é exatamente isso que estamos tentando ajudar a resolver," disse Fox.
*O TechCrunch tem uma newsletter focada em IA! Inscreva-se aqui para recebê-la em sua caixa de entrada toda quarta-feira.*
Artigo relacionado
Salesforce Apresenta Companheiros Digitais de IA no Slack para Rivalizar com o Microsoft Copilot Salesforce Apresenta Companheiros Digitais de IA no Slack para Rivalizar com o Microsoft Copilot A Salesforce lançou uma nova estratégia de IA para o local de trabalho, introduzindo “companheiros digitais” especializados integrados às conversas do Slack, revelou a empresa na segunda-feira.A nova
Investimento de US$ 40 bilhões da Oracle em chips Nvidia impulsiona centro de dados de IA no Texas Investimento de US$ 40 bilhões da Oracle em chips Nvidia impulsiona centro de dados de IA no Texas A Oracle planeja investir aproximadamente US$ 40 bilhões em chips Nvidia para alimentar um grande novo centro de dados no Texas, desenvolvido pela OpenAI, conforme relatado pelo Financial Times. Este
Aplicativo Meta AI Introduzirá Nível Premium e Anúncios Aplicativo Meta AI Introduzirá Nível Premium e Anúncios O aplicativo de IA da Meta pode em breve apresentar uma assinatura paga, seguindo o exemplo de concorrentes como OpenAI, Google e Microsoft. Durante uma teleconferência de resultados do primeiro trime
Comentários (55)
0/200
AlbertGarcía
AlbertGarcía 17 de Agosto de 2025 à59 10:00:59 WEST

This article on Composo is pretty eye-opening! It's wild how AI apps can be so powerful yet so unpredictable. Startups tackling LLM performance issues is a smart move—businesses need that reliability. Curious to see how this tech evolves! 😎

DouglasMartínez
DouglasMartínez 16 de Agosto de 2025 à59 08:00:59 WEST

This article on Composo is pretty cool! It's wild how AI apps can be so powerful yet so unpredictable. Nice to see startups tackling the performance monitoring side—hope it makes LLMs more reliable for businesses! 😎

JackCarter
JackCarter 4 de Agosto de 2025 à52 07:48:52 WEST

This article on Composo is super insightful! It’s wild how LLMs are so powerful yet so unpredictable. Excited to see startups tackling this to make AI apps more reliable! 😎

JohnTaylor
JohnTaylor 28 de Julho de 2025 à30 02:19:30 WEST

This article on Composo is pretty eye-opening! It's wild how AI apps can be so powerful yet so unpredictable. I wonder how startups like this will tackle the chaos of LLMs in real-world use. 🤔 Anyone else curious about the future of AI monitoring?

JoseJackson
JoseJackson 28 de Julho de 2025 à5 02:19:05 WEST

This article on Composo is pretty eye-opening! It's cool to see startups tackling the messy side of AI apps. I wonder how they handle the unpredictability of LLMs in real-time enterprise settings. 🤔 Anyone tried their tools yet?

EmmaJohnson
EmmaJohnson 20 de Abril de 2025 à17 11:49:17 WEST

Composoのおかげで、我々の企業のAIアプリのパフォーマンスを監視するのが簡単になりました。これはまるで全てをチェックしてくれる個人アシスタントを持つようなものです。唯一の問題は、時々インターフェースが遅くなることです。全体的に、LLMを使うビジネスには必須ですね!🤓

De volta ao topo
OR