Composo : 기업을위한 AI 앱 성능 모니터링

AI와 대규모 언어 모델(LLM)은 매우 유망하지만, 솔직히 말해—때로는 성공하거나 실패할 수 있습니다. 언제 모든 문제를 해결할지 확실하지 않으므로, 스타트업들이 기업들이 LLM 기반 앱이 의도한 대로 작동하는지 확인하도록 돕기 위해 뛰어드는 것은 놀라운 일이 아닙니다.
런던 기반 스타트업 Composo가 이 문제를 해결하는 데 앞서 있다고 생각합니다. 그들은 기업들이 LLM 앱의 정확성과 품질을 확인할 수 있도록 돕는 맞춤형 모델을 보유하고 있습니다.
Composo는 이 분야에서 혼자가 아닙니다. Agenta, Freeplay, Humanloop, LangSmith와 같은 경쟁사들과 맞서고 있으며, 이들은 모두 인간, 체크리스트, 또는 구식 도구에 의존하지 않고 LLM 기반으로 앱을 테스트하는 더 나은 방법을 제공하려고 합니다. 하지만 Composo는 노코드 옵션과 API를 모두 제공하기 때문에 다르다고 말합니다. 이는 개발자뿐만 아니라 도메인 전문가와 경영진도 직접 불일치, 품질, 정확성을 확인할 수 있다는 뜻입니다.
작동 방식은 다음과 같습니다: Composo는 사람들이 AI 앱에서 보고 싶어 하는 것에 대해 훈련된 보상 모델과 해당 앱의 특정 기준을 결합합니다. 그런 다음 앱의 출력이 그 기준과 얼마나 잘 맞는지 점수를 매깁니다. 예를 들어, 의료 분류 챗봇이 있다면, 위험 신호 증상을 감시하는 맞춤형 가이드라인을 설정할 수 있고, Composo는 앱이 그 규칙을 얼마나 잘 따르는지 알려줍니다.
그들은 최근 Composo Align의 공개 API를 출시했으며, 이는 사용자가 설정한 기준에 따라 LLM 앱을 평가할 수 있게 합니다.
이 노력은 성과를 내고 있습니다. Accenture, Palantir, McKinsey 같은 대기업이 고객 리스트에 있으며, 최근 200만 달러의 프리시드 펀딩을 확보했습니다. AI 세계에서는 자금이 풍부한 편이지만, Composo의 공동 설립자이자 CEO인 Sebastian Fox는 많은 자금이 필요하지 않다고 말합니다. “적어도 앞으로 3년 동안 우리는 수억 달러를 모금할 계획이 없습니다. 많은 사람들이 기반 모델을 효과적으로 구축하고 있고, 그것은 우리의 강점이 아닙니다,”라고 McKinsey 출신 컨설턴트였던 Fox는 말했습니다. “대신, 매일 아침 OpenAI가 그들의 모델에서 큰 발전을 이루었다는 뉴스를 보면, 그것은 제 사업에 좋은 일입니다.”
새로운 자금으로 Composo는 Graphcore 출신의 기계 학습 엔지니어였던 공동 설립자이자 CTO인 Luke Markham이 이끄는 엔지니어링 팀을 강화하고, 더 많은 고객을 확보하며, R&D를 확대할 계획입니다. “올해의 초점은 우리가 현재 보유한 기술을 여러 기업에 확장하는 데 훨씬 더 집중하고 있습니다,”라고 Fox는 말했습니다.
시드 라운드는 영국 AI 프리시드 펀드 Twin Path Ventures가 주도했으며, JVH Ventures와 EWOR도 참여했습니다. EWOR은 이미 가속기 프로그램을 통해 Composo를 지원한 바 있습니다. “Composo는 기업 AI 도입의 중요한 병목 현상을 해결하고 있습니다,”라고 Twin Path 대변인이 말했습니다.
Fox에 따르면 이 병목 현상은 특히 기업들에게 AI 전체에 큰 문제입니다. “사람들은 흥분의 과대 광고를 넘어 이제 ‘이게 현재 형태로 내 비즈니스에 정말 변화를 가져올까? 신뢰성이 충분하지 않고, 일관성이 없으며, 설령 그렇더라도 그 정도를 증명할 수 없다’고 생각하고 있습니다,”라고 그는 설명했습니다.
이는 AI를 사용하고 싶지만 위험을 걱정하는 기업들에게 Composo를 매우 가치 있게 만들 수 있습니다. 그래서 그들은 산업에 구애받지 않지만, 규제 준수, 법률, 의료, 보안에 초점을 맞춥니다.
Fox는 그들의 차별점을 복제하기 어렵다고 말합니다. “모델의 아키텍처와 우리가 훈련에 사용한 데이터가 모두 있습니다,”라고 그는 말하며, Composo Align은 “전문가 평가의 대규모 데이터셋”으로 훈련되었다고 언급했습니다.
테크 거인들이 이 문제를 해결하려고 나설 수 있지만, Composo는 선두를 달리고 있다고 생각합니다. “다른 하나는 시간이 지남에 따라 우리가 축적하는 데이터입니다,”라고 Fox는 평가 선호도를 쌓아가는 방식에 대해 말했습니다.
유연한 기준 세트에 따라 앱을 평가할 수 있으므로, Composo는 더 경직된 접근 방식을 가진 경쟁사들보다 에이전트 기반 AI의 부상에 더 잘 대비하고 있다고 생각합니다. “제 생각에, 우리는 에이전트가 잘 작동하는 단계에 확실히 도달하지 않았고, 그것이 우리가 해결하려는 것입니다,”라고 Fox는 말했습니다.
TechCrunch는 AI 중심 뉴스레터를 제공합니다! 매주 수요일 받은 편지함에서 확인하려면 여기에서 구독하세요.
관련 기사
"닷 AI 컴패니언 앱, 폐쇄 발표, 개인화 서비스 중단"
금요일 개발자의 발표에 따르면 개인적인 친구이자 친구의 역할을 하도록 설계된 AI 컴패니언 애플리케이션인 Dot이 운영을 중단할 예정입니다. 닷을 개발한 스타트업인 뉴 컴퓨터는 웹사이트를 통해 10월 5일까지 서비스를 계속 이용할 수 있으며, 사용자들이 개인 데이터를 내보낼 수 있는 시간을 제공한다고 밝혔습니다.이 앱은 올해 초 공동 창업자인 샘 휘트모어와
앤트로픽, AI로 생성된 도서 불법 복제에 대한 법적 소송 해결
앤트로픽은 미국 작가들과의 저작권 분쟁에서 잠재적으로 비용이 많이 드는 재판을 피할 수 있는 집단 소송 합의안에 동의하며 합의에 도달했습니다. 이번 화요일에 법원 문서로 제출된 이 합의는 AI 회사가 불법 복제된 문학 작품을 사용하여 클로드 모델을 훈련시켰다는 주장에서 비롯되었습니다.합의 세부 사항은 기밀로 유지되지만, 이 사건은 저자 Andrea Bart
Figma, 모든 사용자에게 AI 기반 앱 빌더 도구 공개
올해 초에 공개된 혁신적인 즉석 앱 개발 플랫폼인 피그마 메이크가 공식적으로 베타 버전을 종료하고 모든 사용자에게 출시되었습니다. 이 획기적인 도구는 Google의 Gemini 코드 어시스트, Microsoft의 GitHub 코파일럿과 같은 AI 기반 코딩 어시스턴트 대열에 합류하여 크리에이터가 기존의 프로그래밍 전문 지식 없이도 자연어 설명을 기능적인 프
의견 (55)
0/200
AlbertGarcía
2025년 8월 17일 오후 6시 0분 59초 GMT+09:00
This article on Composo is pretty eye-opening! It's wild how AI apps can be so powerful yet so unpredictable. Startups tackling LLM performance issues is a smart move—businesses need that reliability. Curious to see how this tech evolves! 😎
0
DouglasMartínez
2025년 8월 16일 오후 4시 0분 59초 GMT+09:00
This article on Composo is pretty cool! It's wild how AI apps can be so powerful yet so unpredictable. Nice to see startups tackling the performance monitoring side—hope it makes LLMs more reliable for businesses! 😎
0
JackCarter
2025년 8월 4일 오후 3시 48분 52초 GMT+09:00
This article on Composo is super insightful! It’s wild how LLMs are so powerful yet so unpredictable. Excited to see startups tackling this to make AI apps more reliable! 😎
0
JohnTaylor
2025년 7월 28일 오전 10시 19분 30초 GMT+09:00
This article on Composo is pretty eye-opening! It's wild how AI apps can be so powerful yet so unpredictable. I wonder how startups like this will tackle the chaos of LLMs in real-world use. 🤔 Anyone else curious about the future of AI monitoring?
0
JoseJackson
2025년 7월 28일 오전 10시 19분 5초 GMT+09:00
This article on Composo is pretty eye-opening! It's cool to see startups tackling the messy side of AI apps. I wonder how they handle the unpredictability of LLMs in real-time enterprise settings. 🤔 Anyone tried their tools yet?
0
EmmaJohnson
2025년 4월 20일 오후 7시 49분 17초 GMT+09:00
Composoのおかげで、我々の企業のAIアプリのパフォーマンスを監視するのが簡単になりました。これはまるで全てをチェックしてくれる個人アシスタントを持つようなものです。唯一の問題は、時々インターフェースが遅くなることです。全体的に、LLMを使うビジネスには必須ですね!🤓
0
AI와 대규모 언어 모델(LLM)은 매우 유망하지만, 솔직히 말해—때로는 성공하거나 실패할 수 있습니다. 언제 모든 문제를 해결할지 확실하지 않으므로, 스타트업들이 기업들이 LLM 기반 앱이 의도한 대로 작동하는지 확인하도록 돕기 위해 뛰어드는 것은 놀라운 일이 아닙니다.
런던 기반 스타트업 Composo가 이 문제를 해결하는 데 앞서 있다고 생각합니다. 그들은 기업들이 LLM 앱의 정확성과 품질을 확인할 수 있도록 돕는 맞춤형 모델을 보유하고 있습니다.
Composo는 이 분야에서 혼자가 아닙니다. Agenta, Freeplay, Humanloop, LangSmith와 같은 경쟁사들과 맞서고 있으며, 이들은 모두 인간, 체크리스트, 또는 구식 도구에 의존하지 않고 LLM 기반으로 앱을 테스트하는 더 나은 방법을 제공하려고 합니다. 하지만 Composo는 노코드 옵션과 API를 모두 제공하기 때문에 다르다고 말합니다. 이는 개발자뿐만 아니라 도메인 전문가와 경영진도 직접 불일치, 품질, 정확성을 확인할 수 있다는 뜻입니다.
작동 방식은 다음과 같습니다: Composo는 사람들이 AI 앱에서 보고 싶어 하는 것에 대해 훈련된 보상 모델과 해당 앱의 특정 기준을 결합합니다. 그런 다음 앱의 출력이 그 기준과 얼마나 잘 맞는지 점수를 매깁니다. 예를 들어, 의료 분류 챗봇이 있다면, 위험 신호 증상을 감시하는 맞춤형 가이드라인을 설정할 수 있고, Composo는 앱이 그 규칙을 얼마나 잘 따르는지 알려줍니다.
그들은 최근 Composo Align의 공개 API를 출시했으며, 이는 사용자가 설정한 기준에 따라 LLM 앱을 평가할 수 있게 합니다.
이 노력은 성과를 내고 있습니다. Accenture, Palantir, McKinsey 같은 대기업이 고객 리스트에 있으며, 최근 200만 달러의 프리시드 펀딩을 확보했습니다. AI 세계에서는 자금이 풍부한 편이지만, Composo의 공동 설립자이자 CEO인 Sebastian Fox는 많은 자금이 필요하지 않다고 말합니다. “적어도 앞으로 3년 동안 우리는 수억 달러를 모금할 계획이 없습니다. 많은 사람들이 기반 모델을 효과적으로 구축하고 있고, 그것은 우리의 강점이 아닙니다,”라고 McKinsey 출신 컨설턴트였던 Fox는 말했습니다. “대신, 매일 아침 OpenAI가 그들의 모델에서 큰 발전을 이루었다는 뉴스를 보면, 그것은 제 사업에 좋은 일입니다.”
새로운 자금으로 Composo는 Graphcore 출신의 기계 학습 엔지니어였던 공동 설립자이자 CTO인 Luke Markham이 이끄는 엔지니어링 팀을 강화하고, 더 많은 고객을 확보하며, R&D를 확대할 계획입니다. “올해의 초점은 우리가 현재 보유한 기술을 여러 기업에 확장하는 데 훨씬 더 집중하고 있습니다,”라고 Fox는 말했습니다.
시드 라운드는 영국 AI 프리시드 펀드 Twin Path Ventures가 주도했으며, JVH Ventures와 EWOR도 참여했습니다. EWOR은 이미 가속기 프로그램을 통해 Composo를 지원한 바 있습니다. “Composo는 기업 AI 도입의 중요한 병목 현상을 해결하고 있습니다,”라고 Twin Path 대변인이 말했습니다.
Fox에 따르면 이 병목 현상은 특히 기업들에게 AI 전체에 큰 문제입니다. “사람들은 흥분의 과대 광고를 넘어 이제 ‘이게 현재 형태로 내 비즈니스에 정말 변화를 가져올까? 신뢰성이 충분하지 않고, 일관성이 없으며, 설령 그렇더라도 그 정도를 증명할 수 없다’고 생각하고 있습니다,”라고 그는 설명했습니다.
이는 AI를 사용하고 싶지만 위험을 걱정하는 기업들에게 Composo를 매우 가치 있게 만들 수 있습니다. 그래서 그들은 산업에 구애받지 않지만, 규제 준수, 법률, 의료, 보안에 초점을 맞춥니다.
Fox는 그들의 차별점을 복제하기 어렵다고 말합니다. “모델의 아키텍처와 우리가 훈련에 사용한 데이터가 모두 있습니다,”라고 그는 말하며, Composo Align은 “전문가 평가의 대규모 데이터셋”으로 훈련되었다고 언급했습니다.
테크 거인들이 이 문제를 해결하려고 나설 수 있지만, Composo는 선두를 달리고 있다고 생각합니다. “다른 하나는 시간이 지남에 따라 우리가 축적하는 데이터입니다,”라고 Fox는 평가 선호도를 쌓아가는 방식에 대해 말했습니다.
유연한 기준 세트에 따라 앱을 평가할 수 있으므로, Composo는 더 경직된 접근 방식을 가진 경쟁사들보다 에이전트 기반 AI의 부상에 더 잘 대비하고 있다고 생각합니다. “제 생각에, 우리는 에이전트가 잘 작동하는 단계에 확실히 도달하지 않았고, 그것이 우리가 해결하려는 것입니다,”라고 Fox는 말했습니다.
TechCrunch는 AI 중심 뉴스레터를 제공합니다! 매주 수요일 받은 편지함에서 확인하려면 여기에서 구독하세요.



This article on Composo is pretty eye-opening! It's wild how AI apps can be so powerful yet so unpredictable. Startups tackling LLM performance issues is a smart move—businesses need that reliability. Curious to see how this tech evolves! 😎




This article on Composo is pretty cool! It's wild how AI apps can be so powerful yet so unpredictable. Nice to see startups tackling the performance monitoring side—hope it makes LLMs more reliable for businesses! 😎




This article on Composo is super insightful! It’s wild how LLMs are so powerful yet so unpredictable. Excited to see startups tackling this to make AI apps more reliable! 😎




This article on Composo is pretty eye-opening! It's wild how AI apps can be so powerful yet so unpredictable. I wonder how startups like this will tackle the chaos of LLMs in real-world use. 🤔 Anyone else curious about the future of AI monitoring?




This article on Composo is pretty eye-opening! It's cool to see startups tackling the messy side of AI apps. I wonder how they handle the unpredictability of LLMs in real-time enterprise settings. 🤔 Anyone tried their tools yet?




Composoのおかげで、我々の企業のAIアプリのパフォーマンスを監視するのが簡単になりました。これはまるで全てをチェックしてくれる個人アシスタントを持つようなものです。唯一の問題は、時々インターフェースが遅くなることです。全体的に、LLMを使うビジネスには必須ですね!🤓












