「Composo:エンタープライズのAIアプリのパフォーマンスの監視」

htmlAIと大規模言語モデル(LLM)は非常に有望ですが、正直言って、成功したり失敗したりします。すべての問題を解決する時期は誰も確信していませんが、スタートアップが企業を支援して、LLM搭載アプリが期待通りに機能するように取り組んでいるのは驚くことではありません。
ロンドンを拠点とするスタートアップ、Composoが登場し、この問題を解決する優位性があると考えています。彼らは、企業がLLMアプリの正確性と基準を満たしているかを確認できるカスタムモデルを提供しています。
Composoはこの分野で唯一ではありません。Agenta、Freeplay、Humanloop、LangSmithといった競合も、人間やチェックリスト、従来のツールに頼らず、LLMベースのより良いアプリテスト方法を提供しようとしています。しかし、ComposoはノーコードオプションとAPIの両方を提供することで異なると主張しています。これにより、開発者だけでなく、ドメイン専門家や経営陣も inconsistency、品質、正確性を自分で確認できます。
その仕組みは次のとおりです:Composoは、AIアプリに求められる結果に基づいてトレーニングされた報酬モデルと、アプリ固有の基準を組み合わせます。そして、アプリの出力がその基準にどの程度一致するかをスコアリングします。例えば、医療トリアージチャットボットがある場合、危険信号の症状を監視するカスタムガイドラインを設定でき、Composoはアプリがそのルールをどれだけ守っているかを教えてくれます。
彼らは最近、Composo Alignの公開APIをリリースしました。これは、設定した任意の基準に基づいてLLMアプリを評価するものです。
その成果を上げているようです。Accenture、Palantir、McKinseyといった大企業が顧客リストに名を連ね、最近200万ドルのプレシード資金を獲得しました。AIの世界では資金が豊富に流れている中でこれは少なく思えるかもしれませんが、Composoの共同創業者兼CEO、Sebastian Foxは、巨額の資金は必要ないと言います。「少なくとも今後3年間は、何億ドルも調達する予定はありません。基盤モデルを構築している人々がいて、彼らが非常に効果的にやっているからです。それが私たちのUSPではありません」と、元McKinseyコンサルタントのFoxは述べました。「代わりに、毎朝起きて、OpenAIがモデルで大きな進歩を遂げたというニュースを見ると、それは私のビジネスにとって良いことです。」
新しい資金で、Composoはエンジニアリングチーム(共同創業者兼CTOで、元Graphcoreの機械学習エンジニアであるLuke Markhamが率いる)を強化し、さらに顧客を獲得し、R&Dを加速する計画です。「今年の焦点は、現在の技術をこれらの企業にスケールすることにあります」とFoxは言いました。
シードラウンドは、英国のAIプレシードファンドTwin Path Venturesが主導し、JVH VenturesとEWORも参加しました。EWORはすでにアクセラレータープログラムを通じてComposoを支援していました。「Composoは、企業AIの導入における重要なボトルネックに対処しています」とTwin Pathのスポークスパーソンは述べました。
このボトルネックは、Foxによると、AIシーン全体、特にビジネスにとって大きな問題です。「人々は興奮の誇大広告を超えて、今、『これが現在の形で私のビジネスに本当に変化をもたらすのか?信頼性が十分でないし、一貫性もない。たとえそうであっても、それがどの程度なのか証明できない』と考えています」と彼は説明しました。
これは、AIを使いたいがリスクを心配する企業にとって、Composoを非常に価値あるものにする可能性があります。そのため、彼らは業界に依存しないが、コンプライアンス、法律、医療、セキュリティに重点を置いています。
差別化要因について、Foxは彼らの成果を再現するのは簡単ではないと言います。「モデルのアーキテクチャと、トレーニングに使用したデータがあります」と彼は述べ、Composo Alignが「専門家の評価の大きなデータセット」でトレーニングされたと付け加えました。
確かに、テック大手が力を入れてこの問題を解決しようとするかもしれませんが、Composoは先行していると考えています。「もう一つは、時間とともに蓄積するデータです」とFoxは、評価の好みを構築する方法について語りました。
柔軟な基準セットでアプリを評価できるため、Composoは、より硬直したアプローチの競合よりも、エージェント型AIの台頭に適していると考えています。「私の意見では、エージェントがうまく機能する段階にはまだ達していません。それを解決しようとしているのです」とFoxは言いました。
*TechCrunchにはAIに焦点を当てたニュースレターがあります!毎週水曜日に受信箱で受け取るには、ここでサインアップしてください。*
関連記事
"ドットAIコンパニオンアプリが閉鎖を発表、パーソナライズドサービスを中止"
個人的な友人や親友として機能するように設計されたAIコンパニオン・アプリケーションであるDotが、金曜日の開発者からの発表によると、運営を終了する。Dotを開発したスタートアップのNew Computer社は、10月5日までサービスを提供し、ユーザーが個人データをエクスポートできるようにするとウェブサイトで述べている。このアプリは、共同設立者であるサム・ホイットモアと元アップルのデザイン・スペシャ
Anthropic、AIが作成した書籍の著作権侵害をめぐる訴訟を解決
Anthropic社は、米国の著作者との重要な著作権紛争で解決に達し、高額になる可能性のある裁判を回避する集団訴訟の和解案に合意した。今週火曜日に裁判所文書に提出されたこの合意は、AI企業が海賊版の文学作品を使ってクロードモデルを訓練したという申し立てに起因する。和解の詳細は非公開だが、この訴訟は作家のアンドレア・バーツ、チャールズ・グレイバー、カーク・ウォレス・ジョンソンの主張に端を発している。
Figma、AIを搭載したアプリビルダー・ツールを全ユーザーに公開
今年初めに発表された革新的なプロンプト・トゥ・アプリ開発プラットフォームであるFigma Makeが、正式にベータ版を終了し、全ユーザーにロールアウトしました。この画期的なツールは、グーグルのジェミニ・コード・アシストやマイクロソフトのギットハブ・コパイロットのようなAIを搭載したコーディング・アシスタントの仲間入りをし、クリエイターが従来のプログラミングの専門知識がなくても、自然言語の記述を機能
コメント (55)
0/200
AlbertGarcía
2025年8月17日 18:00:59 JST
This article on Composo is pretty eye-opening! It's wild how AI apps can be so powerful yet so unpredictable. Startups tackling LLM performance issues is a smart move—businesses need that reliability. Curious to see how this tech evolves! 😎
0
DouglasMartínez
2025年8月16日 16:00:59 JST
This article on Composo is pretty cool! It's wild how AI apps can be so powerful yet so unpredictable. Nice to see startups tackling the performance monitoring side—hope it makes LLMs more reliable for businesses! 😎
0
JackCarter
2025年8月4日 15:48:52 JST
This article on Composo is super insightful! It’s wild how LLMs are so powerful yet so unpredictable. Excited to see startups tackling this to make AI apps more reliable! 😎
0
JohnTaylor
2025年7月28日 10:19:30 JST
This article on Composo is pretty eye-opening! It's wild how AI apps can be so powerful yet so unpredictable. I wonder how startups like this will tackle the chaos of LLMs in real-world use. 🤔 Anyone else curious about the future of AI monitoring?
0
JoseJackson
2025年7月28日 10:19:05 JST
This article on Composo is pretty eye-opening! It's cool to see startups tackling the messy side of AI apps. I wonder how they handle the unpredictability of LLMs in real-time enterprise settings. 🤔 Anyone tried their tools yet?
0
EmmaJohnson
2025年4月20日 19:49:17 JST
Composoのおかげで、我々の企業のAIアプリのパフォーマンスを監視するのが簡単になりました。これはまるで全てをチェックしてくれる個人アシスタントを持つようなものです。唯一の問題は、時々インターフェースが遅くなることです。全体的に、LLMを使うビジネスには必須ですね!🤓
0
AIと大規模言語モデル(LLM)は非常に有望ですが、正直言って、成功したり失敗したりします。すべての問題を解決する時期は誰も確信していませんが、スタートアップが企業を支援して、LLM搭載アプリが期待通りに機能するように取り組んでいるのは驚くことではありません。
ロンドンを拠点とするスタートアップ、Composoが登場し、この問題を解決する優位性があると考えています。彼らは、企業がLLMアプリの正確性と基準を満たしているかを確認できるカスタムモデルを提供しています。
Composoはこの分野で唯一ではありません。Agenta、Freeplay、Humanloop、LangSmithといった競合も、人間やチェックリスト、従来のツールに頼らず、LLMベースのより良いアプリテスト方法を提供しようとしています。しかし、ComposoはノーコードオプションとAPIの両方を提供することで異なると主張しています。これにより、開発者だけでなく、ドメイン専門家や経営陣も inconsistency、品質、正確性を自分で確認できます。
その仕組みは次のとおりです:Composoは、AIアプリに求められる結果に基づいてトレーニングされた報酬モデルと、アプリ固有の基準を組み合わせます。そして、アプリの出力がその基準にどの程度一致するかをスコアリングします。例えば、医療トリアージチャットボットがある場合、危険信号の症状を監視するカスタムガイドラインを設定でき、Composoはアプリがそのルールをどれだけ守っているかを教えてくれます。
彼らは最近、Composo Alignの公開APIをリリースしました。これは、設定した任意の基準に基づいてLLMアプリを評価するものです。
その成果を上げているようです。Accenture、Palantir、McKinseyといった大企業が顧客リストに名を連ね、最近200万ドルのプレシード資金を獲得しました。AIの世界では資金が豊富に流れている中でこれは少なく思えるかもしれませんが、Composoの共同創業者兼CEO、Sebastian Foxは、巨額の資金は必要ないと言います。「少なくとも今後3年間は、何億ドルも調達する予定はありません。基盤モデルを構築している人々がいて、彼らが非常に効果的にやっているからです。それが私たちのUSPではありません」と、元McKinseyコンサルタントのFoxは述べました。「代わりに、毎朝起きて、OpenAIがモデルで大きな進歩を遂げたというニュースを見ると、それは私のビジネスにとって良いことです。」
新しい資金で、Composoはエンジニアリングチーム(共同創業者兼CTOで、元Graphcoreの機械学習エンジニアであるLuke Markhamが率いる)を強化し、さらに顧客を獲得し、R&Dを加速する計画です。「今年の焦点は、現在の技術をこれらの企業にスケールすることにあります」とFoxは言いました。
シードラウンドは、英国のAIプレシードファンドTwin Path Venturesが主導し、JVH VenturesとEWORも参加しました。EWORはすでにアクセラレータープログラムを通じてComposoを支援していました。「Composoは、企業AIの導入における重要なボトルネックに対処しています」とTwin Pathのスポークスパーソンは述べました。
このボトルネックは、Foxによると、AIシーン全体、特にビジネスにとって大きな問題です。「人々は興奮の誇大広告を超えて、今、『これが現在の形で私のビジネスに本当に変化をもたらすのか?信頼性が十分でないし、一貫性もない。たとえそうであっても、それがどの程度なのか証明できない』と考えています」と彼は説明しました。
これは、AIを使いたいがリスクを心配する企業にとって、Composoを非常に価値あるものにする可能性があります。そのため、彼らは業界に依存しないが、コンプライアンス、法律、医療、セキュリティに重点を置いています。
差別化要因について、Foxは彼らの成果を再現するのは簡単ではないと言います。「モデルのアーキテクチャと、トレーニングに使用したデータがあります」と彼は述べ、Composo Alignが「専門家の評価の大きなデータセット」でトレーニングされたと付け加えました。
確かに、テック大手が力を入れてこの問題を解決しようとするかもしれませんが、Composoは先行していると考えています。「もう一つは、時間とともに蓄積するデータです」とFoxは、評価の好みを構築する方法について語りました。
柔軟な基準セットでアプリを評価できるため、Composoは、より硬直したアプローチの競合よりも、エージェント型AIの台頭に適していると考えています。「私の意見では、エージェントがうまく機能する段階にはまだ達していません。それを解決しようとしているのです」とFoxは言いました。
*TechCrunchにはAIに焦点を当てたニュースレターがあります!毎週水曜日に受信箱で受け取るには、ここでサインアップしてください。*



This article on Composo is pretty eye-opening! It's wild how AI apps can be so powerful yet so unpredictable. Startups tackling LLM performance issues is a smart move—businesses need that reliability. Curious to see how this tech evolves! 😎




This article on Composo is pretty cool! It's wild how AI apps can be so powerful yet so unpredictable. Nice to see startups tackling the performance monitoring side—hope it makes LLMs more reliable for businesses! 😎




This article on Composo is super insightful! It’s wild how LLMs are so powerful yet so unpredictable. Excited to see startups tackling this to make AI apps more reliable! 😎




This article on Composo is pretty eye-opening! It's wild how AI apps can be so powerful yet so unpredictable. I wonder how startups like this will tackle the chaos of LLMs in real-world use. 🤔 Anyone else curious about the future of AI monitoring?




This article on Composo is pretty eye-opening! It's cool to see startups tackling the messy side of AI apps. I wonder how they handle the unpredictability of LLMs in real-time enterprise settings. 🤔 Anyone tried their tools yet?




Composoのおかげで、我々の企業のAIアプリのパフォーマンスを監視するのが簡単になりました。これはまるで全てをチェックしてくれる個人アシスタントを持つようなものです。唯一の問題は、時々インターフェースが遅くなることです。全体的に、LLMを使うビジネスには必須ですね!🤓












