オプション
ニュース
「Composo:エンタープライズのAIアプリのパフォーマンスの監視」

「Composo:エンタープライズのAIアプリのパフォーマンスの監視」

2025年4月10日
204

「Composo:エンタープライズのAIアプリのパフォーマンスの監視」

html
AIと大規模言語モデル(LLM)は非常に有望ですが、正直言って、成功したり失敗したりします。すべての問題を解決する時期は誰も確信していませんが、スタートアップが企業を支援して、LLM搭載アプリが期待通りに機能するように取り組んでいるのは驚くことではありません。
ロンドンを拠点とするスタートアップ、Composoが登場し、この問題を解決する優位性があると考えています。彼らは、企業がLLMアプリの正確性と基準を満たしているかを確認できるカスタムモデルを提供しています。
Composoはこの分野で唯一ではありません。Agenta、Freeplay、Humanloop、LangSmithといった競合も、人間やチェックリスト、従来のツールに頼らず、LLMベースのより良いアプリテスト方法を提供しようとしています。しかし、ComposoはノーコードオプションとAPIの両方を提供することで異なると主張しています。これにより、開発者だけでなく、ドメイン専門家や経営陣も inconsistency、品質、正確性を自分で確認できます。
その仕組みは次のとおりです:Composoは、AIアプリに求められる結果に基づいてトレーニングされた報酬モデルと、アプリ固有の基準を組み合わせます。そして、アプリの出力がその基準にどの程度一致するかをスコアリングします。例えば、医療トリアージチャットボットがある場合、危険信号の症状を監視するカスタムガイドラインを設定でき、Composoはアプリがそのルールをどれだけ守っているかを教えてくれます。
彼らは最近、Composo Alignの公開APIをリリースしました。これは、設定した任意の基準に基づいてLLMアプリを評価するものです。
その成果を上げているようです。Accenture、Palantir、McKinseyといった大企業が顧客リストに名を連ね、最近200万ドルのプレシード資金を獲得しました。AIの世界では資金が豊富に流れている中でこれは少なく思えるかもしれませんが、Composoの共同創業者兼CEO、Sebastian Foxは、巨額の資金は必要ないと言います。「少なくとも今後3年間は、何億ドルも調達する予定はありません。基盤モデルを構築している人々がいて、彼らが非常に効果的にやっているからです。それが私たちのUSPではありません」と、元McKinseyコンサルタントのFoxは述べました。「代わりに、毎朝起きて、OpenAIがモデルで大きな進歩を遂げたというニュースを見ると、それは私のビジネスにとって良いことです。」
新しい資金で、Composoはエンジニアリングチーム(共同創業者兼CTOで、元Graphcoreの機械学習エンジニアであるLuke Markhamが率いる)を強化し、さらに顧客を獲得し、R&Dを加速する計画です。「今年の焦点は、現在の技術をこれらの企業にスケールすることにあります」とFoxは言いました。
シードラウンドは、英国のAIプレシードファンドTwin Path Venturesが主導し、JVH VenturesとEWORも参加しました。EWORはすでにアクセラレータープログラムを通じてComposoを支援していました。「Composoは、企業AIの導入における重要なボトルネックに対処しています」とTwin Pathのスポークスパーソンは述べました。
このボトルネックは、Foxによると、AIシーン全体、特にビジネスにとって大きな問題です。「人々は興奮の誇大広告を超えて、今、『これが現在の形で私のビジネスに本当に変化をもたらすのか?信頼性が十分でないし、一貫性もない。たとえそうであっても、それがどの程度なのか証明できない』と考えています」と彼は説明しました。
これは、AIを使いたいがリスクを心配する企業にとって、Composoを非常に価値あるものにする可能性があります。そのため、彼らは業界に依存しないが、コンプライアンス、法律、医療、セキュリティに重点を置いています。
差別化要因について、Foxは彼らの成果を再現するのは簡単ではないと言います。「モデルのアーキテクチャと、トレーニングに使用したデータがあります」と彼は述べ、Composo Alignが「専門家の評価の大きなデータセット」でトレーニングされたと付け加えました。
確かに、テック大手が力を入れてこの問題を解決しようとするかもしれませんが、Composoは先行していると考えています。「もう一つは、時間とともに蓄積するデータです」とFoxは、評価の好みを構築する方法について語りました。
柔軟な基準セットでアプリを評価できるため、Composoは、より硬直したアプローチの競合よりも、エージェント型AIの台頭に適していると考えています。「私の意見では、エージェントがうまく機能する段階にはまだ達していません。それを解決しようとしているのです」とFoxは言いました。
*TechCrunchにはAIに焦点を当てたニュースレターがあります!毎週水曜日に受信箱で受け取るには、ここでサインアップしてください。*
関連記事
GoogleフォトがAIを活用し、『クルーレス』の象徴的なクローゼットを再現 GoogleフォトがAIを活用し、『クルーレス』の象徴的なクローゼットを再現 Googleフォトは水曜日、AIを活用した新機能を発表した。この機能により、まもなく自分の服の写真をデジタルクローゼットに変換できるようになり、新しいコーディネートを考えたり、バーチャルで試着したりできるようになる。このコンセプトは、映画『クルーレス』に登場するシェールの象徴的なバーチャルワードローブから明らかに着想を得たもので、彼女は何を着るか決める際に、数多くのコーディネートの中から自由に選ん
Notionは、ワークスペースをAIエージェントのハブへと変革します Notionは、ワークスペースをAIエージェントのハブへと変革します 生産性向上ソフトウェア企業であるNotionが、「エージェント時代」に突入する。水曜日にライブ配信された製品発表会で、共同ノート作成アプリで知られるNotionは、カスタムAIエージェントの機能を拡張し、外部エージェントと連携し、あらゆるデータベースからデータを取得できる自動化された多段階ワークフローをチームが構築できるようにする新しい開発者向けプラットフォームを発表した。複数のツールやデータソー
ElevenLabs、ブラックロック、ジェイミー・フォックス、エヴァ・ロンゴリアを新たな投資家として発表 ElevenLabs、ブラックロック、ジェイミー・フォックス、エヴァ・ロンゴリアを新たな投資家として発表 音声AI企業であるElevenLabsは、2月に発表された5億ドルのシリーズDラウンドにおいて、追加の投資家名を明らかにした。 これには、ブラックロック、ウェリントン、D.E.ショー、シュローダーズといった機関投資家、NVIDIA、セールスフォース、サンタンデール、KPN、ドイツテレコムなどの企業、そしてジェイミー・フォックス、エヴァ・ロンゴリア、『Squid Game』のクリエイターであるファン
関連特集おすすめ
チャットボット おすすめのAIガールフレンド生成ツール:個性や趣味、バックストーリーを自由にデザイン
おすすめのAIガールフレンド生成ツール:個性や趣味、バックストーリーを自由にデザイン

XIX.AIで、2026年最高のカスタムAIガールフレンド生成ツールを発見しましょう。ユニークな性格、趣味、そして深いバックストーリーをデザインするための、厳選された高評価リストをご覧ください。実際の利用体験に基づく情報を参考に、無料版と有料版の比較も可能です。今すぐ、あなたにぴったりのクリエイティブなパートナーを手に入れましょう。

10 ツール
xix.ai
生産性 AIアーキテクチャ設計者:自然言語を用いてスケーラブルなシステムアーキテクチャを構築する
AIアーキテクチャ設計者:自然言語を用いてスケーラブルなシステムアーキテクチャを構築する

XIX.AIで、2026年最高のAIアーキテクチャ設計ツールをご覧ください。厳選された高評価のリストには、自然言語を用いてスケーラブルなシステムアーキテクチャを構築するための、強力で革新的なソリューションが揃っています。実際の事例に基づく知見をもとに、無料版と有料版の機能を比較しましょう。今すぐAI開発の競争力を高め、開発プロセスを効率化しましょう。

10 ツール
xix.ai
漫画制作 AIキャラクタープロフィール作成ツール:漫画の主人公たちに詳細な背景設定やビジュアル参考資料を生成する
AIキャラクタープロフィール作成ツール:漫画の主人公たちに詳細な背景設定やビジュアル参考資料を生成する

2026年最新の最高のAIキャラクタープロフィール作成ツール:マンガの主人公たちに詳細な背景設定や視覚的参考資料を生成するための高評価ツールを発見しましょう。当社が厳選し、毎週更新しているこのリストでは、実際のテスト結果に基づいて無料版と有料版を比較しています。強力で革新的なソリューションを使って魅力的なキャラクターを創造し、創作作業の効率を高めましょう。XIX.AIでランキングを確認し、今日すぐに完璧なストーリーテリングの助けとなるツールを手に入れてください。

10 ツール
xix.ai
健康とウェルネス AI妊娠サポートツール:妊娠期間ごとの安全な運動・栄養プランを生成
AI妊娠サポートツール:妊娠期間ごとの安全な運動・栄養プランを生成

2026年版、安全で個人に合わせた妊娠期間ごとの運動・栄養プランを提供する、最高のAI妊娠サポートツールを発見しましょう。高評価の厳選されたおすすめツールに加え、無料版と有料版の比較や実際の利用体験に基づくインサイトもご提供します。XIX.AIの専門家によるガイドで、最も健康的な妊娠生活を手に入れましょう。今すぐチェックしてみてください。

10 ツール
xix.ai
書き込み 最高の無料AI検出回避ツール:機械的な下書きを自然で人間らしい文章に変える
最高の無料AI検出回避ツール:機械的な下書きを自然で人間らしい文章に変える

XIX.AIで、2026年最高の無料・検出されないAIライティングツールを発見しましょう。厳選された高評価のリストを活用すれば、機械的な下書きを自然で人間らしい文章へと変えることができます。実際のテスト結果や毎週更新されるランキングをもとに、無料版と有料版の比較が可能です。今すぐAIライティングの真価を解き放ちましょう。

10 ツール
xix.ai
画像編集 AIアートジェネレーターを活用した短編ドラマのストーリーボード制作:ファンタジーおよびアーバンロマンスキャラクター
AIアートジェネレーターを活用した短編ドラマのストーリーボード制作:ファンタジーおよびアーバンロマンスキャラクター

2026年最新情報:短編ドラマのストーリーボード作成に最適なAIアートジェネレーターを発見しましょう。当社が厳選したリストには、魅力的なファンタジーやアーバンロマンスキャラクターを制作するための高評価ツールが掲載されています。無料版と有料版を比較し、実際のテスト結果を確認して、自分に最適な創作ツールを見つけましょう。XIX.AIから毎週更新されるランキングや専門家の意見もご覧いただけます。今日からあなたの物語を視覚化し始めましょう!

10 ツール
xix.ai
コメント (56)
0/500
BrianGonzález
BrianGonzález 2026年1月13日 19:30:50 JST

用AI去监控AI应用,这做法挺有趣的,有点「套娃」的味道。不过这类服务确实有需求,现在模型输出的稳定性确实是个痛点,尤其是对企业级应用来说。我们团队之前试过几个大模型API,偶尔抽风起来真的让人头疼,有个监测工具至少能提前预警吧。😅

AlbertGarcía
AlbertGarcía 2025年8月17日 18:00:59 JST

This article on Composo is pretty eye-opening! It's wild how AI apps can be so powerful yet so unpredictable. Startups tackling LLM performance issues is a smart move—businesses need that reliability. Curious to see how this tech evolves! 😎

DouglasMartínez
DouglasMartínez 2025年8月16日 16:00:59 JST

This article on Composo is pretty cool! It's wild how AI apps can be so powerful yet so unpredictable. Nice to see startups tackling the performance monitoring side—hope it makes LLMs more reliable for businesses! 😎

JackCarter
JackCarter 2025年8月4日 15:48:52 JST

This article on Composo is super insightful! It’s wild how LLMs are so powerful yet so unpredictable. Excited to see startups tackling this to make AI apps more reliable! 😎

JohnTaylor
JohnTaylor 2025年7月28日 10:19:30 JST

This article on Composo is pretty eye-opening! It's wild how AI apps can be so powerful yet so unpredictable. I wonder how startups like this will tackle the chaos of LLMs in real-world use. 🤔 Anyone else curious about the future of AI monitoring?

JoseJackson
JoseJackson 2025年7月28日 10:19:05 JST

This article on Composo is pretty eye-opening! It's cool to see startups tackling the messy side of AI apps. I wonder how they handle the unpredictability of LLMs in real-time enterprise settings. 🤔 Anyone tried their tools yet?

OR