エンタープライズAIのコスト:クロードモデルはGPTより20~30%高い導入価格
異なるモデルファミリーが異なるトークナイザーを採用している可能性があることは広く知られている。しかし、実際のトークン化プロセスがこれらのシステム間でどのように異なるかについての研究は限られています。同じ入力テキストに対して、すべてのトークナイザーは同じ数のトークンを生成するのでしょうか?そうでない場合、その違いはどの程度大きいのでしょうか。また、その違いは実用上どのような意味を持つのでしょうか。
この記事では、トークン化のばらつきが現実にもたらす影響を調べることで、これらの疑問を解決します。2つの主要なモデル・ファミリーの比較分析を紹介する:OpenAIのChatGPTとAnthropicのClaudeです。両者の「トークン単価」は非常に競争力があるように見えますが、実際にテストしてみると、AnthropicのモデルはGPTのモデルよりも20~30%高いことがわかりました。

API価格 - クロード3.5ソネットとGPT-4oの比較
2024年6月現在、これら2つの先進フロンティア・モデルの価格体系は拮抗しています。AnthropicのClaude 3.5 SonnetとOpenAIのGPT-4oは、出力トークンのコストが同じである一方、Claude 3.5 Sonnetは入力トークンに40%の割引を提供しています。

出典バンテージ
トークン化の隠れた非効率性
Anthropicの方が入力トークン率が低いにもかかわらず、固定プロンプトセットを使った実験では、GPT-4oは一貫してClaude Sonnet-3.5よりも経済的な全体コストを実現していることが実証されています。
この不一致はなぜでしょうか?
Anthropicのトークナイザーは通常、OpenAIのアプローチと比較して、同一の入力テキストをより多くのトークンに分割します。つまり、同じプロンプトに対して、AnthropicのモデルはOpenAIの同等品よりもかなり多いトークン数を生成します。その結果、クロード3.5ソネットのトークンあたりの入力コストは低く見えますが、トークン化の量が増えるため、実用的な実装ではこの節約分が相殺され、結果として総費用が高くなります。
この隠れたコストは、Anthropicのトークンエンコーディング手法に起因するもので、同等のコンテンツを表現するために、より多くのトークンを必要とすることがよくあります。トークン数の増加は、運用コストとコンテキストウィンドウの効率性の両方に大きな影響を与えます。
ドメイン固有のトークン化のバリエーション
Anthropicのトークナイザーは、異なるコンテンツドメインを様々な効率で処理するため、OpenAIのモデルと比較してトークン数の増加が一貫していません。AI研究コミュニティは、同様のトークン化の格差を文書化しています。私たちは、3つの著名なドメインで検証しました:英語の記事、Pythonのコード、数学のコンテンツです。
ドメイン モデル入力 GPTトークン クロード・トークン トークン・オーバーヘッド 英語記事
トークン化の違いによる実用上のその他の影響直接的なコストだけでなく、トークナイザーの効率の悪さは間接的にコンテキストウィンドウの使用率に影響します。AnthropicモデルはOpenAIの128Kに対して200Kのトークンコンテキストウィンドウを宣伝していますが、トークン化の冗長性はAnthropicモデルの有効な使用可能領域を実際に減少させる可能性があります。このため、宣伝されているコンテキストウィンドウのサイズと、実際の有効な容量との間に乖離が生じる可能性があります。
トークン化の実装の詳細
GPTモデルはByte Pair Encoding (BPE)を利用します。BPEは頻繁に出現する文字ペアを組み合わせてトークンを形成します。最新のGPTモデルでは、特にオープンソースのo200k_baseトークナイザーを採用しています。tiktokenトークナイザー内でGPT-4oが使用している実際のトークンは公開されています。
JSON {#reasoning "o1-xxx":"o200k_base","o3-xxx":"o200k_base",# chat"chatgpt-4o-":"o200k_base","gpt-4o-xxx":"o200k_base",# 例: gpt-4o-2024-05-13 "gpt-4-xxx":"cl100k_base",#例えば、gpt-4-0314など、さらにgpt-4-32k "gpt-3.5-turbo-xxx":"cl100k_base",#例えば、gpt-3.5-turbo-0301, -0401など。}
残念ながら、Anthropicのトークナイゼーションアプローチは、GPTのトークナイザーほど容易に利用できないため、透明性が低いままです。Anthropicは2024年12月にトークン・カウントAPIを導入したが、この機能は2025年以降のバージョンでは廃止された。
Latenodeによると、"Anthropicは、OpenAIのGPT-4の100,261のバリエーションと比較して、わずか65,000のトークンのバリエーションを持つユニークなトークナイザーを採用しています。"公開されているColabノートブックには、GPTとClaudeモデルのトークン化の違いを分析するためのPythonコードが含まれています。一般に公開されている一般的なトークナイザーとのインタフェースを持つ別のツールも、我々の調査結果を裏付けている。
AI企業にとって、実際のモデルAPIを呼び出すことなくトークン数を正確に見積もる能力は、コスト予測と予算編成に不可欠です。
本質的な洞察
- Anthropicの競争力のある価格設定には、隠れた費用が含まれています:
Claude 3.5 Sonnetは、GPT-4oより40%低いインプットトークンコストを提供していますが、テキストトークナイゼーションの根本的な違いにより、この見かけ上の優位性は欺瞞的である可能性があります。 - トークン化の隠れた非効率性:
人間工学的モデルは、本質的に多くのトークンを生成します。大量のテキストを処理する企業にとって、このばらつきを理解することは、導入コストを正確に評価する上で非常に重要です。 - ドメイン固有のトークン化のパフォーマンス
OpenAIモデルとAnthropicモデルのどちらかを選択する際には、典型的な入力コンテンツを慎重に評価してください。自然言語タスクではコストの差はわずかかもしれませんが、技術的または構造化されたドメインではAnthropicモデルの方が大幅にコストが高くなる可能性があります。 - 効果的なコンテキストウィンドウの容量
Anthropicのトークン化は冗長であるため、200KのコンテキストウィンドウはOpenAIの128Kよりも実用的な容量が少ない可能性があります。
Anthropicは、VentureBeatのコメント要求に対して、記事公開時点では回答していない。回答があれば、この記事を更新します。
関連記事
サティヤ・ナデラ、新たなOpenAIとの契約を活用する準備ができている
水曜日に、ウォール・ストリートのアナリストがマイクロソフトのCEOであるサティヤ・ナデラ氏に直接尋ねました。改正されたOpenAIとの提携関係が同社の財務状況にどのような影響を与えるのかと。ナデラ氏はこの新しい協定を「皆にとっての勝利」と表現しました。「OpenAIとの提携については満足しています。私は常にどんな提携でもウィンウィンの関係を築くことに重点を置いています。そうすることで、長期的に良いパートナーシップを維持できるからです。」彼は、マイクロソフトが依然としてOpenAIの知的財産、
OpenAIは、公的基金、ロボット税、週4日勤務制を柱とするAI経済の構想を提示した
各国政府が超知能機械による経済的影響への対応に苦慮する中、OpenAIは「知能の時代」において富と労働がどのように再構築されるべきかを概説した一連の政策提言を発表した。その構想は、公的資産基金や社会安全網の拡充といった伝統的な左派的な仕組みと、根本的に資本主義的で市場主導型の経済枠組みとを融合させたものである。OpenAIの提案は本質的に「要望リスト」に相当し、人工知能が労働と経済を変革する中で、
グレッグ・ブロックマンが、イーロン・マスクがOpenAIを去った経緯を明かす
2017年8月下旬、当時まだ小規模な非営利研究機関だったOpenAIの主要メンバーは、自社の技術を商用化し、汎用人工知能(AGI)の実現に必要な資金を調達するために、営利法人をどのように設立すべきかについて協議した。イーロン・マスクは同社の完全な支配権を要求しており、ちょうどその直前に共同創業者たち一人ひとりにテスラ「モデル3」を贈っていた。CTOのグレッグ・ブロックマンは、マスクとサム・アルトマ
関連特集おすすめ
コメント (0)
0/500
異なるモデルファミリーが異なるトークナイザーを採用している可能性があることは広く知られている。しかし、実際のトークン化プロセスがこれらのシステム間でどのように異なるかについての研究は限られています。同じ入力テキストに対して、すべてのトークナイザーは同じ数のトークンを生成するのでしょうか?そうでない場合、その違いはどの程度大きいのでしょうか。また、その違いは実用上どのような意味を持つのでしょうか。
この記事では、トークン化のばらつきが現実にもたらす影響を調べることで、これらの疑問を解決します。2つの主要なモデル・ファミリーの比較分析を紹介する:OpenAIのChatGPTとAnthropicのClaudeです。両者の「トークン単価」は非常に競争力があるように見えますが、実際にテストしてみると、AnthropicのモデルはGPTのモデルよりも20~30%高いことがわかりました。

API価格 - クロード3.5ソネットとGPT-4oの比較
2024年6月現在、これら2つの先進フロンティア・モデルの価格体系は拮抗しています。AnthropicのClaude 3.5 SonnetとOpenAIのGPT-4oは、出力トークンのコストが同じである一方、Claude 3.5 Sonnetは入力トークンに40%の割引を提供しています。

出典バンテージ
トークン化の隠れた非効率性
Anthropicの方が入力トークン率が低いにもかかわらず、固定プロンプトセットを使った実験では、GPT-4oは一貫してClaude Sonnet-3.5よりも経済的な全体コストを実現していることが実証されています。
この不一致はなぜでしょうか?
Anthropicのトークナイザーは通常、OpenAIのアプローチと比較して、同一の入力テキストをより多くのトークンに分割します。つまり、同じプロンプトに対して、AnthropicのモデルはOpenAIの同等品よりもかなり多いトークン数を生成します。その結果、クロード3.5ソネットのトークンあたりの入力コストは低く見えますが、トークン化の量が増えるため、実用的な実装ではこの節約分が相殺され、結果として総費用が高くなります。
この隠れたコストは、Anthropicのトークンエンコーディング手法に起因するもので、同等のコンテンツを表現するために、より多くのトークンを必要とすることがよくあります。トークン数の増加は、運用コストとコンテキストウィンドウの効率性の両方に大きな影響を与えます。
ドメイン固有のトークン化のバリエーション
Anthropicのトークナイザーは、異なるコンテンツドメインを様々な効率で処理するため、OpenAIのモデルと比較してトークン数の増加が一貫していません。AI研究コミュニティは、同様のトークン化の格差を文書化しています。私たちは、3つの著名なドメインで検証しました:英語の記事、Pythonのコード、数学のコンテンツです。
| ドメイン | モデル入力 | GPTトークン | クロード・トークン | トークン・オーバーヘッド |
| 英語記事 | トークン化の違いによる実用上のその他の影響直接的なコストだけでなく、トークナイザーの効率の悪さは間接的にコンテキストウィンドウの使用率に影響します。AnthropicモデルはOpenAIの128Kに対して200Kのトークンコンテキストウィンドウを宣伝していますが、トークン化の冗長性はAnthropicモデルの有効な使用可能領域を実際に減少させる可能性があります。このため、宣伝されているコンテキストウィンドウのサイズと、実際の有効な容量との間に乖離が生じる可能性があります。 トークン化の実装の詳細GPTモデルはByte Pair Encoding (BPE)を利用します。BPEは頻繁に出現する文字ペアを組み合わせてトークンを形成します。最新のGPTモデルでは、特にオープンソースのo200k_baseトークナイザーを採用しています。tiktokenトークナイザー内でGPT-4oが使用している実際のトークンは公開されています。 残念ながら、Anthropicのトークナイゼーションアプローチは、GPTのトークナイザーほど容易に利用できないため、透明性が低いままです。Anthropicは2024年12月にトークン・カウントAPIを導入したが、この機能は2025年以降のバージョンでは廃止された。 Latenodeによると、"Anthropicは、OpenAIのGPT-4の100,261のバリエーションと比較して、わずか65,000のトークンのバリエーションを持つユニークなトークナイザーを採用しています。"公開されているColabノートブックには、GPTとClaudeモデルのトークン化の違いを分析するためのPythonコードが含まれています。一般に公開されている一般的なトークナイザーとのインタフェースを持つ別のツールも、我々の調査結果を裏付けている。 本質的な洞察
Anthropicは、VentureBeatのコメント要求に対して、記事公開時点では回答していない。回答があれば、この記事を更新します。 |
サティヤ・ナデラ、新たなOpenAIとの契約を活用する準備ができている
水曜日に、ウォール・ストリートのアナリストがマイクロソフトのCEOであるサティヤ・ナデラ氏に直接尋ねました。改正されたOpenAIとの提携関係が同社の財務状況にどのような影響を与えるのかと。ナデラ氏はこの新しい協定を「皆にとっての勝利」と表現しました。「OpenAIとの提携については満足しています。私は常にどんな提携でもウィンウィンの関係を築くことに重点を置いています。そうすることで、長期的に良いパートナーシップを維持できるからです。」彼は、マイクロソフトが依然としてOpenAIの知的財産、
OpenAIは、公的基金、ロボット税、週4日勤務制を柱とするAI経済の構想を提示した
各国政府が超知能機械による経済的影響への対応に苦慮する中、OpenAIは「知能の時代」において富と労働がどのように再構築されるべきかを概説した一連の政策提言を発表した。その構想は、公的資産基金や社会安全網の拡充といった伝統的な左派的な仕組みと、根本的に資本主義的で市場主導型の経済枠組みとを融合させたものである。OpenAIの提案は本質的に「要望リスト」に相当し、人工知能が労働と経済を変革する中で、
グレッグ・ブロックマンが、イーロン・マスクがOpenAIを去った経緯を明かす
2017年8月下旬、当時まだ小規模な非営利研究機関だったOpenAIの主要メンバーは、自社の技術を商用化し、汎用人工知能(AGI)の実現に必要な資金を調達するために、営利法人をどのように設立すべきかについて協議した。イーロン・マスクは同社の完全な支配権を要求しており、ちょうどその直前に共同創業者たち一人ひとりにテスラ「モデル3」を贈っていた。CTOのグレッグ・ブロックマンは、マスクとサム・アルトマ





家






