JD.com、AIの進展を推進する「JoyAI-LLM-Flash」モデルを発表

JD.comは2月14日、最新の大型言語モデル「JoyAI-LLM-Flash」をHugging Faceプラットフォーム上で公開した。このモデルは合計48億のパラメータを有し、推論時にはそのうち30億が活性化される。20兆のテキストトークンで事前学習されており、現代の知識の理解、論理的推論、プログラミングタスクにおいて高い能力を発揮する。
JoyAI-LLM-Flashは、ファイバーバンドル理論を強化学習に取り入れた革新的な最適化フレームワーク「FiberPO」を採用している。Muonオプティマイザーおよび高密度マルチトークン予測(MTP)技術と組み合わせることで、従来のモデルをスケールアップする際に生じがちな不安定性の課題を効果的に解決している。MTP非搭載版と比較してスループットが1.3倍から1.7倍に向上し、トレーニング効率と実用的な応用可能性の両方を大幅に向上させている。
このモデルは、40層からなるミクスチャー・オブ・エキスパート(MoE)アーキテクチャに基づいて構築されています。128Kトークンのコンテキスト長と129Kの語彙をサポートしており、JD.comにとって人工知能分野における大きな前進となります。
関連記事
Anthropic社の実験用AI「Claude」が、Eコマースのテストにおいて交渉と取引を完了した
人工知能(AI)が急速に進化する中、Anthropicは先週金曜日、「Project Deal」と呼ばれる社内実験をひっそりと開始し、EコマースにおけるAIの可能性を披露した。この実験では、同社のAIモデル「Claude」が、実際の金銭取引を伴うクローズドな市場環境において、購入、販売、価格交渉を自律的に行うよう設計された。実験の中核となったのは、Slack上に構築された社内マーケットプレイスであ
DeepSeek Code、まもなくリリースへ
AI技術の進展が加速する中、DeepSeekは今、まさに刺激的な転換点を迎えています。同社は最近、700億元を超える資金調達に成功したことを明らかにしました。経営陣は、目先の商業的利益よりも、画期的なAI研究への取り組みを重視する姿勢を強調しています。この戦略的転換は、新製品、とりわけ待望の「DeepSeek Code」の開発に全力を注ぐというDeepSeekの決意を示しています。DeepSeek
マスク氏の「Grok」:1.5兆のパラメータとカーソルコードの統合――ゲームチェンジャーか、それともブラフか?
イーロン・マスクがついに動き出した。AI開発競争において、OpenAIとAnthropicは加速している一方、xAIは出遅れているようだ。マスクはたびたび「Claude」に対抗する意向を表明してきたが、Grok4.Xシリーズへの度重なるアップデートにもかかわらず、結果は理論上は良好に見えても実用面では不十分であり、その差はほとんど縮まっていない。しかし、今回、彼には新たな切り札がある。マスクはX(
関連特集おすすめ
コメント (1)
0/500

JD.comは2月14日、最新の大型言語モデル「JoyAI-LLM-Flash」をHugging Faceプラットフォーム上で公開した。このモデルは合計48億のパラメータを有し、推論時にはそのうち30億が活性化される。20兆のテキストトークンで事前学習されており、現代の知識の理解、論理的推論、プログラミングタスクにおいて高い能力を発揮する。
JoyAI-LLM-Flashは、ファイバーバンドル理論を強化学習に取り入れた革新的な最適化フレームワーク「FiberPO」を採用している。Muonオプティマイザーおよび高密度マルチトークン予測(MTP)技術と組み合わせることで、従来のモデルをスケールアップする際に生じがちな不安定性の課題を効果的に解決している。MTP非搭載版と比較してスループットが1.3倍から1.7倍に向上し、トレーニング効率と実用的な応用可能性の両方を大幅に向上させている。
このモデルは、40層からなるミクスチャー・オブ・エキスパート(MoE)アーキテクチャに基づいて構築されています。128Kトークンのコンテキスト長と129Kの語彙をサポートしており、JD.comにとって人工知能分野における大きな前進となります。
Anthropic社の実験用AI「Claude」が、Eコマースのテストにおいて交渉と取引を完了した
人工知能(AI)が急速に進化する中、Anthropicは先週金曜日、「Project Deal」と呼ばれる社内実験をひっそりと開始し、EコマースにおけるAIの可能性を披露した。この実験では、同社のAIモデル「Claude」が、実際の金銭取引を伴うクローズドな市場環境において、購入、販売、価格交渉を自律的に行うよう設計された。実験の中核となったのは、Slack上に構築された社内マーケットプレイスであ
DeepSeek Code、まもなくリリースへ
AI技術の進展が加速する中、DeepSeekは今、まさに刺激的な転換点を迎えています。同社は最近、700億元を超える資金調達に成功したことを明らかにしました。経営陣は、目先の商業的利益よりも、画期的なAI研究への取り組みを重視する姿勢を強調しています。この戦略的転換は、新製品、とりわけ待望の「DeepSeek Code」の開発に全力を注ぐというDeepSeekの決意を示しています。DeepSeek
マスク氏の「Grok」:1.5兆のパラメータとカーソルコードの統合――ゲームチェンジャーか、それともブラフか?
イーロン・マスクがついに動き出した。AI開発競争において、OpenAIとAnthropicは加速している一方、xAIは出遅れているようだ。マスクはたびたび「Claude」に対抗する意向を表明してきたが、Grok4.Xシリーズへの度重なるアップデートにもかかわらず、結果は理論上は良好に見えても実用面では不十分であり、その差はほとんど縮まっていない。しかし、今回、彼には新たな切り札がある。マスクはX(





家






