Apple、単一画像を3Dに変換するLiToモデルを発表。照明精度が37%向上
AppleのAI研究チームは最近、LiTo(Surface Light Field Tokenization)という画期的な3D生成モデルを発表しました。この技術は、たった1枚の2D画像から、リアルな照明効果を備えた完全かつ高精細な3Dオブジェクトを生成することで、3D再構築における核心的な課題に取り組んでいます。

LiToの革新性は、新しい潜在空間と統一された3D表現フレームワークに集約されています:
効率的なエンコーディング:複雑な表面光場データをコンパクトなベクトルセットに圧縮し、オブジェクトの幾何学的形状と光との相互作用を数学的に捉えます。
双方向アーキテクチャ:エンコーダー・デコーダー構造を採用し、エンコーダーが基礎的な幾何学的特徴と外観特徴を抽出します。その後、デコーダーがこのデータを再構築し、鏡面反射やフレネル反射といった高度な視覚効果を正確にレンダリングします。
性能:あらゆる視点における比類なき照明の一貫性
LiToは、数千のオブジェクトを含む包括的な3Dデータセットを用いて学習されました。主な実験結果は以下の通りです:
方向バイアスの排除:LiToはカメラ座標系に厳密に従い、他のモデルで一般的な向きに関する誤差を補正します。
最先端の評価指標:マルチビュー照明の一貫性において、LiToは従来の最先端モデルであるTRELLISを約37%上回っています。
この進歩により、高品質な3Dコンテンツ制作のハードルが大幅に下がります。Vision Proのようなデバイスを含む、将来の拡張現実(AR)および空間コンピューティングプラットフォーム向けに、優れたアセット生成を実現する準備が整っています。
関連記事
スペースXのIPO申請書のハイライト:衛星インターネット事業とAI分野での事業拡大への意欲
SpaceXが計画しているIPOに先立って提出したS-1登録書類の中で、同社は航空宇宙通信および人工知能分野における強力な実力を示す数々の優れた業績指標を公開しました:Starlinkの加入者数が1,000万人を超える:2026年第1四半期までに、世界中で有料Starlinkサービスを利用している加入者数は1,030万人に達し、過去1年間で倍増しました。この成長は、世界最大の低地球軌道衛星群を擁するSpaceXがブロードバンドおよびモバイル通信分野でリーダーシップを発揮していることを示していま
アリババのTuhao M890が三重の性能を発揮し、チップ・クラウド・モデル・インフェルンスにおけるフルスタックエージェントの時代を切り開く
2026年5月20日、アリババクラウドサミットにおいて、アリババクラウドは「エージェント時代」向けに設計されたフルスタック技術システムのアップグレードが完了したことを発表しました。この変革により、基盤チップやクラウドプラットフォームからモデル、推論ソリューションに至るまで、全てのパイプラインが再構築されました。これにより、アリババクラウドは24時間365日連続運用が可能な大規模エージェントを支える「AIファクトリー」としての地位を確立し、人間ユーザーへの直接的なサービス提供を超えた存在となりまし
ペンティウム4の復活:20年前に登場したCPUでMeta Llama 3の大規模モデルを実行する
最近、YouTubeのテクノロジーチャンネルFully Bufferedは、印象的で徹底的な実験を行いました。2006年に発売されたPentium 4 641プロセッサ上で、Meta社の最新大型モデルLlama 3.2 3Bを正常に動作させることに成功したのです。このテストは、現代の人工知能技術を20年前のハードウェアと対決させるものであり、LLMの基本的な互換性の限界を明らかにするとともに、多くの視聴者に「AI時代のムーアの法則がどのようにして異なる世代間で機能しているのか」と考えさせるもの
関連特集おすすめ
コメント (1)
0/500
AppleのAI研究チームは最近、LiTo(Surface Light Field Tokenization)という画期的な3D生成モデルを発表しました。この技術は、たった1枚の2D画像から、リアルな照明効果を備えた完全かつ高精細な3Dオブジェクトを生成することで、3D再構築における核心的な課題に取り組んでいます。

LiToの革新性は、新しい潜在空間と統一された3D表現フレームワークに集約されています:
効率的なエンコーディング:複雑な表面光場データをコンパクトなベクトルセットに圧縮し、オブジェクトの幾何学的形状と光との相互作用を数学的に捉えます。
双方向アーキテクチャ:エンコーダー・デコーダー構造を採用し、エンコーダーが基礎的な幾何学的特徴と外観特徴を抽出します。その後、デコーダーがこのデータを再構築し、鏡面反射やフレネル反射といった高度な視覚効果を正確にレンダリングします。
性能:あらゆる視点における比類なき照明の一貫性
LiToは、数千のオブジェクトを含む包括的な3Dデータセットを用いて学習されました。主な実験結果は以下の通りです:
方向バイアスの排除:LiToはカメラ座標系に厳密に従い、他のモデルで一般的な向きに関する誤差を補正します。
最先端の評価指標:マルチビュー照明の一貫性において、LiToは従来の最先端モデルであるTRELLISを約37%上回っています。
この進歩により、高品質な3Dコンテンツ制作のハードルが大幅に下がります。Vision Proのようなデバイスを含む、将来の拡張現実(AR)および空間コンピューティングプラットフォーム向けに、優れたアセット生成を実現する準備が整っています。
スペースXのIPO申請書のハイライト:衛星インターネット事業とAI分野での事業拡大への意欲
SpaceXが計画しているIPOに先立って提出したS-1登録書類の中で、同社は航空宇宙通信および人工知能分野における強力な実力を示す数々の優れた業績指標を公開しました:Starlinkの加入者数が1,000万人を超える:2026年第1四半期までに、世界中で有料Starlinkサービスを利用している加入者数は1,030万人に達し、過去1年間で倍増しました。この成長は、世界最大の低地球軌道衛星群を擁するSpaceXがブロードバンドおよびモバイル通信分野でリーダーシップを発揮していることを示していま
アリババのTuhao M890が三重の性能を発揮し、チップ・クラウド・モデル・インフェルンスにおけるフルスタックエージェントの時代を切り開く
2026年5月20日、アリババクラウドサミットにおいて、アリババクラウドは「エージェント時代」向けに設計されたフルスタック技術システムのアップグレードが完了したことを発表しました。この変革により、基盤チップやクラウドプラットフォームからモデル、推論ソリューションに至るまで、全てのパイプラインが再構築されました。これにより、アリババクラウドは24時間365日連続運用が可能な大規模エージェントを支える「AIファクトリー」としての地位を確立し、人間ユーザーへの直接的なサービス提供を超えた存在となりまし
ペンティウム4の復活:20年前に登場したCPUでMeta Llama 3の大規模モデルを実行する
最近、YouTubeのテクノロジーチャンネルFully Bufferedは、印象的で徹底的な実験を行いました。2006年に発売されたPentium 4 641プロセッサ上で、Meta社の最新大型モデルLlama 3.2 3Bを正常に動作させることに成功したのです。このテストは、現代の人工知能技術を20年前のハードウェアと対決させるものであり、LLMの基本的な互換性の限界を明らかにするとともに、多くの視聴者に「AI時代のムーアの法則がどのようにして異なる世代間で機能しているのか」と考えさせるもの





家






