Maison
Apple dévoile un modèle LiTo capable de convertir des images 2D en 3D, avec une précision d'éclairage améliorée de 37 %
L'équipe de recherche en IA d'Apple a récemment présenté un modèle de génération 3D révolutionnaire baptisé LiTo (Surface Light Field Tokenization). Cette technologie s'attaque à un défi majeur de la reconstruction 3D en générant des objets 3D complets et de haute fidélité, dotés d'un éclairage réaliste, à partir d'une seule image 2D.

L'innovation de LiTo repose sur un espace latent novateur et un cadre de représentation 3D unifié :
Codage efficace: il compresse les données complexes du champ lumineux de surface en ensembles vectoriels compacts, capturant mathématiquement la géométrie de l'objet et son interaction avec la lumière.
Architecture bidirectionnelle: à l'aide d'une structure encodeur-décodeur, l'encodeur extrait les caractéristiques géométriques et d'apparence fondamentales. Le décodeur reconstitue ensuite ces données, restituant avec précision des effets visuels avancés tels que les reflets spéculaires et les reflets de Fresnel.
Performances : une cohérence d'éclairage inégalée entre les vues
LiTo a été entraîné sur un ensemble de données 3D complet contenant des milliers d'objets. Les principaux résultats expérimentaux sont les suivants :
Élimination du biais directionnel: LiTo respecte strictement le système de coordonnées de la caméra, corrigeant ainsi les erreurs d'orientation courantes dans d'autres modèles.
Mesures de pointe: en matière de cohérence de l'éclairage multi-vues, LiTo surpasse le modèle de référence précédent, TRELLIS, d'environ 37 %.
Cette avancée réduit considérablement les obstacles à la création de contenu 3D de haute qualité. Elle est en passe d'offrir une génération de ressources supérieure pour les futures plateformes de réalité augmentée (RA) et d'informatique spatiale, y compris des appareils tels que le Vision Pro.
Article connexe
Alibaba Tuhao M890 fait ses débuts avec des performances triplées, marquant l’avènement d’une ère d’agents full-stack pour les modèles d’inference basés sur le cloud et les puces.
Le 20 mai 2026, lors du sommet Alibaba Cloud, la société a annoncé l’achèvement d’une mise à niveau complet de son système technologique, conçu pour l’ère des agents intelligents. Cette transformation a réorganisé l’ensemble de la chaîne de traitemen
Pentium 4 Revival : Un processeur vieux de 20 ans permet d’exécuter le modèle Meta Llama 3 Large
Récemment, la chaîne technique YouTube Fully Buffered a mené une expérience impressionnante et poussée : elle a réussi à faire fonctionner le dernier modèle de grande taille de Meta, Llama 3.2 3B, sur un processeur Pentium 4 641, un circuit électroni
Le district de Shangcheng à Hangzhou lance les premières “Dix Mesures d’Or” audiovisuelles de Zhejiang dans le cadre du programme AIGC, avec la création d’un fonds industriel de 5 milliards de yuans.
Le 16ème, la Conférence sur l’écosystème d’innovation de l’industrie audiovisuelle AIGC s’est tenue dans le district de Shangcheng à Hangzhou. Lors de cet événement, la province a dévoilé sa première politique spécifique pour l’industrie audiovisuell
Recommandations de sujets spéciaux liés
commentaires (1)
L'équipe de recherche en IA d'Apple a récemment présenté un modèle de génération 3D révolutionnaire baptisé LiTo (Surface Light Field Tokenization). Cette technologie s'attaque à un défi majeur de la reconstruction 3D en générant des objets 3D complets et de haute fidélité, dotés d'un éclairage réaliste, à partir d'une seule image 2D.

L'innovation de LiTo repose sur un espace latent novateur et un cadre de représentation 3D unifié :
Codage efficace: il compresse les données complexes du champ lumineux de surface en ensembles vectoriels compacts, capturant mathématiquement la géométrie de l'objet et son interaction avec la lumière.
Architecture bidirectionnelle: à l'aide d'une structure encodeur-décodeur, l'encodeur extrait les caractéristiques géométriques et d'apparence fondamentales. Le décodeur reconstitue ensuite ces données, restituant avec précision des effets visuels avancés tels que les reflets spéculaires et les reflets de Fresnel.
Performances : une cohérence d'éclairage inégalée entre les vues
LiTo a été entraîné sur un ensemble de données 3D complet contenant des milliers d'objets. Les principaux résultats expérimentaux sont les suivants :
Élimination du biais directionnel: LiTo respecte strictement le système de coordonnées de la caméra, corrigeant ainsi les erreurs d'orientation courantes dans d'autres modèles.
Mesures de pointe: en matière de cohérence de l'éclairage multi-vues, LiTo surpasse le modèle de référence précédent, TRELLIS, d'environ 37 %.
Cette avancée réduit considérablement les obstacles à la création de contenu 3D de haute qualité. Elle est en passe d'offrir une génération de ressources supérieure pour les futures plateformes de réalité augmentée (RA) et d'informatique spatiale, y compris des appareils tels que le Vision Pro.
Alibaba Tuhao M890 fait ses débuts avec des performances triplées, marquant l’avènement d’une ère d’agents full-stack pour les modèles d’inference basés sur le cloud et les puces.
Le 20 mai 2026, lors du sommet Alibaba Cloud, la société a annoncé l’achèvement d’une mise à niveau complet de son système technologique, conçu pour l’ère des agents intelligents. Cette transformation a réorganisé l’ensemble de la chaîne de traitemen
Pentium 4 Revival : Un processeur vieux de 20 ans permet d’exécuter le modèle Meta Llama 3 Large
Récemment, la chaîne technique YouTube Fully Buffered a mené une expérience impressionnante et poussée : elle a réussi à faire fonctionner le dernier modèle de grande taille de Meta, Llama 3.2 3B, sur un processeur Pentium 4 641, un circuit électroni
Le district de Shangcheng à Hangzhou lance les premières “Dix Mesures d’Or” audiovisuelles de Zhejiang dans le cadre du programme AIGC, avec la création d’un fonds industriel de 5 milliards de yuans.
Le 16ème, la Conférence sur l’écosystème d’innovation de l’industrie audiovisuelle AIGC s’est tenue dans le district de Shangcheng à Hangzhou. Lors de cet événement, la province a dévoilé sa première politique spécifique pour l’industrie audiovisuell











