Hogar
Alibaba presenta Wan2.7-Image para poner fin a la era de los rostros genéricos generados por IA
El equipo oficial de modelos a gran escala de Ali ha lanzado hoy el modelo unificado de generación y edición de imágenes Wan2.7-Image. Este modelo supone un salto cualitativo con respecto a su predecesor en cuanto a personalización de retratos, control del color y representación de textos largos, con el objetivo de superar la «uniformidad» genérica que suele observarse en los elementos visuales generados por IA.
El modelo ya está disponible a través de la API en la plataforma BaiLian de Alibaba Cloud y también está abierto para pruebas públicas en el sitio web de WanXiang.

Mejoras principales: «Escultura facial» virtual y control preciso del color
Wan2.7-Image introduce varias características diferenciadas y líderes en el sector que amplían significativamente las posibilidades creativas:
Rostros únicos para cada sujeto: cuenta con capacidades mejoradas de «esculpido facial» virtual. Los usuarios pueden controlar con precisión la estructura ósea, la forma de los ojos (como los ojos almendrados o de fénix) y otros detalles faciales mediante indicaciones de texto, eliminando de forma efectiva los rostros estandarizados generados por IA.
Paleta de colores de precisión: incorpora por primera vez un control avanzado del color. Los usuarios pueden extraer proporciones de color de imágenes de referencia para replicar con precisión tonos específicos —como el amarillo vibrante de Van Gogh o el azul frío de Picasso— en nuevas creaciones.
Renderización de texto ultralargo de 3K tokens: aborda los problemas habituales de la generación de texto por IA, con soporte para hasta 12 idiomas. El modelo puede renderizar texto complejo, tablas o fórmulas que abarquen una página A4 completa con calidad lista para imprimir.
En el ámbito de la edición de imágenes, Wan2.7-Image estrena una función de «edición interactiva». Los usuarios pueden simplemente seleccionar un área precisa para añadir, alinear, mover o incluso realizar sustituciones lógicas a nivel de píxel, como cambiar cubitos de hielo por frutas conservando perfectamente la iluminación original de la escena.

Además, el modelo permite generar conjuntos coherentes de hasta 12 imágenes, manteniendo una alta consistencia en el estilo y las características del sujeto en diferentes escenas, lo que resulta ideal para retratos de grupo o combinaciones coordinadas de productos.
Ali explica que Wan2.7-Image emplea una arquitectura unificada tanto para la generación como para la comprensión. Al lograr el mapeo semántico dentro de un espacio latente compartido, el modelo va más allá de adivinar patrones de píxeles y desarrolla una comprensión semántica subyacente genuina.
Con su lanzamiento previsto para el panorama de la creación visual de 2026, Wan2.7-Image marca un cambio en la generación de imágenes mediante IA: de la «selección aleatoria» al control de precisión de «nivel industrial». Esta capacidad de edición de alta fidelidad reducirá drásticamente las barreras para la creación de contenido profesional, ya sea para storyboards de películas, publicidad de comercio electrónico o transformaciones en redes sociales.
Artículo relacionado
Aspectos destacados del documento de oferta pública inicial de SpaceX: las ambiciones de expansión en internet por satélite y inteligencia artificial
En su declaración de registro S-1 presentada antes de lo que se espera sea su oferta pública inicial, SpaceX reveló recientemente una serie de impresionantes indicadores comerciales que destacan su sólida posición en las comunicaciones aeroespaciales
Alibaba Tuhao M890 debuta con un triple rendimiento, marcando el inicio de una nueva era de agentes full-stack para modelos de inferencia basados en chips y nube.
El 20 de mayo de 2026, en la Cumbre de Alibaba Cloud, esta compañía anunció la finalización de una actualización del sistema tecnológico completo diseñado para la era de los agentes inteligentes. Esta transformación reconfiguró todo el proceso, desde
Pentium 4 Revival: Una CPU de 20 años de antigüedad ejecuta el modelo grande Meta Llama 3
Recientemente, el canal técnico de YouTube Fully Buffered llevó a cabo un experimento impresionante y riguroso: lograron ejecutar con éxito el último modelo grande de Meta, Llama 3.2 3B, en un procesador Pentium 4 641, un chip lanzado en 2006.Esta p
Recomendaciones de temas especiales relacionados
comentario (0)
0/500
El equipo oficial de modelos a gran escala de Ali ha lanzado hoy el modelo unificado de generación y edición de imágenes Wan2.7-Image. Este modelo supone un salto cualitativo con respecto a su predecesor en cuanto a personalización de retratos, control del color y representación de textos largos, con el objetivo de superar la «uniformidad» genérica que suele observarse en los elementos visuales generados por IA.
El modelo ya está disponible a través de la API en la plataforma BaiLian de Alibaba Cloud y también está abierto para pruebas públicas en el sitio web de WanXiang.

Mejoras principales: «Escultura facial» virtual y control preciso del color
Wan2.7-Image introduce varias características diferenciadas y líderes en el sector que amplían significativamente las posibilidades creativas:
Rostros únicos para cada sujeto: cuenta con capacidades mejoradas de «esculpido facial» virtual. Los usuarios pueden controlar con precisión la estructura ósea, la forma de los ojos (como los ojos almendrados o de fénix) y otros detalles faciales mediante indicaciones de texto, eliminando de forma efectiva los rostros estandarizados generados por IA.
Paleta de colores de precisión: incorpora por primera vez un control avanzado del color. Los usuarios pueden extraer proporciones de color de imágenes de referencia para replicar con precisión tonos específicos —como el amarillo vibrante de Van Gogh o el azul frío de Picasso— en nuevas creaciones.
Renderización de texto ultralargo de 3K tokens: aborda los problemas habituales de la generación de texto por IA, con soporte para hasta 12 idiomas. El modelo puede renderizar texto complejo, tablas o fórmulas que abarquen una página A4 completa con calidad lista para imprimir.
En el ámbito de la edición de imágenes, Wan2.7-Image estrena una función de «edición interactiva». Los usuarios pueden simplemente seleccionar un área precisa para añadir, alinear, mover o incluso realizar sustituciones lógicas a nivel de píxel, como cambiar cubitos de hielo por frutas conservando perfectamente la iluminación original de la escena.

Además, el modelo permite generar conjuntos coherentes de hasta 12 imágenes, manteniendo una alta consistencia en el estilo y las características del sujeto en diferentes escenas, lo que resulta ideal para retratos de grupo o combinaciones coordinadas de productos.
Ali explica que Wan2.7-Image emplea una arquitectura unificada tanto para la generación como para la comprensión. Al lograr el mapeo semántico dentro de un espacio latente compartido, el modelo va más allá de adivinar patrones de píxeles y desarrolla una comprensión semántica subyacente genuina.
Con su lanzamiento previsto para el panorama de la creación visual de 2026, Wan2.7-Image marca un cambio en la generación de imágenes mediante IA: de la «selección aleatoria» al control de precisión de «nivel industrial». Esta capacidad de edición de alta fidelidad reducirá drásticamente las barreras para la creación de contenido profesional, ya sea para storyboards de películas, publicidad de comercio electrónico o transformaciones en redes sociales.
Aspectos destacados del documento de oferta pública inicial de SpaceX: las ambiciones de expansión en internet por satélite y inteligencia artificial
En su declaración de registro S-1 presentada antes de lo que se espera sea su oferta pública inicial, SpaceX reveló recientemente una serie de impresionantes indicadores comerciales que destacan su sólida posición en las comunicaciones aeroespaciales
Alibaba Tuhao M890 debuta con un triple rendimiento, marcando el inicio de una nueva era de agentes full-stack para modelos de inferencia basados en chips y nube.
El 20 de mayo de 2026, en la Cumbre de Alibaba Cloud, esta compañía anunció la finalización de una actualización del sistema tecnológico completo diseñado para la era de los agentes inteligentes. Esta transformación reconfiguró todo el proceso, desde
Pentium 4 Revival: Una CPU de 20 años de antigüedad ejecuta el modelo grande Meta Llama 3
Recientemente, el canal técnico de YouTube Fully Buffered llevó a cabo un experimento impresionante y riguroso: lograron ejecutar con éxito el último modelo grande de Meta, Llama 3.2 3B, en un procesador Pentium 4 641, un chip lanzado en 2006.Esta p











