La IA Wan2.7-Image de Alibaba genera rostros personalizados y redacta ensayos
Hoy, Alibaba ha presentado oficialmente su modelo unificado de gran tamaño para la generación y edición de imágenes, Wan2.7-Image. Este modelo no solo supone un salto cualitativo en la calidad visual, sino que también supera las limitaciones tradicionales de la generación de imágenes mediante IA, como los «rostros genéricos» y la «desalineación de las instrucciones», gracias a una mejora integral de sus capacidades.
Adiós a los rostros generados por IA: entramos en la era de «una persona, un rostro»
Wan2.7-Image mejora significativamente su función de personalización de personajes virtuales. Los usuarios pueden personalizar todo, desde la estructura ósea y los ojos hasta los rasgos faciales más sutiles, controlando con precisión rasgos específicos como una cara ovalada, ojos de fénix o cuencas oculares profundas. Este avance va más allá de la uniformidad mecánica de los retratos de IA del pasado, permitiendo una verdadera expresión personal.

Función «Paleta de colores» y renderización de texto con «calidad de impresión»
En cuanto a la expresión artística, el modelo ahora admite una función de «paleta de colores». Esto permite a los usuarios extraer la composición cromática de una imagen de referencia —como la serie roja de Matisse o la serie amarilla de Van Gogh— con un solo clic y aplicarla con precisión a nuevas creaciones. Además, Wan2.7-Image destaca en la representación de textos largos, admitiendo entradas de hasta 3000 tokens. Puede generar de forma estable una página A4 completa de contenido que contenga fórmulas y tablas complejas, cumpliendo con los estándares de calidad de impresión en los 12 idiomas admitidos.

Edición interactiva y coherencia entre temas
El modelo cuenta con potentes capacidades de edición interactiva, que permiten alinear, mover o sustituir elementos mediante una selección precisa. Por ejemplo, los usuarios pueden seleccionar caracteres en una imagen para intercambiar sus posiciones o sustituir cubitos de hielo por fruta, logrando un control a nivel de píxel. Al mismo tiempo, el modelo admite la coherencia entre múltiples temas en hasta 9 imágenes, manteniendo un estilo y unas características uniformes al generar grupos de chicas generados por IA o conjuntos de muebles.

Avances tecnológicos fundamentales y aplicaciones industriales
Wan2.7-Image emplea una arquitectura unificada líder tanto para la generación como para la comprensión, logrando un mapeo semántico dentro de un espacio latente compartido. Esto significa que el modelo ya no se limita a adivinar texto para hacer coincidir píxeles, sino que posee una comprensión semántica fundamental. El modelo se ha lanzado junto con la versión Wan2.7-Image-pro, que ofrece una composición más estable y una comprensión precisa.

Este modelo se aplica ahora ampliamente en la producción de vídeos de formato corto (un actor interpretando múltiples papeles), la publicidad de comercio electrónico (una imagen de modelo para múltiples usos), la educación, la investigación y el entretenimiento social. Los usuarios pueden acceder a la API a través de la plataforma BaiLian de Alibaba Cloud o probarla directamente en el sitio web oficial de Wanxiang .
Artículo relacionado
DeepL, conocida por la traducción de textos, se centra ahora en la traducción de voz
DeepL, una empresa de traducción conocida principalmente por sus herramientas de texto, ha lanzado hoy un paquete de traducción de voz a voz diseñado para situaciones como reuniones, conversaciones po
Las notas de las reuniones de Talat generadas por IA se guardan en tu dispositivo, no en la nube
Granola, la aplicación para tomar notas basada en IA valorada en 250 millones de dólares, ha ganado popularidad entre los fundadores de empresas tecnológicas y los inversores de capital riesgo. Sin em
El nuevo Roewe i6 sale al mercado por 659 000 yuanes, equipado con un procesador Snapdragon 8155 y el modelo de gran capacidad de Doubao
SAIC Roewe ha presentado hoy el nuevo Roewe i6, un sedán compacto que adopta plenamente el lenguaje visual del Roewe D7. Su característica parrilla grande y vertical y la barra luminosa horizontal se
Recomendaciones de temas especiales relacionados
comentario (0)
0/500
Hoy, Alibaba ha presentado oficialmente su modelo unificado de gran tamaño para la generación y edición de imágenes, Wan2.7-Image. Este modelo no solo supone un salto cualitativo en la calidad visual, sino que también supera las limitaciones tradicionales de la generación de imágenes mediante IA, como los «rostros genéricos» y la «desalineación de las instrucciones», gracias a una mejora integral de sus capacidades.
Adiós a los rostros generados por IA: entramos en la era de «una persona, un rostro»
Wan2.7-Image mejora significativamente su función de personalización de personajes virtuales. Los usuarios pueden personalizar todo, desde la estructura ósea y los ojos hasta los rasgos faciales más sutiles, controlando con precisión rasgos específicos como una cara ovalada, ojos de fénix o cuencas oculares profundas. Este avance va más allá de la uniformidad mecánica de los retratos de IA del pasado, permitiendo una verdadera expresión personal.

Función «Paleta de colores» y renderización de texto con «calidad de impresión»
En cuanto a la expresión artística, el modelo ahora admite una función de «paleta de colores». Esto permite a los usuarios extraer la composición cromática de una imagen de referencia —como la serie roja de Matisse o la serie amarilla de Van Gogh— con un solo clic y aplicarla con precisión a nuevas creaciones. Además, Wan2.7-Image destaca en la representación de textos largos, admitiendo entradas de hasta 3000 tokens. Puede generar de forma estable una página A4 completa de contenido que contenga fórmulas y tablas complejas, cumpliendo con los estándares de calidad de impresión en los 12 idiomas admitidos.

Edición interactiva y coherencia entre temas
El modelo cuenta con potentes capacidades de edición interactiva, que permiten alinear, mover o sustituir elementos mediante una selección precisa. Por ejemplo, los usuarios pueden seleccionar caracteres en una imagen para intercambiar sus posiciones o sustituir cubitos de hielo por fruta, logrando un control a nivel de píxel. Al mismo tiempo, el modelo admite la coherencia entre múltiples temas en hasta 9 imágenes, manteniendo un estilo y unas características uniformes al generar grupos de chicas generados por IA o conjuntos de muebles.

Avances tecnológicos fundamentales y aplicaciones industriales
Wan2.7-Image emplea una arquitectura unificada líder tanto para la generación como para la comprensión, logrando un mapeo semántico dentro de un espacio latente compartido. Esto significa que el modelo ya no se limita a adivinar texto para hacer coincidir píxeles, sino que posee una comprensión semántica fundamental. El modelo se ha lanzado junto con la versión Wan2.7-Image-pro, que ofrece una composición más estable y una comprensión precisa.

Este modelo se aplica ahora ampliamente en la producción de vídeos de formato corto (un actor interpretando múltiples papeles), la publicidad de comercio electrónico (una imagen de modelo para múltiples usos), la educación, la investigación y el entretenimiento social. Los usuarios pueden acceder a la API a través de la
DeepL, conocida por la traducción de textos, se centra ahora en la traducción de voz
DeepL, una empresa de traducción conocida principalmente por sus herramientas de texto, ha lanzado hoy un paquete de traducción de voz a voz diseñado para situaciones como reuniones, conversaciones po
Las notas de las reuniones de Talat generadas por IA se guardan en tu dispositivo, no en la nube
Granola, la aplicación para tomar notas basada en IA valorada en 250 millones de dólares, ha ganado popularidad entre los fundadores de empresas tecnológicas y los inversores de capital riesgo. Sin em
El nuevo Roewe i6 sale al mercado por 659 000 yuanes, equipado con un procesador Snapdragon 8155 y el modelo de gran capacidad de Doubao
SAIC Roewe ha presentado hoy el nuevo Roewe i6, un sedán compacto que adopta plenamente el lenguaje visual del Roewe D7. Su característica parrilla grande y vertical y la barra luminosa horizontal se





Hogar






