Hogar
Ant Group presenta Ling-2.6-flash, una versión de código abierto y la última incorporación a la familia de modelos Baoling
La serie de modelos a gran escala Baoling de Ant Group ha recibido hoy una importante actualización, y Ling-2.6-flash ya está oficialmente disponible para desarrolladores de todo el mundo. Con el fin de adaptarse a diferentes entornos de hardware y reducir las barreras de implementación, este modelo también ha lanzado varias versiones de precisión, entre las que se incluyen BF16, FP8 e INT4, lo que ofrece a los desarrolladores opciones de inferencia más flexibles.
Como modelo Instruct con un total de 104 000 millones de parámetros y 7400 millones de parámetros activados, Ling-2.6-flash se probó anteriormente bajo el alias «Elephant Alpha» en la plataforma OpenRouter. Durante un periodo de prueba de dos semanas, el equipo de desarrollo recopiló una gran cantidad de comentarios del mundo real y realizó optimizaciones específicas, mejorando notablemente la fluidez del cambio de código entre chino e inglés y la compatibilidad con los marcos de programación más habituales.

Aspectos técnicos destacados: arquitectura híbrida y eficiencia superior
La principal fortalezade Ling-2.6-flash reside en su arquitectura única y su alta eficiencia operativa:
Arquitectura lineal híbrida: gracias a la optimización computacional de bajo nivel, el modelo alcanza una excelente velocidad de inferencia. Con 4 tarjetas H20, alcanza hasta 340 tokens/s. En rendimiento de prellenado, ofrece 2,2 veces más que Nemotron-3-Super, lo que reduce significativamente la latencia de respuesta.
Notable ratio de eficiencia de tokens: El equipo calibró meticulosamente la eficiencia de los tokens durante el entrenamiento. Los datos de evaluación muestran que, para tareas de calidad equivalente, Ling-2.6-flash consume solo unos 15 millones de tokens —aproximadamente una décima parte de la competencia comparable—, lo que reduce considerablemente los costes comerciales.
Profundización en los escenarios: mejoras específicas en la capacidad de los agentes
Para los escenarios de agentes —uno de los casos de uso más comunes de los modelos grandes—, Ling-2.6-flash se ha mejorado específicamente. Ya sea gestionando llamadas a herramientas complejas, la planificación en varios pasos o la ejecución final de tareas, el modelo funciona de forma fiable. En varias evaluaciones estándar del sector, como BFCL-V4 y SWE-bench, incluso en comparación con modelos que cuentan con un mayor número de parámetros activados, Ling-2.6-flash mantiene un rendimiento comparable o incluso de vanguardia (SOTA).
Los desarrolladores pueden ahora acceder a los recursos de código abierto del modelo a través de Hugging Face y ModelScope (Moba Community), lo que abre la puerta a una mayor exploración de su potencial en diversas aplicaciones industriales.
Artículo relacionado
Indica el título del artículo para que lo reformulemos en forma de pregunta.
En el panorama digital actual, la inteligencia artificial está transformando todos los sectores, y el mundo de los blogs no es una excepción. Los blogueros buscan constantemente formas de optimizar su
Conntour obtiene 7 millones de dólares de General Catalyst y YC para su tecnología de búsqueda en vídeos de seguridad basada en IA
El sector de la tecnología de vigilancia se encuentra actualmente en el punto de mira, aunque no precisamente por motivos muy positivos. Han surgido polémicas al conocerse que el Servicio de Inmigraci
Se desvela el primer hardware de IA de Apple: los AirPods con cámara entran en la fase de DVT
Las ambiciones de Apple en materia de hardware de IA se están haciendo cada vez más evidentes. El conocido periodista tecnológico Mark Gurman informa de que los tan esperados AirPods con cámaras integ
Recomendaciones de temas especiales relacionados
comentario (0)
0/500
La serie de modelos a gran escala Baoling de Ant Group ha recibido hoy una importante actualización, y
Como modelo Instruct con un total de 104 000 millones de parámetros y 7400 millones de parámetros activados,

Aspectos técnicos destacados: arquitectura híbrida y eficiencia superior
La principal fortaleza
Arquitectura lineal híbrida: gracias a la optimización computacional de bajo nivel, el modelo alcanza una excelente velocidad de inferencia. Con 4 tarjetas H20, alcanza hasta 340 tokens/s. En rendimiento de prellenado, ofrece 2,2 veces más que Nemotron-3-Super, lo que reduce significativamente la latencia de respuesta.
Notable ratio de eficiencia de tokens: El equipo calibró meticulosamente la eficiencia de los tokens durante el entrenamiento. Los datos de evaluación muestran que, para tareas de calidad equivalente,
Profundización en los escenarios: mejoras específicas en la capacidad de los agentes
Para los escenarios de agentes —uno de los casos de uso más comunes de los modelos grandes—
Los desarrolladores pueden ahora acceder a los recursos de código abierto del modelo a través de Hugging Face y ModelScope (Moba Community), lo que abre la puerta a una mayor exploración de su potencial en diversas aplicaciones industriales.
Indica el título del artículo para que lo reformulemos en forma de pregunta.
En el panorama digital actual, la inteligencia artificial está transformando todos los sectores, y el mundo de los blogs no es una excepción. Los blogueros buscan constantemente formas de optimizar su
Conntour obtiene 7 millones de dólares de General Catalyst y YC para su tecnología de búsqueda en vídeos de seguridad basada en IA
El sector de la tecnología de vigilancia se encuentra actualmente en el punto de mira, aunque no precisamente por motivos muy positivos. Han surgido polémicas al conocerse que el Servicio de Inmigraci
Se desvela el primer hardware de IA de Apple: los AirPods con cámara entran en la fase de DVT
Las ambiciones de Apple en materia de hardware de IA se están haciendo cada vez más evidentes. El conocido periodista tecnológico Mark Gurman informa de que los tan esperados AirPods con cámaras integ











