Hogar
Ant Digital presenta el modelo de lenguaje grande (LLM) Bai Ling Enterprise Financial: una nueva definición de velocidad y eficiencia
El auge de los agentes de ejecución autónoma, como el «Agent» de OpenAI, supone una aceleración significativa para las aplicaciones de IA, que pasan de la simple «interacción dialogada» a la compleja «ejecución de tareas». Aunque las empresas están adoptando rápidamente esta tendencia, también se enfrentan a retos como el desperdicio computacional y el cumplimiento de las normas de seguridad. Lograr un despliegue sostenible a gran escala de agentes inteligentes se ha convertido en un objetivo central del sector.
El 26 de marzo, en el Foro de Innovación Industrial del Futuro del Foro de Zhongguancun, Zhang Peng, director general del Departamento de Innovación Tecnológica de Modelos Grandes de Ant Digital, afirmó en su discurso que la aparición de este tipo de agentes revolucionará el paradigma de la IA empresarial. Este cambio hará que el despliegue industrial de modelos grandes pase de una «competencia por la escala de parámetros» a una «competencia por la eficiencia de los tokens».

Zhang Peng, director general del Departamento de Innovación Tecnológica de Modelos Grandes de Ant Digital, hablando en el Foro de Zhongguancun.
La rápida adopción de agentes inteligentes refleja una fuerte demanda del mercado para la ejecución autónoma de tareas. Sin embargo, su implementación en entornos industriales reales presenta importantes obstáculos. A menudo, al carecer de un conocimiento profundo de las reglas y los flujos de trabajo del sector, estos agentes pueden realizar llamadas a herramientas repetidas e ineficientes al gestionar tareas complejas. Esto conduce a un consumo de tokens que supera con creces el valor real creado. Los informes indican que, en algunos escenarios de alta frecuencia, el coste de la ejecución de los agentes puede ser decenas o incluso cientos de veces superior al de las soluciones integradas, lo que plantea preocupaciones sobre la sostenibilidad de su uso industrial generalizado.
«El principal reto en la siguiente fase de la industrialización de los modelos grandes no es competir en el número de parámetros, sino mejorar continuamente la eficiencia por token», señaló Zhang Peng. Él cree que las empresas deberían elegir soluciones de IA que combinen estratégicamente modelos grandes y pequeños en función de escenarios y necesidades específicos, logrando un mayor valor empresarial con un menor coste computacional.
Tomemos como ejemplo el sector financiero. Este campo procesa a diario volúmenes masivos de tareas de alta frecuencia y baja latencia: identificar rápidamente la intención del usuario, extraer datos clave, recuperar y clasificar información. Estas tareas exigen una alta concurrencia, tiempos de respuesta rápidos y una precisión milimétrica. Aunque los modelos de inferencia tradicionales de gran capacidad son potentes, utilizarlos para este tipo de escenarios suele ser excesivo —como «usar un mazo para cascar una nuez»—, lo que da lugar a altos costes, velocidades lentas y un desperdicio de recursos.
«Lo que la industria realmente necesita es una solución de IA que garantice profesionalidad, rigor y cumplimiento normativo, al tiempo que ofrece una rentabilidad y una velocidad de respuesta óptimas», explicó Zhang Peng. Destacó que los modelos de grandes parámetros destacan en el razonamiento complejo y el análisis en profundidad, mientras que los modelos más pequeños ofrecen menor latencia y mayor rentabilidad para tareas más sencillas y de alta frecuencia. Un enfoque híbrido que aproveche ambos es clave para resolver los problemas del mundo real de forma más eficiente y económica.
En el Foro de Zhongguancun, Ant Digital lanzó un modelo ligero específico para el sector financiero denominado Ling-DT-Fin-Mini-2.5, el primero de su serie Ling DT. Este modelo es una arquitectura ligera de «mezcla de expertos» (MoE) basada en el último marco híbrido de atención lineal Ling 2.5, optimizado para tareas financieras de alta concurrencia y baja latencia. Mantiene la capacidad profesional al tiempo que reduce los costes de inferencia a un nivel adecuado para el despliegue masivo. En comparación con los modelos de uso general habituales de capacidad similar, ofrece una velocidad de inferencia un 100 % más rápida y unos costes de hardware significativamente más bajos para procesar volúmenes de tareas equivalentes, lo que supone un ahorro tangible de costes y una mayor eficiencia para las instituciones financieras.
De hecho, a medida que los agentes de IA se adentran más en los procesos industriales básicos para realizar trabajo real, la estrategia de combinar modelos grandes y pequeños se está convirtiendo en un estándar del sector. Recientemente, la propia OpenAI lanzó dos modelos más pequeños, GPT-4o mini y nano, centrados en la baja latencia y la alta rentabilidad para servir como agentes principales a nivel de ejecución.
Zhang Peng concluyó que el progreso tecnológico debe, en última instancia, alinearse con las exigencias racionales de la eficiencia industrial. En la siguiente fase de la competencia, la eficiencia de los tokens se convertirá en la métrica principal para evaluar el valor de la IA empresarial. Ant Digital seguirá centrándose en la IA general (AGI) de nivel empresarial, con planes de lanzar una edición empresarial del modelo grande Ling DT y versiones específicas para cada sector, acelerando el despliegue a gran escala de agentes inteligentes en entornos empresariales complejos.
Artículo relacionado
El MIIT busca comentarios del público sobre 121 estándares industriales, incluido el Protocolo de Contexto para Modelos de IA
El Ministerio de Industria y Tecnologías de la Información de China ha publicado oficialmente un aviso solicitando comentarios del público sobre 121 proyectos de estandarización industrial, incluido el “Requisitos de seguridad aplicativa para el Prot
OpenAI se asocia con el Departamento de Defensa de los EE. UU.; las eliminaciones de ChatGPT aumentan un 295%.
Indignación Pública: La Alianza Militar de OpenAI Desata una Onda de DesinstalacionesRecientemente, el líder en inteligencia artificial OpenAI anunció una estrecha colaboración con el Departamento de Defensa de los Estados Unidos, integrando sus mod
OpenAI lanza la función «Sites», lo que marca el fin de la era «sin código» con sitios web basados en Word
OpenAI ha presentado Sites, una nueva función para Codex, su IA dedicada a la ingeniería de software. Actualmente en fase de prueba, solo está disponible para los suscriptores de pago de los planes Bu
Recomendaciones de temas especiales relacionados
comentario (0)
0/500
El auge de los agentes de ejecución autónoma, como el «Agent» de OpenAI, supone una aceleración significativa para las aplicaciones de IA, que pasan de la simple «interacción dialogada» a la compleja «ejecución de tareas». Aunque las empresas están adoptando rápidamente esta tendencia, también se enfrentan a retos como el desperdicio computacional y el cumplimiento de las normas de seguridad. Lograr un despliegue sostenible a gran escala de agentes inteligentes se ha convertido en un objetivo central del sector.
El 26 de marzo, en el Foro de Innovación Industrial del Futuro del Foro de Zhongguancun, Zhang Peng, director general del Departamento de Innovación Tecnológica de Modelos Grandes de Ant Digital, afirmó en su discurso que la aparición de este tipo de agentes revolucionará el paradigma de la IA empresarial. Este cambio hará que el despliegue industrial de modelos grandes pase de una «competencia por la escala de parámetros» a una «competencia por la eficiencia de los tokens».

Zhang Peng, director general del Departamento de Innovación Tecnológica de Modelos Grandes de Ant Digital, hablando en el Foro de Zhongguancun.
La rápida adopción de agentes inteligentes refleja una fuerte demanda del mercado para la ejecución autónoma de tareas. Sin embargo, su implementación en entornos industriales reales presenta importantes obstáculos. A menudo, al carecer de un conocimiento profundo de las reglas y los flujos de trabajo del sector, estos agentes pueden realizar llamadas a herramientas repetidas e ineficientes al gestionar tareas complejas. Esto conduce a un consumo de tokens que supera con creces el valor real creado. Los informes indican que, en algunos escenarios de alta frecuencia, el coste de la ejecución de los agentes puede ser decenas o incluso cientos de veces superior al de las soluciones integradas, lo que plantea preocupaciones sobre la sostenibilidad de su uso industrial generalizado.
«El principal reto en la siguiente fase de la industrialización de los modelos grandes no es competir en el número de parámetros, sino mejorar continuamente la eficiencia por token», señaló Zhang Peng. Él cree que las empresas deberían elegir soluciones de IA que combinen estratégicamente modelos grandes y pequeños en función de escenarios y necesidades específicos, logrando un mayor valor empresarial con un menor coste computacional.
Tomemos como ejemplo el sector financiero. Este campo procesa a diario volúmenes masivos de tareas de alta frecuencia y baja latencia: identificar rápidamente la intención del usuario, extraer datos clave, recuperar y clasificar información. Estas tareas exigen una alta concurrencia, tiempos de respuesta rápidos y una precisión milimétrica. Aunque los modelos de inferencia tradicionales de gran capacidad son potentes, utilizarlos para este tipo de escenarios suele ser excesivo —como «usar un mazo para cascar una nuez»—, lo que da lugar a altos costes, velocidades lentas y un desperdicio de recursos.
«Lo que la industria realmente necesita es una solución de IA que garantice profesionalidad, rigor y cumplimiento normativo, al tiempo que ofrece una rentabilidad y una velocidad de respuesta óptimas», explicó Zhang Peng. Destacó que los modelos de grandes parámetros destacan en el razonamiento complejo y el análisis en profundidad, mientras que los modelos más pequeños ofrecen menor latencia y mayor rentabilidad para tareas más sencillas y de alta frecuencia. Un enfoque híbrido que aproveche ambos es clave para resolver los problemas del mundo real de forma más eficiente y económica.
En el Foro de Zhongguancun, Ant Digital lanzó un modelo ligero específico para el sector financiero denominado Ling-DT-Fin-Mini-2.5, el primero de su serie Ling DT. Este modelo es una arquitectura ligera de «mezcla de expertos» (MoE) basada en el último marco híbrido de atención lineal Ling 2.5, optimizado para tareas financieras de alta concurrencia y baja latencia. Mantiene la capacidad profesional al tiempo que reduce los costes de inferencia a un nivel adecuado para el despliegue masivo. En comparación con los modelos de uso general habituales de capacidad similar, ofrece una velocidad de inferencia un 100 % más rápida y unos costes de hardware significativamente más bajos para procesar volúmenes de tareas equivalentes, lo que supone un ahorro tangible de costes y una mayor eficiencia para las instituciones financieras.
De hecho, a medida que los agentes de IA se adentran más en los procesos industriales básicos para realizar trabajo real, la estrategia de combinar modelos grandes y pequeños se está convirtiendo en un estándar del sector. Recientemente, la propia OpenAI lanzó dos modelos más pequeños, GPT-4o mini y nano, centrados en la baja latencia y la alta rentabilidad para servir como agentes principales a nivel de ejecución.
Zhang Peng concluyó que el progreso tecnológico debe, en última instancia, alinearse con las exigencias racionales de la eficiencia industrial. En la siguiente fase de la competencia, la eficiencia de los tokens se convertirá en la métrica principal para evaluar el valor de la IA empresarial. Ant Digital seguirá centrándose en la IA general (AGI) de nivel empresarial, con planes de lanzar una edición empresarial del modelo grande Ling DT y versiones específicas para cada sector, acelerando el despliegue a gran escala de agentes inteligentes en entornos empresariales complejos.
El MIIT busca comentarios del público sobre 121 estándares industriales, incluido el Protocolo de Contexto para Modelos de IA
El Ministerio de Industria y Tecnologías de la Información de China ha publicado oficialmente un aviso solicitando comentarios del público sobre 121 proyectos de estandarización industrial, incluido el “Requisitos de seguridad aplicativa para el Prot
OpenAI se asocia con el Departamento de Defensa de los EE. UU.; las eliminaciones de ChatGPT aumentan un 295%.
Indignación Pública: La Alianza Militar de OpenAI Desata una Onda de DesinstalacionesRecientemente, el líder en inteligencia artificial OpenAI anunció una estrecha colaboración con el Departamento de Defensa de los Estados Unidos, integrando sus mod
OpenAI lanza la función «Sites», lo que marca el fin de la era «sin código» con sitios web basados en Word
OpenAI ha presentado Sites, una nueva función para Codex, su IA dedicada a la ingeniería de software. Actualmente en fase de prueba, solo está disponible para los suscriptores de pago de los planes Bu











