Hogar
Baidu lanza Ernie 5.1, que reduce los costes de preentrenamiento en un 94 % y se sitúa entre los cuatro primeros a nivel mundial
Baidu presentó oficialmente su modelo lingüístico de última generación, Ernie 5.1, el 11 de mayo de 2026. Partiendo de la base de preentrenamiento de Ernie 5.0, lanzada a principios de enero —un modelo con 2,4 billones de parámetros—, esta nueva versión se desarrolló utilizando un innovador «marco de entrenamiento elástico de una sola pasada». Este enfoque permitió a Baidu optimizar múltiples tamaños de modelo en un único ciclo de entrenamiento, reduciendo los costes de preentrenamiento de Ernie 5.1 a solo el 6 % de los de modelos comparables.

A fecha de 9 de mayo, Ernie 5.1 ocupaba la cuarta posición a nivel mundial y el primer puesto entre los modelos chinos en la clasificación de Arena Search con una puntuación de 1223 puntos, lo que demuestra su excepcional eficiencia y su rendimiento equilibrado.
Desde el punto de vista arquitectónico, Ernie 5.1 presenta un diseño de submodelos con profundidad, anchura y número de expertos activos ajustables. Su recuento total de parámetros es solo un tercio del de su predecesor, y el número de parámetros efectivos activados por consulta se ha reducido aproximadamente a la mitad. Para abordar el «efecto balancín» común en el entrenamiento multihabilidades, Baidu implementó un proceso de post-entrenamiento en cuatro fases. Este método utiliza código de entrenamiento especializado en paralelo, inferencia y modelos expertos proxy, combinados con la destilación de estrategias y el aprendizaje por refuerzo, lo que resuelve eficazmente el reto sectorial de equilibrar la capacidad de programación con el razonamiento creativo. Además, una infraestructura de aprendizaje por refuerzo renovada desacopla las actualizaciones del modelo, la generación de respuestas y la evaluación. Cuando se combina con una biblioteca de cálculo de baja precisión estandarizada, esto mejora significativamente la estabilidad del entrenamiento a gran escala.

Artículo relacionado
Los ingresos de Anthropropic aumentan drásticamente y su capital bursátil se acerca a los mil millones de dólares.
Los informes indican que Anthropic ha logrado un significativo crecimiento en sus ingresos en solo unos pocos meses. Los ingresos anualizados de la empresa ahora superan los 30 mil millones de dólares, lo cual representa más del triple de lo que eran
Apple retira la aplicación Cal AI debido a compras dentro de la aplicación no autorizadas y facturación engañosa.
La reciente eliminación por parte de Apple de Cal AI, una popular aplicación de seguimiento alimentario basada en inteligencia artificial y disponible dentro de MyFitnessPal, pone de manifiesto su estricta aplicación de las políticas de la App Store
El sistema de facturación basado en tokens de Github Copilot provoca la indignación de los desarrolladores.
La era de oro de GitHub Copilot de Microsoft podría estar llegando a su fin, especialmente para los usuarios individuales. La empresa está pasando de un modelo de suscripción fija a uno basado en tokens, lo que podría aumentar significativamente los
Recomendaciones de temas especiales relacionados
comentario (0)
0/500
Baidu presentó oficialmente su modelo lingüístico de última generación, Ernie 5.1, el 11 de mayo de 2026. Partiendo de la base de preentrenamiento de Ernie 5.0, lanzada a principios de enero —un modelo con 2,4 billones de parámetros—, esta nueva versión se desarrolló utilizando un innovador «marco de entrenamiento elástico de una sola pasada». Este enfoque permitió a Baidu optimizar múltiples tamaños de modelo en un único ciclo de entrenamiento, reduciendo los costes de preentrenamiento de Ernie 5.1 a solo el 6 % de los de modelos comparables.

A fecha de 9 de mayo, Ernie 5.1 ocupaba la cuarta posición a nivel mundial y el primer puesto entre los modelos chinos en la clasificación de Arena Search con una puntuación de 1223 puntos, lo que demuestra su excepcional eficiencia y su rendimiento equilibrado.
Desde el punto de vista arquitectónico, Ernie 5.1 presenta un diseño de submodelos con profundidad, anchura y número de expertos activos ajustables. Su recuento total de parámetros es solo un tercio del de su predecesor, y el número de parámetros efectivos activados por consulta se ha reducido aproximadamente a la mitad. Para abordar el «efecto balancín» común en el entrenamiento multihabilidades, Baidu implementó un proceso de post-entrenamiento en cuatro fases. Este método utiliza código de entrenamiento especializado en paralelo, inferencia y modelos expertos proxy, combinados con la destilación de estrategias y el aprendizaje por refuerzo, lo que resuelve eficazmente el reto sectorial de equilibrar la capacidad de programación con el razonamiento creativo. Además, una infraestructura de aprendizaje por refuerzo renovada desacopla las actualizaciones del modelo, la generación de respuestas y la evaluación. Cuando se combina con una biblioteca de cálculo de baja precisión estandarizada, esto mejora significativamente la estabilidad del entrenamiento a gran escala.

Los ingresos de Anthropropic aumentan drásticamente y su capital bursátil se acerca a los mil millones de dólares.
Los informes indican que Anthropic ha logrado un significativo crecimiento en sus ingresos en solo unos pocos meses. Los ingresos anualizados de la empresa ahora superan los 30 mil millones de dólares, lo cual representa más del triple de lo que eran
Apple retira la aplicación Cal AI debido a compras dentro de la aplicación no autorizadas y facturación engañosa.
La reciente eliminación por parte de Apple de Cal AI, una popular aplicación de seguimiento alimentario basada en inteligencia artificial y disponible dentro de MyFitnessPal, pone de manifiesto su estricta aplicación de las políticas de la App Store
El sistema de facturación basado en tokens de Github Copilot provoca la indignación de los desarrolladores.
La era de oro de GitHub Copilot de Microsoft podría estar llegando a su fin, especialmente para los usuarios individuales. La empresa está pasando de un modelo de suscripción fija a uno basado en tokens, lo que podría aumentar significativamente los











