Дом
Baidu представила модель Ernie 5.1, которая позволяет сократить затраты на предварительное обучение на 94 % и вошла в четверку лучших в мире
11 мая 2026 года компания Baidu официально представила языковую модель нового поколения — Ernie 5.1. Опираясь на основу предварительного обучения Ernie 5.0, выпущенную ранее в январе — модель с 2,4 триллионами параметров — эта новая версия была разработана с использованием инновационной «однократной эластичной структуры обучения». Такой подход позволил Baidu оптимизировать несколько размеров модели в рамках одного цикла обучения, сократив затраты на предварительное обучение Ernie 5.1 до всего 6% по сравнению с аналогичными моделями.

По состоянию на 9 мая Ernie 5.1 занимала четвертое место в мире и первое среди китайских моделей в рейтинге Arena Search с результатом 1223 балла, продемонстрировав свою исключительную эффективность и сбалансированную производительность.
С архитектурной точки зрения Ernie 5.1 отличается конструкцией субмоделей с настраиваемой глубиной, шириной и количеством активных экспертов. Общее количество параметров составляет лишь треть от предшественника, а количество эффективных параметров, активируемых на один запрос, сократилось примерно вдвое. Для устранения «эффекта качелей», характерного для обучения с использованием нескольких навыков, Baidu внедрила четырехэтапный процесс постобучения. Этот метод использует параллельный специализированный код обучения, инференцию и прокси-модели экспертов в сочетании с дистилляцией стратегий и обучением с подкреплением, что позволяет эффективно решать общеотраслевую задачу балансирования программных возможностей и творческого мышления. Кроме того, обновленная инфраструктура обучения с подкреплением разделяет обновления модели, генерацию ответов и оценку. В сочетании со стандартизированной библиотекой вычислений с низкой точностью это значительно повышает стабильность крупномасштабного обучения.

Связанная статья
Доходы компании Anthropropic растут стремительно; ее рыночная капитализация приближается к отметке в триллион долларов.
Отчеты показывают, что компания Anthropic добилась значительного роста доходов всего за несколько месяцев. Годовой объем ее доходов теперь превышает 30 миллиардов долларов — это более чем в три раза больше, чем было в конце прошлого года. Такой рост
Компания Apple удалила приложение Cal AI из-за несанкционированных покупок внутри приложения и манипулятивных способов осуществления платежей.
Недавнее удаление Apple приложения Cal AI, популярного приложения для отслеживания потребления пищи на основе искусственного интеллекта в рамках сервиса MyFitnessPal, подчеркивает строгое соблюдение Apple политик App Store в отношении внешних платеже
Тарификация Github Copilot на основе токенов вызывает возмущение среди разработчиков
Золотой век сервиса GitHub Copilot от Microsoft, по-видимому, подходит к концу, особенно для частных пользователей. Компания переходит от фиксированной абонентской платы к модели оплаты на основе токенов, что может значительно увеличить затраты. Боль
Рекомендации по связанным специальным темам
Комментарии (0)
11 мая 2026 года компания Baidu официально представила языковую модель нового поколения — Ernie 5.1. Опираясь на основу предварительного обучения Ernie 5.0, выпущенную ранее в январе — модель с 2,4 триллионами параметров — эта новая версия была разработана с использованием инновационной «однократной эластичной структуры обучения». Такой подход позволил Baidu оптимизировать несколько размеров модели в рамках одного цикла обучения, сократив затраты на предварительное обучение Ernie 5.1 до всего 6% по сравнению с аналогичными моделями.

По состоянию на 9 мая Ernie 5.1 занимала четвертое место в мире и первое среди китайских моделей в рейтинге Arena Search с результатом 1223 балла, продемонстрировав свою исключительную эффективность и сбалансированную производительность.
С архитектурной точки зрения Ernie 5.1 отличается конструкцией субмоделей с настраиваемой глубиной, шириной и количеством активных экспертов. Общее количество параметров составляет лишь треть от предшественника, а количество эффективных параметров, активируемых на один запрос, сократилось примерно вдвое. Для устранения «эффекта качелей», характерного для обучения с использованием нескольких навыков, Baidu внедрила четырехэтапный процесс постобучения. Этот метод использует параллельный специализированный код обучения, инференцию и прокси-модели экспертов в сочетании с дистилляцией стратегий и обучением с подкреплением, что позволяет эффективно решать общеотраслевую задачу балансирования программных возможностей и творческого мышления. Кроме того, обновленная инфраструктура обучения с подкреплением разделяет обновления модели, генерацию ответов и оценку. В сочетании со стандартизированной библиотекой вычислений с низкой точностью это значительно повышает стабильность крупномасштабного обучения.

Доходы компании Anthropropic растут стремительно; ее рыночная капитализация приближается к отметке в триллион долларов.
Отчеты показывают, что компания Anthropic добилась значительного роста доходов всего за несколько месяцев. Годовой объем ее доходов теперь превышает 30 миллиардов долларов — это более чем в три раза больше, чем было в конце прошлого года. Такой рост
Компания Apple удалила приложение Cal AI из-за несанкционированных покупок внутри приложения и манипулятивных способов осуществления платежей.
Недавнее удаление Apple приложения Cal AI, популярного приложения для отслеживания потребления пищи на основе искусственного интеллекта в рамках сервиса MyFitnessPal, подчеркивает строгое соблюдение Apple политик App Store в отношении внешних платеже
Тарификация Github Copilot на основе токенов вызывает возмущение среди разработчиков
Золотой век сервиса GitHub Copilot от Microsoft, по-видимому, подходит к концу, особенно для частных пользователей. Компания переходит от фиксированной абонентской платы к модели оплаты на основе токенов, что может значительно увеличить затраты. Боль











