ИИ Alibaba ZeroSearch сокращает расходы на обучение на 88% благодаря автономному обучению

Дом

Новости

19 сентября 2025 г.

JoseJackson

# alibaba # LLMs # nlp

ИИ Alibaba "ZeroSearch" сокращает расходы на обучение на 88% благодаря автономному обучению

ZeroSearch от Alibaba: Изменение эффективности обучения ИИ

Исследователи Alibaba Group разработали революционный метод обучения систем искусственного интеллекта поиску информации в обход дорогостоящих коммерческих API поисковых систем. Их технология ZeroSearch позволяет крупным языковым моделям развивать сложные поисковые способности в симулированной среде вместо традиционного взаимодействия с поисковыми системами на этапах обучения.

"Традиционное обучение с подкреплением требует обширных поисковых запросов, которые накапливают значительные затраты на API и препятствуют масштабируемости", - объясняют исследователи в своей недавно опубликованной статье в arXiv. "ZeroSearch представляет собой экономически эффективный механизм обучения с подкреплением, который расширяет возможности поиска LLM независимо от реальных поисковых систем".

Механика обучения без поиска

Современные методы обучения ИИ сталкиваются с двумя основными ограничениями: непостоянное качество документов, получаемых от коммерческих поисковых систем во время циклов обучения, и непомерные расходы, связанные с огромными объемами API-вызовов к таким сервисам, как Google Search.

В ZeroSearch реализован инновационный двухфазный подход:

Первоначальная контролируемая тонкая настройка превращает LLM в модуль генерации документов.
Усовершенствованное усиление на основе учебных программ постепенно изменяет качество вывода.

"Наше фундаментальное открытие показывает, что предварительно обученные LLM изначально обладают достаточными знаниями о мире, чтобы генерировать контекстуально подходящие документы", - отмечают исследователи. "Основное различие между симулированными и реальными результатами поиска заключается в стилистических различиях в тексте, а не в существенных пробелах в содержании".

Контрольные показатели производительности демонстрируют значительные преимущества

Тщательное тестирование семи различных наборов данных, содержащих вопросы-ответы, продемонстрировало конкурентные преимущества ZeroSearch:

7B моделей параметров соответствовали точности поиска Google
14B конфигураций параметров превысили производительность коммерческого поиска

Особенно поразительны финансовые последствия:

Традиционное обучение с 64K запросами: $586,70 через SerpAPI
Эквивалент ZeroSearch: $70,80 при использовании четырех графических процессоров A100.
Общее снижение затрат: 88%

"Эти результаты подтверждают, что LLM могут заменить обычные поисковые системы в системах обучения с подкреплением", - заключает исследовательская группа.

Более широкие последствия для развития ИИ

ZeroSearch знаменует собой смену парадигмы в методологии обучения искусственного интеллекта, демонстрируя автономное развитие способностей без зависимости от внешних инструментов.

Технология обещает несколько преобразующих эффектов:

Демократизация затрат: Снижение финансовых барьеров для стартапов за счет устранения дорогостоящих API-зависимостей.
Контроль обучения: Обеспечивает точное регулирование информационных входов в процессе разработки модели
Архитектурная гибкость: Совместимость с основными семействами моделей, включая Qwen-2.5 и LLaMA-3.2.

Alibaba предоставила открытый доступ к полной реализации - включая кодовые базы, наборы обучающих данных и предварительно обученные модели - через репозитории GitHub и Hugging Face.

Эта инновация предвещает появление нового ландшафта развития ИИ, в котором передовые возможности появляются благодаря сложному моделированию, а не использованию внешних сервисов. По мере развития этих самодостаточных методов обучения они могут существенно изменить текущую зависимость технологической экосистемы от основных API-интерфейсов платформ.

Связанная статья

Персонализация ИИ улучшает реальность или искажает ее? Исследование скрытых рисков Человеческая цивилизация уже становилась свидетелем когнитивных революций - рукописный почерк вытеснил память, калькуляторы автоматизировали вычисления, системы GPS заменили ориентирование на местност

TreeQuest от Sakana AI повышает производительность искусственного интеллекта благодаря совместной работе с несколькими моделями Японская лаборатория искусственного интеллекта Sakana AI представила методику, позволяющую нескольким большим языковым моделям (LLM) работать вместе, образуя высокоэффективную команду ИИ. Этот метод,

ByteDance представляет модель ИИ Seed-Thinking-v1.5 для усиления способностей к рассуждению Гонка за продвинутыми ИИ с функцией рассуждения началась с модели o1 от OpenAI в сентябре 2024 года, набрав обороты с запуском R1 от DeepSeek в январе 2025 года.Крупные разработчики ИИ соревнуются в с

Комментарии (0)

0/200

Представлять на рассмотрение

Лучшие новости

Gemini 2.5 Pro в настоящее время неограничен и дешевле, чем Claude, GPT-4O Топовые генераторы видео на AI в 2025: Pika Labs по сравнению с альтернативами Озвучка с помощью ИИ: Ультимативное руководство по созданию реалистичных голосов ИИ ИИ Cambium превращает отходы в пиломатериалы OpenAI улучшает AI Voice Assistant для лучших чатов Как гарантировать, что ваши данные заслуживают доверия для интеграции искусственного интеллекта NoteBooklm расширяется во всем мире, добавляет слайды и расширенную проверку фактов Настройки для дата -центров США могут разблокировать 76 ГВт новой мощности. Google использует ИИ для приостановки более 39 миллионов счетов объявлений о подозрении на мошенничество Клонирование голоса с ИИ: Полное руководство по освоению конверсии голоса

Более

Показан