вариант
Дом
Новости
TreeQuest от Sakana AI повышает производительность искусственного интеллекта благодаря совместной работе с несколькими моделями

TreeQuest от Sakana AI повышает производительность искусственного интеллекта благодаря совместной работе с несколькими моделями

24 августа 2025 г.
68

Японская лаборатория искусственного интеллекта Sakana AI представила методику, позволяющую нескольким большим языковым моделям (LLM) работать вместе, образуя высокоэффективную команду ИИ. Этот метод, получивший название Multi-LLM AB-MCTS, позволяет моделям работать методом проб и ошибок, используя свои уникальные преимущества для решения сложных задач, недоступных для одной модели.

Для предприятий такой подход дает возможность создавать более мощные системы ИИ. Вместо того чтобы полагаться на одного поставщика или одну модель, компании могут динамически использовать сильные стороны различных пограничных моделей, назначая лучший ИИ для каждого сегмента задач, чтобы достичь оптимальных результатов.

Использование коллективного интеллекта

Передовые модели ИИ быстро развиваются, каждая из них имеет свои сильные и слабые стороны, основанные на обучающих данных и дизайне. Одна модель может быть блестящей в кодировании, другая - в творческом письме. Команда Sakana AI рассматривает эти различия как достоинства, а не недостатки.

"Мы рассматриваем эти уникальные возможности как ценные инструменты для создания коллективного интеллекта", - пишут исследователи в своем блоге. Они утверждают, что, подобно человеческим командам, добивающимся прорывов благодаря разнообразию, системы ИИ могут добиться большего, сотрудничая друг с другом. "Объединяя свои сильные стороны, системы ИИ могут решать задачи, с которыми не справится ни одна модель".

Повышение производительности в области умозаключений

Алгоритм Sakana AI - техника "масштабирования во время вывода" (также называемая "масштабированием во время тестирования") - набирает обороты в исследованиях ИИ. В отличие от "масштабирования во время обучения", которое сосредоточено на больших моделях и наборах данных, масштабирование во время вывода повышает производительность за счет оптимизации вычислительных ресурсов после обучения.

Один из методов использует обучение с подкреплением, побуждая модели создавать подробные последовательности цепочек мыслей (CoT), как это показано в таких моделях, как OpenAI o3 и DeepSeek-R1. Другой подход, повторная выборка, побуждает модель многократно генерировать различные решения, что напоминает мозговой штурм. Метод Sakana AI совершенствует эти концепции.

"Наша система улучшает выборку Best-of-N", - сказал Такуя Акиба, научный сотрудник Sakana AI и соавтор статьи, в интервью VentureBeat. "Она улучшает такие методы рассуждений, как расширенный CoT, с помощью обучения с подкреплением. Стратегически выбирая подход к поиску и правильный LLM, он оптимизирует производительность в рамках ограниченных вызовов, добиваясь превосходства в сложных задачах".

Принцип работы адаптивного ветвящегося поиска

В основе технологии лежит алгоритм Adaptive Branching Monte Carlo Tree Search (AB-MCTS). Он позволяет LLM выполнять интеллектуальный метод проб и ошибок, балансируя между "поиском в глубину" (уточнение перспективного решения) и "поиском в ширину" (генерация новых решений). AB-MCTS сочетает эти стратегии, позволяя системе уточнять идеи или переходить к новым, когда это необходимо.

Для этого используется Monte Carlo Tree Search (MCTS), алгоритм принятия решений, применяемый в игре AlphaGo компании DeepMind. AB-MCTS использует вероятностные модели для принятия решения о необходимости доработки или перезапуска на каждом шаге.

Различные стратегии масштабирования времени тестирования Источник: Sakana AI

Мульти-LLM AB-MCTS идет дальше, решая не только "что" делать (уточнять или генерировать), но и "какой" LLM использовать. Изначально не зная, какая модель лучше всего подходит для решения задачи, система тестирует несколько LLM, со временем выясняя, какие из них работают лучше, и поручая им больше работы.

Тестирование команды ИИ

Система Multi-LLM AB-MCTS была оценена на эталоне ARC-AGI-2, который проверяет визуальное мышление человека при решении новых задач, что является сложной задачей для ИИ.

Команда объединила такие передовые модели, как o4-mini, Gemini 2.5 Pro и DeepSeek-R1.

Коллективная модель решила более 30 % из 120 тестовых задач, значительно превзойдя показатели любой отдельной модели. Система динамически назначала лучшую модель для каждой задачи, быстро определяя наиболее эффективный LLM, когда существовал четкий путь решения.

AB-MCTS в сравнении с отдельными моделями (источник: Sakana AI)
AB-MCTS в сравнении с отдельными моделями Источник: Sakana AI

Примечательно, что система решала задачи, которые ранее не могли быть решены ни одной отдельной моделью. В одном случае неправильное решение, полученное от o4-mini, было доработано DeepSeek-R1 и Gemini-2.5 Pro, которые исправили ошибку и выдали правильный ответ.

"Это показывает, что Multi-LLM AB-MCTS может объединять пограничные модели для решения ранее неразрешимых задач, расширяя границы коллективного интеллекта ИИ", - заявляют исследователи.

AB-MTCS может выбирать различные модели на разных этапах решения задачи (источник: Sakana AI)
AB-MTCS может выбирать различные модели на разных этапах решения задачи Источник: Sakana AI

"Сильные стороны каждой модели и ее склонность к галлюцинациям различны", - отмечает Акиба. "Соединяя модели с меньшим риском галлюцинаций, мы можем добиться как мощного рассуждения, так и надежности, решая ключевую проблему бизнеса".

От исследований к практическому применению

Компания Sakana AI выпустила TreeQuest, фреймворк с открытым исходным кодом под лицензией Apache 2.0, позволяющий разработчикам и компаниям внедрять Multi-LLM AB-MCTS. Его гибкий API поддерживает пользовательский скоринг и логику для различных задач.

"Мы все еще изучаем AB-MCTS для решения конкретных бизнес-задач, но его потенциал очевиден", - говорит Акиба.

Помимо эталона ARC-AGI-2, AB-MCTS успешно справляется с такими задачами, как сложное кодирование и повышение точности моделей машинного обучения.

"AB-MCTS отлично справляется с итеративными задачами методом проб и ошибок, такими как оптимизация показателей производительности программного обеспечения", - добавил Акиба. "Например, он может автоматически сократить время ожидания ответа веб-сервиса".

Этот инструмент с открытым исходным кодом может обеспечить создание нового поколения надежных и прочных корпоративных приложений ИИ.

Связанная статья
Multiverse Computing запускает бесплатную сжатую генеративную модель искусственного интеллекта Multiverse Computing запускает бесплатную сжатую генеративную модель искусственного интеллекта Крупные языковые модели сталкиваются с серьезной проблемой: их огромный размер. Испанский стартап Multiverse Computing решает эту проблему, создавая сжатые модели, призванные преодолеть разрыв между в
Секретные данные отслеживания раскрывают кражу моделей искусственного интеллекта Секретные данные отслеживания раскрывают кражу моделей искусственного интеллекта Новый метод позволяет за считанные секунды незаметно наносить водяные знаки на модели, такие как ChatGPT, без повторного обучения, не оставляя следов в стандартных выводах и противостоять всем практич
Искусственный интеллект обманом заставили одобрить абсурдные научные статьи Искусственный интеллект обманом заставили одобрить абсурдные научные статьи Новые исследования показывают, что системы искусственного интеллекта теперь могут создавать фальшивые научные статьи, которые другие модели искусственного интеллекта ошибочно принимают за подлинные. Э
Рекомендации по связанным специальным темам
Создание анимации Генератор аниме на основе искусственного интеллекта для Donghua: Создание персонажей для веб-романов и аватаров для комиксов
Генератор аниме на основе искусственного интеллекта для Donghua: Создание персонажей для веб-романов и аватаров для комиксов

Откройте для себя лучшие генераторы аниме на основе искусственного интеллекта 2026 года для создания донхуа. Наш список, составленный специально для вас, включает мощные инструменты, позволяющие создавать потрясающих персонажей для веб-новелл и комиксов. Сравните бесплатные и платные варианты на основе реальных тестов. Найдите идеального помощника в творчестве и превратите свои истории в жизнь сегодня на сайте XIX.AI.

10 инструментов
xix.ai
Создание комиксов Лучшие инструменты для автоматической раскраски манги с помощью ИИ: нанесение плоских цветов без ошибок в цветовом решении
Лучшие инструменты для автоматической раскраски манги с помощью ИИ: нанесение плоских цветов без ошибок в цветовом решении

Откройте для себя лучшие инструменты для автоматической раскраски манги с помощью ИИ в 2026 году на сайте XIX.AI. В нашем тщательно составленном списке представлены самые популярные и революционные решения, которые наносят плоские цвета без единой ошибки в цветовом соответствии, что значительно повышает вашу продуктивность. Изучите сравнения бесплатных и платных версий, результаты реальных тестов и еженедельно обновляемые рейтинги, чтобы найти идеальный вариант для себя. Воспользуйтесь преимуществами ИИ уже сегодня.

10 инструментов
xix.ai
письмо Лучшие программы для создания персонажей в жанре научной фантастики: генерация последовательных мотиваций персонажей и их роковых недостатков
Лучшие программы для создания персонажей в жанре научной фантастики: генерация последовательных мотиваций персонажей и их роковых недостатков

Откройте для себя 20 лучших инструментов 2026 года для создания персонажей с помощью искусственного интеллекта, которые помогут вам придать своим героям глубину. В тщательно подобранном списке XIX.AI представлены самые популярные и революционные инструменты, способные генерировать правдоподобные мотивации и роковые недостатки персонажей. Сравните бесплатные и платные варианты на основе реальных тестов. Раскройте свой потенциал в области создания историй уже сейчас.

10 инструментов
xix.ai
Бизнес Лучшее ПО для оптимизации цен с помощью ИИ: отслеживание конкурентов и автоматическая корректировка цен в магазине
Лучшее ПО для оптимизации цен с помощью ИИ: отслеживание конкурентов и автоматическая корректировка цен в магазине

Откройте для себя лучшее программное обеспечение 2026 года для оптимизации цен с помощью ИИ на сайте XIX.AI. В нашем тщательно подобранном списке представлены высокооцененные, революционные инструменты, которые отслеживают конкурентов и автоматически корректируют цены в вашем магазине для получения максимальной прибыли. Сравните бесплатные и платные варианты на основе реальных тестов. Получите преимущество в ценообразовании уже сейчас.

10 инструментов
xix.ai
код Лучшие системы проверки кода на основе ИИ: автоматизация обеспечения соответствия стандартам чистого кода и рефакторинг файлов в устаревших репозиториях
Лучшие системы проверки кода на основе ИИ: автоматизация обеспечения соответствия стандартам чистого кода и рефакторинг файлов в устаревших репозиториях

Откройте для себя 20 лучших рецензентов кода на базе ИИ 2026 года на XIX.AI. В нашем тщательно составленном списке представлены высокооцененные, революционные инструменты для автоматизации проверки соответствия стандартам чистого кода и рефакторинга файлов в устаревших репозиториях. Сравните бесплатные и платные варианты с помощью реальных тестов и еженедельно обновляемых рейтингов. Получите преимущество ИИ уже сегодня.

10 инструментов
xix.ai
Преобразование текста в речь Лучшие приложения с функцией преобразования текста в речь на базе ИИ для детей с дислексией: помощь в обучении и повышение эффективности чтения
Лучшие приложения с функцией преобразования текста в речь на базе ИИ для детей с дислексией: помощь в обучении и повышение эффективности чтения

Откройте для себя лучшие приложения с технологией TTS на базе искусственного интеллекта 2026 года, специально отобранные для помощи людям с дислексией. В нашем рейтинге экспертов сравниваются бесплатные и платные инструменты, а также освещаются мощные функции, способствующие повышению эффективности чтения и обучения. Откройте для себя революционные решения, которые обязательно стоит попробовать, чтобы раскрыть потенциал учащихся. Начните свое путешествие на XIX.AI.

10 инструментов
xix.ai
Комментарии (1)
0/500
JoseJackson
JoseJackson 12 февраля 2026 г., 11:00:30 GMT+03:00

Вот это да! Модели ИИ, которые сотрудничают, как настоящая команда? Это напоминает мне о том, как разные эксперты работают вместе над сложным проектом. Интересно, сможет ли этот подход решить проблему узкой специализации ИИ, когда одна модель хороша в одном, но бесполезна в другом. Надеюсь, это не приведёт к тому, что ИИ начнут 'ссориться' между собой из-за разных точек зрения! 🤔

OR