Дом

Новости

Предварительный обзор Hy3: первый релиз с открытым исходным кодом после реорганизации Yuan, отличающийся повышенной практичностью и расширенными возможностями агентов

Предварительный обзор Hy3: первый релиз с открытым исходным кодом после реорганизации Yuan, отличающийся повышенной практичностью и расширенными возможностями агентов

1 июня 2026 г.

GregoryAdams

23 апреля подразделение Huan Yuan компании Tencent выпустило языковую модель Hy3preview в виде открытого исходного кода. Эта гибридная экспертная модель сочетает в себе быстрое и медленное мышление, имеет 295 миллиардов параметров и 21 миллиард активированных параметров, а также поддерживает контекст длиной до 256K. Это первая модель, обученная после реорганизации Huan Yuan, и самая интеллектуальная модель в истории Huan Yuan, обеспечивающая существенный рост производительности в области сложного мышления, выполнения инструкций, контекстного обучения, генерации кода, возможностей агентов и общей эффективности мышления.

В феврале 2026 года Tencent Huan Yuan реструктурировала свою инфраструктуру предварительного обучения и обучения с подкреплением, а также установила три руководящих принципа для достижения практической полезности:

1. Системные возможности: вместо того, чтобы делать акцент на специализации, мы признаем, что даже одно приложение, такое как агент кода, требует глубокого взаимодействия между рассуждениями, обработкой длинного контекста, выполнением инструкций, диалогом, кодированием и использованием инструментов.

2. Аутентичная оценка: выходя за рамки легко поддающихся манипуляциям публичных тестов, мы оцениваем и повышаем реальную эффективность модели с помощью вопросов, разработанных внутри компании, последних наборов экзаменационных заданий, оценки людьми, крауд-тестирования конкретных продуктов и других методов.

3. Ориентация на экономическую эффективность: практическая применимость должна соответствовать коммерческой жизнеспособности. Тщательно совместно разработанная архитектура модели и инфраструктура вывода существенно снижают затраты на выполнение задач, делая ИИ доступным и эффективным.

Hy3preview знаменует начало ускоренного стремления Huan Yuan к созданию практичных больших языковых моделей, решающих реальные проблемы.

Яо Шуню, главный научный сотрудник Tencent по ИИ, отметил, что Hy3preview — это первый шаг в реконструкции модели Huan Yuan. Благодаря этому релизу с открытым исходным кодом мы надеемся получить искреннюю обратную связь от сообщества и пользователей, что поможет усовершенствовать практическую применимость официальной версии Hy3. В то же время мы продолжаем расширять масштабы предварительного обучения и обучения с подкреплением, повышая интеллектуальный потенциал модели. Благодаря тесному совместному проектированию с многочисленными продуктами Tencent мы неуклонно повышаем реальную производительность модели и начинаем исследовать возможности специализированных моделей.

В настоящее время Hy3preview доступна на Tencent Cloud, Yua, ima, CodeBuddy, WorkBuddy, QQ, QQ Browser, Tencent Docs и Tencent LeXiang. Другие крупные продукты, такие как официальный аккаунт WeChat, Peace Elite, Tencent News, Tencent Stock Selection, Tencent Customer Service и WeChat Reading, постепенно внедряются. Кроме того, Hy3preview интегрируется с популярными фреймворками агентов с открытым исходным кодом, такими как OpenClaw, OpenCode и KiloCode, и представлен на платформе обслуживания больших моделей Tencent Cloud — TokenHub.

Hy3preview делает акцент на всесторонней практичности, значительно расширяя возможности агентов

Многочисленные оценки подтверждают, что возможности Hy3preview были значительно улучшены.

1.Превосходные возможности обучения в контексте и выполнения инструкций

В разнообразных реальных производственных и повседневных сценариях анализ беспорядочных, длинных контекстов и соблюдение сложных, меняющихся правил остаются ключевой проблемой для моделей. Опираясь на бизнес-кейсы Tencent, Хуань Юань представил CL-bench и CL-bench-Life для инновационной оценки обучения в контексте и значительно улучшил способности Hy3preview к обучению в контексте и выполнению инструкций.

2. Исключительная способность к сложному рассуждению, позволившая получить максимальный балл на квалификационном экзамене по математике для докторантов в Университете Цинхуа в Китае

Сложное рассуждение лежит в основе способности модели решать разнообразные задачи. Hy3preview продемонстрировал превосходные результаты в сложных тестах по рассуждению в области STEM, таких как FrontierScience-Olympiad и IMOAnswerBench, а также достиг выдающихся результатов на последнем экзамене на соискание степени доктора математических наук в Академии Цучжэнь Университета Цинхуа (весна 2026 г.) и Национальном конкурсе по биологии среди старшеклассников (CHSBO2025), продемонстрировав надежное обобщенное рассуждение.

3. Значительные усовершенствования в возможностях кода и агентов, демонстрирующие высокую экономическую эффективность

Возможности кода и агентов являются наиболее заметными улучшениями в Hy3preview. Благодаря обновленной инфраструктуре предварительного обучения и обучения с подкреплением, а также расширенному масштабу задач RL, Tencent Huan Yuan быстро достиг конкурентоспособных результатов в ведущих тестах для кодовых агентов, таких как SWE-Bench Verified и Terminal-Bench2.0, а также в тестах для поисковых агентов, таких как BrowseComp и WideSearch.

В цифровой сфере код измеряет способность модели выполнять задачи в средах разработки, в то время как поиск оценивает ее способность извлекать, фильтровать и синтезировать информацию из открытых источников. Вместе они определяют, действительно ли модель полезна в сложных сценариях с агентами, таких как OpenClaw. Hy3preview достиг высоких результатов в таких оценках, как ClawEval и WildClawBench, показав, что возможности наших агентов неуклонно продвигаются к полноте и практичности.

Помимо общедоступных тестов, Tencent Huan Yuan создал несколько наборов внутренних оценок для определения производительности модели в реальных условиях разработки. Результаты показывают, что в наборе задач бэкэнд-инженерии Hy-Backend, ориентированном на разработчиков тесте Hy-Vibe Bench и сложном наборе задач программной инженерии Hy-SWE Max, Hy3preview продемонстрировал высокую конкурентоспособность.

При сравнении размера модели и общей производительности агента с альтернативными решениями с открытым исходным кодом Hy3preview выделяется своей высокой экономической эффективностью.

Основные направления деятельности Tencent полностью интегрированы, и ряд ключевых продуктов на базе ИИ демонстрирует очевидные преимущества

До официального запуска Hy3preview был протестирован на основных продуктах Tencent в области ИИ, что принесло заметные положительные результаты.

Что касается Yua, то Huan Yuan и Yua прошли глубокую совместную разработку. Производительность модели по ключевым показателям, таким как точность понимания намерений, качество генерации текста и глубокий поиск, была улучшена, а также была проведена тонкая настройка стиля письма, выражений, эмоционального интеллекта, структуры контента и профессионализма. Такое тесное сотрудничество между моделью и продуктом обеспечило пользователям более интеллектуальный и человекоподобный опыт взаимодействия.

В сценариях вопросов и ответов на основе базы знаний и общих вопросов и ответов ima тесты показали, что Hy3preview отлично справляется с обработкой длинных текстов, особенно в задачах поиска, где он обеспечивает высокую точность, охват и полноту ответов.

В CodeBuddy и WorkBuddy задержка первого токена Hy3preview сократилась на 54%, продолжительность сквозного процесса уменьшилась на 47%, а коэффициент успешности поднялся до более чем 99,99%. В реальных пользовательских средах он стабильно управляет сложными рабочими процессами агентов, насчитывающими до 495 шагов, охватывающими разнообразные офисные задачи, такие как обработка документов, анализ данных, поиск знаний и оркестрация инструментария MCP.

В специальных оценках ИИ-аватара официального аккаунта WeChat и ИИ-службы поддержки клиентов Hy3preview продемонстрировал более всесторонние улучшения по сравнению с Hy2. Он показал большую зрелость в понимании намерений пользователя, продолжении сложного контекста и организации знаний. При работе с неоднозначными запросами, короткими предложениями и многоходовыми диалогами система лучше улавливала потребности пользователей и давала более четкие и стабильные ответы. Благодаря интеграции баз знаний, пользовательской памяти и генерации контекста, ее вывод более точно соответствовал роли ИИ-аватара или службы поддержки, что значительно сократило количество чрезмерных домыслов, субъективных предположений и эмоционального тона, приблизив общее взаимодействие к «надежному, естественному и эффективному» опыту.

В сценарии с ИИ-НПЦ в Peace Elite команда быстро интегрировала и оценила Hy3preview после его выпуска, получив впечатляющие общие результаты. В ролевой игре с персонажами вне игры Hy3preview точно улавливал настройки персонажей и предоставлял высокорелевантный контент с добавленной стоимостью для открытых вопросов, создавая более реалистичный, естественный и иммерсивный диалог. Во время сложных игровых боевых сценариев время отклика модели было близко к времени отклика реальных игроков, демонстрируя отличную стабильность и человекоподобные навыки ролевой игры, что сделало ее общую производительность исключительной.

В сценарии AI PPT Tencent Docs по сравнению с предыдущей версией Hy2 Hy3preview продемонстрировала значительные улучшения: успешность генерации выросла на 20%, оценки улучшились на 10%, а время генерации сократилось на 20%. В целом новая модель превосходила предыдущую в выборе шаблонов, подборе цветов, генерации контуров и дополнении контента — без галлюцинаций, с тематической согласованностью и высокой визуальной привлекательностью.

Что касается AI-помощника QQ Xiao Q, по сравнению с предыдущей версией Hy3preview обеспечила значительную оптимизацию задержки первого байта при обработке длинных текстов, общей скорости отклика и эффективности потоковой передачи. Такие ключевые возможности, как математическое мышление, значительно улучшились, а выполнение инструкций в различных сценариях и способность к обобщению были еще более усовершенствованы. В области рассуждений с вызовом инструментов и разрешения ссылок в многоходовых диалогах он продемонстрировал более стабильную и эффективную производительность. В официальном тесте сценариев интеллектуальных агентов PinchBench QQ от OpenClaw он достиг выдающихся результатов, а общий пользовательский опыт заметно улучшился.

Эффективность рассуждений улучшилась на 40%, обеспечив оптимальную плотность интеллекта при тех же затратах

Благодаря тесному взаимодействию между моделью и инференционной средой, а также комплексной оптимизации инференционной среды, производительности операторов, алгоритмов квантования и других компонентов, общая эффективность вывода улучшилась на 40%, а стоимость Hy3preview значительно снизилась по сравнению с предыдущим поколением.

На платформе обслуживания больших моделей Tencent Cloud TokenHub цена ввода Hy3preview составляет всего 1,2 юаня за миллион токенов, кэш ввода — 0,4 юаня за миллион токенов, а вывода — 4 юаня за миллион токенов. Кроме того, Tencent Cloud и Huan Yuan совместно представили индивидуальный пакет Hy3preview Token Plan, стоимость которого в личной версии начинается от 28 юаней в месяц, предлагая экономичный вариант для разработки агентов и создания приложений «Lobster».

Связанная статья

WordPress.com теперь позволяет ИИ-ботам создавать и публиковать посты, а также выполнять другие задачи WordPress.com, популярная платформа для веб-хостинга и публикации контента, теперь внедряет ИИ-агентов — шаг, который может кардинально изменить облик и функциональность Интернета. В пятницу компания

Экспериментальный ИИ Claude от компании Anthropic успешно завершил переговоры и сделки в ходе тестирования в сфере электронной коммерции На фоне стремительного развития искусственного интеллекта компания Anthropic в минувшую пятницу незаметно запустила внутренний эксперимент под названием «Project Deal», продемонстрировав потенциал ИИ

DeepSeek Code готовится к запуску На фоне стремительного развития технологий искусственного интеллекта компания DeepSeek находится на захватывающем этапе своего развития. Недавно эта компания, специализирующаяся на ИИ, объявила о прив

Рекомендации по связанным специальным темам

Бизнес

Лучшие инструменты для подбора персонала с помощью ИИ: отбор резюме и автоматизация планирования собеседований с кандидатами

Откройте для себя 20 лучших инструментов для рекрутинга на базе ИИ 2026 года на сайте XIX.AI. В нашем тщательно составленном списке представлены мощные, революционные решения для отбора резюме и автоматизации планирования собеседований с кандидатами. Сравните бесплатные и платные варианты с помощью реальных тестов и еженедельно обновляемого рейтинга. Найдите своего идеального помощника по подбору персонала и оптимизируйте процесс рекрутинга уже сегодня!

10 инструментов

xix.ai

Производительность

Персональные тренеры по благополучию и концентрации на базе ИИ: борьба с выгоранием и повышение уровня умственной энергии

Откройте для себя лучших в 2026 году ИИ-тренеров по личному благополучию и концентрации внимания на сайте XIX.AI. В нашем тщательно составленном рейтинге представлены высокооцененные, революционные инструменты для борьбы с выгоранием и повышения умственной энергии. Сравните бесплатные и платные варианты с помощью реальных отзывов. Откройте для себя путь к максимальной продуктивности и благополучию уже сегодня.

10 инструментов

xix.ai

чат-бот

Лучшие романтические чат-боты на базе ИИ: постройте долгосрочные отношения с помощью чат-ботов с устойчивой индивидуальностью

Откройте для себя лучшие романтические чат-боты с искусственным интеллектом 2026 года, которые помогут вам построить искренние и долгосрочные отношения. В нашем тщательно составленном списке вы найдете чат-ботов с яркими и последовательными личностями, сравнение бесплатных и платных версий, а также результаты реальных тестов. Найдите своего идеального спутника и начните строить отношения уже сегодня на XIX.AI.

10 инструментов

xix.ai

Образование и обучение

Лучшие наставники в области искусственного интеллекта и науки о данных: мастерство работы с SQL, библиотекой Pandas и рабочими процессами машинного обучения

Откройте для себя 20 лучших наставников в области искусственного интеллекта и науки о данных на 2026 год, которые помогут вам овладеть SQL, Pandas и рабочими процессами машинного обучения. Изучите наш тщательно отобранный список на сайте XIX.AI – здесь вы найдете эффективные рекомендации, способные изменить ход ваших работ. Сравните бесплатные и платные варианты с примерами из реальной практики. Освоите науку о данных уже сегодня.

10 инструментов

xix.ai

чат-бот

Лучшие тренажеры по флирту и общению на базе ИИ: повышайте свою харизму и уверенность в себе в режиме реального времени

Откройте для себя 20 лучших тренажеров по флирту и общению с ИИ на сайте XIX.AI. Наша тщательно подобранная подборка самых популярных инструментов поможет вам развить коммуникабельность и уверенность в себе в режиме реального времени. Ознакомьтесь с незаменимыми инструментами, которые кардинально изменят вашу жизнь, — с сравнением бесплатных и платных версий и еженедельно обновляемым рейтингом. Раскройте свой коммуникативный потенциал уже сегодня.

10 инструментов

xix.ai

код

Лучшие инструменты ИИ для автоматизированного тестирования модулей: создание случаев тестирования Jest, PyTest и JUnit одним кликом

Откройте для себя самые новые и высоко оцененные инструменты ИИ 2026 года для автоматизированного тестирования модулей. Наша тщательно подобранная коллекция включает мощные решения, способные радикально изменить процесс разработки, позволяющие мгновенно генерировать тестовые случаи для Jest, PyTest и JUnit. Сравните бесплатные и платные варианты с результатами реальных тестов, а также еженедельно обновляемыми рейтингами на сайте XIX.AI. Раскройте потенциал ИИ и повысьте эффективность своей работы в области разработки сегодня же.

10 инструментов

xix.ai