вариант
Дом
Новости
Microsoft LAM: Революционизируем искусственный интеллект с помощью крупномасштабных моделей действий

Microsoft LAM: Революционизируем искусственный интеллект с помощью крупномасштабных моделей действий

27 мая 2025 г.
36

Исследование крупной действующей модели Microsoft (LAM)

Искусственный интеллект постоянно развивается, и Microsoft выходит вперед с инновационной Крупной действующей моделью (LAM). В отличие от обычных языковых моделей, которые просто генерируют текст, LAM предназначена для выполнения действий непосредственно в окружении Windows. Этот уникальный подход направлен на связь между ИИ, понимающим язык, и ИИ, который может выполнять задачи, открывая путь к более практичным и интегрированным решениям искусственного интеллекта.

Что такое Крупная действующая модель (LAM)?

Крупная действующая модель Microsoft, или LAM, не просто генерирует текст. Она помогает выполнять задачи в生态系统е Windows. Представьте себе, что вы говорите компьютеру выполнить задачу, и он не только понимает её, но и выполняет её в приложениях, таких как Microsoft Word, Excel и PowerPoint. Цель LAM — преодолеть разрыв между традиционными языковыми моделями и теми, которые могут взаимодействовать напрямую с операционной системой, делая ИИ более практичным и интегрированным в наши повседневные рабочие процессы.

LAM в действии

Разработка и дизайн LAM

Разработка LAM сосредоточена на интерпретации пользовательских инструкций и преобразовании их в выполнимые шаги, которые можно реализовать в приложениях, таких как Microsoft Word, Excel и PowerPoint. Все это означает понимание естественного языка, его перевод в действия и выполнение этих действий в программном интерфейсе. Дизайн LAM подчеркивает автономное выполнение задач, что отлично подходит для автоматизации рутинных задач, оптимизации рабочих процессов и повышения общей производительности. Возможность напрямую взаимодействовать с приложениями Windows — это то, что отличает LAM от других ИИ-моделей, которые в основном сосредоточены на генерации текста или предоставлении информации.

Процесс дизайна LAM

Соединение разрывов: языковые модели и операционные системы

LAM стремится соединить разрыв между языковыми моделями, которые производят только текст, и теми, которые могут напрямую взаимодействовать с операционной системой. Это настоящая революция, выводящая ИИ за рамки простого получения информации и генерации текста к реальному выполнению задач. Позволяя ИИ взаимодействовать напрямую с окружением Windows, LAM может справиться с задачами от простого форматирования в Word до сложного анализа данных в Excel, делая её универсальным и практичным инструментом для пользователей различных областей.

LAM соединяет разрывы

Процесс обучения LAM

Методы обучения: контролируемое дообучение, имитационное обучение и усиленное обучение

Обучение LAM включает смешанный подход, состоящий из контролируемого дообучения, имитационного обучения и усиленного обучения. Эти методы помогают LAM научиться интерпретировать пользовательские инструкции, планировать действия и эффективно выполнять задачи. Контролируемое дообучение использует маркированные наборы данных для обучения LAM связи между языком и действиями. Имитационное обучение позволяет LAM наблюдать и копировать примеры экспертов, а усиленное обучение помогает ему учиться через проб и ошибок, получая награды за правильные действия и штрафы за ошибки.

Методы обучения LAM

Источники данных для обучения: документация программного обеспечения, статьи WikiHow и запросы Bing

Данные для обучения LAM берутся из разных источников, таких как официальная документация программного обеспечения, статьи WikiHow и запросы Bing. Эти источники дают LAM широкое понимание потребностей пользователей и того, как выполнять задачи в различных контекстах. Документация программного обеспечения предоставляет подробные инструкции по использованию приложений, таких как Word и Excel, в то время как статьи WikiHow предлагают пошаговые руководства для различных задач. Запросы Bing помогают LAM понимать намерения пользователей и адаптировать свои ответы соответственно.

Источники данных для обучения LAM

Развитие данных и роль GPT-4

GPT-4 играет ключевую роль в структурировании исходного текста в пары задач-планов для обучения LAM. Он помогает добавлять сложность базовым задачам, вводя дополнительные условия или инструкции, что позволяет LAM обрабатывать широкий спектр сценариев и адаптироваться к различным потребностям пользователей. Использование GPT-4 гарантирует высокое качество и актуальность тренировочных данных, что приводит к лучшей производительности.

Роль GPT-4 в обучении LAM

Создание пар задач-планов: преобразование инструкций в действия

Одним из ключевых шагов в обучении LAM является преобразование письменных инструкций в действия, которые можно выполнить в Windows. Это включает создание пар задач-планов, которые состоят из пользовательской инструкции и соответствующей последовательности действий, необходимых для выполнения задачи. Например, пара задач-планов может включать инструкцию «Подчеркнуть текст «Hello World» в Word» и действия по выделению текста и нажатию кнопки подчеркивания. Обучение на этих парах помогает LAM эффективно связывать язык с действиями.

Пары задач-планов LAM

Этапы обучения: от LAM1 до LAM4

Обучение LAM включает несколько этапов, начиная с базовой модели под названием Mistral 7B и прогрессируя через несколько итераций до LAM4. LAM1 учится писать связные планы для задач, в то время как LAM2 может генерировать шаги действий путем подражания успешным примерам. LAM3 представляет новые способы решения задач, а LAM4 использует модель вознаграждений для оптимизации принятия решений через усиленное обучение, извлекая уроки из как успешных, так и неудачных попыток.

Этапы обучения LAM

Как использовать Microsoft LAM в повседневных задачах

Хотя LAM всё ещё находится в разработке, его потенциальные применения огромны. Вот как вы можете использовать LAM в будущем для типовых задач:

Задача 1: Форматирование документа в Word

Пользовательская инструкция: «Сделайте заголовок этого документа жирным и увеличьте размер шрифта до 16.»

Интерпретация LAM: LAM определяет заголовок, выделяет его и открывает возможности форматирования.

Выполнение действия: LAM нажимает кнопку жирного шрифта и изменяет размер шрифта на 16.

Задача 2: Создание презентации в PowerPoint

Пользовательская инструкция: «Создайте новый слайд с маркиров

Связанная статья
Технические лидеры используют ИИ-аватары для отчетов о доходах Технические лидеры используют ИИ-аватары для отчетов о доходах Генеральные директора технологических компаний не только делают приоритет на ИИ в своих бизнесах, но теперь используют ИИ-аватары для представления себя во время отчетов о доходах.Фирма «покупай сейча
Новая пошаговая стратегическая игра по «Звездным войнам» Zero Company представлена Новая пошаговая стратегическая игра по «Звездным войнам» Zero Company представлена Стратегическая игра по Star Wars, анонсированная в 2022 году, теперь имеет официальное название: Zero Company, как сообщила EA сегодня. На сайте игры указано, что это «однопользовательская пошаговая т
Meta усиливает меры по борьбе с неоригинальным контентом на Facebook Meta усиливает меры по борьбе с неоригинальным контентом на Facebook В понедельник Meta объявила о более строгих мерах по борьбе с аккаунтами, публикующими неоригинальный контент на Facebook, направленных на тех, кто неоднократно использует чужие тексты, изображения ил
Вернуться к вершине
OR