Обнимая лица: как предприятия могут сократить расходы на ИИ, сохраняя производительность

Дом

Новости

2 декабря 2025 г.

HenryWalker

# GPUS

Обнимая лица: как предприятия могут сократить расходы на ИИ, сохраняя производительность

Многие компании исходят из того, что для разработки ИИ требуются огромные вычислительные мощности, и поэтому приоритетом для них является простое приобретение дополнительных ресурсов.

Однако Саша Луччиони, руководитель направления ИИ и климата в компании Hugging Face, предлагает другой путь. Что если сместить акцент на более разумное использование ИИ? Вместо того чтобы неустанно искать дополнительные (и зачастую чрезмерные) вычислительные мощности, компании могли бы повысить производительность и точность моделей.

Лучиони утверждает, что суть проблемы заключается в подходе: компании должны стремиться к более интеллектуальным вычислениям, а не просто к их увеличению.

"Мы упускаем из виду более интеллектуальные методы, потому что зацикливаемся на том, что нам нужно больше FLOPS, больше GPU и больше времени", - объясняет она.

Вот пять ключевых стратегий от Hugging Face, которые помогут компаниям любого размера более эффективно внедрять ИИ.

1: Выберите подходящую модель для решения задачи

Не поддавайтесь желанию использовать массивные модели общего назначения для каждого приложения. Специализированные или дистиллированные модели часто могут достигать эквивалентной или даже превосходящей точности для конкретных задач - при значительно меньшей стоимости и меньшем потреблении энергии.

Исследования Лучиони показывают, что модель, ориентированная на конкретную задачу, может потреблять в 20-30 раз меньше энергии, чем модель общего назначения. "Эти модели создаются для одной цели, в отличие от больших языковых моделей, предназначенных для обработки любых запросов", - заявила она.

Здесь очень важна дистилляция модели. Полномасштабная модель может быть первоначально обучена, а затем доработана для выполнения определенной функции. Например, Лучиони отметила, что модель DeepSeek R1 настолько велика, что большинство организаций не могут позволить себе ее запустить - для этого часто требуется не менее 8 графических процессоров. В отличие от этого, дистиллированные версии могут быть в 10-30 раз меньше и работать на одном GPU.

Она также подчеркнула преимущества эффективности моделей с открытым исходным кодом, которые избавляют от необходимости обучения с нуля. В отличие от нескольких лет назад, когда компании тратили ресурсы на поиск подходящих моделей, теперь они могут начать с базовой модели и доработать ее под свои нужды.

"Это способствует совместным, постепенным инновациям, а не изолированным усилиям, когда каждый обучает свои собственные модели, эффективно расходуя вычислительные ресурсы", - говорит Лучиони.

Растет понимание того, что затраты на генеративный ИИ часто перевешивают его преимущества, что приводит к разочарованию корпораций. В то время как общие функции, такие как составление электронных писем или расшифровка совещаний, действительно полезны, модели для конкретных задач по-прежнему требуют значительных усилий. По словам Лучиони, готовые модели часто оказываются недостаточными и более дорогими.

Устранение этого пробела представляет собой следующий рубеж для создания дополнительных преимуществ. "Большинство компаний хотят решить конкретную задачу", - отметил Лучиони. "Они не ищут искусственный интеллект общего назначения (ИИОН), им нужен специализированный интеллект. Именно эту задачу мы и должны решить".

2. Сделать эффективность по умолчанию

Внедрите принципы "теории подталкивания" в дизайн системы, установите консервативные бюджеты на вычисления, ограничьте постоянно включенные генеративные функции и потребуйте от пользователей отказаться от использования высокозатратных режимов вычислений.

В поведенческих науках "теория подталкивания" подразумевает тонкое управление выбором для поощрения позитивного поведения. Лучиони привел классический пример с предложением столовых приборов к еде на вынос: если сделать посуду выбором, а не включать ее по умолчанию, можно значительно сократить количество отходов.

"Простой переход от модели отказа к модели отказа может оказать мощное влияние на поведение пользователей, - объясняет Лучиони.

Настройки по умолчанию часто приводят к ненужному использованию и увеличению расходов, поскольку модели выполняют задачи, которые от них не требовались. Например, некоторые поисковые системы теперь автоматически генерируют резюме ИИ в верхней части результатов. Лучиони также заметил, что при недавнем использовании GPT-5 от OpenAI модель по умолчанию переходила в режим полного рассуждения даже для очень простых запросов.

"Для меня это должно быть исключением", - сказала она. Если я спрашиваю: "В чем смысл жизни?", то, конечно, резюме ИИ может быть полезным. Но для таких вопросов, как "Какая погода в Монреале?" или "Каковы часы работы моей местной аптеки? мне не нужно генеративное резюме. По умолчанию не должно быть никаких рассуждений".

3. Оптимизация использования аппаратного обеспечения

Внедрите пакетную обработку, настройте точность вычислений и размер пакета для конкретного поколения оборудования, чтобы свести к минимуму нерациональное использование памяти и энергопотребление.

Компании должны оценить свои специфические потребности: Должна ли модель работать непрерывно? Будет ли она сталкиваться с запросами в реальном времени, возможно, со 100 запросами одновременно? В таких случаях оптимизация в режиме реального времени просто необходима, отметил Лучиони. Однако во многих других сценариях это не так; модели можно запускать периодически, чтобы экономить память, а пакетная обработка позволяет оптимизировать ее использование.

Это инженерная задача, но очень специфическая, поэтому трудно давать общие советы вроде "перегоните все модели" или "измените точность во всех"", - говорит Лучиони.

В ходе недавнего исследования она обнаружила, что идеальный размер партии сильно зависит от аппаратного обеспечения, вплоть до конкретной модели или версии. Увеличение размера партии всего на одну единицу иногда может повысить энергопотребление, поскольку модель требует больше ресурсов памяти.

"Этот аспект люди часто упускают из виду. Они думают: "Я просто увеличу размер партии", но настоящая эффективность достигается путем тщательной настройки всех этих переменных". В результате получается высоко оптимизированная система, но адаптированная к конкретным условиям", - объясняет Лучиони.

4. Стимулируйте прозрачность энергопотребления

Стимулы побуждают к изменениям. Учитывая это, компания Hugging Face в начале этого года запустила программу AI Energy Score. Эта инициатива способствует повышению энергоэффективности с помощью системы рейтинга от 1 до 5 звезд, где самые эффективные модели получают "пять звезд".

Можно считать, что это "Energy Star для AI", вдохновленная давней федеральной программой, которая устанавливает стандарты эффективности и маркирует приборы, отвечающие требованиям, своим логотипом.

"На протяжении десятилетий звездный рейтинг был мощным мотиватором. Люди хотели его получить", - говорит Лучиони. "Добиться такого же эффекта с помощью Energy Score было бы просто фантастикой".

Компания Hugging Face создала публичную таблицу лидеров, которую она планирует обновить новыми моделями, такими как DeepSeek и GPT-oss, в сентябре, и продолжать обновлять каждые шесть месяцев или по мере появления новых моделей. Цель состоит в том, чтобы разработчики моделей воспринимали высокий рейтинг как "почетный знак", - заметил Лучиони.

5. Переосмыслить концепцию "больше вычислений - лучше".

Вместо того чтобы стремиться к самым большим кластерам GPU, начните с вопроса: "Какой способ достижения желаемого результата является наиболее разумным?". Для многих приложений более разумные архитектуры и лучше подобранные наборы данных дают лучшие результаты, чем грубое масштабирование.

"Я считаю, что большинству людей, вероятно, не нужно столько GPU, сколько они думают", - заявила Лучиони. Она призвала компании пересмотреть реальные задачи, которые будут решать их GPU, понять, зачем они нужны, как такие задачи выполнялись раньше и какие ощутимые преимущества даст дополнительное количество GPU.

"Это превратилось в гонку на понижение, когда каждый считает, что ему нужен больший кластер", - сказала она. "Главное - проанализировать, для чего вы используете ИИ, какие конкретные методы необходимы и что эти методы действительно требуют".

Связанная статья

Amazon занимает 100 миллиардов долларов США в 2025 году Несмотря на недавний шум, предполагающий, что Deepseek выступит в эпоху сокращенных бюджетов ИИ, нет никаких признаков того, что Big Tech попадает в тормоза. Напротив, они наступают на газ. Amazon - последний гигант, который раскрыл огромный план расходов на ИИ, прогнозируя более 100 миллиардов долларов в Капи

Nvidia представляет графические процессоры следующего поколения: Blackwell Ultra, Vera Rubin, Feynman На конференции NVIDIA GTC 2025 в Сан -Хосе во вторник генеральный директор Дженсен Хуанг обнародовал линейку предстоящих графических процессоров, которые появились на рынке в ближайшие месяцы. Звезда шоу? GPU Vera Rubin, намеченный на выпуск второго тайма 2026 года. Этот зверь может похвастаться десятками гигабайт памяти и поставляется со стражей

Компания Baidu Health в ближайшее время проведет внутреннее тестирование AI-помощника врача DoctorClaw для поиска научной информации и оказания помощи в офисной работе По имеющимся данным, компания Baidu Health приступила к внутреннему тестированию профессионального интеллектуального помощника на базе искусственного интеллекта, предназначенного для врачей. Этот прод

Рекомендации по связанным специальным темам

письмо

Лучшие инструменты для создания скриптов на основе искусственного интеллекта для радио и подкастинга: написание увлекательных аудиореклам

Откройте для себя лучшие инструменты для создания скриптов на основе искусственного интеллекта в 2026 году, предназначенные для радио- и подкастинга, на сайте XIX.AI. Наш тщательно отобранный список включает мощные решения, способные значительно ускорить процесс создания привлекательных аудиореклам. Сравните бесплатные и платные варианты на основе реальных тестов и еженедельно обновляемых рейтингов. Раскройте свой творческий потенциал уже сегодня!

10 инструментов

xix.ai

Бизнес

Лучшее программное обеспечение для проверки договоров с помощью ИИ: мгновенное выявление юридических лазеек и рисков несоблюдения нормативных требований

Откройте для себя лучшее программное обеспечение 2026 года для анализа договоров с помощью ИИ на сайте XIX.AI. В нашем тщательно отобранном списке лидеров представлены мощные инструменты, которые мгновенно выявляют юридические лазейки и риски несоответствия нормативным требованиям. Сравните бесплатные и платные варианты с помощью реальных тестов и еженедельно обновляемых рейтингов. Найдите решение, которое кардинально изменит ваш подход к безопасному и эффективному анализу договоров. Ознакомьтесь с исчерпывающим руководством прямо сейчас.

10 инструментов

xix.ai

Создание анимации

Генератор аниме на основе искусственного интеллекта для Donghua: Создание персонажей для веб-романов и аватаров для комиксов

Откройте для себя лучшие генераторы аниме на основе искусственного интеллекта 2026 года для создания донхуа. Наш список, составленный специально для вас, включает мощные инструменты, позволяющие создавать потрясающих персонажей для веб-новелл и комиксов. Сравните бесплатные и платные варианты на основе реальных тестов. Найдите идеального помощника в творчестве и превратите свои истории в жизнь сегодня на сайте XIX.AI.

10 инструментов

xix.ai

Создание комиксов

Лучшие инструменты для автоматической раскраски манги с помощью ИИ: нанесение плоских цветов без ошибок в цветовом решении

Откройте для себя лучшие инструменты для автоматической раскраски манги с помощью ИИ в 2026 году на сайте XIX.AI. В нашем тщательно составленном списке представлены самые популярные и революционные решения, которые наносят плоские цвета без единой ошибки в цветовом соответствии, что значительно повышает вашу продуктивность. Изучите сравнения бесплатных и платных версий, результаты реальных тестов и еженедельно обновляемые рейтинги, чтобы найти идеальный вариант для себя. Воспользуйтесь преимуществами ИИ уже сегодня.

10 инструментов

xix.ai

письмо

Лучшие программы для создания персонажей в жанре научной фантастики: генерация последовательных мотиваций персонажей и их роковых недостатков

Откройте для себя 20 лучших инструментов 2026 года для создания персонажей с помощью искусственного интеллекта, которые помогут вам придать своим героям глубину. В тщательно подобранном списке XIX.AI представлены самые популярные и революционные инструменты, способные генерировать правдоподобные мотивации и роковые недостатки персонажей. Сравните бесплатные и платные варианты на основе реальных тестов. Раскройте свой потенциал в области создания историй уже сейчас.

10 инструментов

xix.ai

Бизнес

Лучшее ПО для оптимизации цен с помощью ИИ: отслеживание конкурентов и автоматическая корректировка цен в магазине

Откройте для себя лучшее программное обеспечение 2026 года для оптимизации цен с помощью ИИ на сайте XIX.AI. В нашем тщательно подобранном списке представлены высокооцененные, революционные инструменты, которые отслеживают конкурентов и автоматически корректируют цены в вашем магазине для получения максимальной прибыли. Сравните бесплатные и платные варианты на основе реальных тестов. Получите преимущество в ценообразовании уже сейчас.

10 инструментов

xix.ai