Дом

Новости

DeepSeek Shakes AI Industry: Далее AI LEAP может зависеть от увеличения вычислений при выводе, а не на большем количестве данных

DeepSeek Shakes AI Industry: Далее AI LEAP может зависеть от увеличения вычислений при выводе, а не на большем количестве данных

18 апреля 2025 г.

AlbertWalker

255

# DeepSeek

Индустрия ИИ находится в состоянии постоянных изменений, и 2025 год принес несколько революционных разработок, которые встряхнули отрасль. Одним из главных потрясений стало то, что китайская лаборатория ИИ DeepSeek представила новую модель, которая вызвала падение акций Nvidia на 17% и повлияла на другие акции компаний, связанных с центрами данных для ИИ. Почему столько шума вокруг модели DeepSeek? Она обеспечивает высочайшую производительность за небольшую часть стоимости по сравнению с другими американскими конкурентами, вызывая бурные дискуссии о том, что это означает для будущего центров данных для ИИ.

Но чтобы по-настоящему понять, что делает DeepSeek, нужно рассмотреть общую картину. Мир ИИ сталкивается с нехваткой данных для обучения. Крупные игроки уже использовали большую часть общедоступных данных в интернете, что означает, что мы упираемся в стену в улучшении предварительного обучения. В результате отрасль переключается на "вычисления во время тестирования" (TTC). Представьте это как момент, когда модели ИИ "думают" перед ответом, как, например, в серии "o" от OpenAI. Есть надежда, что TTC может обеспечить такие же улучшения масштабирования, как это когда-то делало предварительное обучение, потенциально открывая следующую большую волну прорывов в ИИ.

Эти изменения указывают на два крупных сдвига: во-первых, лаборатории с меньшими бюджетами теперь вступают в игру, создавая передовые модели. Во-вторых, TTC становится новым рубежом для продвижения ИИ вперед. Давайте разберем эти тенденции и их возможное значение для ландшафта и рынка ИИ.

Последствия для индустрии ИИ

Мы считаем, что переход к TTC и усиление конкуренции среди моделей рассуждений могут изменить ландшафт ИИ по нескольким направлениям: аппаратное обеспечение, облачные платформы, базовые модели и корпоративное программное обеспечение.

1. Аппаратное обеспечение (графические процессоры, специализированные чипы и вычислительная инфраструктура)

Переход к TTC может изменить потребности компаний в области ИИ в аппаратном обеспечении и подходы к его управлению. Вместо того чтобы вкладывать деньги в всё более крупные кластеры графических процессоров для обучения, они могут начать больше сосредотачиваться на усилении возможностей вывода для удовлетворения требований TTC. Хотя графические процессоры останутся важными для вывода, различия между рабочими нагрузками обучения и вывода могут повлиять на то, как эти чипы настраиваются и используются. Поскольку рабочие нагрузки вывода более непредсказуемы и имеют "пиковый" характер, планирование мощностей может стать сложнее.

Мы также считаем, что этот сдвиг может стимулировать рынок аппаратного обеспечения, специально разработанного для вывода с низкой задержкой, например, ASIC. Поскольку TTC становится важнее, чем мощность обучения, доминирование универсальных графических процессоров может начать ослабевать, открывая двери для производителей специализированных чипов для вывода.

2. Облачные платформы: гиперскейлеры (AWS, Azure, GCP) и облачные вычисления

Одной из основных проблем для внедрения ИИ в бизнесе, помимо вопросов точности, является ненадежность API вывода. Такие проблемы, как нестабильное время ответа, ограничения по количеству запросов и сложности с параллельными запросами, могут быть настоящей головной болью. TTC может усугубить эти проблемы. В этом сценарии облачный провайдер, который может гарантировать высокое качество обслуживания (QoS) для решения этих проблем, получит значительное преимущество.

Интересно, что, хотя новые методы могут сделать ИИ более эффективным, они не обязательно снизят спрос на аппаратное обеспечение. Согласно парадоксу Джевонса, где повышение эффективности приводит к увеличению потребления, более эффективные модели вывода могут побудить больше разработчиков использовать модели рассуждений, увеличивая потребность в вычислительной мощности. Мы считаем, что недавние улучшения моделей могут стимулировать рост спроса на облачные вычисления для ИИ, как для вывода, так и для обучения небольших специализированных моделей.

3. Поставщики базовых моделей (OpenAI, Anthropic, Cohere, DeepSeek, Mistral)

Если новые игроки, такие как DeepSeek, смогут конкурировать с крупными игроками при значительно меньших затратах, монополия проприетарных предварительно обученных моделей может начать рушиться. Мы также можем ожидать больше инноваций в TTC для трансформерных моделей, и, как показал DeepSeek, эти инновации могут прийти из неожиданных мест, помимо привычных лидеров в области ИИ.

4. Внедрение ИИ в корпоративной среде и SaaS (уровень приложений)

Учитывая китайское происхождение DeepSeek, их продукты, вероятно, будут подвергаться постоянной проверке с точки зрения безопасности и конфиденциальности. Их API и сервисы чат-ботов, базирующиеся в Китае, вряд ли найдут отклик у корпоративных клиентов в области ИИ в США, Канаде или других западных странах. Многие компании уже блокируют веб-сайт и приложения DeepSeek. Даже если модели DeepSeek будут размещены третьими сторонами в западных центрах данных, они могут столкнуться с проверками, что может ограничить их внедрение в корпоративной среде. Исследователи указывают на такие проблемы, как возможность взлома, предвзятость и генерация вредоносного контента. Хотя некоторые компании могут экспериментировать с моделями DeepSeek, широкое внедрение кажется маловероятным из-за этих опасений.

С другой стороны, вертикальная специализация набирает обороты. В прошлом вертикальные приложения, построенные на базовых моделях, были сосредоточены на создании адаптированных рабочих процессов. Такие методы, как генерация с использованием поиска (RAG), маршрутизация моделей, вызов функций и защитные механизмы, были ключевыми для настройки обобщённых моделей под конкретные случаи использования. Но всегда существовала озабоченность, что значительные улучшения базовых моделей могут сделать эти приложения устаревшими. Сэм Альтман однажды предупреждал, что большой скачок в возможностях моделей может "разрушить" эти инновации.

Однако, если мы наблюдаем плато в улучшениях вычислений во время обучения, угроза быстрого устаревания уменьшается. В мире, где улучшения производительности моделей происходят за счёт оптимизации TTC, могут появиться новые возможности для игроков на уровне приложений. Инновации, такие как оптимизация структурированных запросов, стратегии рассуждений с учётом задержек и эффективные методы выборки, могут обеспечить значительные улучшения производительности в конкретных вертикалях.

Эти улучшения особенно актуальны для моделей, ориентированных на рассуждения, таких как GPT-4o от OpenAI и DeepSeek-R1, которые могут отвечать несколько секунд. В приложениях реального времени сокращение задержек и повышение качества вывода в конкретной области могут дать конкурентное преимущество. В результате компании с глубокими знаниями в определённой области могут сыграть ключевую роль в оптимизации эффективности вывода и настройке результатов.

Работа DeepSeek показывает, что мы отходим от зависимости исключительно от увеличения предварительного обучения для улучшения качества моделей. Вместо этого TTC становится всё более важным. Хотя неясно, будут ли модели DeepSeek широко приняты в корпоративном программном обеспечении из-за проверок, их влияние на улучшение других моделей становится всё более очевидным.

Мы считаем, что инновации DeepSeek побуждают устоявшиеся лаборатории ИИ перенимать аналогичные методы, дополняя их существующие преимущества в аппаратном обеспечении. Предсказанное снижение стоимости моделей, похоже, стимулирует большее использование моделей, что соответствует модели парадокса Джевонса.

Пашутан Ваезипур — технический руководитель в Georgian.

Связанная статья

DeepSeek представляет модель искусственного интеллекта, способную составить конкуренцию передовым системам Китайская лаборатория искусственного интеллекта DeepSeek выпустила две предварительные версии своей новейшей крупномасштабной языковой модели DeepSeek V4 — долгожданное обновление прошлогодней модели

Модель искусственного интеллекта DeepSeek V3.2 обеспечивает высочайшую производительность при минимальных вычислительных затратах В то время как крупные технологические компании инвестируют миллиарды в вычислительные мощности для разработки передовых моделей искусственного интеллекта, китайская компания DeepSeek достигла аналоги

Руководители служб безопасности призывают к быстрому регулированию ИИ, ссылаясь на риски таких инструментов, как DeepSeek В операционных центрах безопасности, особенно среди руководителей служб информационной безопасности (CISO), растет беспокойство по поводу гиганта искусственного интеллекта DeepSeek из Китая.Хотя изнач

Рекомендации по связанным специальным темам

Преобразование текста в речь

Лучшие приложения с функцией преобразования текста в речь на базе ИИ для детей с дислексией: помощь в обучении и повышение эффективности чтения

Откройте для себя лучшие приложения с технологией TTS на базе искусственного интеллекта 2026 года, специально отобранные для помощи людям с дислексией. В нашем рейтинге экспертов сравниваются бесплатные и платные инструменты, а также освещаются мощные функции, способствующие повышению эффективности чтения и обучения. Откройте для себя революционные решения, которые обязательно стоит попробовать, чтобы раскрыть потенциал учащихся. Начните свое путешествие на XIX.AI.

10 инструментов

xix.ai

Создание комиксов

Лучшие генераторы на базе ИИ для сёнэн-манги: создавайте динамичные сцены боевых действий и эффекты энергии

Откройте для себя лучшие генераторы искусственного интеллекта для манги в стиле «сёнен» 2026 года на сайте XIX.AI. В нашем тщательно отобранном списке представлены мощные инструменты для создания динамичных сцен боевых действий и эффектных энергетических эффектов. Сравните бесплатные и платные варианты на основе реальных тестов. Раскройте свой творческий потенциал и начните создавать эпическую мангу уже сегодня!

15 инструментов

xix.ai

Бизнес

Лучшие приложения для учета расходов на базе ИИ: сканируйте чеки и автоматически классифицируйте корпоративные расходы

Лучшие программы для учета расходов с ИИ 2026 года: самые популярные инструменты для сканирования чеков и автоматической классификации корпоративных расходов. Откройте для себя мощные, революционные решения для удобного управления расходами, точного финансового мониторинга и оптимизации соблюдения нормативных требований. Наш тщательно составленный и еженедельно обновляемый обзор бесплатных и платных вариантов поможет вам найти идеальный вариант. Воспользуйтесь преимуществами ИИ с помощью рекомендаций экспертов XIX.AI.

10 инструментов

xix.ai

Бизнес

Лучшие инструменты для подбора персонала с помощью ИИ: отбор резюме и автоматизация планирования собеседований с кандидатами

Откройте для себя 20 лучших инструментов для рекрутинга на базе ИИ 2026 года на сайте XIX.AI. В нашем тщательно составленном списке представлены мощные, революционные решения для отбора резюме и автоматизации планирования собеседований с кандидатами. Сравните бесплатные и платные варианты с помощью реальных тестов и еженедельно обновляемого рейтинга. Найдите своего идеального помощника по подбору персонала и оптимизируйте процесс рекрутинга уже сегодня!

10 инструментов

xix.ai

Производительность

Персональные тренеры по благополучию и концентрации на базе ИИ: борьба с выгоранием и повышение уровня умственной энергии

Откройте для себя лучших в 2026 году ИИ-тренеров по личному благополучию и концентрации внимания на сайте XIX.AI. В нашем тщательно составленном рейтинге представлены высокооцененные, революционные инструменты для борьбы с выгоранием и повышения умственной энергии. Сравните бесплатные и платные варианты с помощью реальных отзывов. Откройте для себя путь к максимальной продуктивности и благополучию уже сегодня.

10 инструментов

xix.ai

чат-бот

Лучшие романтические чат-боты на базе ИИ: постройте долгосрочные отношения с помощью чат-ботов с устойчивой индивидуальностью

Откройте для себя лучшие романтические чат-боты с искусственным интеллектом 2026 года, которые помогут вам построить искренние и долгосрочные отношения. В нашем тщательно составленном списке вы найдете чат-ботов с яркими и последовательными личностями, сравнение бесплатных и платных версий, а также результаты реальных тестов. Найдите своего идеального спутника и начните строить отношения уже сегодня на XIX.AI.

10 инструментов

xix.ai

Комментарии (37)

0/500

Пожалуйста, войдите в систему

DanielAllen

25 мая 2026 г., 19:00:16 GMT+03:00

Interessant, dass jetzt die Rechenleistung beim Inferenz wichtiger wird als mehr Daten. Aber ist das wirklich nachhaltig? Die Energiebilanz dieser riesigen Modelle macht mir Sorgen. Die Aktienkurse von Nvidia & Co. reagieren ja schon extrem auf solche News. 🧐

WalterHarris

23 апреля 2026 г., 3:01:00 GMT+03:00

Interessant, dass jetzt die Rechenleistung beim Inferencing als Engpass gesehen wird. Aber irgendwie frage ich mich, ob das nicht nur die nächste Runde im Hardware-Wettlauf einläutet. Nvidia-Aktienkurse als Indikator für KI-Fortschritt zu nehmen finde ich etwas kurzsichtig 🤔 Die eigentliche Frage ist doch: Wer kann sich diese Rechenpower überhaupt leisten? Kleine Labs werden da noch weiter abgehängt.

DonaldAdams

23 сентября 2025 г., 23:30:31 GMT+03:00

DeepSeek這波真的猛！直接讓NVIDIA股價跳水17%...不過我比較好奇的是，如果推理運算才是重點，那我們這些小公司是不是根本玩不起這場遊戲？硬體成本感覺會是個無底洞啊 😅

EdwardYoung

15 августа 2025 г., 14:00:59 GMT+03:00

DeepSeek's new model sounds like a real game-changer! A 17% drop in Nvidia's stock is wild—makes me wonder how much compute power is actually driving these AI leaps. Curious to see if this sparks a race for better inference tech! 🚀

WillieRoberts

13 августа 2025 г., 8:00:59 GMT+03:00

DeepSeek's new model sounds like a game-changer! 🤯 I'm curious how this shift to more compute at inference will play out—could it make AI more accessible or just widen the gap between big players?

HenryDavis

31 июля 2025 г., 14:35:39 GMT+03:00

DeepSeek's new model sounds like a game-changer! A 17% Nvidia stock dip is wild—wonder how this’ll shift the AI race. More compute at inference? Mind blown! 🤯

Лучшие новости

AI Builder и Power Automate Революционизируют Суммирование Документов AI Hosts of Notebooklm подкаста теперь доступны для интервью Китай представляет национальный гуманоидный робот и стандарты воплощенного интеллекта По данным Ramp, корпоративное внедрение ИИ находится на плаву Руководство по создателю изображений Bing: Гайд по генерации искусством ИИ Научитесь создавать музыку ИИ, используя свой голос: пошаговый учебник SUNO iMyFone MagicMic: Обзор и руководство по реальном времени AI изменению голоса Топовые генераторы видео на AI в 2025: Pika Labs по сравнению с альтернативами DeepSeek V4 становится мультимодальным искусственным интеллектом, меняющим правила игры Компания Embodied Intelligence представляет первый отраслевой стандарт, призванный сдержать неконтролируемый рост

Более

Показан