

DeepSeek Shakes AI Industry: Далее AI LEAP может зависеть от увеличения вычислений при выводе, а не на большем количестве данных
17 апреля 2025 г.
AlbertWalker
48

Индустрия ИИ находится в состоянии постоянного потока, причем 2025 год приносит некоторые изменения, изменяющие игру, которые встряхивают. Одна крупная встряска произошла, когда китайская лаборатория искусственного интеллекта, Deepseek, сбросила бомбу с новой моделью, которая вызвала 17% падение акций Nvidia и повлияло на другие акции центра обработки данных AI. Гул вокруг модели Deepseek? Он обеспечивает первоклассную производительность на долю от того, что стоит других конкурентов США, разжигая шторм о том, что это означает для будущего центров обработки данных искусственного интеллекта.
Но чтобы действительно получить то, что делает DeepSeek, нам нужно увеличить масштаб и посмотреть на более широкую картину. Мир ИИ захватывает нехватку учебных данных. Крупные игроки уже пережевали большинство данных общего интернета, что означает, что мы берем на стену в улучшении до обучения. В результате, сдвигающие механизмы отрасли в сторону «вычисления времени испытания» (TTC). Подумайте об этом, как о моделях ИИ, которые требуются, чтобы «думать», прежде чем ответить, как в серии «O» Openai. Есть надежда на то, что TTC может предложить такие же улучшения масштабирования, что и до тренировки, потенциально открывая в следующую большую волну прорывов ИИ.
Эти сдвиги сигнализируют о двух больших изменениях: во-первых, в игре сейчас находятся меньшие бюджетные лаборатории, выпускающие передовые модели. Во -вторых, TTC становится новой границей для движения ИИ. Давайте разберем эти тенденции и то, что они могут означать для ландшафта ИИ и рынка.
Последствия для индустрии ИИ
Мы считаем, что переход к TTC и увеличение конкуренции между моделями рассуждений могут изменить ландшафт ИИ на нескольких фронтах: аппаратные средства, облачные платформы, модели фундамента и корпоративное программное обеспечение.
1. Аппаратное обеспечение (графические процессоры, выделенные чипы и вычислительная инфраструктура)
Перемещение к TTC может изменить то, что нужно компании по аппаратному ИИ и как они управляют им. Вместо того, чтобы вкладывать деньги в постоянные кластеры графических процессоров для обучения, они могут больше сосредоточиться на усилении своих возможностей для вывода для удовлетворения требований TTC. В то время как графические процессоры по -прежнему будут иметь решающее значение для вывода, разница между рабочими нагрузками обучения и вывода может повлиять на то, как эти чипы настроены и используются. Поскольку рабочие нагрузки вывода более непредсказуемы и «Spikey», планирование пропускной способности может стать сложнее.
Мы также думаем, что этот сдвиг может повысить рынок аппаратного обеспечения, специально предназначенного для вывода с низкой задержкой, таких как Asics. Поскольку TTC становится более важным, чем учебная способность, правление графических процессоров общего назначения может начать ослабевать, открывая двери для специализированных производителей чипов.
2. Облачные платформы: гиперсклаы (AWS, Azure, GCP) и Cloud Compute
Одним из основных препятствий для принятия искусственного интеллекта в бизнесе, помимо проблем с точностью, является ненадежность API -интерфейсов вывода. Такие вещи, как непоследовательное время отклика, ограничения по ставке и проблемы с параллельными запросами, могут быть реальной головной болью. TTC может сделать эти проблемы еще хуже. В этом сценарии облачный провайдер, который может гарантировать высокое качество обслуживания (QoS) для решения этих проблем, может иметь большую ногу.
Интересно, что, хотя новые методы могут сделать ИИ более эффективным, они могут не уменьшить спрос на оборудование. Следуя парадоксу Джевонса, где большая эффективность приводит к большему потреблению, более эффективные модели вывода могут заставить больше разработчиков использовать модели рассуждений, увеличивая необходимость в вычислительной мощности. Мы думаем, что недавние улучшения модели могут стимулировать больше спроса на Cloud AI Compute, как для вывода, так и для меньшего, специализированного модели.
3. Фонд -модельные поставщики (Openai, Anpropic, Cohere, Deepseek, Mistral)
Если новые участники, такие как DeepSeek, могут пойти на ноги с большим оружием за долю от стоимости, оплот проприетарных предварительно обученных моделей может начать разрушаться. Мы также можем ожидать большего количества инноваций в TTC для моделей Transformer, и, как показал Deepseek, эти инновации могут поступать из неожиданных мест за пределами обычных подозреваемых в ИИ.
4. Принятие ИИ предприятия и SaaS (уровень приложений)
Учитывая корни Deepseek в Китае, обязательно будет постоянно изучать их продукты с точки зрения безопасности и конфиденциальности. Их китайские услуги API и чат-ботов вряд ли будут завоевать популярность с клиентами AI Enterprise в США, Канаде или других западных странах. Многие компании уже блокируют веб -сайт и приложения DeepSeek. Даже в размещении третьих сторон в западных центрах обработки данных, модели Deepseek могут столкнуться с проверкой, что может ограничить их принятие на предприятии. Исследователи отмечают такие проблемы, как джейлбрейк, предвзятость и вредное поколение контента. В то время как некоторые предприятия могут экспериментировать с моделями Deepseek, широкое распространение кажется маловероятным из -за этих проблем.
С другой стороны, вертикальная специализация набирает оболочку. В прошлом вертикальные приложения, основанные на моделях фундамента, были о создании индивидуальных рабочих процессов. Такие методы, как поиск-август, генерация (RAG), маршрутизация модели, вызов функций и ограждения, были ключевыми в настройке обобщенных моделей для этих конкретных вариантов использования. Но всегда было беспокойство, что значительные улучшения в базовых моделях могут сделать эти приложения устаревшими. Сэм Альтман однажды предупредил, что большой скачок в возможностях моделей может «переходить» эти инновации.
Однако, если мы видим плато в вычислительном поезде во время поезда, угроза быстрого навеса уменьшается. В мире, где улучшения производительности модели поступают из-за оптимизации TTC, могут появиться новые возможности для игроков на уровне приложений. Инновации, такие как структурированная оперативная оптимизация, стратегии рассуждений с задержкой, и эффективные методы отбора проб, могут предложить большие повышения производительности в определенных вертикалях.
Эти улучшения особенно актуальны для моделей, ориентированных на рассуждения, таких как GPT-4O OpenAI и DeepSeek-R1, которые могут занять несколько секунд, чтобы ответить. В приложениях в реальном времени сокращение задержки и повышение качества вывода в определенном домене может дать конкурентное преимущество. В результате компании с глубокими знаниями в области могут сыграть решающую роль в оптимизации эффективности вывода и тонкой настройки.
Работа DeepSeek показывает, что мы отходим от полагаться исключительно на более предварительное обучение, чтобы улучшить качество модели. Вместо этого TTC становится все более важным. Хотя неясно, будут ли модели Deepseek широко приняты в предпринимательском программном обеспечении из -за проверки, их влияние на улучшение других моделей становится более очевидным.
Мы считаем, что инновации DeepSeek подталкивают созданные лаборатории ИИ для принятия аналогичных методов, дополняя свои существующие аппаратные преимущества. Прогнозируемое снижение затрат на модель, по -видимому, способствует большему использованию моделей, подгоняя паттерн парадокса Джевонса.
Pashootan Vaezipoor является техническим лидером в Грузии.
Связанная статья
前Deepseeker和合作者發布了新的培訓可靠AI代理的方法:Ragen
人工智能代理年度:仔細研究2025年的期望和現實2025年被許多專家預示為當年的AI代理商(由高級大型語言和多式聯運公司提供支持的AI代理商),來自OpenAI,Anthropic,Google和Google和Deepseek等公司,最終將帶上中心中心中心中心。
DeepSeek的AIS發現了真正的人類慾望
DeepSeek在AI獎勵模型中的突破性:加強AI推理和響應中國AI初創公司DeepSeek與Tsinghua University合作,在AI研究中取得了重要的里程碑。他們對AI獎勵模型的創新方法有望徹底改變AI系統的學習方式
研究人員以低於50美元的價格開發了OpenAI $ 50“推理”模型的開源競爭對手
上週五,斯坦福大學和華盛頓大學的AI專家的一份開創性的研究論文襲擊了現場,透露,他們設法開發了一種被稱為S1的AI“推理”模型,以低於50美元的雲計算學分。 S1擁有自己的AI世界,這種啟示正在震撼AI世界
Комментарии (30)
JohnRoberts
18 апреля 2025 г., 12:09:37 GMT
DeepSeek's new model is shaking things up, but I'm not sure if it's all that. It's interesting how they're focusing on compute at inference, but I'm still waiting to see real-world results. 🤔💻
0
WalterWhite
18 апреля 2025 г., 12:09:37 GMT
DeepSeekの新しいモデルは話題になっていますが、正直よくわかりません。推論時の計算に焦点を当てているのは面白いですが、実際の結果を見るまで待ちます。🤔💻
0
RogerPerez
18 апреля 2025 г., 12:09:37 GMT
DeepSeek의 새로운 모델이 화제가 되고 있지만, 솔직히 잘 모르겠어요. 추론 시의 계산에 집중하는 건 흥미롭지만, 실제 결과를 보기 전까지는 기다려야 할 것 같아요. 🤔💻
0
PatrickMartinez
18 апреля 2025 г., 12:09:37 GMT
O novo modelo da DeepSeek está causando um impacto, mas não tenho certeza se é tudo isso. É interessante focar no cálculo durante a inferência, mas ainda estou esperando pelos resultados reais. 🤔💻
0
ScottPerez
18 апреля 2025 г., 12:09:37 GMT
El nuevo modelo de DeepSeek está dando que hablar, pero no estoy seguro de que sea para tanto. Es interesante que se enfoquen en el cálculo durante la inferencia, pero aún espero ver resultados reales. 🤔💻
0
SophiaCampbell
18 апреля 2025 г., 17:57:57 GMT
DeepSeek really shook the AI world with their new model! Nvidia's stock took a hit, but honestly, it's exciting to see such big moves. It's like watching a sci-fi movie unfold in real-time. Can't wait to see where this leads, but more compute at inference? Sounds pricey! 🚀
0






Индустрия ИИ находится в состоянии постоянного потока, причем 2025 год приносит некоторые изменения, изменяющие игру, которые встряхивают. Одна крупная встряска произошла, когда китайская лаборатория искусственного интеллекта, Deepseek, сбросила бомбу с новой моделью, которая вызвала 17% падение акций Nvidia и повлияло на другие акции центра обработки данных AI. Гул вокруг модели Deepseek? Он обеспечивает первоклассную производительность на долю от того, что стоит других конкурентов США, разжигая шторм о том, что это означает для будущего центров обработки данных искусственного интеллекта.
Но чтобы действительно получить то, что делает DeepSeek, нам нужно увеличить масштаб и посмотреть на более широкую картину. Мир ИИ захватывает нехватку учебных данных. Крупные игроки уже пережевали большинство данных общего интернета, что означает, что мы берем на стену в улучшении до обучения. В результате, сдвигающие механизмы отрасли в сторону «вычисления времени испытания» (TTC). Подумайте об этом, как о моделях ИИ, которые требуются, чтобы «думать», прежде чем ответить, как в серии «O» Openai. Есть надежда на то, что TTC может предложить такие же улучшения масштабирования, что и до тренировки, потенциально открывая в следующую большую волну прорывов ИИ.
Эти сдвиги сигнализируют о двух больших изменениях: во-первых, в игре сейчас находятся меньшие бюджетные лаборатории, выпускающие передовые модели. Во -вторых, TTC становится новой границей для движения ИИ. Давайте разберем эти тенденции и то, что они могут означать для ландшафта ИИ и рынка.
Последствия для индустрии ИИ
Мы считаем, что переход к TTC и увеличение конкуренции между моделями рассуждений могут изменить ландшафт ИИ на нескольких фронтах: аппаратные средства, облачные платформы, модели фундамента и корпоративное программное обеспечение.
1. Аппаратное обеспечение (графические процессоры, выделенные чипы и вычислительная инфраструктура)
Перемещение к TTC может изменить то, что нужно компании по аппаратному ИИ и как они управляют им. Вместо того, чтобы вкладывать деньги в постоянные кластеры графических процессоров для обучения, они могут больше сосредоточиться на усилении своих возможностей для вывода для удовлетворения требований TTC. В то время как графические процессоры по -прежнему будут иметь решающее значение для вывода, разница между рабочими нагрузками обучения и вывода может повлиять на то, как эти чипы настроены и используются. Поскольку рабочие нагрузки вывода более непредсказуемы и «Spikey», планирование пропускной способности может стать сложнее.
Мы также думаем, что этот сдвиг может повысить рынок аппаратного обеспечения, специально предназначенного для вывода с низкой задержкой, таких как Asics. Поскольку TTC становится более важным, чем учебная способность, правление графических процессоров общего назначения может начать ослабевать, открывая двери для специализированных производителей чипов.
2. Облачные платформы: гиперсклаы (AWS, Azure, GCP) и Cloud Compute
Одним из основных препятствий для принятия искусственного интеллекта в бизнесе, помимо проблем с точностью, является ненадежность API -интерфейсов вывода. Такие вещи, как непоследовательное время отклика, ограничения по ставке и проблемы с параллельными запросами, могут быть реальной головной болью. TTC может сделать эти проблемы еще хуже. В этом сценарии облачный провайдер, который может гарантировать высокое качество обслуживания (QoS) для решения этих проблем, может иметь большую ногу.
Интересно, что, хотя новые методы могут сделать ИИ более эффективным, они могут не уменьшить спрос на оборудование. Следуя парадоксу Джевонса, где большая эффективность приводит к большему потреблению, более эффективные модели вывода могут заставить больше разработчиков использовать модели рассуждений, увеличивая необходимость в вычислительной мощности. Мы думаем, что недавние улучшения модели могут стимулировать больше спроса на Cloud AI Compute, как для вывода, так и для меньшего, специализированного модели.
3. Фонд -модельные поставщики (Openai, Anpropic, Cohere, Deepseek, Mistral)
Если новые участники, такие как DeepSeek, могут пойти на ноги с большим оружием за долю от стоимости, оплот проприетарных предварительно обученных моделей может начать разрушаться. Мы также можем ожидать большего количества инноваций в TTC для моделей Transformer, и, как показал Deepseek, эти инновации могут поступать из неожиданных мест за пределами обычных подозреваемых в ИИ.
4. Принятие ИИ предприятия и SaaS (уровень приложений)
Учитывая корни Deepseek в Китае, обязательно будет постоянно изучать их продукты с точки зрения безопасности и конфиденциальности. Их китайские услуги API и чат-ботов вряд ли будут завоевать популярность с клиентами AI Enterprise в США, Канаде или других западных странах. Многие компании уже блокируют веб -сайт и приложения DeepSeek. Даже в размещении третьих сторон в западных центрах обработки данных, модели Deepseek могут столкнуться с проверкой, что может ограничить их принятие на предприятии. Исследователи отмечают такие проблемы, как джейлбрейк, предвзятость и вредное поколение контента. В то время как некоторые предприятия могут экспериментировать с моделями Deepseek, широкое распространение кажется маловероятным из -за этих проблем.
С другой стороны, вертикальная специализация набирает оболочку. В прошлом вертикальные приложения, основанные на моделях фундамента, были о создании индивидуальных рабочих процессов. Такие методы, как поиск-август, генерация (RAG), маршрутизация модели, вызов функций и ограждения, были ключевыми в настройке обобщенных моделей для этих конкретных вариантов использования. Но всегда было беспокойство, что значительные улучшения в базовых моделях могут сделать эти приложения устаревшими. Сэм Альтман однажды предупредил, что большой скачок в возможностях моделей может «переходить» эти инновации.
Однако, если мы видим плато в вычислительном поезде во время поезда, угроза быстрого навеса уменьшается. В мире, где улучшения производительности модели поступают из-за оптимизации TTC, могут появиться новые возможности для игроков на уровне приложений. Инновации, такие как структурированная оперативная оптимизация, стратегии рассуждений с задержкой, и эффективные методы отбора проб, могут предложить большие повышения производительности в определенных вертикалях.
Эти улучшения особенно актуальны для моделей, ориентированных на рассуждения, таких как GPT-4O OpenAI и DeepSeek-R1, которые могут занять несколько секунд, чтобы ответить. В приложениях в реальном времени сокращение задержки и повышение качества вывода в определенном домене может дать конкурентное преимущество. В результате компании с глубокими знаниями в области могут сыграть решающую роль в оптимизации эффективности вывода и тонкой настройки.
Работа DeepSeek показывает, что мы отходим от полагаться исключительно на более предварительное обучение, чтобы улучшить качество модели. Вместо этого TTC становится все более важным. Хотя неясно, будут ли модели Deepseek широко приняты в предпринимательском программном обеспечении из -за проверки, их влияние на улучшение других моделей становится более очевидным.
Мы считаем, что инновации DeepSeek подталкивают созданные лаборатории ИИ для принятия аналогичных методов, дополняя свои существующие аппаратные преимущества. Прогнозируемое снижение затрат на модель, по -видимому, способствует большему использованию моделей, подгоняя паттерн парадокса Джевонса.
Pashootan Vaezipoor является техническим лидером в Грузии.



DeepSeek's new model is shaking things up, but I'm not sure if it's all that. It's interesting how they're focusing on compute at inference, but I'm still waiting to see real-world results. 🤔💻




DeepSeekの新しいモデルは話題になっていますが、正直よくわかりません。推論時の計算に焦点を当てているのは面白いですが、実際の結果を見るまで待ちます。🤔💻




DeepSeek의 새로운 모델이 화제가 되고 있지만, 솔직히 잘 모르겠어요. 추론 시의 계산에 집중하는 건 흥미롭지만, 실제 결과를 보기 전까지는 기다려야 할 것 같아요. 🤔💻




O novo modelo da DeepSeek está causando um impacto, mas não tenho certeza se é tudo isso. É interessante focar no cálculo durante a inferência, mas ainda estou esperando pelos resultados reais. 🤔💻




El nuevo modelo de DeepSeek está dando que hablar, pero no estoy seguro de que sea para tanto. Es interesante que se enfoquen en el cálculo durante la inferencia, pero aún espero ver resultados reales. 🤔💻




DeepSeek really shook the AI world with their new model! Nvidia's stock took a hit, but honestly, it's exciting to see such big moves. It's like watching a sci-fi movie unfold in real-time. Can't wait to see where this leads, but more compute at inference? Sounds pricey! 🚀












