вариант
Дом
Новости
DeepSeek Shakes AI Industry: Далее AI LEAP может зависеть от увеличения вычислений при выводе, а не на большем количестве данных

DeepSeek Shakes AI Industry: Далее AI LEAP может зависеть от увеличения вычислений при выводе, а не на большем количестве данных

18 апреля 2025 г.
107

DeepSeek Shakes AI Industry: Далее AI LEAP может зависеть от увеличения вычислений при выводе, а не на большем количестве данных

Индустрия ИИ находится в состоянии постоянного потока, причем 2025 год приносит некоторые изменения, изменяющие игру, которые встряхивают. Одна крупная встряска произошла, когда китайская лаборатория искусственного интеллекта, Deepseek, сбросила бомбу с новой моделью, которая вызвала 17% падение акций Nvidia и повлияло на другие акции центра обработки данных AI. Гул вокруг модели Deepseek? Он обеспечивает первоклассную производительность на долю от того, что стоит других конкурентов США, разжигая шторм о том, что это означает для будущего центров обработки данных искусственного интеллекта.

Но чтобы действительно получить то, что делает DeepSeek, нам нужно увеличить масштаб и посмотреть на более широкую картину. Мир ИИ захватывает нехватку учебных данных. Крупные игроки уже пережевали большинство данных общего интернета, что означает, что мы берем на стену в улучшении до обучения. В результате, сдвигающие механизмы отрасли в сторону «вычисления времени испытания» (TTC). Подумайте об этом, как о моделях ИИ, которые требуются, чтобы «думать», прежде чем ответить, как в серии «O» Openai. Есть надежда на то, что TTC может предложить такие же улучшения масштабирования, что и до тренировки, потенциально открывая в следующую большую волну прорывов ИИ.

Эти сдвиги сигнализируют о двух больших изменениях: во-первых, в игре сейчас находятся меньшие бюджетные лаборатории, выпускающие передовые модели. Во -вторых, TTC становится новой границей для движения ИИ. Давайте разберем эти тенденции и то, что они могут означать для ландшафта ИИ и рынка.

Последствия для индустрии ИИ

Мы считаем, что переход к TTC и увеличение конкуренции между моделями рассуждений могут изменить ландшафт ИИ на нескольких фронтах: аппаратные средства, облачные платформы, модели фундамента и корпоративное программное обеспечение.

1. Аппаратное обеспечение (графические процессоры, выделенные чипы и вычислительная инфраструктура)

Перемещение к TTC может изменить то, что нужно компании по аппаратному ИИ и как они управляют им. Вместо того, чтобы вкладывать деньги в постоянные кластеры графических процессоров для обучения, они могут больше сосредоточиться на усилении своих возможностей для вывода для удовлетворения требований TTC. В то время как графические процессоры по -прежнему будут иметь решающее значение для вывода, разница между рабочими нагрузками обучения и вывода может повлиять на то, как эти чипы настроены и используются. Поскольку рабочие нагрузки вывода более непредсказуемы и «Spikey», планирование пропускной способности может стать сложнее.

Мы также думаем, что этот сдвиг может повысить рынок аппаратного обеспечения, специально предназначенного для вывода с низкой задержкой, таких как Asics. Поскольку TTC становится более важным, чем учебная способность, правление графических процессоров общего назначения может начать ослабевать, открывая двери для специализированных производителей чипов.

2. Облачные платформы: гиперсклаы (AWS, Azure, GCP) и Cloud Compute

Одним из основных препятствий для принятия искусственного интеллекта в бизнесе, помимо проблем с точностью, является ненадежность API -интерфейсов вывода. Такие вещи, как непоследовательное время отклика, ограничения по ставке и проблемы с параллельными запросами, могут быть реальной головной болью. TTC может сделать эти проблемы еще хуже. В этом сценарии облачный провайдер, который может гарантировать высокое качество обслуживания (QoS) для решения этих проблем, может иметь большую ногу.

Интересно, что, хотя новые методы могут сделать ИИ более эффективным, они могут не уменьшить спрос на оборудование. Следуя парадоксу Джевонса, где большая эффективность приводит к большему потреблению, более эффективные модели вывода могут заставить больше разработчиков использовать модели рассуждений, увеличивая необходимость в вычислительной мощности. Мы думаем, что недавние улучшения модели могут стимулировать больше спроса на Cloud AI Compute, как для вывода, так и для меньшего, специализированного модели.

3. Фонд -модельные поставщики (Openai, Anpropic, Cohere, Deepseek, Mistral)

Если новые участники, такие как DeepSeek, могут пойти на ноги с большим оружием за долю от стоимости, оплот проприетарных предварительно обученных моделей может начать разрушаться. Мы также можем ожидать большего количества инноваций в TTC для моделей Transformer, и, как показал Deepseek, эти инновации могут поступать из неожиданных мест за пределами обычных подозреваемых в ИИ.

4. Принятие ИИ предприятия и SaaS (уровень приложений)

Учитывая корни Deepseek в Китае, обязательно будет постоянно изучать их продукты с точки зрения безопасности и конфиденциальности. Их китайские услуги API и чат-ботов вряд ли будут завоевать популярность с клиентами AI Enterprise в США, Канаде или других западных странах. Многие компании уже блокируют веб -сайт и приложения DeepSeek. Даже в размещении третьих сторон в западных центрах обработки данных, модели Deepseek могут столкнуться с проверкой, что может ограничить их принятие на предприятии. Исследователи отмечают такие проблемы, как джейлбрейк, предвзятость и вредное поколение контента. В то время как некоторые предприятия могут экспериментировать с моделями Deepseek, широкое распространение кажется маловероятным из -за этих проблем.

С другой стороны, вертикальная специализация набирает оболочку. В прошлом вертикальные приложения, основанные на моделях фундамента, были о создании индивидуальных рабочих процессов. Такие методы, как поиск-август, генерация (RAG), маршрутизация модели, вызов функций и ограждения, были ключевыми в настройке обобщенных моделей для этих конкретных вариантов использования. Но всегда было беспокойство, что значительные улучшения в базовых моделях могут сделать эти приложения устаревшими. Сэм Альтман однажды предупредил, что большой скачок в возможностях моделей может «переходить» эти инновации.

Однако, если мы видим плато в вычислительном поезде во время поезда, угроза быстрого навеса уменьшается. В мире, где улучшения производительности модели поступают из-за оптимизации TTC, могут появиться новые возможности для игроков на уровне приложений. Инновации, такие как структурированная оперативная оптимизация, стратегии рассуждений с задержкой, и эффективные методы отбора проб, могут предложить большие повышения производительности в определенных вертикалях.

Эти улучшения особенно актуальны для моделей, ориентированных на рассуждения, таких как GPT-4O OpenAI и DeepSeek-R1, которые могут занять несколько секунд, чтобы ответить. В приложениях в реальном времени сокращение задержки и повышение качества вывода в определенном домене может дать конкурентное преимущество. В результате компании с глубокими знаниями в области могут сыграть решающую роль в оптимизации эффективности вывода и тонкой настройки.

Работа DeepSeek показывает, что мы отходим от полагаться исключительно на более предварительное обучение, чтобы улучшить качество модели. Вместо этого TTC становится все более важным. Хотя неясно, будут ли модели Deepseek широко приняты в предпринимательском программном обеспечении из -за проверки, их влияние на улучшение других моделей становится более очевидным.

Мы считаем, что инновации DeepSeek подталкивают созданные лаборатории ИИ для принятия аналогичных методов, дополняя свои существующие аппаратные преимущества. Прогнозируемое снижение затрат на модель, по -видимому, способствует большему использованию моделей, подгоняя паттерн парадокса Джевонса.

Pashootan Vaezipoor является техническим лидером в Грузии.

Связанная статья
DeepSeek-GRM:為企業打造可擴展、高性價比的AI解決方案 DeepSeek-GRM:為企業打造可擴展、高性價比的AI解決方案 如果你經營著一家企業,你就知道將人工智慧(AI)整合到你的營運中有多麼艱難。高昂的成本和技術複雜性往往使先進的AI模型超出小型公司的能力範圍。但這就是DeepSeek-GRM的切入點,旨在使AI更加高效且易於取得,縮小大型科技公司與小型企業之間的差距。DeepSeek-GRM 使用一種稱為生成式獎勵建模(GRM)的聰明技術來引導AI回應更符合人類的需求。這一
新技術使DeepSeek和其他模型能夠響應敏感的查詢 新技術使DeepSeek和其他模型能夠響應敏感的查詢 從中國的DeepSeek等大型語言模型(LLM)中消除偏見和審查是一個複雜的挑戰,引起了美國決策者和商業領袖的關注,他們認為這是潛在的國家安全威脅。美國國會選拔委員會的最新報告標記為深層
前Deepseeker和合作者發布了新的培訓可靠AI代理的方法:Ragen 前Deepseeker和合作者發布了新的培訓可靠AI代理的方法:Ragen 人工智能代理年度:仔細研究2025年的期望和現實2025年被許多專家預示為當年的AI代理商(由高級大型語言和多式聯運公司提供支持的AI代理商),來自OpenAI,Anthropic,Google和Google和Deepseek等公司,最終將帶上中心中心中心中心。
Комментарии (30)
JohnRoberts
JohnRoberts 18 апреля 2025 г., 0:00:00 GMT

DeepSeek's new model is shaking things up, but I'm not sure if it's all that. It's interesting how they're focusing on compute at inference, but I'm still waiting to see real-world results. 🤔💻

WalterWhite
WalterWhite 18 апреля 2025 г., 0:00:00 GMT

DeepSeekの新しいモデルは話題になっていますが、正直よくわかりません。推論時の計算に焦点を当てているのは面白いですが、実際の結果を見るまで待ちます。🤔💻

RogerPerez
RogerPerez 18 апреля 2025 г., 0:00:00 GMT

DeepSeek의 새로운 모델이 화제가 되고 있지만, 솔직히 잘 모르겠어요. 추론 시의 계산에 집중하는 건 흥미롭지만, 실제 결과를 보기 전까지는 기다려야 할 것 같아요. 🤔💻

PatrickMartinez
PatrickMartinez 18 апреля 2025 г., 0:00:00 GMT

O novo modelo da DeepSeek está causando um impacto, mas não tenho certeza se é tudo isso. É interessante focar no cálculo durante a inferência, mas ainda estou esperando pelos resultados reais. 🤔💻

ScottPerez
ScottPerez 18 апреля 2025 г., 0:00:00 GMT

El nuevo modelo de DeepSeek está dando que hablar, pero no estoy seguro de que sea para tanto. Es interesante que se enfoquen en el cálculo durante la inferencia, pero aún espero ver resultados reales. 🤔💻

SophiaCampbell
SophiaCampbell 19 апреля 2025 г., 0:00:00 GMT

DeepSeek really shook the AI world with their new model! Nvidia's stock took a hit, but honestly, it's exciting to see such big moves. It's like watching a sci-fi movie unfold in real-time. Can't wait to see where this leads, but more compute at inference? Sounds pricey! 🚀

Вернуться к вершине
OR