вариант
Дом
Новости
Запуск моделей искусственного интеллекта становится проблемой, связанной с памятью

Запуск моделей искусственного интеллекта становится проблемой, связанной с памятью

9 апреля 2026 г.
74

Запуск моделей искусственного интеллекта становится проблемой, связанной с памятью

Обсуждения затрат на инфраструктуру ИИ часто сосредоточены на компании Nvidia и графических процессорах, однако память становится ключевым элементом этой системы. Поскольку гипермасштабируемые компании вкладывают миллиарды в новые центры обработки данных, цены на чипы DRAM за последний год выросли примерно в семь раз.

Одновременно с этим развивается новая дисциплина, направленная на координацию работы этой памяти, чтобы нужные данные поступали к нужному агенту ИИ в нужное время. Компании, которые преуспевают в этом, могут выполнять те же запросы, используя меньше токенов — и именно это может стать решающим фактором выживания на конкурентном рынке.

Аналитик по полупроводникам Дэн О'Лафлин (Dan O’Laughlin) предлагает убедительную точку зрения на важность чипов памяти в своем Substack, где представлена беседа с Валом Берковичи (Val Bercovici), директором по искусственному интеллекту в Weka. Оба эксперта имеют опыт работы в сфере полупроводников, поэтому их обсуждение склоняется к аппаратному обеспечению, хотя последствия для программного обеспечения ИИ не менее значимы.

Особое внимание привлек один отрывок, в котором Берковичи комментирует растущую сложность документации Anthropic по кэшированию запросов:

Подсказка находится на странице ценообразования кэширования промтов Anthropic. Шесть или семь месяцев назад, особенно во время запуска Claude Code, это была простая страница, которая по сути говорила: «Используйте кэширование, это дешевле». Теперь она читается как энциклопедия советов о том, сколько записей в кэш следует приобрести заранее. Вы видите стандартные для отрасли уровни, такие как 5-минутные и 1-часовые окна — но ничего более длительного. Это показательная деталь. Затем, конечно, существуют различные возможности арбитража, связанные с ценами на чтение из кэша, в зависимости от того, сколько записей в кэш вы приобрели заранее.

Основной вопрос заключается в том, как долго Claude хранит ваш запрос в кэше. Вы можете оплатить 5-минутный интервал или более дорогой часовой интервал. Доступ к данным, все еще находящимся в кэше, обходится гораздо дешевле, поэтому эффективное управление может привести к существенной экономии. Однако есть одна загвоздка: каждый новый фрагмент данных, добавленный к запросу, может вытеснить что-то другое из кэша.

Хотя детали сложны, вывод прост: управление памятью в моделях ИИ станет одним из ключевых факторов в будущем ИИ. Компании, которые освоят его, получат значительное конкурентное преимущество.

В этой развивающейся области есть значительный потенциал для прогресса. В октябре прошлого года я писал о стартапе TensorMesh, который работает над уровнем стека, известным как оптимизация кэша.

Мероприятие TechCrunch

TechCrunch Founder Summit 2026: билеты в продаже

23 июня в Бостоне более 1100 основателей соберутся на TechCrunch Founder Summit 2026, чтобы провести целый день, посвященный росту, реализации и масштабированию в реальных условиях. Учитесь у основателей и инвесторов, которые сформировали отрасль. Общайтесь с коллегами, проходящими через аналогичные этапы роста. Унесите с собой тактики, которые можно применить сразу

Сэкономьте до 300 долларов на билете или до 30% при покупке групповых билетов для команд из четырех и более человек.

TechCrunch Founder Summit: билеты в продаже

23 июня в Бостоне более 1100 основателей соберутся на TechCrunch Founder Summit 2026, чтобы провести целый день, посвященный росту, реализации и масштабированию в реальных условиях. Учитесь у основателей и инвесторов, которые сформировали индустрию. Общайтесь с коллегами, проходящими через аналогичные этапы роста. Узнайте о тактиках, которые можно применить сразу

Сэкономьте до 300 долларов на билете или до 30% при покупке групповых билетов для команд из четырех и более человек.

Бостон, Массачусетс | 23 июня 2026 г. ЗАПИСАТЬСЯ СЕЙЧАС

Возможности существуют и в других частях стека. Например, ниже по стеку стоит вопрос о том, как центры обработки данных используют различные типы памяти. (Интервью включает в себя глубокое обсуждение того, когда использовать чипы DRAM, а когда HBM, хотя оно становится довольно техническим.) Выше по стеку конечные пользователи учатся структурировать свои рои моделей, чтобы эффективно использовать общие кэши.

По мере того как компании совершенствуют оркестрацию памяти, они будут потреблять меньше токенов, что сделает инференцию более дешевой. В то же время модели становятся более эффективными в обработке каждого токена, что еще больше снижает затраты. По мере снижения затрат на серверы многие приложения, которые в настоящее время считаются нерентабельными, начнут приближаться к рентабельности.

Связанная статья
Hightouch достигла годового повторяемого дохода (ARR) в 100 млн долларов благодаря маркетинговым инструментам на базе искусственного интеллекта Hightouch достигла годового повторяемого дохода (ARR) в 100 млн долларов благодаря маркетинговым инструментам на базе искусственного интеллекта Раньше маркетологи полагались на дизайнеров и других креативных специалистов при создании изображений и видеороликов для персонализированных рекламных кампаний в Интернете.В конце 2024 года семилетний
Рост объемов добычи природного газа компанией Meta может обеспечить энергией энергосистему Южной Дакоты Рост объемов добычи природного газа компанией Meta может обеспечить энергией энергосистему Южной Дакоты Центры обработки данных стали настолько масштабными, что их потребление электроэнергии теперь сопоставимо с потреблением целых штатов США. Возьмем, к примеру, центр обработки данных Hyperion AI компан
Cursor ведет переговоры о привлечении более 2 млрд долларов при оценке компании в 50 млрд долларов на фоне ускорения роста в корпоративном сегменте Cursor ведет переговоры о привлечении более 2 млрд долларов при оценке компании в 50 млрд долларов на фоне ускорения роста в корпоративном сегменте По словам четырех источников, знакомых с ситуацией, стартап Cursor, занимающийся разработкой программного обеспечения для искусственного интеллекта, близок к заключению нового раунда финансирования, к
Рекомендации по связанным специальным темам
Бизнес Лучшие инструменты для подбора персонала с помощью ИИ: отбор резюме и автоматизация планирования собеседований с кандидатами
Лучшие инструменты для подбора персонала с помощью ИИ: отбор резюме и автоматизация планирования собеседований с кандидатами

Откройте для себя 20 лучших инструментов для рекрутинга на базе ИИ 2026 года на сайте XIX.AI. В нашем тщательно составленном списке представлены мощные, революционные решения для отбора резюме и автоматизации планирования собеседований с кандидатами. Сравните бесплатные и платные варианты с помощью реальных тестов и еженедельно обновляемого рейтинга. Найдите своего идеального помощника по подбору персонала и оптимизируйте процесс рекрутинга уже сегодня!

10 инструментов
xix.ai
Производительность Персональные тренеры по благополучию и концентрации на базе ИИ: борьба с выгоранием и повышение уровня умственной энергии
Персональные тренеры по благополучию и концентрации на базе ИИ: борьба с выгоранием и повышение уровня умственной энергии

Откройте для себя лучших в 2026 году ИИ-тренеров по личному благополучию и концентрации внимания на сайте XIX.AI. В нашем тщательно составленном рейтинге представлены высокооцененные, революционные инструменты для борьбы с выгоранием и повышения умственной энергии. Сравните бесплатные и платные варианты с помощью реальных отзывов. Откройте для себя путь к максимальной продуктивности и благополучию уже сегодня.

10 инструментов
xix.ai
чат-бот Лучшие романтические чат-боты на базе ИИ: постройте долгосрочные отношения с помощью чат-ботов с устойчивой индивидуальностью
Лучшие романтические чат-боты на базе ИИ: постройте долгосрочные отношения с помощью чат-ботов с устойчивой индивидуальностью

Откройте для себя лучшие романтические чат-боты с искусственным интеллектом 2026 года, которые помогут вам построить искренние и долгосрочные отношения. В нашем тщательно составленном списке вы найдете чат-ботов с яркими и последовательными личностями, сравнение бесплатных и платных версий, а также результаты реальных тестов. Найдите своего идеального спутника и начните строить отношения уже сегодня на XIX.AI.

10 инструментов
xix.ai
Образование и обучение Лучшие наставники в области искусственного интеллекта и науки о данных: мастерство работы с SQL, библиотекой Pandas и рабочими процессами машинного обучения
Лучшие наставники в области искусственного интеллекта и науки о данных: мастерство работы с SQL, библиотекой Pandas и рабочими процессами машинного обучения

Откройте для себя 20 лучших наставников в области искусственного интеллекта и науки о данных на 2026 год, которые помогут вам овладеть SQL, Pandas и рабочими процессами машинного обучения. Изучите наш тщательно отобранный список на сайте XIX.AI – здесь вы найдете эффективные рекомендации, способные изменить ход ваших работ. Сравните бесплатные и платные варианты с примерами из реальной практики. Освоите науку о данных уже сегодня.

10 инструментов
xix.ai
чат-бот Лучшие тренажеры по флирту и общению на базе ИИ: повышайте свою харизму и уверенность в себе в режиме реального времени
Лучшие тренажеры по флирту и общению на базе ИИ: повышайте свою харизму и уверенность в себе в режиме реального времени

Откройте для себя 20 лучших тренажеров по флирту и общению с ИИ на сайте XIX.AI. Наша тщательно подобранная подборка самых популярных инструментов поможет вам развить коммуникабельность и уверенность в себе в режиме реального времени. Ознакомьтесь с незаменимыми инструментами, которые кардинально изменят вашу жизнь, — с сравнением бесплатных и платных версий и еженедельно обновляемым рейтингом. Раскройте свой коммуникативный потенциал уже сегодня.

10 инструментов
xix.ai
код Лучшие инструменты ИИ для автоматизированного тестирования модулей: создание случаев тестирования Jest, PyTest и JUnit одним кликом
Лучшие инструменты ИИ для автоматизированного тестирования модулей: создание случаев тестирования Jest, PyTest и JUnit одним кликом

Откройте для себя самые новые и высоко оцененные инструменты ИИ 2026 года для автоматизированного тестирования модулей. Наша тщательно подобранная коллекция включает мощные решения, способные радикально изменить процесс разработки, позволяющие мгновенно генерировать тестовые случаи для Jest, PyTest и JUnit. Сравните бесплатные и платные варианты с результатами реальных тестов, а также еженедельно обновляемыми рейтингами на сайте XIX.AI. Раскройте потенциал ИИ и повысьте эффективность своей работы в области разработки сегодня же.

10 инструментов
xix.ai
Комментарии (1)
0/500
NicholasNelson
NicholasNelson 7 мая 2026 г., 3:00:57 GMT+03:00

這篇文章點出了AI發展中常被忽略的記憶體瓶頸,挺有意思的。大家都在搶GPU,但DRAM價格一年漲七倍也太誇張了吧!這會不會讓小公司更難玩得起AI啊?🤔

OR