Pruna AI открывает структуру оптимизации модели ИИ с открытым исходным кодом
Pruna AI, европейский стартап, ориентированный на разработку алгоритмов сжатия для моделей искусственного интеллекта, собирается выпустить свою структуру оптимизации в качестве открытого исходного кода в этот четверг. Компания работает над структурой, которая включает в себя различные методы эффективности, такие как кэширование, обрезка, квантование и дистилляция для повышения производительности модели ИИ.
Джон Рэчван, соучредитель и технический директор Pruna AI, объяснил TechCrunch, что их структура не только применяет эти методы, но и стандартизирует процесс сохранения, загрузки и оценки сжатых моделей. Это позволяет пользователям оценивать любую потенциальную потерю качества и улучшения производительности, достигнутые за счет сжатия.
Рахван сравнил роль Пруны Ай с роли обнимающегося лица, которая стандартизировала использование трансформаторов и диффузоров. «Мы делаем то же самое, но для методов эффективности», - заявил он, подчеркивая стандартизацию того, как эти методы применяются и управляются.
Крупные лаборатории ИИ уже приняли аналогичные методы сжатия. Например, OpenAI использовала дистилляцию для разработки более быстрых версий своих моделей, таких как GPT-4 Turbo. Аналогичным образом, Bhard Forest Labs создал Flux.1-Schnell, дистиллированная версия их модели Flux.1. Дистилляция включает в себя подход «учителя-ученика», в котором выходы более крупной модели используются для обучения меньшей, более эффективной модели.
Рачван отметил, что, хотя крупные компании часто разрабатывают эти инструменты внутри, сообщество с открытым исходным кодом обычно фокусируется на отдельных методах. «Но вы не можете найти инструмент, который объединяет их все, облегчает их использование и объединяться», - сказал он, подчеркивая уникальное ценностное предложение Pruna AI.

Слева направо: Райан Нейт Мази, Бертран Чарпентье, Джон Ракван, Стефан Гюннеманнимаж Кредиты: Пруна Ай Хотя структура Pruna AI поддерживает широкий спектр моделей, в том числе крупные языковые модели, диффузионные модели, модели речи к тексту и модели компьютерного зрения, компания в настоящее время фокусируется на моделях генерации изображений и видео. Существующие пользователи Pruna AI включают сценарий и фоторум.
В дополнение к версии с открытым исходным кодом, Pruna AI предлагает Enterprise Edition с расширенными функциями оптимизации, включая предстоящий агент сжатия. Рачван описал этот агент как инструмент, который автоматически находит наилучшую комбинацию сжатия для модели на основе определенных пользователей требований к производительности и точности.
Pro Pro Version Pro Pruna Ai выставлена счета по часу, аналогично аренду графического процессора в облачных сервисах, таких как AWS. Оптимизируя модели, пользователи могут значительно снизить затраты на вывод. Например, Pruna AI удалось сжать модель Llama на один восьмой свой первоначальный размер с минимальной потерей качества, демонстрируя потенциальную экономию затрат.
Компания недавно получила раунд семян в размере 6,5 млн. Долл. США от инвесторов, включая EQT Ventures, Daphni, Motier Ventures и Kima Ventures. Pruna AI рассматривает свою структуру сжатия как стратегические инвестиции, которые могут оплачивать себя за счет снижения эксплуатационных расходов.
Связанная статья
AI-поддерживаемое резюме: Полное руководство по суммированию видео на YouTube
В современном быстро меняющемся мире способность быстро обрабатывать и понимать информацию важнее, чем когда-либо. YouTube с его бесконечным множеством видео — это кладезь знаний, но у кого есть время
AI Революционизирует Ультразвук для Оценок на Месте Ухода
Искусственный интеллект трансформирует мир здравоохранения, и ультразвуковая технология следует за этой волной перемен. Эта статья рассматривает, как AI преобразует оценки ультразвука на месте ухода (
Справочные листы по машинному обучению: Основное руководство по быстрому доступу к AI
В динамичном мире технологий, где AI и облачные вычисления стимулируют инновации, важно оставаться в курсе и готовым. Обсуждаете ли вы стратегии с коллегой, создаете образовательный контент или готови
Комментарии (30)
NicholasLewis
11 апреля 2025 г., 0:00:00 GMT
Pruna AI's open-source framework sounds promising, but it's a bit too technical for me. I appreciate the effort to make AI more efficient, but I wish there was a simpler way to use it. Maybe they'll add a user-friendly interface in the future. Still, it's cool they're sharing it for free!
0
PeterMartinez
11 апреля 2025 г., 0:00:00 GMT
El marco de código abierto de Pruna AI suena prometedor, pero es un poco demasiado técnico para mí. Aprecio el esfuerzo por hacer que la IA sea más eficiente, pero desearía que hubiera una forma más sencilla de usarlo. Tal vez en el futuro agreguen una interfaz más amigable para el usuario. Aún así, es genial que lo compartan gratis!
0
BenBrown
11 апреля 2025 г., 0:00:00 GMT
Pruna AIのオープンソースフレームワークは有望に聞こえますが、私には少し技術的すぎます。AIをより効率的にする努力は評価しますが、もっと簡単に使える方法があればいいのにと思います。将来、ユーザーフレンドリーなインターフェースが追加されるかもしれません。それでも、無料で共有してくれるのは素晴らしいですね!
0
DouglasMartínez
11 апреля 2025 г., 0:00:00 GMT
Das Open-Source-Framework von Pruna AI klingt vielversprechend, aber es ist ein bisschen zu technisch für mich. Ich schätze den Aufwand, die KI effizienter zu machen, aber ich wünschte, es gäbe eine einfachere Möglichkeit, es zu nutzen. Vielleicht fügen sie in Zukunft eine benutzerfreundlichere Oberfläche hinzu. Trotzdem ist es cool, dass sie es kostenlos teilen!
0
DanielWalker
11 апреля 2025 г., 0:00:00 GMT
Le cadre open-source de Pruna AI semble prometteur, mais c'est un peu trop technique pour moi. J'apprécie l'effort pour rendre l'IA plus efficace, mais j'aimerais qu'il y ait une manière plus simple de l'utiliser. Peut-être qu'ils ajouteront une interface plus conviviale à l'avenir. C'est quand même cool qu'ils le partagent gratuitement !
0
TimothyGonzález
13 апреля 2025 г., 0:00:00 GMT
Pruna AI's open-source framework sounds promising, but I'm not sure how to use it yet. The idea of optimizing AI models with caching, pruning, and quantization is cool, but it's a bit over my head. Hopefully, they'll release some tutorials soon!
0
Pruna AI, европейский стартап, ориентированный на разработку алгоритмов сжатия для моделей искусственного интеллекта, собирается выпустить свою структуру оптимизации в качестве открытого исходного кода в этот четверг. Компания работает над структурой, которая включает в себя различные методы эффективности, такие как кэширование, обрезка, квантование и дистилляция для повышения производительности модели ИИ.
Джон Рэчван, соучредитель и технический директор Pruna AI, объяснил TechCrunch, что их структура не только применяет эти методы, но и стандартизирует процесс сохранения, загрузки и оценки сжатых моделей. Это позволяет пользователям оценивать любую потенциальную потерю качества и улучшения производительности, достигнутые за счет сжатия.
Рахван сравнил роль Пруны Ай с роли обнимающегося лица, которая стандартизировала использование трансформаторов и диффузоров. «Мы делаем то же самое, но для методов эффективности», - заявил он, подчеркивая стандартизацию того, как эти методы применяются и управляются.
Крупные лаборатории ИИ уже приняли аналогичные методы сжатия. Например, OpenAI использовала дистилляцию для разработки более быстрых версий своих моделей, таких как GPT-4 Turbo. Аналогичным образом, Bhard Forest Labs создал Flux.1-Schnell, дистиллированная версия их модели Flux.1. Дистилляция включает в себя подход «учителя-ученика», в котором выходы более крупной модели используются для обучения меньшей, более эффективной модели.
Рачван отметил, что, хотя крупные компании часто разрабатывают эти инструменты внутри, сообщество с открытым исходным кодом обычно фокусируется на отдельных методах. «Но вы не можете найти инструмент, который объединяет их все, облегчает их использование и объединяться», - сказал он, подчеркивая уникальное ценностное предложение Pruna AI.
В дополнение к версии с открытым исходным кодом, Pruna AI предлагает Enterprise Edition с расширенными функциями оптимизации, включая предстоящий агент сжатия. Рачван описал этот агент как инструмент, который автоматически находит наилучшую комбинацию сжатия для модели на основе определенных пользователей требований к производительности и точности.
Pro Pro Version Pro Pruna Ai выставлена счета по часу, аналогично аренду графического процессора в облачных сервисах, таких как AWS. Оптимизируя модели, пользователи могут значительно снизить затраты на вывод. Например, Pruna AI удалось сжать модель Llama на один восьмой свой первоначальный размер с минимальной потерей качества, демонстрируя потенциальную экономию затрат.
Компания недавно получила раунд семян в размере 6,5 млн. Долл. США от инвесторов, включая EQT Ventures, Daphni, Motier Ventures и Kima Ventures. Pruna AI рассматривает свою структуру сжатия как стратегические инвестиции, которые могут оплачивать себя за счет снижения эксплуатационных расходов.




Pruna AI's open-source framework sounds promising, but it's a bit too technical for me. I appreciate the effort to make AI more efficient, but I wish there was a simpler way to use it. Maybe they'll add a user-friendly interface in the future. Still, it's cool they're sharing it for free!




El marco de código abierto de Pruna AI suena prometedor, pero es un poco demasiado técnico para mí. Aprecio el esfuerzo por hacer que la IA sea más eficiente, pero desearía que hubiera una forma más sencilla de usarlo. Tal vez en el futuro agreguen una interfaz más amigable para el usuario. Aún así, es genial que lo compartan gratis!




Pruna AIのオープンソースフレームワークは有望に聞こえますが、私には少し技術的すぎます。AIをより効率的にする努力は評価しますが、もっと簡単に使える方法があればいいのにと思います。将来、ユーザーフレンドリーなインターフェースが追加されるかもしれません。それでも、無料で共有してくれるのは素晴らしいですね!




Das Open-Source-Framework von Pruna AI klingt vielversprechend, aber es ist ein bisschen zu technisch für mich. Ich schätze den Aufwand, die KI effizienter zu machen, aber ich wünschte, es gäbe eine einfachere Möglichkeit, es zu nutzen. Vielleicht fügen sie in Zukunft eine benutzerfreundlichere Oberfläche hinzu. Trotzdem ist es cool, dass sie es kostenlos teilen!




Le cadre open-source de Pruna AI semble prometteur, mais c'est un peu trop technique pour moi. J'apprécie l'effort pour rendre l'IA plus efficace, mais j'aimerais qu'il y ait une manière plus simple de l'utiliser. Peut-être qu'ils ajouteront une interface plus conviviale à l'avenir. C'est quand même cool qu'ils le partagent gratuitement !




Pruna AI's open-source framework sounds promising, but I'm not sure how to use it yet. The idea of optimizing AI models with caching, pruning, and quantization is cool, but it's a bit over my head. Hopefully, they'll release some tutorials soon!












