lựa chọn
Trang chủ
Tin tức
Pruna AI tiết lộ Khung tối ưu hóa mô hình AI nguồn mở nguồn mở

Pruna AI tiết lộ Khung tối ưu hóa mô hình AI nguồn mở nguồn mở

Ngày 10 tháng 4 năm 2025
103

Pruna AI, một công ty khởi nghiệp châu Âu tập trung vào việc phát triển các thuật toán nén cho các mô hình AI, dự kiến sẽ phát hành khung tối ưu hóa của mình dưới dạng mã nguồn mở vào thứ Năm này. Công ty đã làm việc trên một khung tích hợp các kỹ thuật hiệu quả khác nhau như lưu trữ đệm, cắt tỉa, lượng tử hóa và chưng cất để nâng cao hiệu suất mô hình AI.

John Rachwan, đồng sáng lập và CTO của Pruna AI, giải thích với TechCrunch rằng khung của họ không chỉ áp dụng các phương pháp này mà còn chuẩn hóa quy trình lưu, tải và đánh giá các mô hình đã nén. Điều này cho phép người dùng đánh giá bất kỳ mất mát chất lượng nào và những cải tiến hiệu suất đạt được thông qua quá trình nén.

Rachwan so sánh vai trò của Pruna AI với Hugging Face, nơi đã chuẩn hóa việc sử dụng các bộ biến đổi và bộ khuếch tán. "Chúng tôi đang làm điều tương tự, nhưng dành cho các phương pháp hiệu quả," ông tuyên bố, nhấn mạnh việc chuẩn hóa cách các phương pháp này được áp dụng và quản lý.

Các phòng thí nghiệm AI lớn đã áp dụng các kỹ thuật nén tương tự. Ví dụ, OpenAI đã sử dụng chưng cất để phát triển các phiên bản nhanh hơn của mô hình của mình, như GPT-4 Turbo. Tương tự, Black Forest Labs đã tạo ra Flux.1-schnell, một phiên bản chưng cất của mô hình Flux.1 của họ. Chưng cất liên quan đến cách tiếp cận "giáo viên-học sinh" nơi đầu ra của một mô hình lớn hơn được sử dụng để huấn luyện một mô hình nhỏ hơn, hiệu quả hơn.

Rachwan chỉ ra rằng trong khi các công ty lớn thường phát triển các công cụ này nội bộ, cộng đồng mã nguồn mở thường tập trung vào các phương pháp đơn lẻ. "Nhưng bạn không thể tìm thấy một công cụ tổng hợp tất cả chúng, giúp chúng dễ sử dụng và kết hợp với nhau," ông nói, nhấn mạnh giá trị độc đáo của Pruna AI.

Từ trái sang phải: Rayan Nait Mazi, Bertrand Charpentier, John Rachwan, Stephan GünnemannTín dụng hình ảnh: Pruna AI
Mặc dù khung của Pruna AI hỗ trợ nhiều loại mô hình, bao gồm các mô hình ngôn ngữ lớn, mô hình khuếch tán, mô hình chuyển đổi giọng nói thành văn bản và mô hình thị giác máy tính, công ty hiện đang tập trung vào các mô hình tạo hình ảnh và video. Người dùng hiện tại của Pruna AI bao gồm Scenario và PhotoRoom.

Ngoài phiên bản mã nguồn mở, Pruna AI cung cấp một phiên bản doanh nghiệp với các tính năng tối ưu hóa nâng cao, bao gồm một tác nhân nén sắp ra mắt. Rachwan mô tả tác nhân này như một công cụ tự động tìm ra sự kết hợp nén tốt nhất cho một mô hình dựa trên yêu cầu hiệu suất và độ chính xác do người dùng chỉ định.

Phiên bản chuyên nghiệp của Pruna AI được tính phí theo giờ, tương tự như việc thuê GPU trên các dịch vụ đám mây như AWS. Bằng cách tối ưu hóa các mô hình, người dùng có thể giảm đáng kể chi phí suy luận. Chẳng hạn, Pruna AI đã nén một mô hình Llama xuống còn một phần tám kích thước ban đầu với mất mát chất lượng tối thiểu, thể hiện tiềm năng tiết kiệm chi phí.

Công ty gần đây đã huy động được vòng tài trợ hạt giống trị giá 6,5 triệu USD từ các nhà đầu tư bao gồm EQT Ventures, Daphni, Motier Ventures và Kima Ventures. Pruna AI xem khung nén của mình như một khoản đầu tư chiến lược có thể tự chi trả thông qua việc giảm chi phí vận hành.

Bài viết liên quan
Cựu Kỹ sư OpenAI Chia sẻ Thông tin về Văn hóa Công ty và Tăng trưởng Nhanh chóng Cựu Kỹ sư OpenAI Chia sẻ Thông tin về Văn hóa Công ty và Tăng trưởng Nhanh chóng Ba tuần trước, Calvin French-Owen, một kỹ sư đã đóng góp vào một sản phẩm chủ chốt của OpenAI, đã rời công ty.Gần đây, anh ấy đã chia sẻ một bài đăng blog hấp dẫn, mô tả chi tiết một năm làm việc tại
AI驱动的翻译提升全球商业沟通 AI驱动的翻译提升全球商业沟通 在当今互联的世界中,无缝的跨语言沟通对成功至关重要。DeepL 引领潮流,利用尖端人工智能优化全球企业的多语言互动。从即时文本翻译到高级语音解决方案,DeepL 改变公司与全球客户、合作伙伴和团队的互动方式。主要亮点DeepL 利用 AI 优化跨语言商业沟通。其 AI 优先考虑翻译的精确性、质量和安全性。DeepL 支持文本和语音翻译,提升国际运营。DeepL 的全球覆盖现已扩展到 165 个新市
Công nghệ Pháp lý AI: Cách tiếp cận của iLevel.ai về Độ chính xác và Độ tin cậy Công nghệ Pháp lý AI: Cách tiếp cận của iLevel.ai về Độ chính xác và Độ tin cậy Ngành pháp lý đang chuyển đổi với sự tích hợp trí tuệ nhân tạo (AI). Các nền tảng như iLevel.ai hướng đến hỗ trợ các chuyên gia pháp lý, nhưng vẫn còn lo ngại về độ chính xác, độ tin cậy và các vấn đề
Nhận xét (30)
0/200
PaulRoberts
PaulRoberts 11:04:39 GMT+07:00 Ngày 25 tháng 4 năm 2025

O framework de código aberto da Pruna AI é uma bênção para nós entusiastas de AI DIY! É como ter uma faca suíça para otimizar modelos. Consegui reduzir meus modelos sem perder muita precisão, o que é incrível. O único problema? A documentação poderia ser mais detalhada. Ainda assim, mal posso esperar para ver o que mais eles vão lançar! 🚀

DouglasMitchell
DouglasMitchell 00:25:23 GMT+07:00 Ngày 25 tháng 4 năm 2025

El marco de código abierto de Pruna AI es un regalo para nosotros los entusiastas del AI DIY. ¡Es como tener un cuchillo suizo para optimizar modelos! He podido reducir mis modelos sin perder mucha precisión, lo cual es genial. El único inconveniente es que la documentación podría ser más completa. ¡Aun así, no puedo esperar a ver qué más sacan! 🚀

WillieMartinez
WillieMartinez 08:20:47 GMT+07:00 Ngày 20 tháng 4 năm 2025

Pruna AI's open-source framework sounds promising, but the setup was a bit of a headache. Once I got it running, the optimization really sped up my models. Just wish the documentation was clearer. Still, it's a solid tool for anyone looking to optimize AI models! 🤓

JamesLopez
JamesLopez 05:46:00 GMT+07:00 Ngày 19 tháng 4 năm 2025

Pruna AI's open-source framework is a godsend for us DIY AI enthusiasts! It's like having a Swiss Army knife for optimizing models. I've been able to shrink my models without losing much accuracy, which is just awesome. The only hiccup? The documentation could use a bit more love. Still, can't wait to see what else they roll out! 🚀

CharlesNelson
CharlesNelson 02:07:22 GMT+07:00 Ngày 19 tháng 4 năm 2025

Pruna AI's open-source framework sounds promising, but I'm not a tech whiz, so I'm a bit lost. The idea of optimizing AI models is cool, but I wish they had more user-friendly tutorials. Maybe they'll release something simpler soon? 🤔🧠

JerryMoore
JerryMoore 16:56:48 GMT+07:00 Ngày 17 tháng 4 năm 2025

Pruna AI의 오픈소스 프레임워크는 promising하지만, 기술에 밝지 않아서 좀 헷갈려. AI 모델 최적화는 흥미로운데, 좀 더 사용자 친화적인 튜토리얼이 있었으면 좋겠어. 곧 더 간단한 걸 내놓을까? 🤔🧠

Quay lại đầu
OR