AI nguồn mở chiến đấu trở lại với bản phát hành Llama 4 của Meta

Trang chủ

Tin tức

Ngày 15 tháng 4 năm 2025

PatrickLewis

# meta # llama

Trong những năm gần đây, cảnh quan AI đã chuyển đổi từ một lĩnh vực hợp tác mở sang một nơi mà các hệ thống độc quyền thống trị. Ngay cả OpenAI, một công ty bắt đầu với từ "mở" trong tên gọi, đã chuyển sang giữ bí mật các mô hình mạnh mẽ nhất của mình sau năm 2019. Các công ty khác như Anthropic và Google cũng làm theo, xây dựng AI tiên tiến đằng sau các bức tường API, chỉ có thể truy cập theo điều kiện của họ. Sự thay đổi này thường được biện minh bởi các mối quan ngại về an toàn và lợi ích kinh doanh, nhưng nó khiến nhiều người trong cộng đồng AI hoài niệm về những ngày tháng của tình đồng nghiệp mã nguồn mở.

Bây giờ, xu hướng đang thay đổi. Tinh thần của AI mã nguồn mở đang trở lại, dẫn đầu bởi việc Meta phát hành các mô hình Llama 4. Động thái này là một nỗ lực táo bạo để đưa AI mã nguồn mở trở lại vị trí trung tâm, và ngay cả những người vốn kín đáo cũng đang chú ý. CEO của OpenAI, Sam Altman, gần đây đã thừa nhận rằng công ty đã "đi sai hướng trong lịch sử" liên quan đến các mô hình mở và công bố kế hoạch cho một biến thể "trọng lượng mở" mới của GPT-4. Rõ ràng, AI mã nguồn mở đang hồi sinh, và ý nghĩa của "mở" đang tiến hóa.

(Nguồn: Meta)

Llama 4: Thách thức mở của Meta đối với GPT-4o, Claude và Gemini

Việc Meta công bố Llama 4 đánh dấu một thách thức trực tiếp đối với các mô hình mới nhất từ các gã khổng lồ AI, định vị nó như một lựa chọn trọng lượng mở. Llama 4 có hai phiên bản hiện có – Llama 4 Scout và Llama 4 Maverick – mỗi phiên bản đều có thông số kỹ thuật ấn tượng. Cả hai đều là mô hình hỗn hợp chuyên gia (MoE), nghĩa là chúng chỉ kích hoạt một phần thông số của mình cho mỗi truy vấn, cho phép tổng kích thước lớn mà không làm chi phí vận hành tăng vọt. Scout và Maverick mỗi cái sử dụng 17 tỷ thông số "hoạt động" cho bất kỳ đầu vào nào, nhưng Scout phân phối chúng trên 16 chuyên gia (tổng cộng 109 tỷ thông số), trong khi Maverick trải rộng trên 128 chuyên gia (tổng cộng 400 tỷ). Kết quả là các mô hình Llama 4 mang lại hiệu suất hàng đầu, cùng với những lợi thế độc đáo mà ngay cả một số mô hình đóng cũng không thể sánh bằng.

Chẳng hạn, Llama 4 Scout tự hào có cửa sổ ngữ cảnh lên đến 10 triệu token, vượt xa hầu hết các đối thủ. Điều này cho phép nó xử lý và phân tích các tài liệu hoặc mã nguồn khổng lồ trong một lần duy nhất. Mặc dù quy mô lớn, Scout có thể chạy hiệu quả trên một GPU H100 duy nhất khi được lượng tử hóa cao, cho thấy các nhà phát triển không cần siêu máy tính để thử nghiệm với nó.

Mặt khác, Llama 4 Maverick được tối ưu hóa cho hiệu suất đỉnh cao. Các thử nghiệm ban đầu cho thấy Maverick có thể sánh ngang hoặc thậm chí vượt qua các mô hình đóng hàng đầu trong các nhiệm vụ suy luận, lập trình và thị giác. Meta đã ám chỉ về một mô hình lớn hơn nữa, Llama 4 Behemoth, hiện đang được huấn luyện, được báo cáo là “vượt qua GPT-4.5, Claude 3.7 Sonnet và Gemini 2.0 Pro trong một số điểm chuẩn STEM.” Thông điệp rõ ràng: các mô hình mở không còn đứng sau; Llama 4 đang nhắm đến vị trí dẫn đầu.

Hơn nữa, Meta đã khiến Llama 4 có thể được tải xuống và sử dụng ngay lập tức. Các nhà phát triển có thể truy cập Scout và Maverick từ trang web chính thức hoặc Hugging Face dưới Giấy phép Cộng đồng Llama 4. Điều này có nghĩa là bất kỳ ai – từ một nhà phát triển cá nhân đến một tập đoàn lớn – có thể tiếp cận mô hình, tinh chỉnh nó theo nhu cầu cụ thể và chạy nó trên phần cứng hoặc đám mây của riêng họ. Đây là một sự tương phản rõ rệt với các mô hình độc quyền như GPT-4o của OpenAI hoặc Claude 3.7 của Anthropic, chỉ có thể truy cập qua API trả phí mà không có quyền truy cập vào trọng lượng cơ bản.

Meta nhấn mạnh rằng sự cởi mở của Llama 4 là để trao quyền cho người dùng: “Chúng tôi đang chia sẻ các mô hình đầu tiên trong đàn Llama 4, điều này sẽ cho phép mọi người xây dựng các trải nghiệm đa phương thức được cá nhân hóa hơn.” Về cơ bản, Llama 4 là một bộ công cụ được thiết kế để nằm trong tay các nhà phát triển và nhà nghiên cứu trên toàn thế giới. Bằng cách phát hành các mô hình có thể cạnh tranh với GPT-4 và Claude, Meta đang thổi hồn mới vào ý tưởng rằng AI hàng đầu không nên bị khóa sau một bức tường trả phí.

(Nguồn: Meta)

Chủ nghĩa lý tưởng chân thực hay chiến lược?

Meta giới thiệu Llama 4 với một cảm giác lý tưởng và vị tha. “Mô hình AI mã nguồn mở của chúng tôi, Llama, đã được tải xuống hơn một tỷ lần,” CEO Mark Zuckerberg gần đây tuyên bố, thêm rằng “việc mã nguồn mở các mô hình AI là cần thiết để đảm bảo mọi người ở khắp nơi có thể tiếp cận với lợi ích của AI.” Cách thể hiện này định vị Meta như một nhà vô địch của AI dân chủ hóa – một công ty sẵn sàng chia sẻ các mô hình quý giá của mình vì lợi ích lớn hơn. Sự phổ biến của gia đình Llama hỗ trợ câu chuyện này: các mô hình đã được tải xuống với tốc độ đáng kinh ngạc (tăng từ 650 triệu lên 1 tỷ lượt tải xuống chỉ trong vài tháng), và chúng đã được sử dụng bởi các công ty như Spotify, AT&T và DoorDash.

Meta nhấn mạnh rằng các nhà phát triển đánh giá cao “tính minh bạch, khả năng tùy chỉnh và bảo mật” của việc có các mô hình mở mà họ có thể tự chạy, điều này “giúp đạt được những cấp độ sáng tạo và đổi mới mới,” so với bản chất mờ mịt của các API hộp đen. Điều này nghe giống như tinh thần phần mềm mã nguồn mở cổ điển (nghĩ đến Linux hoặc Apache) được áp dụng cho AI – một chiến thắng rõ ràng cho cộng đồng.

Tuy nhiên, có một góc độ chiến lược trong sự cởi mở của Meta. Meta không phải là một tổ chức từ thiện, và "mã nguồn mở" trong bối cảnh này đi kèm với những ràng buộc. Llama 4 được phát hành dưới giấy phép cộng đồng đặc biệt, không phải giấy phép tự do tiêu chuẩn – vì vậy mặc dù trọng lượng mô hình miễn phí để sử dụng, nhưng có những hạn chế (ví dụ, một số trường hợp sử dụng tài nguyên cao có thể yêu cầu sự cho phép, và giấy phép là “độc quyền” theo nghĩa được Meta soạn thảo). Điều này không phù hợp với định nghĩa được phê duyệt bởi Sáng kiến Mã nguồn Mở (OSI), dẫn đến một số ý kiến cho rằng các công ty đang lạm dụng thuật ngữ này.

Trong thực tế, cách tiếp cận của Meta thường được gọi là AI “trọng lượng mở” hoặc “nguồn có sẵn”: mã và trọng lượng được chia sẻ, nhưng Meta giữ lại một số quyền kiểm soát và không tiết lộ mọi thứ (như dữ liệu huấn luyện). Mặc dù điều này không làm giảm tiện ích cho người dùng, nó cho thấy Meta đang chiến lược cởi mở – giữ đủ kiểm soát để bảo vệ mình (và có lẽ là lợi thế cạnh tranh của mình). Nhiều công ty đang áp dụng nhãn “mã nguồn mở” cho các mô hình AI trong khi giữ lại các chi tiết quan trọng, điều này làm suy yếu tinh thần thực sự của sự cởi mở.

Tại sao Meta lại mở ra? Cảnh quan cạnh tranh cung cấp một số câu trả lời. Việc phát hành các mô hình mạnh mẽ miễn phí có thể nhanh chóng xây dựng một cơ sở người dùng nhà phát triển và doanh nghiệp rộng lớn – Mistral AI, một startup Pháp, đã làm điều này với các mô hình mở ban đầu để khẳng định mình là một phòng thí nghiệm hàng đầu.

Bằng cách tràn ngập thị trường với Llama, Meta đảm bảo rằng công nghệ của mình trở thành nền tảng trong hệ sinh thái AI, điều này có thể mang lại lợi ích dài hạn. Đây là một chiến lược ôm và mở rộng cổ điển: nếu mọi người sử dụng mô hình “mở” của bạn, bạn gián tiếp đặt ra các tiêu chuẩn và có lẽ thậm chí hướng mọi người đến các nền tảng của bạn (ví dụ, các sản phẩm trợ lý AI của Meta tận dụng Llama). Cũng có một góc độ PR và định vị. Meta được đóng vai trò là nhà đổi mới nhân từ, đặc biệt là so sánh với OpenAI – công ty đã phải đối mặt với chỉ trích vì cách tiếp cận đóng của mình. Trên thực tế, sự thay đổi thái độ của OpenAI đối với các mô hình mở phần nào làm nổi bật hiệu quả của động thái của Meta.

Sau khi mô hình mở Trung Quốc đột phá DeepSeek-R1 xuất hiện vào tháng Một và vượt qua các mô hình trước đó, Altman cho biết OpenAI không muốn bị bỏ lại ở “phía sai của lịch sử.” Bây giờ OpenAI đang hứa hẹn một mô hình mở với khả năng suy luận mạnh mẽ trong tương lai, đánh dấu một sự thay đổi trong thái độ. Thật khó để không thấy ảnh hưởng của Meta trong sự thay đổi đó. Lập trường mã nguồn mở của Meta vừa thực sự nhắm đến việc mở rộng quyền truy cập AI vừa là một động thái chiến lược để vượt qua các đối thủ và định hình tương lai thị trường theo điều kiện của Meta.

Hệ quả cho Nhà phát triển, Doanh nghiệp và Tương lai của AI

Đối với các nhà phát triển, sự trở lại của các mô hình mở như Llama 4 là một thay đổi đáng hoan nghênh. Thay vì bị khóa trong hệ sinh thái và phí của một nhà cung cấp duy nhất, họ giờ đây có tự do chạy AI mạnh mẽ trên cơ sở hạ tầng của riêng mình hoặc tùy chỉnh nó theo ý muốn.

Đây là một lợi thế đáng kể cho các doanh nghiệp trong các lĩnh vực nhạy cảm – nghĩ đến tài chính, chăm sóc sức khỏe hoặc chính phủ – những nơi thận trọng về việc đưa dữ liệu bí mật vào hộp đen của người khác. Với Llama 4, một ngân hàng hoặc bệnh viện có thể triển khai một mô hình ngôn ngữ tiên tiến đằng sau tường lửa của riêng họ, tinh chỉnh nó trên dữ liệu riêng tư, mà không chia sẻ một token nào với một thực thể bên ngoài. Cũng có lợi ích về chi phí. Trong khi phí API dựa trên sử dụng cho các mô hình hàng đầu có thể nhanh chóng tăng vọt, một mô hình mở không có phí sử dụng – bạn chỉ trả cho sức mạnh tính toán để chạy nó. Các doanh nghiệp mở rộng khối lượng công việc AI nặng có thể tiết kiệm đáng kể bằng cách chọn một giải pháp mở mà họ có thể quản lý nội bộ.

Không có gì ngạc nhiên khi các doanh nghiệp đang thể hiện sự quan tâm nhiều hơn đến các mô hình mở; nhiều người nhận ra rằng sự kiểm soát và bảo mật mà AI mã nguồn mở cung cấp đáp ứng tốt hơn nhu cầu của họ so với các dịch vụ đóng một kích cỡ phù hợp cho tất cả.

Các nhà phát triển cũng được hưởng lợi từ sự đổi mới tăng lên. Với quyền truy cập vào nội bộ mô hình, họ có thể tinh chỉnh và nâng cao AI cho các lĩnh vực ngách (luật, công nghệ sinh học, ngôn ngữ khu vực – bất cứ điều gì) theo cách mà một API đóng có thể không bao giờ đáp ứng. Sự bùng nổ của các dự án do cộng đồng dẫn dắt xung quanh các mô hình Llama trước đó – từ chatbot được tinh chỉnh trên kiến thức y khoa đến các ứng dụng điện thoại thông minh của những người đam mê chạy các phiên bản thu nhỏ – đã chứng minh cách các mô hình mở có thể dân chủ hóa thử nghiệm.

Tuy nhiên, sự phục hưng mô hình mở cũng đặt ra những câu hỏi quan trọng. Liệu “dân chủ hóa” có thực sự xảy ra nếu chỉ những người có tài nguyên tính toán đáng kể mới có thể chạy một mô hình 400 tỷ thông số? Mặc dù Llama 4 Scout và Maverick giảm rào cản phần cứng so với các mô hình nguyên khối, chúng vẫn là những gã khổng lồ – một điểm không bị bỏ qua đối với một số nhà phát triển có PC không thể xử lý chúng mà không có hỗ trợ đám mây.

Hy vọng là các kỹ thuật như nén mô hình, chưng cất, hoặc các biến thể chuyên gia nhỏ hơn sẽ khiến sức mạnh của Llama 4 dễ tiếp cận hơn. Một mối quan ngại khác là việc lạm dụng. OpenAI và những người khác từ lâu đã lập luận rằng việc phát hành các mô hình mạnh mẽ một cách cởi mở có thể cho phép các tác nhân độc hại (để tạo ra thông tin sai lệch, mã độc, v.v.).

Những mối quan ngại này vẫn tồn tại: một Claude hoặc GPT mã nguồn mở có thể bị lạm dụng mà không có các bộ lọc an toàn mà các công ty áp đặt trên API của họ. Mặt khác, những người ủng hộ lập luận rằng sự cởi mở cho phép cộng đồng cũng xác định và sửa chữa các vấn đề, khiến các mô hình trở nên mạnh mẽ và minh bạch hơn theo thời gian so với bất kỳ hệ thống bí mật nào. Có bằng chứng rằng các cộng đồng mô hình mở xem xét an toàn một cách nghiêm túc, phát triển các rào cản riêng của họ và chia sẻ các phương pháp tốt nhất – nhưng đó là một căng thẳng đang tiếp diễn.

Điều ngày càng rõ ràng là chúng ta đang tiến tới một cảnh quan AI lai, nơi các mô hình mở và đóng cùng tồn tại, mỗi cái ảnh hưởng đến cái kia. Các nhà cung cấp đóng như OpenAI, Anthropic và Google vẫn giữ lợi thế về hiệu suất tuyệt đối – hiện tại. Thật vậy, vào cuối năm 2024, nghiên cứu cho thấy các mô hình mở tụt hậu khoảng một năm so với các mô hình đóng tốt nhất về khả năng. Nhưng khoảng cách đó đang thu hẹp nhanh chóng.

Trong thị trường ngày nay, “AI mã nguồn mở” không còn chỉ có nghĩa là các dự án sở thích hoặc các mô hình cũ – giờ đây nó nằm ở trung tâm của chiến lược AI cho các gã khổng lồ công nghệ và các startup. Việc ra mắt Llama 4 của Meta là một lời nhắc nhở mạnh mẽ về giá trị đang tiến hóa của sự cởi mở. Đó vừa là một lập trường triết học để dân chủ hóa công nghệ vừa là một động thái chiến thuật trong một trận chiến ngành công nghiệp cao cấp. Đối với các nhà phát triển và doanh nghiệp, nó mở ra những cánh cửa mới cho đổi mới và tự chủ, ngay cả khi nó làm phức tạp các quyết định với những đánh đổi mới. Và đối với hệ sinh thái rộng lớn hơn, nó làm dấy lên hy vọng rằng lợi ích của AI sẽ không bị khóa trong tay của một vài tập đoàn – nếu tinh thần mã nguồn mở có thể giữ vững vị trí của mình.

Bài viết liên quan

Meta cung cấp lương cao cho nhân tài AI, phủ nhận tiền thưởng ký hợp đồng 100 triệu USD Meta đang thu hút các nhà nghiên cứu AI đến phòng thí nghiệm siêu trí tuệ mới của mình với các gói lương thưởng trị giá hàng triệu USD. Tuy nhiên, các tuyên bố về tiền thưởng ký hợp đồng 100 triệu USD

Meta Tăng Cường Bảo Mật AI với Công Cụ Llama Nâng Cao Meta đã phát hành các công cụ bảo mật Llama mới để thúc đẩy phát triển AI và bảo vệ chống lại các mối đe dọa mới nổi.Các công cụ bảo mật mô hình AI Llama nâng cấp này được kết hợp với các tài nguyên m

Meta Tăng Cường Nỗ Lực Kiềm Chế Nội Dung Không Nguyên Gốc trên Facebook Vào thứ Hai, Meta đã công bố các biện pháp nghiêm ngặt hơn để xử lý các tài khoản đăng nội dung không nguyên gốc trên Facebook, nhắm đến những tài khoản liên tục sử dụng lại văn bản, hình ảnh hoặc vid

Nhận xét (11)

0/200

Nộp

RaymondAllen

08:19:05 GMT+07:00 Ngày 28 tháng 7 năm 2025

Llama 4's release is a game-changer! Open-source AI finally gets a big win, but can it keep up with the walled gardens of OpenAI and Google? Excited to see where this goes! 🚀

MarkScott

11:16:48 GMT+07:00 Ngày 17 tháng 4 năm 2025

Open-Source AI Fights Back - это потрясающе! С выпуском Llama 4 от Meta кажется, что мы возвращаемся к корням открытого сотрудничества. Это не идеально, но это шаг в правильном направлении. Продолжайте бороться за большую прозрачность, ребята! 🌟

GeorgeTaylor

09:10:40 GMT+07:00 Ngày 17 tháng 4 năm 2025

Open-Source AI Fights Back é incrível! Com o lançamento do Llama 4 da Meta, parece que estamos voltando às raízes da colaboração aberta. Não é perfeito, mas é um passo na direção certa. Continuem pressionando por mais transparência, pessoal! 🌟

JustinAnderson

09:07:46 GMT+07:00 Ngày 17 tháng 4 năm 2025

¡El lanzamiento de Llama 4 de Meta es un soplo de aire fresco en el mundo de la IA! Que el código abierto luche contra los gigantes propietarios es épico. 😎 Ahora podemos trastear e innovar sin restricciones. Espero que más empresas sigan el ejemplo y mantengan la IA accesible para todos! 🌍

BenHernández

03:30:47 GMT+07:00 Ngày 17 tháng 4 năm 2025

MetaのLlama 4リリースはAI業界に新鮮な風を吹き込んだね！オープンソースが専有の大手に対抗するのはエピックだよ。😎 今なら制限なしでいじくり回して革新できる。もっと多くの企業がこれに続いて、AIを全員にアクセス可能にしてほしい！🌍

BrianBaker

01:56:13 GMT+07:00 Ngày 17 tháng 4 năm 2025

Open-Source AI Fights Back is a breath of fresh air in the AI world! With Meta's Llama 4, it feels like we're getting back to the roots of open collaboration. It's not perfect, but it's a step in the right direction. Keep pushing for more transparency, guys! 🌟

Tin tức hàng đầu

Gemini 2.5 Pro hiện không giới hạn và rẻ hơn Claude, GPT-4O Máy phát video AI hàng đầu vào năm 2025: Pika Labs so với các lựa chọn thay thế Lồng tiếng AI: Hướng dẫn Tối ưu để Tạo Giọng Nói Thực tế Openai tăng cường trợ lý giọng nói AI để trò chuyện tốt hơn Notebooklm mở rộng toàn cầu, thêm các slide và kiểm tra thực tế nâng cao Các trung tâm dữ liệu của Hoa Kỳ có thể mở khóa 76 GW công suất năng lượng mới Người sáng lập AI để tiêu thụ sức mạnh của nhiều NYC vào năm 2026, người sáng lập Sao chép giọng nói AI: Hướng dẫn tối thượng để làm chủ chuyển đổi giọng nói Trải nghiệm ô chữ I/O do AI hỗ trợ Giám đốc điều hành NVIDIA làm rõ những quan niệm sai lầm về tác động thị trường của Deepseek

Hơn

Đặc trưng