AI nguồn mở chiến đấu trở lại với bản phát hành Llama 4 của Meta
Ngày 15 tháng 4 năm 2025
PatrickLewis
40
Trong những năm gần đây, cảnh quan AI đã biến đổi từ một lĩnh vực hợp tác mở sang một nơi mà các hệ thống độc quyền ngự trị tối cao. Ngay cả Openai, một công ty bắt đầu với "Open" trong tên của mình, đã thay đổi để giữ các mô hình mạnh mẽ nhất của mình dưới sự kết thúc của nó sau năm 2019. Sự thay đổi này thường được chứng minh bởi những lo ngại về lợi ích an toàn và kinh doanh, nhưng nó đã khiến nhiều người trong cộng đồng AI hoài cổ về những ngày của tình bạn nguồn mở.
Bây giờ, thủy triều đang quay. Tinh thần của AI nguồn mở đang trở lại, dẫn đầu bằng cách phát hành các mô hình Llama 4 của Meta. Động thái này là một nỗ lực táo bạo để đưa AI nguồn mở trở lại hàng đầu, và ngay cả những người bí mật truyền thống đang chú ý. Giám đốc điều hành của Openai, Sam Altman gần đây đã thừa nhận rằng công ty đã "ở phía sai của lịch sử" liên quan đến các mô hình mở và công bố kế hoạch cho một biến thể "trọng lượng mở" mới của GPT-4. Rõ ràng, AI nguồn mở đang dàn dựng một sự hồi sinh và ý nghĩa của "mở" đang phát triển.
(Nguồn: Meta)
Llama 4: Người thách thức mở của Meta đối với GPT-4O, Claude và Song Tử
Meta tiết lộ Llama 4 đánh dấu một thách thức trực tiếp cho các mô hình mới nhất từ AI Giants, định vị nó như một sự thay thế trọng lượng mở. Llama 4 có hai phiên bản có sẵn ngày hôm nay - Llama 4 Scout và Llama 4 Maverick - mỗi phiên bản có thông số kỹ thuật ấn tượng. Cả hai đều là các mô hình hỗn hợp (MOE), có nghĩa là chúng chỉ kích hoạt một phần nhỏ các tham số của chúng trên mỗi truy vấn, cho phép tổng kích thước lớn mà không cần tăng chi phí thời gian chạy. Scout và Maverick mỗi người sử dụng 17 tỷ tham số "hoạt động" cho bất kỳ đầu vào nào, nhưng Scout phân phối chúng trên 16 chuyên gia (tổng số tham số 109B), trong khi Maverick trải rộng trên 128 chuyên gia (tổng cộng 400b). Kết quả là các mô hình Llama 4 cung cấp hiệu suất hàng đầu, cùng với những lợi thế độc đáo mà ngay cả một số mô hình đóng cũng không thể khớp.
Chẳng hạn, Llama 4 Scout tự hào có một cửa sổ bối cảnh 10 triệu mã thông báo, vượt xa hầu hết các đối thủ cạnh tranh. Điều này cho phép nó xử lý và phân tích các tài liệu lớn hoặc cơ sở mã trong một lần vượt qua. Mặc dù quy mô của nó, Scout có thể chạy hiệu quả trên một GPU H100 khi định lượng cao, cho thấy các nhà phát triển sẽ không cần một siêu máy tính để chơi với nó.
Mặt khác, Llama 4 Maverick được tối ưu hóa cho hiệu suất cao nhất. Các thử nghiệm ban đầu chỉ ra rằng Maverick có thể khớp hoặc thậm chí vượt trội so với các mô hình đóng hàng đầu trong các nhiệm vụ lý luận, mã hóa và tầm nhìn. Meta đã gợi ý về một mô hình thậm chí còn lớn hơn, Llama 4 Behemoth, hiện đang được đào tạo, theo báo cáo , vượt trội so với GPT-4.5, Claude 3.7 Sonnet và Gemini 2.0 Pro trên một số điểm chuẩn gốc. Thông điệp rất rõ ràng: Các mô hình mở không còn chơi Fiddle thứ hai; Llama 4 đang nhắm đến đỉnh cao.
Hơn nữa, Meta đã cung cấp Llama 4 ngay lập tức để tải xuống và sử dụng. Các nhà phát triển có thể truy cập Scout và Maverick từ trang web chính thức hoặc ôm mặt theo giấy phép cộng đồng Llama 4. Điều này có nghĩa là bất kỳ ai-từ một nhà phát triển solo đến một tập đoàn lớn-có thể đi sâu vào mô hình, tinh chỉnh nó theo nhu cầu cụ thể của họ và chạy nó trên phần cứng hoặc đám mây của riêng họ. Đây là một sự tương phản rõ ràng với các mô hình độc quyền như GPT-4O của Openai hoặc Claude 3.7 của Anthropic, chỉ có thể truy cập thông qua các API được trả tiền mà không cần truy cập vào các trọng số cơ bản.
Meta nhấn mạnh rằng sự cởi mở của Llama 4 là về việc trao quyền cho người dùng: Chúng tôi đang chia sẻ các mô hình đầu tiên trong đàn Llama 4, điều này sẽ cho phép mọi người xây dựng trải nghiệm đa phương thức được cá nhân hóa hơn. Về bản chất, Llama 4 là một bộ công cụ được thiết kế để nằm trong tay các nhà phát triển và nhà nghiên cứu trên toàn thế giới. Bằng cách phát hành các mô hình có thể đi bằng ngón chân với những người như GPT-4 và Claude, Meta đang kéo cuộc sống mới vào ý tưởng rằng AI hàng đầu không nên bị khóa sau một tường thuật.
(Nguồn: Meta)
Chủ nghĩa lý tưởng đích thực hay chơi chiến lược?
Meta trình bày Llama 4 với ý thức về chủ nghĩa duy tâm và lòng vị tha. Mô hình AI nguồn mở của chúng tôi, Llama, đã được tải xuống hơn một tỷ lần, Giám đốc điều hành của Mark, Mark Zuckerberg đã công bố gần đây, thêm rằng các mô hình AI mở nguồn là rất cần thiết để đảm bảo mọi người ở khắp mọi nơi có quyền truy cập vào lợi ích của AI. Định vị chân dung này là một nhà vô địch của AI dân chủ hóa-một công ty sẵn sàng chia sẻ các mô hình vương miện của mình vì lợi ích lớn hơn. Sự phổ biến của gia đình Llama ủng hộ câu chuyện này: Các mô hình đã được tải xuống với tốc độ đáng kinh ngạc (tăng từ 650 triệu lên 1 tỷ tổng số tải xuống chỉ trong vài tháng) và chúng đã được sử dụng bởi các công ty như Spotify, AT & T và Doordash.
Meta nhấn mạnh rằng các nhà phát triển đánh giá cao tính minh bạch, khả năng tùy chỉnh và bảo mật của việc có các mô hình mở mà họ có thể tự chạy, điều này giúp đạt được mức độ sáng tạo và đổi mới mới, so với bản chất mờ đục của API hộp đen. Điều này nghe có vẻ giống như các ethos phần mềm nguồn mở cổ điển (nghĩ rằng Linux hoặc Apache) áp dụng cho AI-một chiến thắng rõ ràng cho cộng đồng.
Tuy nhiên, có một góc độ chiến lược đối với sự cởi mở của Meta. Meta không phải là một tổ chức từ thiện và "nguồn mở" trong bối cảnh này đi kèm với các chuỗi được đính kèm. LLAMA 4 được phát hành theo giấy phép cộng đồng đặc biệt, không phải là giấy phép cho phép tiêu chuẩn-vì vậy trong khi các trọng số mô hình được sử dụng miễn phí, có những hạn chế (ví dụ: một số trường hợp sử dụng tài nguyên cao có thể yêu cầu cho phép và giấy phép là quyền sở hữu của Hồi giáo theo nghĩa là nó được chế tạo bởi META). Điều này không phù hợp với Định nghĩa Sáng kiến Nguồn mở (OSI) được phê duyệt về nguồn mở, khiến một số người lập luận rằng các công ty đang lạm dụng thuật ngữ này.
Trong thực tế, cách tiếp cận của Meta thường được dán nhãn là "trọng lượng mở" hoặc "có sẵn nguồn" AI: mã và trọng số được chia sẻ, nhưng Meta vẫn giữ một số kiểm soát và không tiết lộ mọi thứ (như dữ liệu đào tạo). Mặc dù điều này không làm giảm tiện ích cho người dùng, nhưng nó cho thấy Meta đang mở một cách chiến lược - nắm giữ đủ kiểm soát để bảo vệ chính nó (và có lẽ là lợi thế cạnh tranh của nó). Nhiều công ty đang áp dụng nhãn "nguồn mở" cho các mô hình AI trong khi giữ lại các chi tiết chính, làm suy yếu tinh thần cởi mở thực sự.
Tại sao Meta sẽ mở ra cả? Cảnh quan cạnh tranh cung cấp một số câu trả lời. Phát hành các mô hình mạnh mẽ miễn phí có thể nhanh chóng xây dựng một nhà phát triển và cơ sở người dùng doanh nghiệp rộng lớn-Mistral AI, một công ty khởi nghiệp của Pháp, đã làm điều này với các mô hình mở đầu để thiết lập như một phòng thí nghiệm hàng đầu.
Bằng cách tràn ngập thị trường với Llama, Meta đảm bảo công nghệ của nó trở thành nền tảng trong hệ sinh thái AI, có thể mang lại lợi ích lâu dài. Đó là một chiến lược cổ điển và mở rộng: Nếu mọi người sử dụng mô hình "mở" của bạn, bạn sẽ gián tiếp thiết lập các tiêu chuẩn và thậm chí có thể hướng dẫn mọi người về nền tảng của bạn (ví dụ: các sản phẩm trợ lý AI của Meta tận dụng llama). Ngoài ra còn có một PR và góc định vị. Meta có thể đóng vai trò của nhà đổi mới nhân từ, đặc biệt là trái ngược với Openai - nơi đã phải đối mặt với những lời chỉ trích cho cách tiếp cận khép kín của nó. Trên thực tế, sự thay đổi trái tim của Openai trên các mô hình mở một phần làm nổi bật mức độ di chuyển của Meta hiệu quả như thế nào.
Sau khi mô hình mở đột phá của Trung Quốc Deepseek-R1 đã xuất hiện vào tháng 1 và nhảy vọt các mô hình trước đó, Altman chỉ ra Openai không muốn bị bỏ lại ở phía bên trái của lịch sử. Bây giờ Openai đang hứa hẹn một mô hình mở với khả năng lý luận mạnh mẽ trong tương lai, đánh dấu một sự thay đổi trong thái độ. Thật khó để không thấy ảnh hưởng của Meta trong sự thay đổi đó. Lập trường nguồn mở của Meta đều thực sự nhằm mục đích mở rộng quyền truy cập của AI và là một trò chơi chiến lược để vượt qua các đối thủ và định hình tương lai của thị trường theo các điều khoản của Meta.
Ý nghĩa đối với các nhà phát triển, doanh nghiệp và tương lai của AI
Đối với các nhà phát triển, sự hồi sinh của các mô hình mở như Llama 4 là một sự thay đổi đáng hoan nghênh. Thay vì bị khóa vào hệ sinh thái và phí của một nhà cung cấp duy nhất, giờ đây họ có quyền tự do điều hành AI mạnh mẽ trên cơ sở hạ tầng của chính họ hoặc tùy chỉnh nó khi họ thấy phù hợp.
Đây là một lợi thế đáng kể cho các doanh nghiệp trong các lĩnh vực nhạy cảm - nghĩ rằng tài chính, chăm sóc sức khỏe hoặc chính phủ - điều đó thận trọng về việc cung cấp dữ liệu bí mật vào hộp đen của người khác. Với Llama 4, một ngân hàng hoặc bệnh viện có thể triển khai mô hình ngôn ngữ hiện đại đằng sau tường lửa của chính họ, điều chỉnh nó trên dữ liệu riêng tư, mà không chia sẻ mã thông báo với một thực thể bên ngoài. Cũng có một lợi ích chi phí. Mặc dù phí API dựa trên việc sử dụng cho các mô hình hàng đầu có thể nhanh chóng leo thang, một mô hình mở không có phí sử dụng-bạn chỉ trả tiền cho sức mạnh tính toán để chạy nó. Các doanh nghiệp mở rộng khối lượng công việc AI nặng đứng để tiết kiệm đáng kể bằng cách chọn một giải pháp mở mà họ có thể quản lý trong nhà.
Không có gì lạ khi các doanh nghiệp đang thể hiện sự quan tâm nhiều hơn đối với các mô hình mở; Nhiều người đang nhận ra rằng kiểm soát và bảo mật được cung cấp bởi AI nguồn mở tốt hơn đáp ứng nhu cầu của họ hơn là các dịch vụ đóng cửa một kích cỡ phù hợp.
Các nhà phát triển cũng được hưởng lợi từ sự đổi mới tăng lên. Với quyền truy cập vào các bên trong mô hình, họ có thể tinh chỉnh và tăng cường AI cho các miền thích hợp (luật, công nghệ sinh học, ngôn ngữ khu vực-bạn đặt tên cho nó) theo cách mà một API đóng có thể không bao giờ phục vụ. Sự bùng nổ của các dự án dựa trên cộng đồng xung quanh các mô hình Llama trước đó-từ các chatbot được điều chỉnh theo kiến thức y tế đến các ứng dụng điện thoại thông minh có sở thích chạy các phiên bản thu nhỏ-đã chứng minh làm thế nào các mô hình mở có thể dân chủ hóa thử nghiệm.
Tuy nhiên, Phục hưng mô hình mở cũng đặt ra những câu hỏi quan trọng. "Dân chủ hóa" có thực sự xảy ra nếu chỉ những người có tài nguyên điện toán quan trọng có thể chạy mô hình 400B-tham số không? Trong khi Llama 4 Scout và Maverick hạ thấp hàng rào phần cứng so với các mô hình nguyên khối, nhưng chúng vẫn là những người nặng ký - một điểm không bị mất đối với một số nhà phát triển có PC không thể xử lý chúng mà không cần hỗ trợ đám mây.
Hy vọng là các kỹ thuật như nén mô hình, chưng cất hoặc các biến thể chuyên gia nhỏ hơn sẽ giúp sức mạnh của Llama 4 trở nên dễ tiếp cận hơn. Một mối quan tâm khác là lạm dụng. Openai và những người khác từ lâu đã lập luận rằng việc phát hành các mô hình mạnh mẽ một cách công khai có thể cho phép các tác nhân độc hại (để tạo thông tin sai lệch, mã phần mềm độc hại, v.v.).
Những lo ngại này vẫn còn: một Claude hoặc GPT nguồn mở có thể bị sử dụng sai mà không cần các bộ lọc an toàn mà các công ty thực thi trên API của họ. Mặt khác, những người đề xuất cho rằng sự cởi mở cho phép cộng đồng cũng xác định và khắc phục các vấn đề, làm cho các mô hình mạnh mẽ và minh bạch hơn theo thời gian hơn bất kỳ hệ thống bí mật nào. Có bằng chứng cho thấy các cộng đồng mô hình mở rất coi trọng, phát triển các lan can của riêng họ và chia sẻ các thực tiễn tốt nhất - nhưng đó là một sự căng thẳng đang diễn ra.
Điều ngày càng rõ ràng là chúng ta đang hướng tới một cảnh quan AI lai, nơi các mô hình mở và đóng cùng tồn tại, mỗi mô hình ảnh hưởng đến cái khác. Các nhà cung cấp đã đóng như Openai, Anthropic và Google vẫn giữ một lợi thế về hiệu suất tuyệt đối - bây giờ. Thật vậy, vào cuối năm 2024, nghiên cứu đã đề xuất các mô hình mở kéo dài khoảng một năm sau các mô hình đóng tốt nhất về khả năng. Nhưng khoảng cách đó đang đóng lại nhanh chóng.
Trong thị trường ngày nay, "AI nguồn mở" không còn chỉ có nghĩa là các dự án sở thích hoặc các mô hình cũ hơn-giờ đây nó là trung tâm của chiến lược AI cho những người khổng lồ công nghệ và các công ty khởi nghiệp. Sự ra mắt của Meta Llama 4 là một lời nhắc nhở mạnh mẽ về giá trị phát triển của sự cởi mở. Đó là cả một lập trường triết học để dân chủ hóa công nghệ vừa là một động thái chiến thuật trong một trận chiến ngành công nghiệp cổ phần cao. Đối với các nhà phát triển và doanh nghiệp, nó mở ra những cánh cửa mới cho sự đổi mới và tự chủ, ngay cả khi nó làm phức tạp các quyết định với sự đánh đổi mới. Và đối với hệ sinh thái rộng lớn hơn, nó làm tăng hy vọng rằng lợi ích của AI sẽ không bị khóa trong tay một vài tập đoàn- nếu các ethos nguồn mở có thể giữ vững lập trường.
Bài viết liên quan
Meta bảo vệ bản phát hành Llama 4, trích dẫn lỗi là nguyên nhân của các báo cáo chất lượng hỗn hợp
Cuối tuần qua, Meta, nhà máy điện đằng sau Facebook, Instagram, WhatsApp và Quest VR, đã làm mọi người ngạc nhiên khi tiết lộ mô hình ngôn ngữ AI mới nhất của họ, Llama 4.
Các giáo sư luật hỗ trợ các tác giả trong cuộc chiến bản quyền AI chống lại Meta
Một nhóm các giáo sư luật bản quyền đã ném hỗ trợ của họ đằng sau các tác giả kiện Meta, cho rằng gã khổng lồ công nghệ đã đào tạo các mô hình Llama AI của mình trên sách điện tử mà không có sự đồng ý của các tác giả. Các giáo sư đã nộp một bản tóm tắt amicus vào thứ Sáu tại Tòa án quận Hoa Kỳ cho Quận Bắc California,
Meta AI sẽ sớm đào tạo dữ liệu của người dùng EU
Meta gần đây đã tiết lộ kế hoạch đào tạo AI của mình bằng cách sử dụng dữ liệu từ người dùng EU về các nền tảng của mình, chẳng hạn như Facebook và Instagram. Sáng kiến này sẽ khai thác vào các bài viết công khai, nhận xét và thậm chí lịch sử trò chuyện với Meta AI, nhưng hãy yên tâm, tin nhắn riêng tư của bạn với bạn bè và gia đình là ngoài giới hạn.
Nhận xét (5)
0/200
KevinAnderson
06:43:16 GMT Ngày 16 tháng 4 năm 2025
Meta's Llama 4 release is a breath of fresh air in the AI world! Open-source fighting back against the proprietary giants is epic. 😎 Now we can tinker and innovate without restrictions. Hope more companies follow suit and keep AI accessible to all! 🌍
0
BenHernández
20:30:47 GMT Ngày 16 tháng 4 năm 2025
MetaのLlama 4リリースはAI業界に新鮮な風を吹き込んだね!オープンソースが専有の大手に対抗するのはエピックだよ。😎 今なら制限なしでいじくり回して革新できる。もっと多くの企業がこれに続いて、AIを全員にアクセス可能にしてほしい!🌍
0
LarryMartin
04:52:10 GMT Ngày 16 tháng 4 năm 2025
메타의 Llama 4 출시는 AI 세계에 신선한 바람을 불어넣었어! 오픈 소스가 독점 거대 기업에 맞서 싸우는 건 정말 멋져. 😎 이제 제한 없이 만지고 혁신할 수 있어. 더 많은 기업이 이에 동참해서 AI를 모두에게 접근 가능하게 했으면 좋겠어! 🌍
0
CharlesRoberts
18:09:05 GMT Ngày 15 tháng 4 năm 2025
O lançamento do Llama 4 da Meta é um sopro de ar fresco no mundo da IA! O código aberto lutando contra os gigantes proprietários é épico. 😎 Agora podemos mexer e inovar sem restrições. Espero que mais empresas sigam o exemplo e mantenham a IA acessível a todos! 🌍
0
JustinAnderson
02:07:46 GMT Ngày 17 tháng 4 năm 2025
¡El lanzamiento de Llama 4 de Meta es un soplo de aire fresco en el mundo de la IA! Que el código abierto luche contra los gigantes propietarios es épico. 😎 Ahora podemos trastear e innovar sin restricciones. Espero que más empresas sigan el ejemplo y mantengan la IA accesible para todos! 🌍
0






Trong những năm gần đây, cảnh quan AI đã biến đổi từ một lĩnh vực hợp tác mở sang một nơi mà các hệ thống độc quyền ngự trị tối cao. Ngay cả Openai, một công ty bắt đầu với "Open" trong tên của mình, đã thay đổi để giữ các mô hình mạnh mẽ nhất của mình dưới sự kết thúc của nó sau năm 2019. Sự thay đổi này thường được chứng minh bởi những lo ngại về lợi ích an toàn và kinh doanh, nhưng nó đã khiến nhiều người trong cộng đồng AI hoài cổ về những ngày của tình bạn nguồn mở.
Bây giờ, thủy triều đang quay. Tinh thần của AI nguồn mở đang trở lại, dẫn đầu bằng cách phát hành các mô hình Llama 4 của Meta. Động thái này là một nỗ lực táo bạo để đưa AI nguồn mở trở lại hàng đầu, và ngay cả những người bí mật truyền thống đang chú ý. Giám đốc điều hành của Openai, Sam Altman gần đây đã thừa nhận rằng công ty đã "ở phía sai của lịch sử" liên quan đến các mô hình mở và công bố kế hoạch cho một biến thể "trọng lượng mở" mới của GPT-4. Rõ ràng, AI nguồn mở đang dàn dựng một sự hồi sinh và ý nghĩa của "mở" đang phát triển.
(Nguồn: Meta)
Llama 4: Người thách thức mở của Meta đối với GPT-4O, Claude và Song Tử
Meta tiết lộ Llama 4 đánh dấu một thách thức trực tiếp cho các mô hình mới nhất từ AI Giants, định vị nó như một sự thay thế trọng lượng mở. Llama 4 có hai phiên bản có sẵn ngày hôm nay - Llama 4 Scout và Llama 4 Maverick - mỗi phiên bản có thông số kỹ thuật ấn tượng. Cả hai đều là các mô hình hỗn hợp (MOE), có nghĩa là chúng chỉ kích hoạt một phần nhỏ các tham số của chúng trên mỗi truy vấn, cho phép tổng kích thước lớn mà không cần tăng chi phí thời gian chạy. Scout và Maverick mỗi người sử dụng 17 tỷ tham số "hoạt động" cho bất kỳ đầu vào nào, nhưng Scout phân phối chúng trên 16 chuyên gia (tổng số tham số 109B), trong khi Maverick trải rộng trên 128 chuyên gia (tổng cộng 400b). Kết quả là các mô hình Llama 4 cung cấp hiệu suất hàng đầu, cùng với những lợi thế độc đáo mà ngay cả một số mô hình đóng cũng không thể khớp.
Chẳng hạn, Llama 4 Scout tự hào có một cửa sổ bối cảnh 10 triệu mã thông báo, vượt xa hầu hết các đối thủ cạnh tranh. Điều này cho phép nó xử lý và phân tích các tài liệu lớn hoặc cơ sở mã trong một lần vượt qua. Mặc dù quy mô của nó, Scout có thể chạy hiệu quả trên một GPU H100 khi định lượng cao, cho thấy các nhà phát triển sẽ không cần một siêu máy tính để chơi với nó.
Mặt khác, Llama 4 Maverick được tối ưu hóa cho hiệu suất cao nhất. Các thử nghiệm ban đầu chỉ ra rằng Maverick có thể khớp hoặc thậm chí vượt trội so với các mô hình đóng hàng đầu trong các nhiệm vụ lý luận, mã hóa và tầm nhìn. Meta đã gợi ý về một mô hình thậm chí còn lớn hơn, Llama 4 Behemoth, hiện đang được đào tạo, theo báo cáo , vượt trội so với GPT-4.5, Claude 3.7 Sonnet và Gemini 2.0 Pro trên một số điểm chuẩn gốc. Thông điệp rất rõ ràng: Các mô hình mở không còn chơi Fiddle thứ hai; Llama 4 đang nhắm đến đỉnh cao.
Hơn nữa, Meta đã cung cấp Llama 4 ngay lập tức để tải xuống và sử dụng. Các nhà phát triển có thể truy cập Scout và Maverick từ trang web chính thức hoặc ôm mặt theo giấy phép cộng đồng Llama 4. Điều này có nghĩa là bất kỳ ai-từ một nhà phát triển solo đến một tập đoàn lớn-có thể đi sâu vào mô hình, tinh chỉnh nó theo nhu cầu cụ thể của họ và chạy nó trên phần cứng hoặc đám mây của riêng họ. Đây là một sự tương phản rõ ràng với các mô hình độc quyền như GPT-4O của Openai hoặc Claude 3.7 của Anthropic, chỉ có thể truy cập thông qua các API được trả tiền mà không cần truy cập vào các trọng số cơ bản.
Meta nhấn mạnh rằng sự cởi mở của Llama 4 là về việc trao quyền cho người dùng: Chúng tôi đang chia sẻ các mô hình đầu tiên trong đàn Llama 4, điều này sẽ cho phép mọi người xây dựng trải nghiệm đa phương thức được cá nhân hóa hơn. Về bản chất, Llama 4 là một bộ công cụ được thiết kế để nằm trong tay các nhà phát triển và nhà nghiên cứu trên toàn thế giới. Bằng cách phát hành các mô hình có thể đi bằng ngón chân với những người như GPT-4 và Claude, Meta đang kéo cuộc sống mới vào ý tưởng rằng AI hàng đầu không nên bị khóa sau một tường thuật.
(Nguồn: Meta)
Chủ nghĩa lý tưởng đích thực hay chơi chiến lược?
Meta trình bày Llama 4 với ý thức về chủ nghĩa duy tâm và lòng vị tha. Mô hình AI nguồn mở của chúng tôi, Llama, đã được tải xuống hơn một tỷ lần, Giám đốc điều hành của Mark, Mark Zuckerberg đã công bố gần đây, thêm rằng các mô hình AI mở nguồn là rất cần thiết để đảm bảo mọi người ở khắp mọi nơi có quyền truy cập vào lợi ích của AI. Định vị chân dung này là một nhà vô địch của AI dân chủ hóa-một công ty sẵn sàng chia sẻ các mô hình vương miện của mình vì lợi ích lớn hơn. Sự phổ biến của gia đình Llama ủng hộ câu chuyện này: Các mô hình đã được tải xuống với tốc độ đáng kinh ngạc (tăng từ 650 triệu lên 1 tỷ tổng số tải xuống chỉ trong vài tháng) và chúng đã được sử dụng bởi các công ty như Spotify, AT & T và Doordash.
Meta nhấn mạnh rằng các nhà phát triển đánh giá cao tính minh bạch, khả năng tùy chỉnh và bảo mật của việc có các mô hình mở mà họ có thể tự chạy, điều này giúp đạt được mức độ sáng tạo và đổi mới mới, so với bản chất mờ đục của API hộp đen. Điều này nghe có vẻ giống như các ethos phần mềm nguồn mở cổ điển (nghĩ rằng Linux hoặc Apache) áp dụng cho AI-một chiến thắng rõ ràng cho cộng đồng.
Tuy nhiên, có một góc độ chiến lược đối với sự cởi mở của Meta. Meta không phải là một tổ chức từ thiện và "nguồn mở" trong bối cảnh này đi kèm với các chuỗi được đính kèm. LLAMA 4 được phát hành theo giấy phép cộng đồng đặc biệt, không phải là giấy phép cho phép tiêu chuẩn-vì vậy trong khi các trọng số mô hình được sử dụng miễn phí, có những hạn chế (ví dụ: một số trường hợp sử dụng tài nguyên cao có thể yêu cầu cho phép và giấy phép là quyền sở hữu của Hồi giáo theo nghĩa là nó được chế tạo bởi META). Điều này không phù hợp với Định nghĩa Sáng kiến Nguồn mở (OSI) được phê duyệt về nguồn mở, khiến một số người lập luận rằng các công ty đang lạm dụng thuật ngữ này.
Trong thực tế, cách tiếp cận của Meta thường được dán nhãn là "trọng lượng mở" hoặc "có sẵn nguồn" AI: mã và trọng số được chia sẻ, nhưng Meta vẫn giữ một số kiểm soát và không tiết lộ mọi thứ (như dữ liệu đào tạo). Mặc dù điều này không làm giảm tiện ích cho người dùng, nhưng nó cho thấy Meta đang mở một cách chiến lược - nắm giữ đủ kiểm soát để bảo vệ chính nó (và có lẽ là lợi thế cạnh tranh của nó). Nhiều công ty đang áp dụng nhãn "nguồn mở" cho các mô hình AI trong khi giữ lại các chi tiết chính, làm suy yếu tinh thần cởi mở thực sự.
Tại sao Meta sẽ mở ra cả? Cảnh quan cạnh tranh cung cấp một số câu trả lời. Phát hành các mô hình mạnh mẽ miễn phí có thể nhanh chóng xây dựng một nhà phát triển và cơ sở người dùng doanh nghiệp rộng lớn-Mistral AI, một công ty khởi nghiệp của Pháp, đã làm điều này với các mô hình mở đầu để thiết lập như một phòng thí nghiệm hàng đầu.
Bằng cách tràn ngập thị trường với Llama, Meta đảm bảo công nghệ của nó trở thành nền tảng trong hệ sinh thái AI, có thể mang lại lợi ích lâu dài. Đó là một chiến lược cổ điển và mở rộng: Nếu mọi người sử dụng mô hình "mở" của bạn, bạn sẽ gián tiếp thiết lập các tiêu chuẩn và thậm chí có thể hướng dẫn mọi người về nền tảng của bạn (ví dụ: các sản phẩm trợ lý AI của Meta tận dụng llama). Ngoài ra còn có một PR và góc định vị. Meta có thể đóng vai trò của nhà đổi mới nhân từ, đặc biệt là trái ngược với Openai - nơi đã phải đối mặt với những lời chỉ trích cho cách tiếp cận khép kín của nó. Trên thực tế, sự thay đổi trái tim của Openai trên các mô hình mở một phần làm nổi bật mức độ di chuyển của Meta hiệu quả như thế nào.
Sau khi mô hình mở đột phá của Trung Quốc Deepseek-R1 đã xuất hiện vào tháng 1 và nhảy vọt các mô hình trước đó, Altman chỉ ra Openai không muốn bị bỏ lại ở phía bên trái của lịch sử. Bây giờ Openai đang hứa hẹn một mô hình mở với khả năng lý luận mạnh mẽ trong tương lai, đánh dấu một sự thay đổi trong thái độ. Thật khó để không thấy ảnh hưởng của Meta trong sự thay đổi đó. Lập trường nguồn mở của Meta đều thực sự nhằm mục đích mở rộng quyền truy cập của AI và là một trò chơi chiến lược để vượt qua các đối thủ và định hình tương lai của thị trường theo các điều khoản của Meta.
Ý nghĩa đối với các nhà phát triển, doanh nghiệp và tương lai của AI
Đối với các nhà phát triển, sự hồi sinh của các mô hình mở như Llama 4 là một sự thay đổi đáng hoan nghênh. Thay vì bị khóa vào hệ sinh thái và phí của một nhà cung cấp duy nhất, giờ đây họ có quyền tự do điều hành AI mạnh mẽ trên cơ sở hạ tầng của chính họ hoặc tùy chỉnh nó khi họ thấy phù hợp.
Đây là một lợi thế đáng kể cho các doanh nghiệp trong các lĩnh vực nhạy cảm - nghĩ rằng tài chính, chăm sóc sức khỏe hoặc chính phủ - điều đó thận trọng về việc cung cấp dữ liệu bí mật vào hộp đen của người khác. Với Llama 4, một ngân hàng hoặc bệnh viện có thể triển khai mô hình ngôn ngữ hiện đại đằng sau tường lửa của chính họ, điều chỉnh nó trên dữ liệu riêng tư, mà không chia sẻ mã thông báo với một thực thể bên ngoài. Cũng có một lợi ích chi phí. Mặc dù phí API dựa trên việc sử dụng cho các mô hình hàng đầu có thể nhanh chóng leo thang, một mô hình mở không có phí sử dụng-bạn chỉ trả tiền cho sức mạnh tính toán để chạy nó. Các doanh nghiệp mở rộng khối lượng công việc AI nặng đứng để tiết kiệm đáng kể bằng cách chọn một giải pháp mở mà họ có thể quản lý trong nhà.
Không có gì lạ khi các doanh nghiệp đang thể hiện sự quan tâm nhiều hơn đối với các mô hình mở; Nhiều người đang nhận ra rằng kiểm soát và bảo mật được cung cấp bởi AI nguồn mở tốt hơn đáp ứng nhu cầu của họ hơn là các dịch vụ đóng cửa một kích cỡ phù hợp.
Các nhà phát triển cũng được hưởng lợi từ sự đổi mới tăng lên. Với quyền truy cập vào các bên trong mô hình, họ có thể tinh chỉnh và tăng cường AI cho các miền thích hợp (luật, công nghệ sinh học, ngôn ngữ khu vực-bạn đặt tên cho nó) theo cách mà một API đóng có thể không bao giờ phục vụ. Sự bùng nổ của các dự án dựa trên cộng đồng xung quanh các mô hình Llama trước đó-từ các chatbot được điều chỉnh theo kiến thức y tế đến các ứng dụng điện thoại thông minh có sở thích chạy các phiên bản thu nhỏ-đã chứng minh làm thế nào các mô hình mở có thể dân chủ hóa thử nghiệm.
Tuy nhiên, Phục hưng mô hình mở cũng đặt ra những câu hỏi quan trọng. "Dân chủ hóa" có thực sự xảy ra nếu chỉ những người có tài nguyên điện toán quan trọng có thể chạy mô hình 400B-tham số không? Trong khi Llama 4 Scout và Maverick hạ thấp hàng rào phần cứng so với các mô hình nguyên khối, nhưng chúng vẫn là những người nặng ký - một điểm không bị mất đối với một số nhà phát triển có PC không thể xử lý chúng mà không cần hỗ trợ đám mây.
Hy vọng là các kỹ thuật như nén mô hình, chưng cất hoặc các biến thể chuyên gia nhỏ hơn sẽ giúp sức mạnh của Llama 4 trở nên dễ tiếp cận hơn. Một mối quan tâm khác là lạm dụng. Openai và những người khác từ lâu đã lập luận rằng việc phát hành các mô hình mạnh mẽ một cách công khai có thể cho phép các tác nhân độc hại (để tạo thông tin sai lệch, mã phần mềm độc hại, v.v.).
Những lo ngại này vẫn còn: một Claude hoặc GPT nguồn mở có thể bị sử dụng sai mà không cần các bộ lọc an toàn mà các công ty thực thi trên API của họ. Mặt khác, những người đề xuất cho rằng sự cởi mở cho phép cộng đồng cũng xác định và khắc phục các vấn đề, làm cho các mô hình mạnh mẽ và minh bạch hơn theo thời gian hơn bất kỳ hệ thống bí mật nào. Có bằng chứng cho thấy các cộng đồng mô hình mở rất coi trọng, phát triển các lan can của riêng họ và chia sẻ các thực tiễn tốt nhất - nhưng đó là một sự căng thẳng đang diễn ra.
Điều ngày càng rõ ràng là chúng ta đang hướng tới một cảnh quan AI lai, nơi các mô hình mở và đóng cùng tồn tại, mỗi mô hình ảnh hưởng đến cái khác. Các nhà cung cấp đã đóng như Openai, Anthropic và Google vẫn giữ một lợi thế về hiệu suất tuyệt đối - bây giờ. Thật vậy, vào cuối năm 2024, nghiên cứu đã đề xuất các mô hình mở kéo dài khoảng một năm sau các mô hình đóng tốt nhất về khả năng. Nhưng khoảng cách đó đang đóng lại nhanh chóng.
Trong thị trường ngày nay, "AI nguồn mở" không còn chỉ có nghĩa là các dự án sở thích hoặc các mô hình cũ hơn-giờ đây nó là trung tâm của chiến lược AI cho những người khổng lồ công nghệ và các công ty khởi nghiệp. Sự ra mắt của Meta Llama 4 là một lời nhắc nhở mạnh mẽ về giá trị phát triển của sự cởi mở. Đó là cả một lập trường triết học để dân chủ hóa công nghệ vừa là một động thái chiến thuật trong một trận chiến ngành công nghiệp cổ phần cao. Đối với các nhà phát triển và doanh nghiệp, nó mở ra những cánh cửa mới cho sự đổi mới và tự chủ, ngay cả khi nó làm phức tạp các quyết định với sự đánh đổi mới. Và đối với hệ sinh thái rộng lớn hơn, nó làm tăng hy vọng rằng lợi ích của AI sẽ không bị khóa trong tay một vài tập đoàn- nếu các ethos nguồn mở có thể giữ vững lập trường.




Meta's Llama 4 release is a breath of fresh air in the AI world! Open-source fighting back against the proprietary giants is epic. 😎 Now we can tinker and innovate without restrictions. Hope more companies follow suit and keep AI accessible to all! 🌍




MetaのLlama 4リリースはAI業界に新鮮な風を吹き込んだね!オープンソースが専有の大手に対抗するのはエピックだよ。😎 今なら制限なしでいじくり回して革新できる。もっと多くの企業がこれに続いて、AIを全員にアクセス可能にしてほしい!🌍




메타의 Llama 4 출시는 AI 세계에 신선한 바람을 불어넣었어! 오픈 소스가 독점 거대 기업에 맞서 싸우는 건 정말 멋져. 😎 이제 제한 없이 만지고 혁신할 수 있어. 더 많은 기업이 이에 동참해서 AI를 모두에게 접근 가능하게 했으면 좋겠어! 🌍




O lançamento do Llama 4 da Meta é um sopro de ar fresco no mundo da IA! O código aberto lutando contra os gigantes proprietários é épico. 😎 Agora podemos mexer e inovar sem restrições. Espero que mais empresas sigam o exemplo e mantenham a IA acessível a todos! 🌍




¡El lanzamiento de Llama 4 de Meta es un soplo de aire fresco en el mundo de la IA! Que el código abierto luche contra los gigantes propietarios es épico. 😎 Ahora podemos trastear e innovar sin restricciones. Espero que más empresas sigan el ejemplo y mantengan la IA accesible para todos! 🌍












