lựa chọn
Trang chủ
Tin tức
AI nguồn mở chiến đấu trở lại với bản phát hành Llama 4 của Meta

AI nguồn mở chiến đấu trở lại với bản phát hành Llama 4 của Meta

Ngày 15 tháng 4 năm 2025
84

Trong những năm gần đây, cảnh quan AI đã biến đổi từ một lĩnh vực hợp tác mở sang một nơi mà các hệ thống độc quyền ngự trị tối cao. Ngay cả Openai, một công ty bắt đầu với "Open" trong tên của mình, đã thay đổi để giữ các mô hình mạnh mẽ nhất của mình dưới sự kết thúc của nó sau năm 2019. Sự thay đổi này thường được chứng minh bởi những lo ngại về lợi ích an toàn và kinh doanh, nhưng nó đã khiến nhiều người trong cộng đồng AI hoài cổ về những ngày của tình bạn nguồn mở.

Bây giờ, thủy triều đang quay. Tinh thần của AI nguồn mở đang trở lại, dẫn đầu bằng cách phát hành các mô hình Llama 4 của Meta. Động thái này là một nỗ lực táo bạo để đưa AI nguồn mở trở lại hàng đầu, và ngay cả những người bí mật truyền thống đang chú ý. Giám đốc điều hành của Openai, Sam Altman gần đây đã thừa nhận rằng công ty đã "ở phía sai của lịch sử" liên quan đến các mô hình mở và công bố kế hoạch cho một biến thể "trọng lượng mở" mới của GPT-4. Rõ ràng, AI nguồn mở đang dàn dựng một sự hồi sinh và ý nghĩa của "mở" đang phát triển.

(Nguồn: Meta)

Llama 4: Người thách thức mở của Meta đối với GPT-4O, Claude và Song Tử

Meta tiết lộ Llama 4 đánh dấu một thách thức trực tiếp cho các mô hình mới nhất từ ​​AI Giants, định vị nó như một sự thay thế trọng lượng mở. Llama 4 có hai phiên bản có sẵn ngày hôm nay - Llama 4 Scout và Llama 4 Maverick - mỗi phiên bản có thông số kỹ thuật ấn tượng. Cả hai đều là các mô hình hỗn hợp (MOE), có nghĩa là chúng chỉ kích hoạt một phần nhỏ các tham số của chúng trên mỗi truy vấn, cho phép tổng kích thước lớn mà không cần tăng chi phí thời gian chạy. Scout và Maverick mỗi người sử dụng 17 tỷ tham số "hoạt động" cho bất kỳ đầu vào nào, nhưng Scout phân phối chúng trên 16 chuyên gia (tổng số tham số 109B), trong khi Maverick trải rộng trên 128 chuyên gia (tổng cộng 400b). Kết quả là các mô hình Llama 4 cung cấp hiệu suất hàng đầu, cùng với những lợi thế độc đáo mà ngay cả một số mô hình đóng cũng không thể khớp.

Chẳng hạn, Llama 4 Scout tự hào có một cửa sổ bối cảnh 10 triệu mã thông báo, vượt xa hầu hết các đối thủ cạnh tranh. Điều này cho phép nó xử lý và phân tích các tài liệu lớn hoặc cơ sở mã trong một lần vượt qua. Mặc dù quy mô của nó, Scout có thể chạy hiệu quả trên một GPU H100 khi định lượng cao, cho thấy các nhà phát triển sẽ không cần một siêu máy tính để chơi với nó.

Mặt khác, Llama 4 Maverick được tối ưu hóa cho hiệu suất cao nhất. Các thử nghiệm ban đầu chỉ ra rằng Maverick có thể khớp hoặc thậm chí vượt trội so với các mô hình đóng hàng đầu trong các nhiệm vụ lý luận, mã hóa và tầm nhìn. Meta đã gợi ý về một mô hình thậm chí còn lớn hơn, Llama 4 Behemoth, hiện đang được đào tạo, theo báo cáo , vượt trội so với GPT-4.5, Claude 3.7 Sonnet và Gemini 2.0 Pro trên một số điểm chuẩn gốc. Thông điệp rất rõ ràng: Các mô hình mở không còn chơi Fiddle thứ hai; Llama 4 đang nhắm đến đỉnh cao.

Hơn nữa, Meta đã cung cấp Llama 4 ngay lập tức để tải xuống và sử dụng. Các nhà phát triển có thể truy cập Scout và Maverick từ trang web chính thức hoặc ôm mặt theo giấy phép cộng đồng Llama 4. Điều này có nghĩa là bất kỳ ai-từ một nhà phát triển solo đến một tập đoàn lớn-có thể đi sâu vào mô hình, tinh chỉnh nó theo nhu cầu cụ thể của họ và chạy nó trên phần cứng hoặc đám mây của riêng họ. Đây là một sự tương phản rõ ràng với các mô hình độc quyền như GPT-4O của Openai hoặc Claude 3.7 của Anthropic, chỉ có thể truy cập thông qua các API được trả tiền mà không cần truy cập vào các trọng số cơ bản.

Meta nhấn mạnh rằng sự cởi mở của Llama 4 là về việc trao quyền cho người dùng: Chúng tôi đang chia sẻ các mô hình đầu tiên trong đàn Llama 4, điều này sẽ cho phép mọi người xây dựng trải nghiệm đa phương thức được cá nhân hóa hơn. Về bản chất, Llama 4 là một bộ công cụ được thiết kế để nằm trong tay các nhà phát triển và nhà nghiên cứu trên toàn thế giới. Bằng cách phát hành các mô hình có thể đi bằng ngón chân với những người như GPT-4 và Claude, Meta đang kéo cuộc sống mới vào ý tưởng rằng AI hàng đầu không nên bị khóa sau một tường thuật.

(Nguồn: Meta)

Chủ nghĩa lý tưởng đích thực hay chơi chiến lược?

Meta trình bày Llama 4 với ý thức về chủ nghĩa duy tâm và lòng vị tha. Mô hình AI nguồn mở của chúng tôi, Llama, đã được tải xuống hơn một tỷ lần, Giám đốc điều hành của Mark, Mark Zuckerberg đã công bố gần đây, thêm rằng các mô hình AI mở nguồn là rất cần thiết để đảm bảo mọi người ở khắp mọi nơi có quyền truy cập vào lợi ích của AI. Định vị chân dung này là một nhà vô địch của AI dân chủ hóa-một công ty sẵn sàng chia sẻ các mô hình vương miện của mình vì lợi ích lớn hơn. Sự phổ biến của gia đình Llama ủng hộ câu chuyện này: Các mô hình đã được tải xuống với tốc độ đáng kinh ngạc (tăng từ 650 triệu lên 1 tỷ tổng số tải xuống chỉ trong vài tháng) và chúng đã được sử dụng bởi các công ty như Spotify, AT & T và Doordash.

Meta nhấn mạnh rằng các nhà phát triển đánh giá cao tính minh bạch, khả năng tùy chỉnh và bảo mật của việc có các mô hình mở mà họ có thể tự chạy, điều này giúp đạt được mức độ sáng tạo và đổi mới mới, so với bản chất mờ đục của API hộp đen. Điều này nghe có vẻ giống như các ethos phần mềm nguồn mở cổ điển (nghĩ rằng Linux hoặc Apache) áp dụng cho AI-một chiến thắng rõ ràng cho cộng đồng.

Tuy nhiên, có một góc độ chiến lược đối với sự cởi mở của Meta. Meta không phải là một tổ chức từ thiện và "nguồn mở" trong bối cảnh này đi kèm với các chuỗi được đính kèm. LLAMA 4 được phát hành theo giấy phép cộng đồng đặc biệt, không phải là giấy phép cho phép tiêu chuẩn-vì vậy trong khi các trọng số mô hình được sử dụng miễn phí, có những hạn chế (ví dụ: một số trường hợp sử dụng tài nguyên cao có thể yêu cầu cho phép và giấy phép là quyền sở hữu của Hồi giáo theo nghĩa là nó được chế tạo bởi META). Điều này không phù hợp với Định nghĩa Sáng kiến ​​Nguồn mở (OSI) được phê duyệt về nguồn mở, khiến một số người lập luận rằng các công ty đang lạm dụng thuật ngữ này.

Trong thực tế, cách tiếp cận của Meta thường được dán nhãn là "trọng lượng mở" hoặc "có sẵn nguồn" AI: mã và trọng số được chia sẻ, nhưng Meta vẫn giữ một số kiểm soát và không tiết lộ mọi thứ (như dữ liệu đào tạo). Mặc dù điều này không làm giảm tiện ích cho người dùng, nhưng nó cho thấy Meta đang mở một cách chiến lược - nắm giữ đủ kiểm soát để bảo vệ chính nó (và có lẽ là lợi thế cạnh tranh của nó). Nhiều công ty đang áp dụng nhãn "nguồn mở" cho các mô hình AI trong khi giữ lại các chi tiết chính, làm suy yếu tinh thần cởi mở thực sự.

Tại sao Meta sẽ mở ra cả? Cảnh quan cạnh tranh cung cấp một số câu trả lời. Phát hành các mô hình mạnh mẽ miễn phí có thể nhanh chóng xây dựng một nhà phát triển và cơ sở người dùng doanh nghiệp rộng lớn-Mistral AI, một công ty khởi nghiệp của Pháp, đã làm điều này với các mô hình mở đầu để thiết lập như một phòng thí nghiệm hàng đầu.

Bằng cách tràn ngập thị trường với Llama, Meta đảm bảo công nghệ của nó trở thành nền tảng trong hệ sinh thái AI, có thể mang lại lợi ích lâu dài. Đó là một chiến lược cổ điển và mở rộng: Nếu mọi người sử dụng mô hình "mở" của bạn, bạn sẽ gián tiếp thiết lập các tiêu chuẩn và thậm chí có thể hướng dẫn mọi người về nền tảng của bạn (ví dụ: các sản phẩm trợ lý AI của Meta tận dụng llama). Ngoài ra còn có một PR và góc định vị. Meta có thể đóng vai trò của nhà đổi mới nhân từ, đặc biệt là trái ngược với Openai - nơi đã phải đối mặt với những lời chỉ trích cho cách tiếp cận khép kín của nó. Trên thực tế, sự thay đổi trái tim của Openai trên các mô hình mở một phần làm nổi bật mức độ di chuyển của Meta hiệu quả như thế nào.

Sau khi mô hình mở đột phá của Trung Quốc Deepseek-R1 đã xuất hiện vào tháng 1 và nhảy vọt các mô hình trước đó, Altman chỉ ra Openai không muốn bị bỏ lại ở phía bên trái của lịch sử. Bây giờ Openai đang hứa hẹn một mô hình mở với khả năng lý luận mạnh mẽ trong tương lai, đánh dấu một sự thay đổi trong thái độ. Thật khó để không thấy ảnh hưởng của Meta trong sự thay đổi đó. Lập trường nguồn mở của Meta đều thực sự nhằm mục đích mở rộng quyền truy cập của AI và là một trò chơi chiến lược để vượt qua các đối thủ và định hình tương lai của thị trường theo các điều khoản của Meta.

Ý nghĩa đối với các nhà phát triển, doanh nghiệp và tương lai của AI

Đối với các nhà phát triển, sự hồi sinh của các mô hình mở như Llama 4 là một sự thay đổi đáng hoan nghênh. Thay vì bị khóa vào hệ sinh thái và phí của một nhà cung cấp duy nhất, giờ đây họ có quyền tự do điều hành AI mạnh mẽ trên cơ sở hạ tầng của chính họ hoặc tùy chỉnh nó khi họ thấy phù hợp.

Đây là một lợi thế đáng kể cho các doanh nghiệp trong các lĩnh vực nhạy cảm - nghĩ rằng tài chính, chăm sóc sức khỏe hoặc chính phủ - điều đó thận trọng về việc cung cấp dữ liệu bí mật vào hộp đen của người khác. Với Llama 4, một ngân hàng hoặc bệnh viện có thể triển khai mô hình ngôn ngữ hiện đại đằng sau tường lửa của chính họ, điều chỉnh nó trên dữ liệu riêng tư, mà không chia sẻ mã thông báo với một thực thể bên ngoài. Cũng có một lợi ích chi phí. Mặc dù phí API dựa trên việc sử dụng cho các mô hình hàng đầu có thể nhanh chóng leo thang, một mô hình mở không có phí sử dụng-bạn chỉ trả tiền cho sức mạnh tính toán để chạy nó. Các doanh nghiệp mở rộng khối lượng công việc AI nặng đứng để tiết kiệm đáng kể bằng cách chọn một giải pháp mở mà họ có thể quản lý trong nhà.

Không có gì lạ khi các doanh nghiệp đang thể hiện sự quan tâm nhiều hơn đối với các mô hình mở; Nhiều người đang nhận ra rằng kiểm soát và bảo mật được cung cấp bởi AI nguồn mở tốt hơn đáp ứng nhu cầu của họ hơn là các dịch vụ đóng cửa một kích cỡ phù hợp.

Các nhà phát triển cũng được hưởng lợi từ sự đổi mới tăng lên. Với quyền truy cập vào các bên trong mô hình, họ có thể tinh chỉnh và tăng cường AI cho các miền thích hợp (luật, công nghệ sinh học, ngôn ngữ khu vực-bạn đặt tên cho nó) theo cách mà một API đóng có thể không bao giờ phục vụ. Sự bùng nổ của các dự án dựa trên cộng đồng xung quanh các mô hình Llama trước đó-từ các chatbot được điều chỉnh theo kiến ​​thức y tế đến các ứng dụng điện thoại thông minh có sở thích chạy các phiên bản thu nhỏ-đã chứng minh làm thế nào các mô hình mở có thể dân chủ hóa thử nghiệm.

Tuy nhiên, Phục hưng mô hình mở cũng đặt ra những câu hỏi quan trọng. "Dân chủ hóa" có thực sự xảy ra nếu chỉ những người có tài nguyên điện toán quan trọng có thể chạy mô hình 400B-tham số không? Trong khi Llama 4 Scout và Maverick hạ thấp hàng rào phần cứng so với các mô hình nguyên khối, nhưng chúng vẫn là những người nặng ký - một điểm không bị mất đối với một số nhà phát triển có PC không thể xử lý chúng mà không cần hỗ trợ đám mây.

Hy vọng là các kỹ thuật như nén mô hình, chưng cất hoặc các biến thể chuyên gia nhỏ hơn sẽ giúp sức mạnh của Llama 4 trở nên dễ tiếp cận hơn. Một mối quan tâm khác là lạm dụng. Openai và những người khác từ lâu đã lập luận rằng việc phát hành các mô hình mạnh mẽ một cách công khai có thể cho phép các tác nhân độc hại (để tạo thông tin sai lệch, mã phần mềm độc hại, v.v.).

Những lo ngại này vẫn còn: một Claude hoặc GPT nguồn mở có thể bị sử dụng sai mà không cần các bộ lọc an toàn mà các công ty thực thi trên API của họ. Mặt khác, những người đề xuất cho rằng sự cởi mở cho phép cộng đồng cũng xác định và khắc phục các vấn đề, làm cho các mô hình mạnh mẽ và minh bạch hơn theo thời gian hơn bất kỳ hệ thống bí mật nào. Có bằng chứng cho thấy các cộng đồng mô hình mở rất coi trọng, phát triển các lan can của riêng họ và chia sẻ các thực tiễn tốt nhất - nhưng đó là một sự căng thẳng đang diễn ra.

Điều ngày càng rõ ràng là chúng ta đang hướng tới một cảnh quan AI lai, nơi các mô hình mở và đóng cùng tồn tại, mỗi mô hình ảnh hưởng đến cái khác. Các nhà cung cấp đã đóng như Openai, Anthropic và Google vẫn giữ một lợi thế về hiệu suất tuyệt đối - bây giờ. Thật vậy, vào cuối năm 2024, nghiên cứu đã đề xuất các mô hình mở kéo dài khoảng một năm sau các mô hình đóng tốt nhất về khả năng. Nhưng khoảng cách đó đang đóng lại nhanh chóng.

Trong thị trường ngày nay, "AI nguồn mở" không còn chỉ có nghĩa là các dự án sở thích hoặc các mô hình cũ hơn-giờ đây nó là trung tâm của chiến lược AI cho những người khổng lồ công nghệ và các công ty khởi nghiệp. Sự ra mắt của Meta Llama 4 là một lời nhắc nhở mạnh mẽ về giá trị phát triển của sự cởi mở. Đó là cả một lập trường triết học để dân chủ hóa công nghệ vừa là một động thái chiến thuật trong một trận chiến ngành công nghiệp cổ phần cao. Đối với các nhà phát triển và doanh nghiệp, nó mở ra những cánh cửa mới cho sự đổi mới và tự chủ, ngay cả khi nó làm phức tạp các quyết định với sự đánh đổi mới. Và đối với hệ sinh thái rộng lớn hơn, nó làm tăng hy vọng rằng lợi ích của AI sẽ không bị khóa trong tay một vài tập đoàn- nếu các ethos nguồn mở có thể giữ vững lập trường.

Bài viết liên quan
Meta AI在歐盟推出並實施限制 Meta AI在歐盟推出並實施限制 Meta 的由人工智能驱动的虛擬助手 Meta AI,終於在歐洲聯盟登陸,這是在與歐洲隱私當局的激烈規管爭議中實現的。該公司在星期四宣布,這個類似聊天機器人的工具將整合到其社交平台套件中,不過其功能比美國市場上的版本更加有限。在另一項發展中,Meta 向 TechCrunch 確認,Meta AI 即將在英國的 WhatsApp 上推出,從最初於去年十月在
OpenAI 聘請前Facebook應用程式負責人 OpenAI 聘請前Facebook應用程式負責人 菲吉·西莫加入OpenAI担任应用程序业务主管OpenAI通过聘请现任Instacart首席执行官兼前Facebook应用程序负责人菲吉·西莫来领导其应用程序业务,引起了广泛关注。这一任命直接来自高层,OpenAI首席执行官山姆·阿尔特曼在X上分享道,这个新职位将使他能够更多地关注研究、计算和安全性。显然,他们正在为应用程序领域的某些令人兴奋的发展奠定基础!
Meta預測到2035年生成性AI收入將達1.4萬億美元 Meta預測到2035年生成性AI收入將達1.4萬億美元 去年,Meta大膽預測其生成式AI產品到2025年將產生20億至30億美元的收入。展望更遠的未來,他們預計到2035年將增長到驚人的4600億至1.4兆美元之間。這些預測是在週三浮出水面的法庭文件中揭示的,當時正值書籍作者對Meta提起訴訟。他們指控該公司未經許可就用他們的作品訓練AI。然而,文件並未具體說明Meta將何謂“生成式AI產品”。不過,眾所周知,
Nhận xét (10)
0/200
KevinAnderson
KevinAnderson 00:00:00 GMT Ngày 16 tháng 4 năm 2025

Meta's Llama 4 release is a breath of fresh air in the AI world! Open-source fighting back against the proprietary giants is epic. 😎 Now we can tinker and innovate without restrictions. Hope more companies follow suit and keep AI accessible to all! 🌍

BenHernández
BenHernández 00:00:00 GMT Ngày 17 tháng 4 năm 2025

MetaのLlama 4リリースはAI業界に新鮮な風を吹き込んだね!オープンソースが専有の大手に対抗するのはエピックだよ。😎 今なら制限なしでいじくり回して革新できる。もっと多くの企業がこれに続いて、AIを全員にアクセス可能にしてほしい!🌍

LarryMartin
LarryMartin 00:00:00 GMT Ngày 16 tháng 4 năm 2025

메타의 Llama 4 출시는 AI 세계에 신선한 바람을 불어넣었어! 오픈 소스가 독점 거대 기업에 맞서 싸우는 건 정말 멋져. 😎 이제 제한 없이 만지고 혁신할 수 있어. 더 많은 기업이 이에 동참해서 AI를 모두에게 접근 가능하게 했으면 좋겠어! 🌍

CharlesRoberts
CharlesRoberts 00:00:00 GMT Ngày 16 tháng 4 năm 2025

O lançamento do Llama 4 da Meta é um sopro de ar fresco no mundo da IA! O código aberto lutando contra os gigantes proprietários é épico. 😎 Agora podemos mexer e inovar sem restrições. Espero que mais empresas sigam o exemplo e mantenham a IA acessível a todos! 🌍

JustinAnderson
JustinAnderson 00:00:00 GMT Ngày 17 tháng 4 năm 2025

¡El lanzamiento de Llama 4 de Meta es un soplo de aire fresco en el mundo de la IA! Que el código abierto luche contra los gigantes propietarios es épico. 😎 Ahora podemos trastear e innovar sin restricciones. Espero que más empresas sigan el ejemplo y mantengan la IA accesible para todos! 🌍

BrianBaker
BrianBaker 00:00:00 GMT Ngày 17 tháng 4 năm 2025

Open-Source AI Fights Back is a breath of fresh air in the AI world! With Meta's Llama 4, it feels like we're getting back to the roots of open collaboration. It's not perfect, but it's a step in the right direction. Keep pushing for more transparency, guys! 🌟

Quay lại đầu
OR