Định nghĩa trọng lượng mở cung cấp quan điểm mới về cuộc tranh luận OSAID
Ngày 24 tháng 4 năm 2025
AlbertRodriguez
0
Cuộc tranh luận về những gì cấu thành AI nguồn mở tiếp tục phát triển, với đầu vào đáng kể từ cả nhà phát triển và lãnh đạo ngành. Sáng kiến nguồn mở (OSI) đã cố gắng thiết lập một định nghĩa rõ ràng với định nghĩa AI nguồn mở (OSAID) của nó, nhưng những bất đồng vẫn tồn tại về những gì nên được đưa vào. Đáp lại, Liên minh nguồn mở mới được hình thành (OSA) đã giới thiệu khuôn khổ riêng của mình, định nghĩa trọng lượng mở (OWD), tìm cách giải quyết những thách thức độc đáo của phát triển AI.
OWD nhằm mục đích đạt được sự cân bằng giữa AI đóng và nguồn mở bằng cách đặt các tiêu chuẩn cho những gì được tính là "nguồn mở" trong AI, đặc biệt là đối với các mô hình ngôn ngữ lớn (LLM). Nó tập trung vào ba lĩnh vực chính:
Các thành phần chính của định nghĩa trọng lượng mở (OWD)
1. Khả năng truy cập trọng lượng mô hình
OWD nhấn mạnh tầm quan trọng của việc tạo ra trọng số mô hình, các giá trị số kết nối các nút trên các lớp AI có thể truy cập được cho các nhà phát triển và nhà nghiên cứu. Những trọng số này, được xác định trong quá trình đào tạo, rất quan trọng để hiểu và cải thiện các mô hình AI.
2. Thông tin dữ liệu
Mặc dù OWD không bắt buộc truy cập đầy đủ vào dữ liệu đào tạo, nhưng nó nhấn mạnh sự cần thiết của việc cung cấp thông tin chi tiết về nội dung và phương thức thu thập của bộ dữ liệu. Tính minh bạch này giúp đánh giá hiệu suất và sai lệch tiềm năng của mô hình.
3. Tính minh bạch kiến trúc
Khung khuyến khích tiết lộ kiến trúc của mô hình, có thể hỗ trợ các cải tiến và sửa đổi hơn nữa của cộng đồng.
Amanda Brock, Giám đốc điều hành của Openuk, hỗ trợ OWD, xem nó như một bước để hợp tác toàn cầu tốt hơn. Cô phê phán OSI OSAID, cho thấy rằng sự tập trung của OWD vào việc phân tách các thành phần AI là thực tế hơn. Quan điểm của Brock là việc xác định tính cởi mở của các yếu tố riêng lẻ như dữ liệu, trọng lượng và mô hình hiệu quả hơn một định nghĩa rộng, có khả năng không phù hợp.
OSA, do người sáng lập Sam Johnston dẫn đầu, nhằm mục đích mở rộng định nghĩa nguồn mở truyền thống (OSD) để bao gồm các yếu tố cụ thể của AI như trọng lượng, đề xuất một "Nguồn mở 2.0". Động thái này diễn ra giữa các cuộc tranh luận đang diễn ra về khả năng áp dụng của OSD vào AI, đặc biệt là liên quan đến dữ liệu và trọng số mô hình.
Để đối phó với OWD, Stefano Maffulli của OSI đã chỉ ra rằng các cộng đồng, chẳng hạn như Linux Foundation, đã phát triển các định nghĩa của riêng họ về các trọng số mở. Ngoài ra, Heather Meeker, một luật sư nguồn mở nổi tiếng, đã nêu bật sự khác biệt cơ bản giữa mã nguồn phần mềm và trọng lượng ròng thần kinh (NNWS), cho rằng các nguyên tắc của cấp phép phần mềm nguồn mở không dễ dàng áp dụng cho NNW do bản chất của chúng là kiến thức được lưu trữ trong các ma trận lớn.
Meeker đề xuất giấy phép cho phép trọng số mở như một cách để chia sẻ NNWS theo khuôn khổ giống như nguồn mở, nhấn mạnh các mục tiêu ban đầu của tự do nguồn mở. Tuy nhiên, cô thừa nhận những thách thức trong việc áp dụng các quyền tự do này cho NNWs, với bản chất không thể đọc được và không thể đọc được của họ.
Maffulli nhấn mạnh rằng các định nghĩa của OSI, giống như các định nghĩa của Quỹ Linux, được điều khiển bằng cộng đồng, phản ánh bản chất hợp tác của phát triển nguồn mở. Ông lưu ý rằng OSI đang theo dõi cách các học viên AI áp dụng các định nghĩa này trong thực tế.
Bất chấp những nỗ lực này, Meeker bày tỏ sự nghi ngờ về khả năng bất kỳ định nghĩa nào trở thành một tiêu chuẩn thực tế, trích dẫn ảnh hưởng của khung pháp lý, quy định quyền riêng tư và động lực thị trường.
Cuộc tranh luận đang diễn ra nhấn mạnh một thách thức rộng lớn hơn: xác định những gì thực sự cấu thành AI nguồn mở. Mặc dù có sự đồng thuận rằng chỉ cần dán nhãn cho mô hình AI hoặc bộ dữ liệu là "nguồn mở" không đủ như đã thấy trong trường hợp của Llama, cộng đồng vẫn còn cách xa một định nghĩa thống nhất.

Bài viết liên quan
Động thái ấn tượng nhất của Openai không liên quan đến AI
Nếu bạn nghĩ rằng Chatgpt, Sora, nhà điều hành và trình tạo hình ảnh mới là những điều ấn tượng nhất mà Openai đã làm, bạn đang thiếu bức tranh lớn hơn. Chắc chắn, những công cụ này là không thể tin được và đã biến đổi công việc của riêng tôi, tăng hiệu quả và tăng doanh thu. Nhưng phép thuật thực sự? Mở thị trường của Openai (
Google Bard phân tích thiết kế bìa sách và lời nhắc AI
Bạn đã bao giờ tự hỏi làm thế nào bạn có thể khai thác sức mạnh của AI để đi sâu vào thế giới phân tích hình ảnh? Google Bard đang ở đây để cách mạng hóa cách bạn tiếp cận nội dung trực quan, đặc biệt là khi nói đến việc tạo ra sự sáng tạo cho các thiết kế bìa sách. Cho dù bạn là một nhà thiết kế đang tìm kiếm cảm hứng mới o
Là người xây dựng cửa hàng Dropshipt AI Shopify có đáng đầu tư không?
Trong thế giới năng động của thương mại điện tử, việc cạnh tranh đòi hỏi cả hiệu quả và đổi mới. Dropshipping đã trở thành một mô hình kinh doanh được ưa chuộng do các rào cản nhập cảnh thấp, nhưng việc thiết lập một cửa hàng trực tuyến được đánh bóng vẫn có thể là một thách thức. Đây là nơi các công cụ chạy bằng AI như Dropshipt bước vào, AIM
Nhận xét (0)
0/200






Cuộc tranh luận về những gì cấu thành AI nguồn mở tiếp tục phát triển, với đầu vào đáng kể từ cả nhà phát triển và lãnh đạo ngành. Sáng kiến nguồn mở (OSI) đã cố gắng thiết lập một định nghĩa rõ ràng với định nghĩa AI nguồn mở (OSAID) của nó, nhưng những bất đồng vẫn tồn tại về những gì nên được đưa vào. Đáp lại, Liên minh nguồn mở mới được hình thành (OSA) đã giới thiệu khuôn khổ riêng của mình, định nghĩa trọng lượng mở (OWD), tìm cách giải quyết những thách thức độc đáo của phát triển AI.
OWD nhằm mục đích đạt được sự cân bằng giữa AI đóng và nguồn mở bằng cách đặt các tiêu chuẩn cho những gì được tính là "nguồn mở" trong AI, đặc biệt là đối với các mô hình ngôn ngữ lớn (LLM). Nó tập trung vào ba lĩnh vực chính:
Các thành phần chính của định nghĩa trọng lượng mở (OWD)
1. Khả năng truy cập trọng lượng mô hình
OWD nhấn mạnh tầm quan trọng của việc tạo ra trọng số mô hình, các giá trị số kết nối các nút trên các lớp AI có thể truy cập được cho các nhà phát triển và nhà nghiên cứu. Những trọng số này, được xác định trong quá trình đào tạo, rất quan trọng để hiểu và cải thiện các mô hình AI.
2. Thông tin dữ liệu
Mặc dù OWD không bắt buộc truy cập đầy đủ vào dữ liệu đào tạo, nhưng nó nhấn mạnh sự cần thiết của việc cung cấp thông tin chi tiết về nội dung và phương thức thu thập của bộ dữ liệu. Tính minh bạch này giúp đánh giá hiệu suất và sai lệch tiềm năng của mô hình.
3. Tính minh bạch kiến trúc
Khung khuyến khích tiết lộ kiến trúc của mô hình, có thể hỗ trợ các cải tiến và sửa đổi hơn nữa của cộng đồng.
Amanda Brock, Giám đốc điều hành của Openuk, hỗ trợ OWD, xem nó như một bước để hợp tác toàn cầu tốt hơn. Cô phê phán OSI OSAID, cho thấy rằng sự tập trung của OWD vào việc phân tách các thành phần AI là thực tế hơn. Quan điểm của Brock là việc xác định tính cởi mở của các yếu tố riêng lẻ như dữ liệu, trọng lượng và mô hình hiệu quả hơn một định nghĩa rộng, có khả năng không phù hợp.
OSA, do người sáng lập Sam Johnston dẫn đầu, nhằm mục đích mở rộng định nghĩa nguồn mở truyền thống (OSD) để bao gồm các yếu tố cụ thể của AI như trọng lượng, đề xuất một "Nguồn mở 2.0". Động thái này diễn ra giữa các cuộc tranh luận đang diễn ra về khả năng áp dụng của OSD vào AI, đặc biệt là liên quan đến dữ liệu và trọng số mô hình.
Để đối phó với OWD, Stefano Maffulli của OSI đã chỉ ra rằng các cộng đồng, chẳng hạn như Linux Foundation, đã phát triển các định nghĩa của riêng họ về các trọng số mở. Ngoài ra, Heather Meeker, một luật sư nguồn mở nổi tiếng, đã nêu bật sự khác biệt cơ bản giữa mã nguồn phần mềm và trọng lượng ròng thần kinh (NNWS), cho rằng các nguyên tắc của cấp phép phần mềm nguồn mở không dễ dàng áp dụng cho NNW do bản chất của chúng là kiến thức được lưu trữ trong các ma trận lớn.
Meeker đề xuất giấy phép cho phép trọng số mở như một cách để chia sẻ NNWS theo khuôn khổ giống như nguồn mở, nhấn mạnh các mục tiêu ban đầu của tự do nguồn mở. Tuy nhiên, cô thừa nhận những thách thức trong việc áp dụng các quyền tự do này cho NNWs, với bản chất không thể đọc được và không thể đọc được của họ.
Maffulli nhấn mạnh rằng các định nghĩa của OSI, giống như các định nghĩa của Quỹ Linux, được điều khiển bằng cộng đồng, phản ánh bản chất hợp tác của phát triển nguồn mở. Ông lưu ý rằng OSI đang theo dõi cách các học viên AI áp dụng các định nghĩa này trong thực tế.
Bất chấp những nỗ lực này, Meeker bày tỏ sự nghi ngờ về khả năng bất kỳ định nghĩa nào trở thành một tiêu chuẩn thực tế, trích dẫn ảnh hưởng của khung pháp lý, quy định quyền riêng tư và động lực thị trường.
Cuộc tranh luận đang diễn ra nhấn mạnh một thách thức rộng lớn hơn: xác định những gì thực sự cấu thành AI nguồn mở. Mặc dù có sự đồng thuận rằng chỉ cần dán nhãn cho mô hình AI hoặc bộ dữ liệu là "nguồn mở" không đủ như đã thấy trong trường hợp của Llama, cộng đồng vẫn còn cách xa một định nghĩa thống nhất.



5 bước dễ dàng để đòi lại quyền riêng tư dữ liệu trực tuyến của bạn - Bắt đầu ngay hôm nay
Các trung tâm dữ liệu của Hoa Kỳ có thể mở khóa 76 GW công suất năng lượng mới Cơ quan AI UK đổi tên thành Viện An ninh, ký hợp đồng với nhân học Nvidia tiết lộ GPU thế hệ tiếp theo: Blackwell Ultra, Vera Rubin, Feynman








