La définition de poids ouvert fournit une nouvelle perspective sur le débat OSAID

Le débat sur ce qui constitue l'IA open-source continue d'évoluer, avec des contributions significatives des développeurs et des leaders de l'industrie. L'Open Source Initiative (OSI) s'efforce d'établir une définition claire avec sa définition de l'IA open-source (OSAID), mais des désaccords persistent sur ce qui devrait être inclus. En réponse, la nouvellement formée Open Source Alliance (OSA) a introduit son propre cadre, la définition des poids ouverts (OWD), qui cherche à répondre aux défis uniques du développement de l'IA.
L'OWD vise à trouver un équilibre entre l'IA fermée et open-source en établissant des normes pour ce qui compte comme "open-source" dans l'IA, en particulier pour les grands modèles de langage (LLMs). Il se concentre sur trois domaines clés :
Composants clés de la définition des poids ouverts (OWD)
1. Accessibilité des poids du modèle
L'OWD met l'accent sur l'importance de rendre les poids du modèle — les valeurs numériques qui relient les nœuds à travers les couches de l'IA — accessibles aux développeurs et aux chercheurs. Ces poids, déterminés pendant l'entraînement, sont cruciaux pour comprendre et améliorer les modèles d'IA.
2. Informations sur les ensembles de données
Bien que l'OWD ne mandate pas un accès complet aux données d'entraînement, il souligne la nécessité de fournir des informations détaillées sur le contenu des ensembles de données et les méthodes de collecte. Cette transparence aide à évaluer les performances du modèle et ses éventuels biais.
3. Transparence de l'architecture
Le cadre encourage la divulgation de l'architecture du modèle, ce qui peut aider à de nouvelles améliorations et modifications par la communauté.
Amanda Brock, PDG d'OpenUK, soutient l'OWD, le considérant comme un pas vers une meilleure collaboration mondiale. Elle critique l'OSAID de l'OSI, suggérant que l'accent mis par l'OWD sur la dissociation des composants de l'IA est plus pratique. Selon Brock, définir l'ouverture des éléments individuels comme les données, les poids et les modèles est plus efficace qu'une définition large et potentiellement inadaptée.
L'OSA, dirigée par le fondateur Sam Johnston, vise à élargir la définition traditionnelle de l'open-source (OSD) pour inclure des éléments spécifiques à l'IA comme les poids, proposant un "Open Source 2.0". Ce mouvement intervient au milieu des débats en cours sur l'applicabilité de l'OSD à l'IA, en particulier en ce qui concerne les données et les poids des modèles.
En réponse à l'OWD, Stefano Maffulli de l'OSI a souligné que des communautés, comme la Linux Foundation, ont déjà développé leurs propres définitions des poids ouverts. De plus, Heather Meeker, une avocate renommée en open-source, a mis en évidence les différences fondamentales entre le code source des logiciels et les poids des réseaux neuronaux (NNWs), arguant que les principes des licences de logiciels open-source ne s'appliquent pas facilement aux NNWs en raison de leur nature en tant que connaissances apprises stockées dans de grandes matrices.
Meeker a proposé la licence permissive des poids ouverts comme moyen de partager les NNWs dans un cadre de type open-source, mettant l'accent sur les objectifs originaux de la liberté open-source. Cependant, elle a reconnu les défis d'appliquer ces libertés aux NNWs, étant donné leur nature non lisible par l'humain et non déboguable.
Maffulli a souligné que les définitions de l'OSI, comme celles de la Linux Foundation, sont élaborées par la communauté, reflétant la nature collaborative du développement open-source. Il a noté que l'OSI surveille comment les praticiens de l'IA appliquent ces définitions dans la pratique.
Malgré ces efforts, Meeker a exprimé des doutes sur la probabilité qu'une seule définition devienne une norme de facto, citant l'influence des cadres réglementaires, des réglementations sur la confidentialité et des dynamiques du marché.
Le débat en cours souligne un défi plus large : définir ce qui constitue véritablement l'IA open-source. Bien qu'il y ait un consensus sur le fait que simplement qualifier un modèle ou un ensemble de données d'IA comme "open-source" ne suffit pas — comme on l'a vu dans le cas de Llama de Meta — la communauté reste loin d'une définition unifiée.
Article connexe
Exploiter l'IA pour la recherche académique : outils et techniques pour une rédaction simplifiée
Rédiger un article de recherche peut être difficile, mais les outils d'IA peuvent simplifier considérablement le processus. Ce guide explore l'utilisation de plateformes d'IA comme ChatGPT, Google Bar
NotebookLM Dévoile des Carnets Sélectionnés de Publications de Premier Plan et d'Experts
Google améliore son outil de recherche et de prise de notes alimenté par l'IA, NotebookLM, pour en faire un centre de connaissances complet. Lundi, l'entreprise a présenté une collection de carnets so
Engagez plus de 1 000 innovateurs en IA : Organisez un événement parallèle aux TechCrunch Sessions : AI
Vous souhaitez présenter votre marque à des experts de premier plan en IA ? Organiser un événement parallèle pendant la semaine des TechCrunch Sessions : AI offre une occasion unique de vous connecter
commentaires (10)
0/200
FredGreen
26 avril 2025 17:10:52 UTC+02:00
I'm still wrapping my head around the OSAID debate, but this article helps a lot! It's fascinating to see how the Open Source Initiative is trying to define open-source AI. Still, it's a bit confusing. 🤔
0
WalterWhite
25 avril 2025 17:06:56 UTC+02:00
このツールは、オープンソースAIの議論について新たな視点を与えてくれました!OSAIDのニュアンスを理解するのに役立ちます。ただ、初心者向けに例を増やしてほしいです。全体的に素晴らしいリソースです!👀📖
0
AlbertRodriguez
25 avril 2025 11:04:16 UTC+02:00
Ainda estou tentando entender o debate sobre OSAID, mas este artigo ajuda muito! É fascinante ver como a Iniciativa de Código Aberto está tentando definir a IA de código aberto. Ainda assim, é um pouco confuso. 🤔
0
AnthonyHernández
25 avril 2025 05:21:50 UTC+02:00
OSAID 논쟁에 대해 아직 이해 중이지만, 이 기사가 많이 도움이 되었어요! 오픈 소스 이니셔티브가 오픈 소스 AI를 어떻게 정의하려고 하는지 흥미로워요. 그래도 아직 조금 헷갈려요. 🤔
0
WillGarcía
25 avril 2025 04:10:04 UTC+02:00
OSAIDの議論についてまだ理解中ですが、この記事がとても参考になりました!オープンソースイニシアチブがオープンソースAIをどう定義しようとしているのか興味深いです。ただ、まだ少し混乱しています。🤔
0
JonathanAllen
24 avril 2025 13:06:06 UTC+02:00
Essa ferramenta realmente me deu uma nova perspectiva sobre o debate de IA de código aberto! É super útil para entender as nuances do OSAID. No entanto, poderia ter mais exemplos para iniciantes. No geral, é um ótimo recurso! 👀📖
0
Le débat sur ce qui constitue l'IA open-source continue d'évoluer, avec des contributions significatives des développeurs et des leaders de l'industrie. L'Open Source Initiative (OSI) s'efforce d'établir une définition claire avec sa définition de l'IA open-source (OSAID), mais des désaccords persistent sur ce qui devrait être inclus. En réponse, la nouvellement formée Open Source Alliance (OSA) a introduit son propre cadre, la définition des poids ouverts (OWD), qui cherche à répondre aux défis uniques du développement de l'IA.
L'OWD vise à trouver un équilibre entre l'IA fermée et open-source en établissant des normes pour ce qui compte comme "open-source" dans l'IA, en particulier pour les grands modèles de langage (LLMs). Il se concentre sur trois domaines clés :
Composants clés de la définition des poids ouverts (OWD)
1. Accessibilité des poids du modèle
L'OWD met l'accent sur l'importance de rendre les poids du modèle — les valeurs numériques qui relient les nœuds à travers les couches de l'IA — accessibles aux développeurs et aux chercheurs. Ces poids, déterminés pendant l'entraînement, sont cruciaux pour comprendre et améliorer les modèles d'IA.
2. Informations sur les ensembles de données
Bien que l'OWD ne mandate pas un accès complet aux données d'entraînement, il souligne la nécessité de fournir des informations détaillées sur le contenu des ensembles de données et les méthodes de collecte. Cette transparence aide à évaluer les performances du modèle et ses éventuels biais.
3. Transparence de l'architecture
Le cadre encourage la divulgation de l'architecture du modèle, ce qui peut aider à de nouvelles améliorations et modifications par la communauté.
Amanda Brock, PDG d'OpenUK, soutient l'OWD, le considérant comme un pas vers une meilleure collaboration mondiale. Elle critique l'OSAID de l'OSI, suggérant que l'accent mis par l'OWD sur la dissociation des composants de l'IA est plus pratique. Selon Brock, définir l'ouverture des éléments individuels comme les données, les poids et les modèles est plus efficace qu'une définition large et potentiellement inadaptée.
L'OSA, dirigée par le fondateur Sam Johnston, vise à élargir la définition traditionnelle de l'open-source (OSD) pour inclure des éléments spécifiques à l'IA comme les poids, proposant un "Open Source 2.0". Ce mouvement intervient au milieu des débats en cours sur l'applicabilité de l'OSD à l'IA, en particulier en ce qui concerne les données et les poids des modèles.
En réponse à l'OWD, Stefano Maffulli de l'OSI a souligné que des communautés, comme la Linux Foundation, ont déjà développé leurs propres définitions des poids ouverts. De plus, Heather Meeker, une avocate renommée en open-source, a mis en évidence les différences fondamentales entre le code source des logiciels et les poids des réseaux neuronaux (NNWs), arguant que les principes des licences de logiciels open-source ne s'appliquent pas facilement aux NNWs en raison de leur nature en tant que connaissances apprises stockées dans de grandes matrices.
Meeker a proposé la licence permissive des poids ouverts comme moyen de partager les NNWs dans un cadre de type open-source, mettant l'accent sur les objectifs originaux de la liberté open-source. Cependant, elle a reconnu les défis d'appliquer ces libertés aux NNWs, étant donné leur nature non lisible par l'humain et non déboguable.
Maffulli a souligné que les définitions de l'OSI, comme celles de la Linux Foundation, sont élaborées par la communauté, reflétant la nature collaborative du développement open-source. Il a noté que l'OSI surveille comment les praticiens de l'IA appliquent ces définitions dans la pratique.
Malgré ces efforts, Meeker a exprimé des doutes sur la probabilité qu'une seule définition devienne une norme de facto, citant l'influence des cadres réglementaires, des réglementations sur la confidentialité et des dynamiques du marché.
Le débat en cours souligne un défi plus large : définir ce qui constitue véritablement l'IA open-source. Bien qu'il y ait un consensus sur le fait que simplement qualifier un modèle ou un ensemble de données d'IA comme "open-source" ne suffit pas — comme on l'a vu dans le cas de Llama de Meta — la communauté reste loin d'une définition unifiée.



I'm still wrapping my head around the OSAID debate, but this article helps a lot! It's fascinating to see how the Open Source Initiative is trying to define open-source AI. Still, it's a bit confusing. 🤔




このツールは、オープンソースAIの議論について新たな視点を与えてくれました!OSAIDのニュアンスを理解するのに役立ちます。ただ、初心者向けに例を増やしてほしいです。全体的に素晴らしいリソースです!👀📖




Ainda estou tentando entender o debate sobre OSAID, mas este artigo ajuda muito! É fascinante ver como a Iniciativa de Código Aberto está tentando definir a IA de código aberto. Ainda assim, é um pouco confuso. 🤔




OSAID 논쟁에 대해 아직 이해 중이지만, 이 기사가 많이 도움이 되었어요! 오픈 소스 이니셔티브가 오픈 소스 AI를 어떻게 정의하려고 하는지 흥미로워요. 그래도 아직 조금 헷갈려요. 🤔




OSAIDの議論についてまだ理解中ですが、この記事がとても参考になりました!オープンソースイニシアチブがオープンソースAIをどう定義しようとしているのか興味深いです。ただ、まだ少し混乱しています。🤔




Essa ferramenta realmente me deu uma nova perspectiva sobre o debate de IA de código aberto! É super útil para entender as nuances do OSAID. No entanto, poderia ter mais exemplos para iniciantes. No geral, é um ótimo recurso! 👀📖












