Licences d'IA ouvertes: dévoiler des restrictions cachées

Cette semaine, Google a dévoilé Gemma 3, une famille de modèles AI ouverts qui ont été salués pour leur efficacité. Cependant, les développeurs sur X ont exprimé leur frustration concernant la licence de Gemma 3, qui présente des risques significatifs pour les applications commerciales. Ce problème n’est pas propre à Gemma 3 ; des entreprises comme Meta imposent également des conditions de licence personnalisées et non standard sur leurs modèles ouverts, créant des obstacles juridiques pour les entreprises. Les petites entreprises, en particulier, craignent que Google et d’autres sociétés similaires n’imposent soudainement des clauses plus strictes, perturbant leurs opérations.
Nick Vidal, responsable de la communauté à l’Open Source Initiative, a souligné ce problème à TechCrunch, déclarant : « Les licences restrictives et incohérentes des modèles AI prétendument ‘ouverts’ créent une incertitude significative, en particulier pour l’adoption commerciale. Bien que ces modèles soient présentés comme ouverts, les conditions réelles imposent divers obstacles juridiques et pratiques qui dissuadent les entreprises d’intégrer ces modèles dans leurs produits ou services. »
Les développeurs de modèles ouverts optent souvent pour des licences propriétaires plutôt que des licences standard comme Apache et MIT pour des raisons spécifiques. Par exemple, la startup AI Cohere a clairement indiqué qu’elle soutient les travaux scientifiques, mais pas commerciaux, sur ses modèles. Cependant, les licences de Gemma et des modèles Llama de Meta incluent des restrictions qui limitent la manière dont les entreprises peuvent les utiliser sans risques juridiques.
La licence de Llama 3 de Meta, par exemple, interdit aux développeurs d’utiliser les sorties du modèle pour améliorer tout autre modèle que Llama 3 ou ses dérivés. Elle interdit également aux entreprises comptant plus de 700 millions d’utilisateurs actifs mensuels de déployer les modèles Llama sans une licence spéciale. La licence de Gemma, bien que moins restrictive, permet à Google de limiter l’utilisation s’il estime qu’il y a une violation de sa politique d’utilisation interdite ou des lois applicables.
Ces conditions s’étendent aux modèles dérivés de Llama ou Gemma, y compris ceux entraînés sur des données synthétiques générées par Gemma. Florian Brand, chercheur en AI à l’Université de Trèves, soutient que de telles licences « ne peuvent raisonnablement pas être qualifiées de ‘open source’. » Il a déclaré à TechCrunch : « La plupart des entreprises disposent d’un ensemble de licences approuvées, comme Apache 2.0, donc toute licence personnalisée représente beaucoup de complications et de coûts. Les petites entreprises sans équipes juridiques ou sans budget pour des avocats se limiteront aux modèles avec des licences standard. »
Brand a également noté que, bien que des entreprises comme Google n’aient pas encore appliqué ces conditions de manière agressive, la simple menace peut dissuader l’adoption. « Ces restrictions ont un impact sur l’écosystème AI, même sur des chercheurs en AI comme moi », a-t-il déclaré.
Han-Chung Lee, directeur de l’apprentissage automatique chez Moody’s, et Eric Tramel, scientifique appliqué chez la startup AI Gretel, conviennent que les licences personnalisées comme celles de Gemma et Llama rendent les modèles « inutilisables » dans de nombreux scénarios commerciaux. Tramel a exprimé des préoccupations concernant le potentiel de « reprises » et la confusion autour des licences pour les dérivés de modèles. Il a averti que les modèles pourraient être utilisés comme un « cheval de Troie » pour obtenir des informations sur des cas commerciaux réussis et ensuite exploiter des actions juridiques pour pénétrer ces marchés.
Malgré leurs licences restrictives, certains modèles comme Llama ont connu une adoption généralisée, étant téléchargés des millions de fois et intégrés dans des produits par de grandes entreprises comme Spotify. Cependant, Yacine Jernite, responsable de l’apprentissage automatique et société chez la startup AI Hugging Face, estime qu’ils pourraient être encore plus réussis avec des licences permissives. Il a exhorté les fournisseurs comme Google à adopter des cadres de licence ouverts et à collaborer plus directement avec les utilisateurs sur des termes largement acceptés.
Jernite a noté : « Étant donné le manque de consensus sur ces termes et le fait que bon nombre des hypothèses sous-jacentes n’ont pas encore été testées devant les tribunaux, tout cela sert principalement de déclaration d’intention de la part de ces acteurs. Si certaines clauses sont interprétées trop largement, beaucoup de bon travail se retrouvera sur un terrain juridique incertain, ce qui est particulièrement effrayant pour les organisations développant des produits commerciaux réussis. »
Vidal a souligné la nécessité de modèles AI qui peuvent être librement intégrés, modifiés et partagés sans crainte de changements soudains de licence ou d’ambiguïté juridique. Il a déclaré : « Le paysage actuel des licences de modèles AI est semé de confusion, de termes restrictifs et de revendications trompeuses d’ouverture. Au lieu de redéfinir ‘ouvert’ pour convenir aux intérêts des entreprises, l’industrie de l’AI devrait s’aligner sur les principes établis de l’open source pour créer un écosystème véritablement ouvert. »
Article connexe
Une étude anthropologique établit un lien entre les contenus générés par l'IA et une diminution de la réflexion humaine
Lorsque vous voyez l'IA produire instantanément un code ou un document bien structuré et d'une logique claire, êtes-vous tenté de lui faire confiance sans y réfléchir à deux fois ? Selon AIbase, Anthr
Les ministères britanniques s'affrontent au sujet des besoins énergétiques des centres de données dédiés à l'IA
Le gouvernement britannique est confronté à un défi de taille : promouvoir les énergies propres tout en visant à devenir un leader mondial dans le domaine de l'intelligence artificielle. Or, de sérieu
L'Administration chinoise du cyberespace impose l'étiquetage des courtes vidéos générées par l'IA et des vidéos de fiction
L'Administration chinoise du cyberespace a mis en place un plan global visant à normaliser l'étiquetage des contenus vidéo courts, en imposant aux plateformes l'utilisation de six balises obligatoires
Recommandations de sujets spéciaux liés
commentaires (52)
Diese Diskussion über „Open AI“ Lizenzen ist wichtiger, als viele denken. Meta hat mit Llama auch schon solche überraschenden Klauseln reingepackt. Für kleine Firmen, die auf sowas setzen, ist das echt ein Minenfeld. Man denkt, man nutzt frei verfügbare Technologie, und plötzlich lauert die nächste Rechnung oder Rechtsstreit. Da ist die Euphorie über neue Modelle schnell verflogen. Die Branche braucht hier echt mehr Transparenz und faire Spielregeln für alle, nicht nur für die Tech-Giganten. 🤔
これって…結局は『Open』じゃないんだね 😅 ライセンス条項の細かい所を読むと、商用利用が結構厽しめに制限されているみたい。技術的には素晴らしいと思うけど、こういう伏兵みたいな規約が増えてくると、結局自分でモデルを作った方が安上がりなんじゃないか、って思っちゃうな。
Gemma 3のライセンス条件をざっと見たけど、やっぱり大企業の「オープン」戦略って本当の意味でのオープンソース精神からは程遠いよね。結局は彼らのエコシステムに縛り付けるための仕組みじゃないかと疑いたくなるわ… 🤨 開発者はいつもリスクトレードオフを迫られる立場で、なんだか気の毒だな。
Gemma 3 heißt plötzlich 'open', aber die Lizenz liest sich wie eine Knebelklausel. 🤔 Komischerweise wird das Risiko für kommerzielle Anwendungen erst auffällig, wenn Entwickler drauf stoßen. Meta ist auch nicht besser. Diese großen Tech-Firmen schaffen eine eigene Art von 'Open Source' – mit unsichtbaren Zäunen. Irgendwann merkt man: frei ist nur der Code, nicht die Nutzung. Gibt's überhaupt noch echte Alternativen?
あれ?オープンAIモデルのはずなのに商用制限が結構あるんだ。GoogleのGemma 3もMetaも結局は自社の利益を守りたいだけ?企業向けに使うなら、ライセンス条項をしっかり確認しないと危険かも…🤔

Cette semaine, Google a dévoilé Gemma 3, une famille de modèles AI ouverts qui ont été salués pour leur efficacité. Cependant, les développeurs sur X ont exprimé leur frustration concernant la licence de Gemma 3, qui présente des risques significatifs pour les applications commerciales. Ce problème n’est pas propre à Gemma 3 ; des entreprises comme Meta imposent également des conditions de licence personnalisées et non standard sur leurs modèles ouverts, créant des obstacles juridiques pour les entreprises. Les petites entreprises, en particulier, craignent que Google et d’autres sociétés similaires n’imposent soudainement des clauses plus strictes, perturbant leurs opérations.
Nick Vidal, responsable de la communauté à l’Open Source Initiative, a souligné ce problème à TechCrunch, déclarant : « Les licences restrictives et incohérentes des modèles AI prétendument ‘ouverts’ créent une incertitude significative, en particulier pour l’adoption commerciale. Bien que ces modèles soient présentés comme ouverts, les conditions réelles imposent divers obstacles juridiques et pratiques qui dissuadent les entreprises d’intégrer ces modèles dans leurs produits ou services. »
Les développeurs de modèles ouverts optent souvent pour des licences propriétaires plutôt que des licences standard comme Apache et MIT pour des raisons spécifiques. Par exemple, la startup AI Cohere a clairement indiqué qu’elle soutient les travaux scientifiques, mais pas commerciaux, sur ses modèles. Cependant, les licences de Gemma et des modèles Llama de Meta incluent des restrictions qui limitent la manière dont les entreprises peuvent les utiliser sans risques juridiques.
La licence de Llama 3 de Meta, par exemple, interdit aux développeurs d’utiliser les sorties du modèle pour améliorer tout autre modèle que Llama 3 ou ses dérivés. Elle interdit également aux entreprises comptant plus de 700 millions d’utilisateurs actifs mensuels de déployer les modèles Llama sans une licence spéciale. La licence de Gemma, bien que moins restrictive, permet à Google de limiter l’utilisation s’il estime qu’il y a une violation de sa politique d’utilisation interdite ou des lois applicables.
Ces conditions s’étendent aux modèles dérivés de Llama ou Gemma, y compris ceux entraînés sur des données synthétiques générées par Gemma. Florian Brand, chercheur en AI à l’Université de Trèves, soutient que de telles licences « ne peuvent raisonnablement pas être qualifiées de ‘open source’. » Il a déclaré à TechCrunch : « La plupart des entreprises disposent d’un ensemble de licences approuvées, comme Apache 2.0, donc toute licence personnalisée représente beaucoup de complications et de coûts. Les petites entreprises sans équipes juridiques ou sans budget pour des avocats se limiteront aux modèles avec des licences standard. »
Brand a également noté que, bien que des entreprises comme Google n’aient pas encore appliqué ces conditions de manière agressive, la simple menace peut dissuader l’adoption. « Ces restrictions ont un impact sur l’écosystème AI, même sur des chercheurs en AI comme moi », a-t-il déclaré.
Han-Chung Lee, directeur de l’apprentissage automatique chez Moody’s, et Eric Tramel, scientifique appliqué chez la startup AI Gretel, conviennent que les licences personnalisées comme celles de Gemma et Llama rendent les modèles « inutilisables » dans de nombreux scénarios commerciaux. Tramel a exprimé des préoccupations concernant le potentiel de « reprises » et la confusion autour des licences pour les dérivés de modèles. Il a averti que les modèles pourraient être utilisés comme un « cheval de Troie » pour obtenir des informations sur des cas commerciaux réussis et ensuite exploiter des actions juridiques pour pénétrer ces marchés.
Malgré leurs licences restrictives, certains modèles comme Llama ont connu une adoption généralisée, étant téléchargés des millions de fois et intégrés dans des produits par de grandes entreprises comme Spotify. Cependant, Yacine Jernite, responsable de l’apprentissage automatique et société chez la startup AI Hugging Face, estime qu’ils pourraient être encore plus réussis avec des licences permissives. Il a exhorté les fournisseurs comme Google à adopter des cadres de licence ouverts et à collaborer plus directement avec les utilisateurs sur des termes largement acceptés.
Jernite a noté : « Étant donné le manque de consensus sur ces termes et le fait que bon nombre des hypothèses sous-jacentes n’ont pas encore été testées devant les tribunaux, tout cela sert principalement de déclaration d’intention de la part de ces acteurs. Si certaines clauses sont interprétées trop largement, beaucoup de bon travail se retrouvera sur un terrain juridique incertain, ce qui est particulièrement effrayant pour les organisations développant des produits commerciaux réussis. »
Vidal a souligné la nécessité de modèles AI qui peuvent être librement intégrés, modifiés et partagés sans crainte de changements soudains de licence ou d’ambiguïté juridique. Il a déclaré : « Le paysage actuel des licences de modèles AI est semé de confusion, de termes restrictifs et de revendications trompeuses d’ouverture. Au lieu de redéfinir ‘ouvert’ pour convenir aux intérêts des entreprises, l’industrie de l’AI devrait s’aligner sur les principes établis de l’open source pour créer un écosystème véritablement ouvert. »
Une étude anthropologique établit un lien entre les contenus générés par l'IA et une diminution de la réflexion humaine
Lorsque vous voyez l'IA produire instantanément un code ou un document bien structuré et d'une logique claire, êtes-vous tenté de lui faire confiance sans y réfléchir à deux fois ? Selon AIbase, Anthr
Les ministères britanniques s'affrontent au sujet des besoins énergétiques des centres de données dédiés à l'IA
Le gouvernement britannique est confronté à un défi de taille : promouvoir les énergies propres tout en visant à devenir un leader mondial dans le domaine de l'intelligence artificielle. Or, de sérieu
L'Administration chinoise du cyberespace impose l'étiquetage des courtes vidéos générées par l'IA et des vidéos de fiction
L'Administration chinoise du cyberespace a mis en place un plan global visant à normaliser l'étiquetage des contenus vidéo courts, en imposant aux plateformes l'utilisation de six balises obligatoires
Diese Diskussion über „Open AI“ Lizenzen ist wichtiger, als viele denken. Meta hat mit Llama auch schon solche überraschenden Klauseln reingepackt. Für kleine Firmen, die auf sowas setzen, ist das echt ein Minenfeld. Man denkt, man nutzt frei verfügbare Technologie, und plötzlich lauert die nächste Rechnung oder Rechtsstreit. Da ist die Euphorie über neue Modelle schnell verflogen. Die Branche braucht hier echt mehr Transparenz und faire Spielregeln für alle, nicht nur für die Tech-Giganten. 🤔
これって…結局は『Open』じゃないんだね 😅 ライセンス条項の細かい所を読むと、商用利用が結構厽しめに制限されているみたい。技術的には素晴らしいと思うけど、こういう伏兵みたいな規約が増えてくると、結局自分でモデルを作った方が安上がりなんじゃないか、って思っちゃうな。
Gemma 3のライセンス条件をざっと見たけど、やっぱり大企業の「オープン」戦略って本当の意味でのオープンソース精神からは程遠いよね。結局は彼らのエコシステムに縛り付けるための仕組みじゃないかと疑いたくなるわ… 🤨 開発者はいつもリスクトレードオフを迫られる立場で、なんだか気の毒だな。
Gemma 3 heißt plötzlich 'open', aber die Lizenz liest sich wie eine Knebelklausel. 🤔 Komischerweise wird das Risiko für kommerzielle Anwendungen erst auffällig, wenn Entwickler drauf stoßen. Meta ist auch nicht besser. Diese großen Tech-Firmen schaffen eine eigene Art von 'Open Source' – mit unsichtbaren Zäunen. Irgendwann merkt man: frei ist nur der Code, nicht die Nutzung. Gibt's überhaupt noch echte Alternativen?
あれ?オープンAIモデルのはずなのに商用制限が結構あるんだ。GoogleのGemma 3もMetaも結局は自社の利益を守りたいだけ?企業向けに使うなら、ライセンス条項をしっかり確認しないと危険かも…🤔





Maison






