«Открыть лицензии на ИИ: раскрыть скрытые ограничения»

На этой неделе Google представил Gemma 3, семейство открытых моделей AI, которые хвалят за их эффективность. Однако разработчики на X выразили недовольство лицензией Gemma 3, которая создает значительные риски для коммерческих приложений. Эта проблема не ограничивается Gemma 3; компании, такие как Meta, также устанавливают нестандартные лицензионные условия для своих открытых моделей, создавая юридические препятствия для бизнеса. Малые компании, в частности, опасаются, что Google и подобные компании могут внезапно ужесточить условия, нарушая их деятельность.
Ник Видал, глава сообщества в Open Source Initiative, отметил проблему в разговоре с TechCrunch, заявив: «Ограничительные и непоследовательные лицензии так называемых 'открытых' моделей AI создают значительную неопределенность, особенно для коммерческого внедрения. Хотя эти модели позиционируются как открытые, их условия накладывают различные юридические и практические препятствия, которые отпугивают компании от интеграции их в свои продукты или услуги».
Разработчики открытых моделей часто выбирают проприетарные лицензии вместо стандартных, таких как Apache и MIT, по определенным причинам. Например, стартап AI Cohere ясно дал понять, что поддерживает научную, но не коммерческую работу над своими моделями. Однако лицензии для Gemma и Llama от Meta включают ограничения, которые ограничивают использование компаниями без юридических рисков.
Лицензия Llama 3 от Meta, например, запрещает разработчикам использовать выходные данные модели для улучшения любой другой модели, кроме Llama 3 или ее производных. Она также запрещает компаниям с более чем 700 миллионами активных пользователей в месяц использовать модели Llama без специальной лицензии. Лицензия Gemma, хотя и менее строгая, позволяет Google ограничивать использование, если считает, что есть нарушение политики запрещенного использования или применимых законов.
Эти условия распространяются на модели, производные от Llama или Gemma, включая те, что обучены на синтетических данных, сгенерированных Gemma. Флориан Бранд, исследователь AI в Университете Трира, утверждает, что такие лицензии «нельзя разумно назвать 'открытым исходным кодом'». Он сказал TechCrunch: «У большинства компаний есть набор одобренных лицензий, таких как Apache 2.0, поэтому любая нестандартная лицензия — это большие хлопоты и расходы. Маленькие компании без юридических команд или средств на адвокатов будут использовать модели со стандартными лицензиями».
Бранд также отметил, что, хотя компании, такие как Google, пока не активно применяют эти условия, сама угроза может отпугивать. «Эти ограничения влияют на экосистему AI — даже на исследователей AI, таких как я», — сказал он.
Хан-Чун Ли, директор по машинному обучению в Moody's, и Эрик Трамел, штатный прикладной ученый в стартапе AI Gretel, согласны, что нестандартные лицензии, такие как у Gemma и Llama, делают модели «непригодными» во многих коммерческих сценариях. Трамел выразил озабоченность по поводу возможных «отзывов» и путаницы в лицензировании производных моделей. Он предупредил, что модели могут использоваться как «троянский конь» для получения информации о успешных бизнес-кейсах, а затем для юридических действий, чтобы выйти на эти рынки.
Несмотря на ограничительные лицензии, некоторые модели, такие как Llama, получили широкое распространение, будучи загруженными миллионами раз и интегрированными в продукты крупных корпораций, таких как Spotify. Однако Ясин Джернит, глава направления машинного обучения и общества в стартапе AI Hugging Face, считает, что они могли бы быть еще успешнее с более свободными лицензиями. Он призвал провайдеров, таких как Google, принять открытые лицензионные рамки и сотрудничать с пользователями на широко принятых условиях.
Джернит отметил: «Учитывая отсутствие консенсуса по этим условиям и то, что многие базовые предположения еще не были проверены в судах, все это служит в первую очередь декларацией намерений этих участников. Если некоторые положения будут интерпретированы слишком широко, многие хорошие работы окажутся на неопределенной юридической почве, что особенно пугает организации, создающие успешные коммерческие продукты».
Видал подчеркнул необходимость в моделях AI, которые можно свободно интегрировать, модифицировать и распространять без страха внезапных изменений лицензии или юридической неопределенности. Он заявил: «Текущий ландшафт лицензирования моделей AI полон путаницы, ограничительных условий и вводящих в заблуждение заявлений об открытости. Вместо того чтобы переопределять 'открытость' в угоду корпоративным интересам, индустрия AI должна следовать установленным принципам открытого исходного кода, чтобы создать по-настоящему открытую экосистему».
Связанная статья
Ведомства правительства Великобритании спорят по поводу энергопотребления центров обработки данных для искусственного интеллекта
Правительство Великобритании стоит перед серьезной задачей: развивать сектор чистой энергетики и одновременно стремиться стать мировым лидером в области искусственного интеллекта. Однако между ведомст
Управление киберпространства Китая вводит обязательную маркировку коротких видеороликов, созданных с помощью искусственного интеллекта, а также вымышленных видеороликов
Управление киберпространства Китая представило комплексный план по стандартизации маркировки контента коротких видеороликов, обязывающий платформы использовать шесть обязательных меток, в том числе «К
DeepL, известная своими услугами по переводу текстов, теперь занимается переводом речи
DeepL, компания-переводчик, наиболее известная своими инструментами для перевода текстов, сегодня представила набор решений для перевода «голос-голос», предназначенный для таких сценариев, как встречи
Рекомендации по связанным специальным темам
Комментарии (52)
Diese Diskussion über „Open AI“ Lizenzen ist wichtiger, als viele denken. Meta hat mit Llama auch schon solche überraschenden Klauseln reingepackt. Für kleine Firmen, die auf sowas setzen, ist das echt ein Minenfeld. Man denkt, man nutzt frei verfügbare Technologie, und plötzlich lauert die nächste Rechnung oder Rechtsstreit. Da ist die Euphorie über neue Modelle schnell verflogen. Die Branche braucht hier echt mehr Transparenz und faire Spielregeln für alle, nicht nur für die Tech-Giganten. 🤔
これって…結局は『Open』じゃないんだね 😅 ライセンス条項の細かい所を読むと、商用利用が結構厽しめに制限されているみたい。技術的には素晴らしいと思うけど、こういう伏兵みたいな規約が増えてくると、結局自分でモデルを作った方が安上がりなんじゃないか、って思っちゃうな。
Gemma 3のライセンス条件をざっと見たけど、やっぱり大企業の「オープン」戦略って本当の意味でのオープンソース精神からは程遠いよね。結局は彼らのエコシステムに縛り付けるための仕組みじゃないかと疑いたくなるわ… 🤨 開発者はいつもリスクトレードオフを迫られる立場で、なんだか気の毒だな。
Gemma 3 heißt plötzlich 'open', aber die Lizenz liest sich wie eine Knebelklausel. 🤔 Komischerweise wird das Risiko für kommerzielle Anwendungen erst auffällig, wenn Entwickler drauf stoßen. Meta ist auch nicht besser. Diese großen Tech-Firmen schaffen eine eigene Art von 'Open Source' – mit unsichtbaren Zäunen. Irgendwann merkt man: frei ist nur der Code, nicht die Nutzung. Gibt's überhaupt noch echte Alternativen?
あれ?オープンAIモデルのはずなのに商用制限が結構あるんだ。GoogleのGemma 3もMetaも結局は自社の利益を守りたいだけ?企業向けに使うなら、ライセンス条項をしっかり確認しないと危険かも…🤔

На этой неделе Google представил Gemma 3, семейство открытых моделей AI, которые хвалят за их эффективность. Однако разработчики на X выразили недовольство лицензией Gemma 3, которая создает значительные риски для коммерческих приложений. Эта проблема не ограничивается Gemma 3; компании, такие как Meta, также устанавливают нестандартные лицензионные условия для своих открытых моделей, создавая юридические препятствия для бизнеса. Малые компании, в частности, опасаются, что Google и подобные компании могут внезапно ужесточить условия, нарушая их деятельность.
Ник Видал, глава сообщества в Open Source Initiative, отметил проблему в разговоре с TechCrunch, заявив: «Ограничительные и непоследовательные лицензии так называемых 'открытых' моделей AI создают значительную неопределенность, особенно для коммерческого внедрения. Хотя эти модели позиционируются как открытые, их условия накладывают различные юридические и практические препятствия, которые отпугивают компании от интеграции их в свои продукты или услуги».
Разработчики открытых моделей часто выбирают проприетарные лицензии вместо стандартных, таких как Apache и MIT, по определенным причинам. Например, стартап AI Cohere ясно дал понять, что поддерживает научную, но не коммерческую работу над своими моделями. Однако лицензии для Gemma и Llama от Meta включают ограничения, которые ограничивают использование компаниями без юридических рисков.
Лицензия Llama 3 от Meta, например, запрещает разработчикам использовать выходные данные модели для улучшения любой другой модели, кроме Llama 3 или ее производных. Она также запрещает компаниям с более чем 700 миллионами активных пользователей в месяц использовать модели Llama без специальной лицензии. Лицензия Gemma, хотя и менее строгая, позволяет Google ограничивать использование, если считает, что есть нарушение политики запрещенного использования или применимых законов.
Эти условия распространяются на модели, производные от Llama или Gemma, включая те, что обучены на синтетических данных, сгенерированных Gemma. Флориан Бранд, исследователь AI в Университете Трира, утверждает, что такие лицензии «нельзя разумно назвать 'открытым исходным кодом'». Он сказал TechCrunch: «У большинства компаний есть набор одобренных лицензий, таких как Apache 2.0, поэтому любая нестандартная лицензия — это большие хлопоты и расходы. Маленькие компании без юридических команд или средств на адвокатов будут использовать модели со стандартными лицензиями».
Бранд также отметил, что, хотя компании, такие как Google, пока не активно применяют эти условия, сама угроза может отпугивать. «Эти ограничения влияют на экосистему AI — даже на исследователей AI, таких как я», — сказал он.
Хан-Чун Ли, директор по машинному обучению в Moody's, и Эрик Трамел, штатный прикладной ученый в стартапе AI Gretel, согласны, что нестандартные лицензии, такие как у Gemma и Llama, делают модели «непригодными» во многих коммерческих сценариях. Трамел выразил озабоченность по поводу возможных «отзывов» и путаницы в лицензировании производных моделей. Он предупредил, что модели могут использоваться как «троянский конь» для получения информации о успешных бизнес-кейсах, а затем для юридических действий, чтобы выйти на эти рынки.
Несмотря на ограничительные лицензии, некоторые модели, такие как Llama, получили широкое распространение, будучи загруженными миллионами раз и интегрированными в продукты крупных корпораций, таких как Spotify. Однако Ясин Джернит, глава направления машинного обучения и общества в стартапе AI Hugging Face, считает, что они могли бы быть еще успешнее с более свободными лицензиями. Он призвал провайдеров, таких как Google, принять открытые лицензионные рамки и сотрудничать с пользователями на широко принятых условиях.
Джернит отметил: «Учитывая отсутствие консенсуса по этим условиям и то, что многие базовые предположения еще не были проверены в судах, все это служит в первую очередь декларацией намерений этих участников. Если некоторые положения будут интерпретированы слишком широко, многие хорошие работы окажутся на неопределенной юридической почве, что особенно пугает организации, создающие успешные коммерческие продукты».
Видал подчеркнул необходимость в моделях AI, которые можно свободно интегрировать, модифицировать и распространять без страха внезапных изменений лицензии или юридической неопределенности. Он заявил: «Текущий ландшафт лицензирования моделей AI полон путаницы, ограничительных условий и вводящих в заблуждение заявлений об открытости. Вместо того чтобы переопределять 'открытость' в угоду корпоративным интересам, индустрия AI должна следовать установленным принципам открытого исходного кода, чтобы создать по-настоящему открытую экосистему».
Ведомства правительства Великобритании спорят по поводу энергопотребления центров обработки данных для искусственного интеллекта
Правительство Великобритании стоит перед серьезной задачей: развивать сектор чистой энергетики и одновременно стремиться стать мировым лидером в области искусственного интеллекта. Однако между ведомст
Управление киберпространства Китая вводит обязательную маркировку коротких видеороликов, созданных с помощью искусственного интеллекта, а также вымышленных видеороликов
Управление киберпространства Китая представило комплексный план по стандартизации маркировки контента коротких видеороликов, обязывающий платформы использовать шесть обязательных меток, в том числе «К
DeepL, известная своими услугами по переводу текстов, теперь занимается переводом речи
DeepL, компания-переводчик, наиболее известная своими инструментами для перевода текстов, сегодня представила набор решений для перевода «голос-голос», предназначенный для таких сценариев, как встречи
Diese Diskussion über „Open AI“ Lizenzen ist wichtiger, als viele denken. Meta hat mit Llama auch schon solche überraschenden Klauseln reingepackt. Für kleine Firmen, die auf sowas setzen, ist das echt ein Minenfeld. Man denkt, man nutzt frei verfügbare Technologie, und plötzlich lauert die nächste Rechnung oder Rechtsstreit. Da ist die Euphorie über neue Modelle schnell verflogen. Die Branche braucht hier echt mehr Transparenz und faire Spielregeln für alle, nicht nur für die Tech-Giganten. 🤔
これって…結局は『Open』じゃないんだね 😅 ライセンス条項の細かい所を読むと、商用利用が結構厽しめに制限されているみたい。技術的には素晴らしいと思うけど、こういう伏兵みたいな規約が増えてくると、結局自分でモデルを作った方が安上がりなんじゃないか、って思っちゃうな。
Gemma 3のライセンス条件をざっと見たけど、やっぱり大企業の「オープン」戦略って本当の意味でのオープンソース精神からは程遠いよね。結局は彼らのエコシステムに縛り付けるための仕組みじゃないかと疑いたくなるわ… 🤨 開発者はいつもリスクトレードオフを迫られる立場で、なんだか気の毒だな。
Gemma 3 heißt plötzlich 'open', aber die Lizenz liest sich wie eine Knebelklausel. 🤔 Komischerweise wird das Risiko für kommerzielle Anwendungen erst auffällig, wenn Entwickler drauf stoßen. Meta ist auch nicht besser. Diese großen Tech-Firmen schaffen eine eigene Art von 'Open Source' – mit unsichtbaren Zäunen. Irgendwann merkt man: frei ist nur der Code, nicht die Nutzung. Gibt's überhaupt noch echte Alternativen?
あれ?オープンAIモデルのはずなのに商用制限が結構あるんだ。GoogleのGemma 3もMetaも結局は自社の利益を守りたいだけ?企業向けに使うなら、ライセンス条項をしっかり確認しないと危険かも…🤔





Дом






