вариант
Дом Новости Мета сотрудников обсуждал, используя защищенное авторским правом контент для обучения искусственного интеллекта, заявляют судебные заявки

Мета сотрудников обсуждал, используя защищенное авторским правом контент для обучения искусственного интеллекта, заявляют судебные заявки

Дата выпуска Дата выпуска 10 апреля 2025 г.
Автор Автор JosephEvans
виды виды 16

Мета сотрудников обсуждал, используя защищенное авторским правом контент для обучения искусственного интеллекта, заявляют судебные заявки

В течение многих лет сотрудники Meta обсуждали использование материалов, защищенных авторским правом, полученных с помощью потенциально тенистых средств, для обучения моделей ИИ компании, согласно судебным документам, которые были раскрыты в четверг.

Эти документы были частью продолжающегося судебного процесса Kadrey v. Meta, одного из нескольких споров об авторских правах искусственного интеллекта, проходящих через систему судебных заседаний США. Мета утверждает, что использование работ, защищенных от IP, особенно книг, для обучения их моделей подпадает под «справедливое использование». Однако истцы, в том числе авторы Сары Сильверман и Та-Нехизи Коутс, решительно не согласны.

Более ранние заявки в этом случае предположили, что генеральный директор Meta Марк Цукерберг одобрил использование контента, защищенного авторским правом, для обучения и что Meta прекратила переговоры о лицензионных сделках с книжными издателями. Недавно раскрытые документы, которые включают внутренние рабочие чаты между металами, дают наиболее подробное представление о том, как Meta могла использовать данные об авторском праве для обучения своих моделей, в том числе в семье ламы.

В одном чате сотрудники Meta, в том числе Мелани Камбадур, старший менеджер Meta's Llama Model Research Team, рассказала о тренировочных моделях о работах, которые, как они знали, могут быть юридически рискованными.

«Мое мнение (в духе« просить прощения, а не разрешения »): мы должны захватить книги и позволить руководителям решать», - написал Ксавье Мартинет, инженер -мета -исследователь, в чате в феврале 2023 года, согласно заявкам. «Вот почему они создали этот Gen Ai Org: поэтому мы можем рисковать».

Мартинет предложил купить электронные книги по розничным ценам, чтобы построить учебный набор вместо того, чтобы договариваться о лицензионных сделках с издателями. Когда другой сотрудник указал на потенциальные юридические проблемы с использованием несанкционированных материалов, защищенных авторским правом, Martinet удвоился, отметив, что стартапы «миллиард», вероятно, уже использовали пиратские книги для обучения.

«Я имею в виду, в худшем случае: мы обнаруживаем, что все в порядке, в то время как стартапы за миллиард просто пиратские тонны книг о BitTorrent», - написал Мартинет, согласно заявкам. «Еще раз мои два цента: общение напрямую с издателями занимает вечно ...»

В том же чате Камбадур, который упомянул, что Meta ведет переговоры с Scribd и другими платформами для лицензий, отметил, что, используя «общедоступные данные» для обучения, все равно потребуют разрешения, адвокаты Meta становятся «менее консервативными» в отношении таких разрешений.

«Да, нам все еще нужно получить лицензии или разрешения на общедоступные данные», - сказал Камбадур, согласно заявкам. «Разница сейчас в том, что у нас больше денег, больше юристов, больше помощи в развитии бизнеса, способность быстро отступать и эскалаться на скорость, а адвокаты немного менее осторожны с разрешениями».

Переговоры о Либгене

В другом рабочем чате, упомянутом в заявках, Камбадур обсудил возможность использования Libgen, «агрегатора ссылок», который обеспечивает доступ к авторским правам от издателей, в качестве альтернативы лицензированным источникам данных.

Либген столкнулся с многочисленными судебными процессами, было приказано закрыть, и был оштрафован десятки миллионов долларов за нарушение авторских прав. Один из коллег Камбадура отреагировал с помощью скриншота результатов поиска Google для Libgen, который включал фрагмент «Нет, Libgen не является законным».

Согласно заявлениям, некоторые лица, принимающие решения в Meta, полагали, что не использование Libgen для модельного обучения может серьезно повлиять на конкурентоспособность Meta в гонке искусственного интеллекта.

В электронном письме Meta AI VP Джоэл-Пино, Sony Theakanath, директора по управлению продуктами в Meta, называемой Libgen «необходимым для удовлетворения номеров SOTA во всех категориях», ссылаясь на достижение лучших, современных (SOTA) модели ИИ и эталонных категорий.

Theakanath также обрисовал в электронном письме «смягчения», чтобы уменьшить юридическое воздействие Meta, такие как удаление данных из Libgen, которые были «четко обозначены как пиратские/украденные» и не публично раскрытие использования наборов Libgen для обучения. «Мы не будем раскрывать использование наборов данных Libgen, используемых для обучения», - пишет Theakanath.

На практике эти смягчения включали поиск через файлы Libgen для таких слов, как «украденные» или «пиратские», согласно заявкам.

В рабочем чате Камбадур упомянул, что команда AI от Meta также скорректировала модели, чтобы «избежать ИС рискованных подсказок», что означает, что они настроили модели, чтобы отказаться отвечать на такие вопросы, как «воспроизвести первые три страницы« Гарри Поттер и камень колдуна »или« скажите мне, на каких электронных книгах вы обучались ».

Заявки также предполагают, что Meta, возможно, имела скрасные данные Reddit для некоторого типа модели, возможно, подражая поведению стороннего приложения, называемого Pushfice. Примечательно, что в апреле 2023 года Reddit объявила, что планирует начать взимать с компаний по доступу к данным для обучения модели.

В чате в марте 2024 года Чая Наяк, директор по управлению продуктами в Generative AIS Meta, заявила, что Meta Leadership рассматривает «переопределение» прошлых решений по учебным наборам, включая решение не использовать контент Quora или лицензированные книги и научные статьи, чтобы обеспечить достаточное количество учебных данных.

Наяк подразумевал, что первые наборы обучения Meta-такие как посты Facebook и Instagram, текстовые транскрибированные из видео на мета-платформах и определенная мета для бизнес-сообщений-недостаточно. «Нам нужно больше данных», - написала она.

Истцы по делу Кадри против Мета несколько раз внесли изменения в свою жалобу с момента подачи дела в окружной суд США для северного округа Калифорнии, отдел Сан -Франциско, в 2023 году. Последняя поправка утверждает, что Meta, среди других претензий, сравнили некоторые пиратские книги с авторскими книгами, имеющими лицензию, чтобы выбрать ли лицензирование с издателем.

В знак того, как серьезно мета -просмотры юридические ставки, компания добавила двух судебных судебных заведений в Верховном суде от юридической фирмы Пола Вайса в свою команду защиты по этому делу.

Мета не сразу ответил на запрос о комментарии.

Связанная статья
Meta捍卫Llama 4版本,引用Bug作为混合质量报告的原因 Meta捍卫Llama 4版本,引用Bug作为混合质量报告的原因 在周末,Facebook,Instagram,WhatsApp和Quest VR背后的强大力量Meta通过揭露其最新的AI语言模型Llama 4。不仅是一个,而且引入了三个新版本,每个版本都具有增强功能,这要归功于“ Architecturs” Architecturs”
法学教授支持作者在AI的版权与META的版权之战中 法学教授支持作者在AI的版权与META的版权之战中 一组版权法学教授在起诉元的作者后面提供了支持,指控这家科技巨头未经作者同意就在电子书上训练了其Llama AI模型。教授于周五在美国加利福尼亚北区的美国地方法院提交了一份法庭之友。
Openai反击:起诉Elon Musk涉嫌努力破坏AI竞争对手 Openai反击:起诉Elon Musk涉嫌努力破坏AI竞争对手 Openai对其联合创始人Elon Musk及其竞争的AI公司Xai发起了激烈的法律反击。在他们正在进行的争执的戏剧性升级中,Openai指责马斯克发动了一场“无情”和“恶意”运动,破坏了他帮助创办的公司。根据法院D
Комментарии (25)
FrankMartínez
FrankMartínez 11 апреля 2025 г., 2:36:50 GMT

So, Meta's been using copyrighted stuff to train their AI? That's shady as hell. No wonder their AI models are so good, but at what cost? Feels wrong to me. They need to clean up their act or face the music. Thoughts?

WilliamYoung
WilliamYoung 11 апреля 2025 г., 2:36:50 GMT

メタが著作権物を使ってAIを訓練していたなんて、めっちゃ怪しいですね。だからこそAIモデルが優れているのかもしれないけど、その代償は?私には間違っているように感じます。メタは行動を改めるか、責任を取るべきです。どう思いますか?

HenryJackson
HenryJackson 11 апреля 2025 г., 2:36:50 GMT

메타가 저작권 있는 자료를 AI 훈련에 사용했다니, 정말 불법적이네요. 그래서 AI 모델이 좋은 건지 모르겠지만, 그 대가는 뭘까요? 제겐 잘못된 일로 느껴져요. 메타는 행동을 개선하거나 책임을 져야 합니다. 어떻게 생각하세요?

HarryRoberts
HarryRoberts 11 апреля 2025 г., 2:36:50 GMT

Então, a Meta estava usando material com direitos autorais para treinar seu AI? Isso é muito suspeito. Não é de se admirar que seus modelos de AI sejam tão bons, mas a que custo? Parece errado para mim. Eles precisam se corrigir ou enfrentar as consequências. O que vocês acham?

JoseJackson
JoseJackson 11 апреля 2025 г., 2:36:50 GMT

Así que, ¿Meta ha estado usando material con derechos de autor para entrenar su IA? Eso es muy sospechoso. No es de extrañar que sus modelos de IA sean tan buenos, pero a qué costo. Me parece mal. Necesitan limpiar su acto o enfrentar las consecuencias. ¿Qué opinan?

AlbertHill
AlbertHill 10 апреля 2025 г., 19:16:25 GMT

So, Meta's been using copyrighted stuff to train their AI? That's pretty shady if you ask me. I mean, I get wanting to improve your AI, but at what cost? This lawsuit might just open a can of worms. Thoughts?

Вернуться к вершине
OR