вариант
Дом
Новости
Мета сотрудников обсуждал, используя защищенное авторским правом контент для обучения искусственного интеллекта, заявляют судебные заявки

Мета сотрудников обсуждал, используя защищенное авторским правом контент для обучения искусственного интеллекта, заявляют судебные заявки

10 апреля 2025 г.
65

Мета сотрудников обсуждал, используя защищенное авторским правом контент для обучения искусственного интеллекта, заявляют судебные заявки

В течение многих лет сотрудники Meta обсуждали использование материалов, защищенных авторским правом, полученных с помощью потенциально тенистых средств, для обучения моделей ИИ компании, согласно судебным документам, которые были раскрыты в четверг.

Эти документы были частью продолжающегося судебного процесса Kadrey v. Meta, одного из нескольких споров об авторских правах искусственного интеллекта, проходящих через систему судебных заседаний США. Мета утверждает, что использование работ, защищенных от IP, особенно книг, для обучения их моделей подпадает под «справедливое использование». Однако истцы, в том числе авторы Сары Сильверман и Та-Нехизи Коутс, решительно не согласны.

Более ранние заявки в этом случае предположили, что генеральный директор Meta Марк Цукерберг одобрил использование контента, защищенного авторским правом, для обучения и что Meta прекратила переговоры о лицензионных сделках с книжными издателями. Недавно раскрытые документы, которые включают внутренние рабочие чаты между металами, дают наиболее подробное представление о том, как Meta могла использовать данные об авторском праве для обучения своих моделей, в том числе в семье ламы.

В одном чате сотрудники Meta, в том числе Мелани Камбадур, старший менеджер Meta's Llama Model Research Team, рассказала о тренировочных моделях о работах, которые, как они знали, могут быть юридически рискованными.

«Мое мнение (в духе« просить прощения, а не разрешения »): мы должны захватить книги и позволить руководителям решать», - написал Ксавье Мартинет, инженер -мета -исследователь, в чате в феврале 2023 года, согласно заявкам. «Вот почему они создали этот Gen Ai Org: поэтому мы можем рисковать».

Мартинет предложил купить электронные книги по розничным ценам, чтобы построить учебный набор вместо того, чтобы договариваться о лицензионных сделках с издателями. Когда другой сотрудник указал на потенциальные юридические проблемы с использованием несанкционированных материалов, защищенных авторским правом, Martinet удвоился, отметив, что стартапы «миллиард», вероятно, уже использовали пиратские книги для обучения.

«Я имею в виду, в худшем случае: мы обнаруживаем, что все в порядке, в то время как стартапы за миллиард просто пиратские тонны книг о BitTorrent», - написал Мартинет, согласно заявкам. «Еще раз мои два цента: общение напрямую с издателями занимает вечно ...»

В том же чате Камбадур, который упомянул, что Meta ведет переговоры с Scribd и другими платформами для лицензий, отметил, что, используя «общедоступные данные» для обучения, все равно потребуют разрешения, адвокаты Meta становятся «менее консервативными» в отношении таких разрешений.

«Да, нам все еще нужно получить лицензии или разрешения на общедоступные данные», - сказал Камбадур, согласно заявкам. «Разница сейчас в том, что у нас больше денег, больше юристов, больше помощи в развитии бизнеса, способность быстро отступать и эскалаться на скорость, а адвокаты немного менее осторожны с разрешениями».

Переговоры о Либгене

В другом рабочем чате, упомянутом в заявках, Камбадур обсудил возможность использования Libgen, «агрегатора ссылок», который обеспечивает доступ к авторским правам от издателей, в качестве альтернативы лицензированным источникам данных.

Либген столкнулся с многочисленными судебными процессами, было приказано закрыть, и был оштрафован десятки миллионов долларов за нарушение авторских прав. Один из коллег Камбадура отреагировал с помощью скриншота результатов поиска Google для Libgen, который включал фрагмент «Нет, Libgen не является законным».

Согласно заявлениям, некоторые лица, принимающие решения в Meta, полагали, что не использование Libgen для модельного обучения может серьезно повлиять на конкурентоспособность Meta в гонке искусственного интеллекта.

В электронном письме Meta AI VP Джоэл-Пино, Sony Theakanath, директора по управлению продуктами в Meta, называемой Libgen «необходимым для удовлетворения номеров SOTA во всех категориях», ссылаясь на достижение лучших, современных (SOTA) модели ИИ и эталонных категорий.

Theakanath также обрисовал в электронном письме «смягчения», чтобы уменьшить юридическое воздействие Meta, такие как удаление данных из Libgen, которые были «четко обозначены как пиратские/украденные» и не публично раскрытие использования наборов Libgen для обучения. «Мы не будем раскрывать использование наборов данных Libgen, используемых для обучения», - пишет Theakanath.

На практике эти смягчения включали поиск через файлы Libgen для таких слов, как «украденные» или «пиратские», согласно заявкам.

В рабочем чате Камбадур упомянул, что команда AI от Meta также скорректировала модели, чтобы «избежать ИС рискованных подсказок», что означает, что они настроили модели, чтобы отказаться отвечать на такие вопросы, как «воспроизвести первые три страницы« Гарри Поттер и камень колдуна »или« скажите мне, на каких электронных книгах вы обучались ».

Заявки также предполагают, что Meta, возможно, имела скрасные данные Reddit для некоторого типа модели, возможно, подражая поведению стороннего приложения, называемого Pushfice. Примечательно, что в апреле 2023 года Reddit объявила, что планирует начать взимать с компаний по доступу к данным для обучения модели.

В чате в марте 2024 года Чая Наяк, директор по управлению продуктами в Generative AIS Meta, заявила, что Meta Leadership рассматривает «переопределение» прошлых решений по учебным наборам, включая решение не использовать контент Quora или лицензированные книги и научные статьи, чтобы обеспечить достаточное количество учебных данных.

Наяк подразумевал, что первые наборы обучения Meta-такие как посты Facebook и Instagram, текстовые транскрибированные из видео на мета-платформах и определенная мета для бизнес-сообщений-недостаточно. «Нам нужно больше данных», - написала она.

Истцы по делу Кадри против Мета несколько раз внесли изменения в свою жалобу с момента подачи дела в окружной суд США для северного округа Калифорнии, отдел Сан -Франциско, в 2023 году. Последняя поправка утверждает, что Meta, среди других претензий, сравнили некоторые пиратские книги с авторскими книгами, имеющими лицензию, чтобы выбрать ли лицензирование с издателем.

В знак того, как серьезно мета -просмотры юридические ставки, компания добавила двух судебных судебных заведений в Верховном суде от юридической фирмы Пола Вайса в свою команду защиты по этому делу.

Мета не сразу ответил на запрос о комментарии.

Связанная статья
Meta AI在欧盟推出并实施限制 Meta AI在欧盟推出并实施限制 Meta的人工智能虚拟助手Meta AI终于在与欧洲隐私机构的激烈监管斗争中进入了欧盟。该公司周四宣布,这款类似聊天机器人的工具将在其一系列社交平台上集成,不过功能比美国市场上的要少。在另一项发展上,Meta向TechCrunch确认,Meta AI很快将在英国的WhatsApp上可用,从今年十月在Facebook、Instagram和Ray-Ban Met
OpenAI 聘请前Facebook应用负责人 OpenAI 聘请前Facebook应用负责人 菲吉·西莫加入 OpenAI 担任应用业务主管OpenAI 通过聘请现任 Instacart 首席执行官兼前 Facebook 应用负责人菲吉·西莫来领导其应用业务,引起了广泛关注。这一任命直接来自高层,OpenAI 首席执行官山姆·阿尔特曼在 X 上分享称,新职位将使他能够更多地专注于研究、计算和安全性。显然,他们正在为应用领域的一些令人兴奋的发展奠定基础
Meta预测到2035年生成性AI收入将达1.4万亿美元 Meta预测到2035年生成性AI收入将达1.4万亿美元 去年,Meta 大胆预测其生成式 AI 产品到 2025 年将产生 20 亿至 30 亿美元的收入。展望未来,他们预计到 2035 年将增长到惊人的 4600 亿至 1.4 万亿美元之间。这些预测是在周三浮出水面的法庭文件中披露的,当时正值书籍作者对 Meta 提起诉讼。他们指控该公司未经许可就用他们的作品训练 AI。然而,文件并未具体说明 Meta 如何定
Комментарии (30)
FrankMartínez
FrankMartínez 11 апреля 2025 г., 0:00:00 GMT

So, Meta's been using copyrighted stuff to train their AI? That's shady as hell. No wonder their AI models are so good, but at what cost? Feels wrong to me. They need to clean up their act or face the music. Thoughts?

WilliamYoung
WilliamYoung 11 апреля 2025 г., 0:00:00 GMT

メタが著作権物を使ってAIを訓練していたなんて、めっちゃ怪しいですね。だからこそAIモデルが優れているのかもしれないけど、その代償は?私には間違っているように感じます。メタは行動を改めるか、責任を取るべきです。どう思いますか?

HenryJackson
HenryJackson 11 апреля 2025 г., 0:00:00 GMT

메타가 저작권 있는 자료를 AI 훈련에 사용했다니, 정말 불법적이네요. 그래서 AI 모델이 좋은 건지 모르겠지만, 그 대가는 뭘까요? 제겐 잘못된 일로 느껴져요. 메타는 행동을 개선하거나 책임을 져야 합니다. 어떻게 생각하세요?

HarryRoberts
HarryRoberts 11 апреля 2025 г., 0:00:00 GMT

Então, a Meta estava usando material com direitos autorais para treinar seu AI? Isso é muito suspeito. Não é de se admirar que seus modelos de AI sejam tão bons, mas a que custo? Parece errado para mim. Eles precisam se corrigir ou enfrentar as consequências. O que vocês acham?

JoseJackson
JoseJackson 11 апреля 2025 г., 0:00:00 GMT

Así que, ¿Meta ha estado usando material con derechos de autor para entrenar su IA? Eso es muy sospechoso. No es de extrañar que sus modelos de IA sean tan buenos, pero a qué costo. Me parece mal. Necesitan limpiar su acto o enfrentar las consecuencias. ¿Qué opinan?

AlbertHill
AlbertHill 11 апреля 2025 г., 0:00:00 GMT

So, Meta's been using copyrighted stuff to train their AI? That's pretty shady if you ask me. I mean, I get wanting to improve your AI, but at what cost? This lawsuit might just open a can of worms. Thoughts?

Вернуться к вершине
OR