lựa chọn
Trang chủ
Tin tức
Meta để đào tạo các mô hình AI với dữ liệu người dùng EU

Meta để đào tạo các mô hình AI với dữ liệu người dùng EU

Ngày 18 tháng 4 năm 2025
89

Meta gần đây đã công bố ý định khai thác nội dung công cộng được chia sẻ bởi người dùng người lớn ở Liên minh châu Âu (EU) để tăng cường các mô hình AI của mình. Động thái này diễn ra sau khi ra mắt các tính năng Meta AI trên khắp châu Âu, nhằm mục đích điều chỉnh các khả năng AI của nó chặt chẽ hơn với người dân đa dạng của khu vực.

Trong một tuyên bố chính thức, Meta tuyên bố: "Hôm nay, chúng tôi đang công bố kế hoạch đào tạo AI tại Meta bằng cách sử dụng nội dung công cộng - như các bài đăng và nhận xét công khai - được người lớn chia sẻ về các sản phẩm của chúng tôi ở EU. Các tương tác của mọi người với Meta AI - như câu hỏi và truy vấn - cũng sẽ được sử dụng để đào tạo và cải thiện các mô hình của chúng tôi."

Bắt đầu từ tuần này, người dùng EU trên các nền tảng của Meta, bao gồm Facebook, Instagram, WhatsApp và Messenger, sẽ được thông báo về việc sử dụng dữ liệu này. Các thông báo này sẽ được gửi qua thông báo và email trong ứng dụng, giải thích các loại dữ liệu công cộng liên quan và cung cấp một liên kết đến một hình thức phản đối. Meta nhấn mạnh, "Chúng tôi đã làm cho hình thức phản đối này dễ dàng tìm thấy, đọc và sử dụng, và chúng tôi sẽ tôn vinh tất cả các hình thức phản đối mà chúng tôi đã nhận được, cũng như những hình thức mới được gửi."

Meta đã nói rõ rằng một số dữ liệu nhất định sẽ không được sử dụng để đào tạo AI. Công ty cho biết họ sẽ không sử dụng "tin nhắn riêng tư của mọi người với bạn bè và gia đình" để đào tạo các mô hình AI thế hệ của mình và dữ liệu công khai từ tài khoản của người dùng dưới 18 tuổi trong EU sẽ bị loại khỏi bộ dữ liệu đào tạo.

Tầm nhìn của Meta về các công cụ AI tập trung EU

Meta định vị việc sử dụng dữ liệu này như một bước quan trọng trong việc phát triển các công cụ AI được thiết kế dành riêng cho người dùng EU. Sau khi triển khai chức năng AI Chatbot gần đây trên các ứng dụng nhắn tin của mình ở châu Âu, Meta coi đây là giai đoạn tiếp theo trong việc tinh chỉnh dịch vụ. "Chúng tôi tin rằng chúng tôi có trách nhiệm xây dựng AI không chỉ dành cho người châu Âu, mà thực sự được xây dựng cho họ", công ty tuyên bố. Điều này liên quan đến việc hiểu các phương ngữ địa phương, thông tục, kiến ​​thức siêu địa phương và sự hài hước và châm biếm độc đáo phổ biến ở các quốc gia khác nhau.

Khi các mô hình AI tiếp tục phát triển với các khả năng đa phương thức trên văn bản, giọng nói, video và hình ảnh, sự liên quan của AI được thiết kế phù hợp như vậy ngày càng quan trọng. Meta cũng bối cảnh hóa các hành động của mình trong ngành công nghiệp rộng lớn hơn, lưu ý rằng sử dụng dữ liệu người dùng để đào tạo AI là một thông lệ phổ biến. "Điều quan trọng cần lưu ý là loại đào tạo AI mà chúng tôi đang làm không phải là duy nhất đối với Meta, cũng không phải là duy nhất ở châu Âu", họ giải thích, trích dẫn các ví dụ như Google và Openai, đã sử dụng dữ liệu người dùng châu Âu để đào tạo các mô hình AI của họ.

Meta tuyên bố cách tiếp cận của nó minh bạch hơn nhiều đối tác trong ngành. Họ đã tham khảo sự tham gia trước đó với các cơ quan quản lý, bao gồm cả sự chậm trễ vào năm ngoái trong khi chờ đợi sự làm rõ pháp lý và nhấn mạnh một ý kiến ​​thuận lợi từ Ủy ban bảo vệ dữ liệu châu Âu (EDPB) vào tháng 12 năm 2024. "

Mối quan tâm về dữ liệu đào tạo AI

Mặc dù Meta cho thấy tính minh bạch và tuân thủ, việc sử dụng dữ liệu người dùng công cộng rộng rãi từ các nền tảng truyền thông xã hội để đào tạo các mô hình ngôn ngữ lớn (LLM) và AI thế hệ làm tăng các mối quan tâm về quyền riêng tư đáng kể. Một vấn đề là định nghĩa về dữ liệu "công khai". Nội dung được chia sẻ công khai trên các nền tảng như Facebook hoặc Instagram có thể không được dự định là nguyên liệu thô để đào tạo AI thương mại. Người dùng thường chia sẻ những câu chuyện cá nhân, ý kiến ​​hoặc công việc sáng tạo trong những gì họ coi là cộng đồng của họ, không mong đợi họ được tái sử dụng trên quy mô lớn.

Hiệu quả của một hệ thống "từ chối" so với hệ thống "chọn tham gia" cũng được tranh luận. Yêu cầu người dùng phải chủ động phản đối sau khi nhận được thông báo có thể dễ dàng bị bỏ lỡ đặt ra câu hỏi về sự đồng ý. Nhiều người dùng có thể không nhìn thấy, hiểu hoặc hành động theo các thông báo này, dẫn đến dữ liệu của họ đang được sử dụng theo mặc định.

Một mối quan tâm khác là tiềm năng cho sự thiên vị vốn có. Các nền tảng truyền thông xã hội có thể phản ánh những thành kiến ​​xã hội, bao gồm phân biệt chủng tộc, phân biệt giới tính và thông tin sai lệch, mà các mô hình AI sau đó có thể học và khuếch đại. Đảm bảo các mô hình này không duy trì các khuôn mẫu hoặc khái quát có hại về văn hóa châu Âu là một thách thức đáng kể.

Câu hỏi cũng phát sinh về bản quyền và sở hữu trí tuệ. Các bài đăng công khai thường chứa nội dung gốc được tạo bởi người dùng và sử dụng điều này để đào tạo các mô hình AI có thể tạo ra nội dung cạnh tranh hoặc lấy giá trị từ nó làm tăng các vấn đề pháp lý về quyền sở hữu và bồi thường công bằng.

Cuối cùng, trong khi Meta tuyên bố tính minh bạch, các quy trình thực tế về lựa chọn dữ liệu, lọc và tác động của chúng đối với hành vi AI thường vẫn chưa rõ ràng. Tính minh bạch thực sự sẽ đòi hỏi những hiểu biết sâu sắc hơn về cách dữ liệu ảnh hưởng đến đầu ra AI và các biện pháp bảo vệ chống lại việc lạm dụng hoặc hậu quả không lường trước được.

Cách tiếp cận của Meta ở EU nêu bật vị trí của Gã khổng lồ công nghệ giá trị trên nội dung do người dùng tạo để phát triển AI. Khi các thực tiễn này lan truyền, các cuộc tranh luận về quyền riêng tư dữ liệu, sự đồng ý, thiên vị thuật toán và trách nhiệm đạo đức của các nhà phát triển AI sẽ tăng cường trên khắp châu Âu và trên toàn cầu.

Bài viết liên quan
億萬富翁討論自動化取代工作在本週的AI更新中 億萬富翁討論自動化取代工作在本週的AI更新中 大家好,歡迎回到TechCrunch的AI通訊!如果您尚未訂閱,可以在此訂閱,每週三直接送到您的收件箱。我們上週稍作休息,但理由充分——AI新聞週期火熱異常,很大程度上要歸功於中國AI公司DeepSeek的突然崛起。這段時間風起雲湧,但我們現在回來了,正好為您更新OpenAI的最新動態。週末,OpenAI執行長Sam Altman在東京停留,與SoftBank負責人孫正義會面。SoftBank是O
NotebookLM應用上線:AI驅動的知識工具 NotebookLM應用上線:AI驅動的知識工具 NotebookLM 行動版上線:你的AI研究助手現已登陸Android與iOS我們對 NotebookLM 的熱烈反響感到驚喜——數百萬用戶已將其視為理解複雜資訊的首選工具。但有一個請求不斷出現:「什麼時候才能帶著NotebookLM隨時使用?」等待結束了!🎉 NotebookLM行動應用程式現已登陸Android和iOS平台,將AI輔助學習的力量裝進你的
谷歌的人工智慧未來基金可能需要謹慎行事 谷歌的人工智慧未來基金可能需要謹慎行事 Google 的新 AI 投資計劃:監管審查下的戰略轉變Google 最近宣布設立 AI 未來基金(AI Futures Fund),這標誌著這家科技巨頭在其塑造人工智慧未來的征程中邁出了大膽的一步。該計劃旨在為初創公司提供急需的資金、早期接觸仍在開發中的尖端人工智慧模型,以及來自 Google 內部專家的指導。儘管這不是 Google 第一次涉足初創企業生
Nhận xét (15)
0/200
KeithLopez
KeithLopez 00:00:00 GMT Ngày 19 tháng 4 năm 2025

So Meta wants to use EU user data to train their AI? I'm not sure how I feel about that. It's cool they're trying to make their AI more tailored to Europe, but using my data? 🤔 I guess if it improves the AI, it might be worth it, but I'm still on the fence.

EricRoberts
EricRoberts 00:00:00 GMT Ngày 18 tháng 4 năm 2025

MetaがEUのユーザーデータを使ってAIを訓練するって?それについてどう思うかわからない。ヨーロッパ向けにAIをカスタマイズしようとしているのはいいけど、私のデータを使うの?🤔 AIが改善されるなら価値があるかもしれないけど、まだ決めかねてる。

WillieJackson
WillieJackson 00:00:00 GMT Ngày 19 tháng 4 năm 2025

¿Así que Meta quiere usar los datos de los usuarios de la UE para entrenar su IA? No estoy seguro de cómo me siento al respecto. Es genial que quieran adaptar su IA a Europa, pero ¿usar mis datos? 🤔 Supongo que si mejora la IA, podría valer la pena, pero aún estoy indeciso.

AlbertWalker
AlbertWalker 00:00:00 GMT Ngày 19 tháng 4 năm 2025

Então a Meta quer usar dados de usuários da UE para treinar sua IA? Não sei bem como me sinto sobre isso. É legal que eles estejam tentando adaptar a IA para a Europa, mas usar meus dados? 🤔 Acho que se melhorar a IA, pode valer a pena, mas ainda estou em dúvida.

HarryPerez
HarryPerez 00:00:00 GMT Ngày 18 tháng 4 năm 2025

Так Meta хочет использовать данные пользователей ЕС для обучения своей ИИ? Не уверен, как я к этому отношусь. Круто, что они пытаются адаптировать ИИ для Европы, но использовать мои данные? 🤔 Думаю, если это улучшит ИИ, это может быть того стоить, но я все еще в раздумьях.

JasonRamirez
JasonRamirez 00:00:00 GMT Ngày 19 tháng 4 năm 2025

I'm not sure how I feel about Meta using EU user data to train AI models. It's a bit creepy, but at the same time, it could lead to better AI features tailored for us. I guess we'll see how it goes. 🤔

Quay lại đầu
OR