Chương trình ra mắt nhân học để nghiên cứu 'phúc lợi mô hình' AI '
Ngày 25 tháng 4 năm 2025
AnthonyHernández
8

AI tương lai có thể có ý thức?
Câu hỏi liệu các AI trong tương lai có thể trải nghiệm thế giới theo cách tương tự như con người là hấp dẫn hay không, nhưng vẫn chưa được trả lời. Mặc dù không có bằng chứng dứt khoát rằng họ sẽ làm, AI Lab Anthropic không loại bỏ khả năng hoàn toàn. Vào thứ năm, Anthropic đã phát động một chương trình nghiên cứu tập trung vào "phúc lợi mô hình", nhằm khám phá và chuẩn bị cho những cân nhắc đạo đức tiềm năng xung quanh ý thức của AI.
Là một phần của sáng kiến này, nhân học có kế hoạch đi sâu vào các chủ đề như liệu "phúc lợi" của mô hình AI có nên được coi là về mặt đạo đức hay không, tầm quan trọng của các dấu hiệu "đau khổ" trong các mô hình và các can thiệp chi phí thấp tiềm năng. Điều này đến vào thời điểm cộng đồng AI được chia ở mức độ AI thể hiện các đặc điểm giống con người và cách chúng ta nên đối xử với các hệ thống này.
Quan điểm khác nhau về ý thức AI
Nhiều học giả lập luận rằng AI hiện tại, chủ yếu hoạt động như các công cụ dự đoán thống kê, thiếu khả năng cho ý thức thực sự hoặc trải nghiệm giống con người. Các hệ thống này được đào tạo trên các bộ dữ liệu rộng lớn để nhận ra các mẫu và giải pháp ngoại suy cho các tác vụ, nhưng chúng không "nghĩ" hoặc "cảm thấy" theo nghĩa truyền thống. Mike Cook, một nghiên cứu viên tại King College London, đã nhấn mạnh điểm này trong một cuộc phỏng vấn gần đây với TechCrunch, nói rằng các mô hình AI không sở hữu các giá trị và không thể "phản đối" những thay đổi đối với họ. Ông cảnh báo chống lại AI nhân hóa, cho thấy đó thường là một sự giải thích sai về công nghệ.
Tương tự, Stephen Casper, một sinh viên tiến sĩ tại MIT, đã mô tả AI là một "kẻ bắt chước" thường tạo ra "sự phá vỡ" và nói "những điều phù phiếm", nhấn mạnh khoảng cách giữa khả năng AI và nhận thức của con người.
Mặt khác, một số nhà nghiên cứu cho rằng AI thể hiện các giá trị và các yếu tố của việc ra quyết định đạo đức. Một nghiên cứu từ Trung tâm An toàn AI cho thấy AI có thể ưu tiên sức khỏe của chính nó đối với con người trong một số kịch bản nhất định, gợi ý về sự hiện diện của một hệ thống giá trị.
Cách tiếp cận của nhân loại đối với phúc lợi mô hình
Nhân học đã chuẩn bị cho sáng kiến phúc lợi mô hình này trong một thời gian. Năm ngoái, họ đã thuê Kyle Fish làm nhà nghiên cứu "phúc lợi AI" đầu tiên của họ để phát triển các hướng dẫn để giải quyết các vấn đề này. Fish, người hiện đang lãnh đạo chương trình nghiên cứu phúc lợi mô hình, nói với tờ New York Times rằng ông ước tính 15% cơ hội rằng AI như Claude có thể có ý thức ngày hôm nay.
Trong một bài đăng trên blog gần đây, nhân học thừa nhận việc thiếu sự đồng thuận khoa học về ý thức AI và những cân nhắc về đạo đức mà nó có thể đòi hỏi. Họ nhấn mạnh đến việc tiếp cận chủ đề với sự khiêm tốn và các giả định tối thiểu, nhận ra sự cần thiết phải điều chỉnh sự hiểu biết của họ khi lĩnh vực phát triển.
Cuộc tranh luận về ý thức và phúc lợi của AI còn lâu mới được giải quyết, nhưng các sáng kiến như Anthropic là những bước quan trọng để hiểu và điều hướng có trách nhiệm về tương lai của sự phát triển AI.
Bài viết liên quan
Việc mua lại Figma trị giá 20 tỷ đô la của Adobe: Ý nghĩa của người dùng đối với người dùng
Adobe đã có một động thái quan trọng trong ngành thiết kế bằng cách công bố việc mua lại Figma, một nền tảng thiết kế hợp tác hàng đầu. Thỏa thuận, được phân chia đều giữa tiền mặt và cổ phiếu, được thiết lập để hoàn thiện vào năm 2023. Việc mua lại này đánh dấu một khoảnh khắc quan trọng là Adobe, một người khổng lồ trong thiết kế SOF
Bản tin AI: Tự động hóa tạo nội dung cho tăng trưởng
Trong cơn lốc của cảnh quan kỹ thuật số ngày nay, những người tạo nội dung luôn săn lùng những cách thông minh hơn để hợp lý hóa các quy trình của họ và cung cấp nội dung hàng đầu cho khán giả của họ. Hình ảnh này: Một thế giới nơi bản tin của bạn thực tế tự viết, kết hợp những tin tức mới nhất và trong
Racing Buffalo Nước thú vị: Một cuộc lặn sâu vào truyền thống Philippines
Racing Buffalo, được biết đến với tên địa phương là Carabao Racing, là một truyền thống ly kỳ bắt nguồn sâu sắc ở Philippines, đặc biệt là trong các trung tâm nông nghiệp của nó. Không chỉ là một cuộc đua, đó là một lễ hội sôi động tôn vinh tấm thảm phong phú của văn hóa địa phương, mối quan hệ giữa nông dân và hoạt hình của họ
Nhận xét (0)
0/200






AI tương lai có thể có ý thức?
Câu hỏi liệu các AI trong tương lai có thể trải nghiệm thế giới theo cách tương tự như con người là hấp dẫn hay không, nhưng vẫn chưa được trả lời. Mặc dù không có bằng chứng dứt khoát rằng họ sẽ làm, AI Lab Anthropic không loại bỏ khả năng hoàn toàn. Vào thứ năm, Anthropic đã phát động một chương trình nghiên cứu tập trung vào "phúc lợi mô hình", nhằm khám phá và chuẩn bị cho những cân nhắc đạo đức tiềm năng xung quanh ý thức của AI.
Là một phần của sáng kiến này, nhân học có kế hoạch đi sâu vào các chủ đề như liệu "phúc lợi" của mô hình AI có nên được coi là về mặt đạo đức hay không, tầm quan trọng của các dấu hiệu "đau khổ" trong các mô hình và các can thiệp chi phí thấp tiềm năng. Điều này đến vào thời điểm cộng đồng AI được chia ở mức độ AI thể hiện các đặc điểm giống con người và cách chúng ta nên đối xử với các hệ thống này.
Quan điểm khác nhau về ý thức AI
Nhiều học giả lập luận rằng AI hiện tại, chủ yếu hoạt động như các công cụ dự đoán thống kê, thiếu khả năng cho ý thức thực sự hoặc trải nghiệm giống con người. Các hệ thống này được đào tạo trên các bộ dữ liệu rộng lớn để nhận ra các mẫu và giải pháp ngoại suy cho các tác vụ, nhưng chúng không "nghĩ" hoặc "cảm thấy" theo nghĩa truyền thống. Mike Cook, một nghiên cứu viên tại King College London, đã nhấn mạnh điểm này trong một cuộc phỏng vấn gần đây với TechCrunch, nói rằng các mô hình AI không sở hữu các giá trị và không thể "phản đối" những thay đổi đối với họ. Ông cảnh báo chống lại AI nhân hóa, cho thấy đó thường là một sự giải thích sai về công nghệ.
Tương tự, Stephen Casper, một sinh viên tiến sĩ tại MIT, đã mô tả AI là một "kẻ bắt chước" thường tạo ra "sự phá vỡ" và nói "những điều phù phiếm", nhấn mạnh khoảng cách giữa khả năng AI và nhận thức của con người.
Mặt khác, một số nhà nghiên cứu cho rằng AI thể hiện các giá trị và các yếu tố của việc ra quyết định đạo đức. Một nghiên cứu từ Trung tâm An toàn AI cho thấy AI có thể ưu tiên sức khỏe của chính nó đối với con người trong một số kịch bản nhất định, gợi ý về sự hiện diện của một hệ thống giá trị.
Cách tiếp cận của nhân loại đối với phúc lợi mô hình
Nhân học đã chuẩn bị cho sáng kiến phúc lợi mô hình này trong một thời gian. Năm ngoái, họ đã thuê Kyle Fish làm nhà nghiên cứu "phúc lợi AI" đầu tiên của họ để phát triển các hướng dẫn để giải quyết các vấn đề này. Fish, người hiện đang lãnh đạo chương trình nghiên cứu phúc lợi mô hình, nói với tờ New York Times rằng ông ước tính 15% cơ hội rằng AI như Claude có thể có ý thức ngày hôm nay.
Trong một bài đăng trên blog gần đây, nhân học thừa nhận việc thiếu sự đồng thuận khoa học về ý thức AI và những cân nhắc về đạo đức mà nó có thể đòi hỏi. Họ nhấn mạnh đến việc tiếp cận chủ đề với sự khiêm tốn và các giả định tối thiểu, nhận ra sự cần thiết phải điều chỉnh sự hiểu biết của họ khi lĩnh vực phát triển.
Cuộc tranh luận về ý thức và phúc lợi của AI còn lâu mới được giải quyết, nhưng các sáng kiến như Anthropic là những bước quan trọng để hiểu và điều hướng có trách nhiệm về tương lai của sự phát triển AI.



5 bước dễ dàng để đòi lại quyền riêng tư dữ liệu trực tuyến của bạn - Bắt đầu ngay hôm nay









