Giấy do AI tạo ra vượt qua đánh giá ngang hàng, Sakana tuyên bố, nhưng chi tiết có sắc thái

Trang chủ

Tin tức

Ngày 10 tháng 4 năm 2025

BenHernández

101

# ai # research # sakana

Công ty khởi nghiệp AI Nhật Bản Sakana gần đây đã gây chú ý khi tuyên bố rằng hệ thống AI của họ, The AI Scientist-v2, đã tạo ra một trong những bài báo khoa học được bình duyệt đầu tiên. Tuy nhiên, có một số chi tiết quan trọng cần xem xét trước khi chúng ta quá phấn khích.

Cuộc tranh luận về vai trò của AI trong khoa học đang ngày càng nóng lên. Một số nhà nghiên cứu tin rằng AI chưa sẵn sàng để trở thành một "nhà khoa học đồng hành," trong khi những người khác thấy tiềm năng nhưng thừa nhận rằng chúng ta vẫn đang ở giai đoạn đầu. Sakana thuộc nhóm thứ hai.

Công ty đã sử dụng The AI Scientist-v2 để tạo ra một bài báo được gửi đến một hội thảo tại ICLR, một hội nghị AI uy tín. Sakana đã hợp tác với Đại học British Columbia và Đại học Oxford để gửi ba bài báo do AI tạo ra đến hội thảo này. AI đã xử lý mọi thứ từ giả thuyết đến thí nghiệm, mã lập trình, phân tích dữ liệu, hình ảnh hóa, và thậm chí cả tiêu đề.

"Chúng tôi đã tạo ra các ý tưởng nghiên cứu bằng cách cung cấp tóm tắt và mô tả hội thảo cho AI," Robert Lange, một nhà khoa học nghiên cứu và thành viên sáng lập tại Sakana, đã nói với TechCrunch qua email. "Điều này đảm bảo rằng các bài báo được tạo ra phù hợp với chủ đề và là những bài nộp phù hợp."

Một trong ba bài báo đã được hội thảo ICLR chấp nhận. Bài báo tập trung vào việc phê bình các kỹ thuật huấn luyện cho các mô hình AI. Tuy nhiên, Sakana đã rút bài báo trước khi nó được xuất bản, với lý do minh bạch và tôn trọng các quy định của ICLR.

Bài báo AI Sakana

Một đoạn trích từ bài báo do AI của Sakana tạo ra. Tín dụng hình ảnh: Sakana

"Bài báo được chấp nhận vừa giới thiệu một phương pháp mới đầy hứa hẹn để huấn luyện mạng nơ-ron vừa cho thấy vẫn còn những thách thức thực nghiệm," Lange nói. "Nó cung cấp một điểm dữ liệu thú vị để thúc đẩy các cuộc điều tra khoa học tiếp theo."

Nhưng chúng ta chưa nên vội vàng. Sakana thừa nhận trong bài đăng blog của họ rằng AI của họ đã mắc một số lỗi trích dẫn "xấu hổ", như việc gán một phương pháp cho một bài báo năm 2016 thay vì công trình gốc năm 1997.

Ngoài ra, bài báo không trải qua quá trình xem xét nghiêm ngặt như các bài báo khoa học được bình duyệt khác. Nó đã bị rút sau lần bình duyệt ban đầu, vì vậy nó không nhận được "đánh giá meta" từ các nhà tổ chức hội thảo, những người có thể đã từ chối nó.

Một điều khác cần lưu ý là các hội thảo tại hội nghị thường có tỷ lệ chấp nhận cao hơn so với các phiên chính của hội nghị. Sakana đã đề cập đến điều này trong bài đăng blog của họ và lưu ý rằng không có nghiên cứu nào do AI tạo ra của họ đáp ứng được tiêu chuẩn nội bộ cho phiên hội nghị chính của ICLR.

Matthew Guzdial, một nhà nghiên cứu AI và trợ lý giáo sư tại Đại học Alberta, gọi kết quả của Sakana là "hơi gây hiểu lầm."

"Những người ở Sakana đã chọn các bài báo từ một số bài báo được tạo ra, nghĩa là họ đã sử dụng phán đoán của con người để chọn các đầu ra mà họ nghĩ có thể được chấp nhận," anh nói qua email. "Điều tôi nghĩ điều này cho thấy là con người kết hợp với AI có thể hiệu quả, không phải là AI một mình có thể tạo ra tiến bộ khoa học."

Mike Cook, một nghiên cứu viên tại King's College London chuyên về AI, đặt câu hỏi về sự nghiêm ngặt của các nhà bình duyệt và hội thảo.

"Các hội thảo mới, như hội thảo này, thường được các nhà nghiên cứu trẻ hơn đánh giá," anh nói với TechCrunch. "Cũng đáng chú ý rằng hội thảo này tập trung vào các kết quả tiêu cực và khó khăn — điều này rất tuyệt, tôi đã từng tổ chức một hội thảo tương tự trước đây — nhưng có thể lập luận rằng việc để AI viết về một thất bại một cách thuyết phục là dễ dàng hơn."

Cook không ngạc nhiên khi một AI có thể vượt qua bình duyệt, vì AI giỏi trong việc viết văn xuôi nghe giống con người. Anh chỉ ra rằng các bài báo được tạo ra một phần bởi AI đã vượt qua bình duyệt tạp chí không phải là mới, và điều này đặt ra các câu hỏi đạo đức cho cộng đồng khoa học.

Các vấn đề kỹ thuật của AI, như xu hướng "ảo giác" của nó, khiến nhiều nhà khoa học thận trọng khi sử dụng nó cho công việc nghiêm túc. Cũng có lo ngại rằng AI có thể chỉ thêm nhiễu vào tài liệu khoa học, thay vì thúc đẩy kiến thức.

"Chúng ta cần tự hỏi liệu kết quả của [Sakana] là về việc AI giỏi thiết kế và thực hiện các thí nghiệm đến mức nào, hay là về việc nó giỏi bán ý tưởng cho con người — điều mà chúng ta biết AI đã rất giỏi," Cook nói. "Có sự khác biệt giữa việc vượt qua bình duyệt và đóng góp kiến thức cho một lĩnh vực."

Công bằng mà nói, Sakana không tuyên bố rằng AI của họ có thể tạo ra công trình khoa học đột phá hay đặc biệt mới mẻ. Mục tiêu của họ là "nghiên cứu chất lượng của nghiên cứu do AI tạo ra" và nhấn mạnh sự cần thiết của "các chuẩn mực liên quan đến khoa học do AI tạo ra."

"Có những câu hỏi khó về việc liệu khoa học [do AI tạo ra] có nên được đánh giá dựa trên giá trị riêng của nó trước tiên để tránh thiên kiến chống lại nó," công ty viết. "Trong tương lai, chúng tôi sẽ tiếp tục trao đổi ý kiến với cộng đồng nghiên cứu về trạng thái của công nghệ này để đảm bảo rằng nó không phát triển thành một tình huống trong tương lai nơi mục đích duy nhất của nó là vượt qua bình duyệt, qua đó làm suy yếu đáng kể ý nghĩa của quá trình bình duyệt khoa học."

Bài viết liên quan

Meta Tăng Cường Bảo Mật AI với Công Cụ Llama Nâng Cao Meta đã phát hành các công cụ bảo mật Llama mới để thúc đẩy phát triển AI và bảo vệ chống lại các mối đe dọa mới nổi.Các công cụ bảo mật mô hình AI Llama nâng cấp này được kết hợp với các tài nguyên m

NotebookLM Ra Mắt Bộ Sưu Tập Ghi Chép Được Chọn Lọc từ Các Ấn Phẩm và Chuyên Gia Hàng Đầu Google đang nâng cấp công cụ nghiên cứu và ghi chú dựa trên AI, NotebookLM, để trở thành một trung tâm tri thức toàn diện. Vào thứ Hai, công ty đã giới thiệu một bộ sưu tập ghi chép được chọn lọc từ c

Alibaba Công Bố Wan2.1-VACE: Giải Pháp Video AI Mã Nguồn Mở Alibaba đã giới thiệu Wan2.1-VACE, một mô hình AI mã nguồn mở được thiết kế để thay đổi quy trình tạo và chỉnh sửa video.VACE là thành phần cốt lõi của gia đình mô hình video AI Wan2.1 của Alibaba, vớ

Nhận xét (36)

0/200

Nộp

StevenGonzalez

11:59:29 GMT+07:00 Ngày 23 tháng 7 năm 2025

This is wild! An AI writing a peer-reviewed paper? Sakana’s claim is bold, but I’m curious how much human tweaking was involved. Still, it’s kinda thrilling to see AI push boundaries in science! 🚀

AlbertThomas

20:28:17 GMT+07:00 Ngày 22 tháng 4 năm 2025

O AI-Generated Paper Passes Peer Review parece incrível, mas os detalhes são um pouco decepcionantes. É como esperar um banquete e receber um lanche. Ainda assim, é um avanço para a IA na ciência, não é? Talvez da próxima vez eles nos surpreendam de verdade! 🚀

NicholasDavis

09:29:30 GMT+07:00 Ngày 22 tháng 4 năm 2025

AI生成的論文通過同行評審？這很酷，但細節有點模糊。Sakana的AI Scientist-v2聽起來很有前景，但我們需要更多透明度。儘管如此，這是AI在科學領域的一個進步！📖

BillyGreen

07:06:42 GMT+07:00 Ngày 22 tháng 4 năm 2025

AI-generated paper passing peer review? That's cool, but the details are a bit sketchy. Sakana's AI Scientist-v2 sounds promising, but we need more transparency. Still, it's a step forward for AI in science! 🤓

MatthewHill

19:20:22 GMT+07:00 Ngày 19 tháng 4 năm 2025

The AI Scientist-v2 sounds cool, but the details are a bit sketchy. It's exciting to think AI can write scientific papers, but we need more transparency. Still, it's a step forward in AI research! 🤔

TerryPerez

12:56:38 GMT+07:00 Ngày 19 tháng 4 năm 2025

AI-Generated Paper Passes Peer Review बहुत अच्छा लगता है, लेकिन विवरण थोड़ा निराशाजनक है। यह ऐसा है जैसे गौरमेट भोजन की उम्मीद करना और सैंडविच मिलना। फिर भी, विज्ञान में AI के लिए यह एक कदम आगे है, है ना? शायद अगली बार वे हमें वाकई हैरान कर देंगे! 🚀

Tin tức hàng đầu

Gemini 2.5 Pro hiện không giới hạn và rẻ hơn Claude, GPT-4O Máy phát video AI hàng đầu vào năm 2025: Pika Labs so với các lựa chọn thay thế Lồng tiếng AI: Hướng dẫn Tối ưu để Tạo Giọng Nói Thực tế Openai tăng cường trợ lý giọng nói AI để trò chuyện tốt hơn Notebooklm mở rộng toàn cầu, thêm các slide và kiểm tra thực tế nâng cao Các trung tâm dữ liệu của Hoa Kỳ có thể mở khóa 76 GW công suất năng lượng mới Người sáng lập AI để tiêu thụ sức mạnh của nhiều NYC vào năm 2026, người sáng lập Sao chép giọng nói AI: Hướng dẫn tối thượng để làm chủ chuyển đổi giọng nói Trải nghiệm ô chữ I/O do AI hỗ trợ Giám đốc điều hành NVIDIA làm rõ những quan niệm sai lầm về tác động thị trường của Deepseek

Hơn

Đặc trưng