lựa chọn
Trang chủ
Tin tức
AI chia tỷ lệ đột phá của các chuyên gia

AI chia tỷ lệ đột phá của các chuyên gia

Ngày 10 tháng 4 năm 2025
96

AI chia tỷ lệ đột phá của các chuyên gia

Có một số tiếng vang trên phương tiện truyền thông xã hội về các nhà nghiên cứu khám phá ra một "luật nhân rộng" AI mới, nhưng các chuyên gia đang dùng nó với một hạt muối. Luật mở rộng AI, giống như các hướng dẫn không chính thức, cho thấy cách các mô hình AI trở nên tốt hơn khi bạn ném nhiều dữ liệu hơn và sức mạnh tính toán vào chúng. Cho đến khoảng một năm trước, xu hướng lớn là tất cả về "đào tạo trước"-về cơ bản, đào tạo các mô hình lớn hơn trên các bộ dữ liệu lớn hơn. Đó vẫn là một điều, nhưng bây giờ chúng tôi đã có thêm hai luật quy mô trong hỗn hợp: tỷ lệ sau đào tạo, đó là tất cả về việc điều chỉnh hành vi của một mô hình và tỷ lệ thời gian thử nghiệm, liên quan đến việc sử dụng nhiều năng lượng tính toán hơn trong quá trình suy luận để tăng khả năng "lý luận" của mô hình (nghĩ rằng các mô hình như R1). Gần đây, các nhà nghiên cứu từ Google và UC Berkeley đã bỏ một bài báo mà một số người trực tuyến đang gọi luật thứ tư: "Tìm kiếm thời gian thực hiện." Phương pháp này có mô hình nhổ ra một loạt các câu trả lời có thể cho một truy vấn cùng một lúc và sau đó chọn phương pháp tốt nhất. Các nhà nghiên cứu cho rằng nó có thể tăng cường hiệu suất của một mô hình cũ hơn, như Gemini 1.5 Pro của Google, để đánh bại mô hình "Lý luận" O1 của Openai trên các tiêu chuẩn khoa học và toán học. Eric Zhao, một thành viên tiến sĩ của Google và là một trong những đồng tác giả của bài báo, đã chia sẻ trên X rằng chỉ bằng cách lấy mẫu ngẫu nhiên 200 câu trả lời và để mô hình tự cho mình, Gemini 1.5-mà anh ta gọi là "mô hình đầu năm 2024 cổ xưa"-có thể vượt qua O1 Preview và thậm chí đến gần O1. Ông chỉ ra rằng sự tự xác minh trở nên dễ dàng hơn khi bạn mở rộng quy mô, đó là loại phản trực giác nhưng mát mẻ. Nhưng không phải ai cũng bị thuyết phục. Matthew Guzdial, một nhà nghiên cứu AI và trợ lý giáo sư tại Đại học Alberta, nói với TechCrunch rằng phương pháp này hoạt động tốt nhất khi bạn có một cách vững chắc để đánh giá câu trả lời. Hầu hết các câu hỏi không đơn giản, mặc dù. Ông nói, "Nếu chúng ta không thể viết mã để xác định những gì chúng ta muốn, chúng ta không thể sử dụng tìm kiếm [thời gian suy luận]. Đối với một cái gì đó như tương tác ngôn ngữ chung, chúng ta không thể làm điều này ... Nói chung, đó không phải là một cách tiếp cận tuyệt vời để thực sự giải quyết hầu hết các vấn đề." Zhao trả lời, nói rằng bài báo của họ thực sự xem xét các trường hợp bạn không có cách rõ ràng để đánh giá các câu trả lời và mô hình phải tự mình tìm ra nó. Ông lập luận rằng khoảng cách giữa việc có một cách rõ ràng để đánh giá và không có người ta có thể co lại khi bạn mở rộng quy mô. Mike Cook, một nghiên cứu viên tại King College London, đã ủng hộ quan điểm của Guzdial, nói rằng tìm kiếm thời gian suy luận không thực sự làm cho lý do của người mẫu tốt hơn. Nó giống như một cách giải quyết cho xu hướng của người mẫu để phạm sai lầm tự tin. Ông chỉ ra rằng nếu mô hình của bạn làm rối tung 5% thời gian, việc kiểm tra 200 lần thử sẽ làm cho những sai lầm đó dễ phát hiện hơn. Tin tức này có thể là một chút của một công nghiệp AI, luôn luôn săn lùng các cách để tăng cường mô hình "Lý luận" mà không phá vỡ ngân hàng. Như các tác giả của bài báo đã lưu ý, các mô hình lý luận có thể trả hàng ngàn đô la chi phí tính toán chỉ để giải quyết một vấn đề toán học. Có vẻ như việc tìm kiếm các kỹ thuật tỷ lệ mới còn lâu mới kết thúc. *Cập nhật 3/20 5:12 AM Thái Bình Dương: Đã thêm ý kiến ​​từ đồng tác giả nghiên cứu Eric Zhao, người có vấn đề với một đánh giá của một nhà nghiên cứu độc lập, người đã phê bình công việc.*
Bài viết liên quan
專注於實惠增強現實的真實對焦系統 專注於實惠增強現實的真實對焦系統 顛覆基於投影的增強現實技術來自著名機構電機電子工程師學會(IEEE)的研究人員在基於投影的增強現實領域取得了突破性的進展。他們的解決方案?配備了電控可變焦鏡片(ETL)的特殊眼鏡,這些鏡片模擬人類眼睛自然感知深度的方式。這種創新的方法解決了使投影系統在受控環境中真正實用的主要障礙。想像一下走進一個房間,其中投影的3D物體看起來就像周圍的家具一樣真實。這就是該
我們如何使用AI來幫助城市應對極端熱量 我們如何使用AI來幫助城市應對極端熱量 看起來2024年可能會打破迄今為止最熱的一年的記錄,超過了2023年。這種趨勢對生活在城市熱島的人們來說尤為艱難,這些景點是在混凝土和瀝青浸泡太陽射線,然後散發出熱量的城市中的那些景點。這些區域可以溫暖
“退化”合成面可能會增強面部識別技術 “退化”合成面可能會增強面部識別技術 密歇根州立大學的研究人員提出了一種創新的方式,將合成面孔用於崇高的原因 - 增強圖像識別系統的準確性。這些合成面無代替導致深層現象的貢獻
Nhận xét (35)
0/200
JustinJackson
JustinJackson 00:00:00 GMT Ngày 11 tháng 4 năm 2025

The hype around this new AI scaling law is a bit overblown, if you ask me. Experts are skeptical, and I'm not surprised. It's interesting, but I'm not ready to bet the farm on it just yet. Anyone else feeling the same?

PatrickCarter
PatrickCarter 00:00:00 GMT Ngày 11 tháng 4 năm 2025

この新しいAIスケーリング法の話題、少し大げさに感じます。専門家も懐疑的で、私も驚きません。興味深いですが、まだ全面的に信じるのは早いかなと思います。皆さんも同じ気持ちですか?

AnthonyPerez
AnthonyPerez 00:00:00 GMT Ngày 11 tháng 4 năm 2025

이 새로운 AI 스케일링 법에 대한 과대광고는 조금 과장된 것 같아요. 전문가들도 회의적이고, 저도 놀랍지 않아요. 흥미롭긴 하지만, 아직 이것에 전부를 걸기에는 이릅니다. 다른 분들도 같은 생각이신가요?

JamesTaylor
JamesTaylor 00:00:00 GMT Ngày 11 tháng 4 năm 2025

O hype em torno dessa nova lei de escalabilidade de IA está um pouco exagerado, se me perguntar. Os especialistas estão céticos e eu não fico surpreso. É interessante, mas ainda não estou pronto para apostar tudo nisso. Alguém mais sente o mesmo?

GeorgeEvans
GeorgeEvans 00:00:00 GMT Ngày 11 tháng 4 năm 2025

El entusiasmo alrededor de esta nueva ley de escalabilidad de IA está un poco exagerado, si me lo preguntas. Los expertos son escépticos y no me sorprende. Es interesante, pero no estoy listo para apostar todo en esto todavía. ¿Alguien más siente lo mismo?

PaulHernández
PaulHernández 00:00:00 GMT Ngày 11 tháng 4 năm 2025

Heard about this new AI scaling law? Sounds cool but honestly, I'm not convinced. It feels like every other week there's a new 'breakthrough' that fizzles out. Experts seem skeptical too, so I'm just gonna wait and see. Anyone else feel the same?

Quay lại đầu
OR