lựa chọn
Trang chủ Tin tức Có gì bên trong LLM? Ai2 olmotrace sẽ 'theo dõi' nguồn

Có gì bên trong LLM? Ai2 olmotrace sẽ 'theo dõi' nguồn

ngày phát hành ngày phát hành Ngày 21 tháng 4 năm 2025
Tác giả Tác giả LawrenceJones
quan điểm quan điểm 59

Có gì bên trong LLM? Ai2 olmotrace sẽ 'theo dõi' nguồn

Hiểu được kết nối giữa đầu ra của một mô hình ngôn ngữ lớn (LLM) và dữ liệu đào tạo của nó luôn là một câu đố cho doanh nghiệp CNTT. Tuần này, Viện AI (AI2) của Allen đã đưa ra một sáng kiến ​​nguồn mở mới thú vị có tên là Olmotrace, nhằm mục đích làm sáng tỏ mối quan hệ này. Bằng cách cho phép người dùng theo dõi các đầu ra của LLM trở lại dữ liệu đào tạo ban đầu của họ, Olmotrace đã giải quyết một trong những rào cản lớn nhất để áp dụng AI doanh nghiệp: sự thiếu minh bạch trong các quy trình ra quyết định của AI.

Olmo, viết tắt của mô hình ngôn ngữ mở, là tên của gia đình LLM nguồn mở của AI2. Bạn có thể thử Olmotrace với mẫu Olmo 2 32B mới nhất trên trang web sân chơi của Ai2. Thêm vào đó, mã nguồn mở được đưa ra để lấy trên GitHub, vì vậy bất cứ ai cũng có thể sử dụng nó một cách tự do.

Điều khiến Olmotrace khác biệt với các phương pháp khác, như các phương pháp tập trung vào điểm số tự tin hoặc thế hệ được truy xuất, là nó cung cấp một cái nhìn rõ ràng về cách các đầu ra mô hình liên quan đến các bộ dữ liệu đào tạo rộng lớn định hình chúng. Jiacheng Liu, một nhà nghiên cứu tại AI2, nói với VentureBeat, "Mục tiêu của chúng tôi là giúp người dùng hiểu lý do tại sao các mô hình ngôn ngữ tạo ra các câu trả lời họ làm."

Cách thức hoạt động của Olmotrace: Không chỉ trích dẫn

Mặc dù các LLM như Perplexity hoặc Chatgpt tìm kiếm có thể cung cấp các trích dẫn nguồn, nhưng chúng hoạt động khác với Olmotrace. Theo LIU, các mô hình này sử dụng thế hệ tự động truy xuất (RAG), nhằm mục đích nâng cao chất lượng đầu ra của mô hình bằng cách kết hợp các nguồn bổ sung ngoài dữ liệu đào tạo. Mặt khác, Olmotrace truy tìm đầu ra của mô hình trở lại trực tiếp vào kho lưu trữ mà không dựa vào RAG hoặc các tài liệu bên ngoài.

Công cụ xác định các chuỗi văn bản duy nhất trong đầu ra mô hình và khớp chúng với các tài liệu cụ thể từ dữ liệu đào tạo. Khi tìm thấy một trận đấu, Olmotrace không chỉ làm nổi bật văn bản có liên quan mà còn cung cấp các liên kết đến tài liệu nguồn gốc. Điều này cho phép người dùng xem chính xác nơi và cách mô hình học thông tin mà nó sử dụng.

Ngoài điểm số tự tin: Bằng chứng hữu hình về việc ra quyết định AI

LLM thường tạo ra các đầu ra dựa trên trọng số mô hình, được sử dụng để tính điểm tin cậy. Điểm số càng cao, đầu ra được cho là chính xác. Tuy nhiên, Liu tin rằng những điểm số này có thể gây hiểu lầm. "Các mô hình có thể quá tự tin của những thứ họ tạo ra và nếu bạn yêu cầu họ tạo ra một điểm số, nó thường bị thổi phồng", ông giải thích. "Đó là những gì các học giả gọi là lỗi hiệu chuẩn. Sự tự tin rằng các mô hình đầu ra không phải lúc nào cũng phản ánh mức độ chính xác của các phản ứng của họ."

Thay vì dựa vào điểm số có khả năng gây hiểu lầm, Olmotrace cung cấp bằng chứng trực tiếp về các nguồn học tập của mô hình, cho phép người dùng đưa ra các phán đoán sáng suốt. "Những gì Olmotrace làm là cho bạn thấy các trận đấu giữa đầu ra mô hình và các tài liệu đào tạo," Liu nói. "Thông qua giao diện, bạn có thể trực tiếp thấy các điểm phù hợp ở đâu và mô hình xuất sự trùng khớp với các tài liệu đào tạo."

Cách olmotrace so sánh với các phương pháp minh bạch khác

AI2 không phải là tổ chức duy nhất làm việc để hiểu rõ hơn về LLM. Nhân chủng học cũng đã tiến hành nghiên cứu, nhưng trọng tâm của họ là các hoạt động nội bộ của mô hình hơn là dữ liệu của nó. Liu nhấn mạnh sự khác biệt: "Chúng tôi đang thực hiện một cách tiếp cận khác với họ. Chúng tôi trực tiếp truy tìm hành vi mô hình, vào dữ liệu đào tạo của họ, trái ngược với việc truy tìm mọi thứ vào các tế bào thần kinh mô hình, mạch nội bộ, loại đó."

Cách tiếp cận này làm cho Olmotrace thiết thực hơn cho các ứng dụng doanh nghiệp, vì nó không yêu cầu kiến ​​thức chuyên sâu về kiến ​​trúc mạng thần kinh để hiểu kết quả.

Các ứng dụng AI của doanh nghiệp: Từ tuân thủ quy định đến gỡ lỗi mô hình

Đối với các doanh nghiệp triển khai AI trong các lĩnh vực quy định như chăm sóc sức khỏe, tài chính hoặc dịch vụ pháp lý, Olmotrace mang lại lợi ích đáng kể so với các hệ thống hộp đen truyền thống. "Chúng tôi nghĩ rằng Olmotrace sẽ giúp người dùng doanh nghiệp và doanh nghiệp hiểu rõ hơn những gì được sử dụng trong đào tạo các mô hình để họ có thể tự tin hơn khi họ muốn xây dựng trên đầu chúng", Liu nói. "Điều này có thể giúp tăng tính minh bạch và niềm tin giữa họ của các mô hình của họ, và cả khách hàng về hành vi mô hình của họ."

Công nghệ cho phép một số khả năng chính cho các nhóm AI doanh nghiệp:

  • Đầu ra mô hình kiểm tra thực tế đối với các nguồn gốc
  • Hiểu nguồn gốc của ảo giác
  • Cải thiện gỡ lỗi mô hình bằng cách xác định các mẫu có vấn đề
  • Tăng cường tuân thủ quy định thông qua truy nguyên nguồn gốc dữ liệu
  • Xây dựng niềm tin với các bên liên quan thông qua sự minh bạch tăng lên

Nhóm AI2 đã đưa Olmotrace vào sử dụng tốt. "Chúng tôi đã sử dụng nó để cải thiện dữ liệu đào tạo của chúng tôi", Liu tiết lộ. "Khi chúng tôi xây dựng Olmo 2 và chúng tôi bắt đầu đào tạo, thông qua Olmotrace, chúng tôi phát hiện ra rằng thực sự một số dữ liệu sau đào tạo là không tốt."

Điều này có nghĩa là gì đối với việc áp dụng AI doanh nghiệp

Đối với các doanh nghiệp nhằm mục đích đi đầu trong việc áp dụng AI, Olmotrace đánh dấu một tiến bộ đáng kể đối với các hệ thống AI có trách nhiệm hơn. Công cụ này có sẵn theo giấy phép nguồn mở Apache 2.0, có nghĩa là bất kỳ tổ chức nào có quyền truy cập vào dữ liệu đào tạo của mô hình có thể thực hiện các khả năng theo dõi tương tự.

"Olmotrace có thể làm việc trên bất kỳ mô hình nào, miễn là bạn có dữ liệu đào tạo của mô hình", Liu lưu ý. "Đối với các mô hình mở hoàn toàn nơi mọi người đều có quyền truy cập vào dữ liệu đào tạo của mô hình, bất kỳ ai cũng có thể thiết lập Olmotrace cho mô hình đó và cho các mô hình độc quyền, có thể một số nhà cung cấp không muốn phát hành dữ liệu của họ, họ cũng có thể thực hiện OLMOTRACE này trong nội bộ."

Khi các khung quản trị AI toàn cầu phát triển, các công cụ như olmotrace cho phép xác minh và khả năng kiểm toán có khả năng trở thành các thành phần quan trọng của các ngăn xếp AI của doanh nghiệp, đặc biệt là trong các ngành công nghiệp được quy định, nơi sự minh bạch ngày càng cần thiết. Đối với những người ra quyết định kỹ thuật xem xét các ưu và nhược điểm của việc áp dụng AI, Olmotrace cung cấp một cách thực tế để thực hiện các hệ thống AI đáng tin cậy và có thể giải thích hơn mà không ảnh hưởng đến sức mạnh của các mô hình ngôn ngữ lớn.

Bài viết liên quan
Xử lý dữ liệu hàng loạt quá chậm đối với AI thời gian thực: cách Apache Airflow 3.0 giải quyết thách thức với sự phối hợp dữ liệu dựa trên sự kiện Xử lý dữ liệu hàng loạt quá chậm đối với AI thời gian thực: cách Apache Airflow 3.0 giải quyết thách thức với sự phối hợp dữ liệu dựa trên sự kiện Di chuyển dữ liệu từ nhiều nguồn khác nhau đến nơi thích hợp cho các ứng dụng AI là không phải là một kỳ công nhỏ. Đây là nơi các công cụ điều phối dữ liệu như Apache Airflow phát huy tác dụng, làm cho quá trình này suôn sẻ và hiệu quả hơn. Cộng đồng Airflow Apache vừa phát hành bản cập nhật quan trọng nhất của mình trong các bạn
Cựu cộng tác viên Deepseeker phát hành Phương pháp mới để đào tạo Đại lý AI đáng tin cậy: Ragen Cựu cộng tác viên Deepseeker phát hành Phương pháp mới để đào tạo Đại lý AI đáng tin cậy: Ragen Năm của các đại lý AI: Nhìn kỹ hơn về kỳ vọng và thực tế 20252025 đã được nhiều chuyên gia coi là năm khi các đại lý AI đặc biệt hóa các hệ thống AI được cung cấp bởi ngôn ngữ lớn và các mô hình đa phương thức từ các công ty như Openai, Anthropic, Google và Deepseek
Claude 3.5 Sonnet đấu tranh một cách sáng tạo trong các bài kiểm tra mã hóa AI bị chi phối bởi Chatgpt Claude 3.5 Sonnet đấu tranh một cách sáng tạo trong các bài kiểm tra mã hóa AI bị chi phối bởi Chatgpt Kiểm tra các khả năng của Tuần lễ Sonnetlast Claude 3.5 mới của nhân học, tôi đã nhận được một email từ Anthropic thông báo về việc phát hành Claude 3.5 Sonnet. Họ tự hào rằng nó "làm tăng thanh công nghiệp cho trí thông minh, vượt trội so với các mô hình đối thủ cạnh tranh và Claude 3 Opus trên một loạt các đánh giá." T
Nhận xét (0)
0/200
Quay lại đầu
OR