Chủ đề thịnh hành
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Nghiên cứu mới về việc cải thiện khả năng tự phản ánh trong các tác nhân ngôn ngữ.
Một vấn đề cốt lõi với khả năng tự phản ánh của tác nhân là các mô hình có xu hướng tạo ra những phản ánh lặp đi lặp lại, làm tăng thêm tiếng ồn thay vì tín hiệu, ảnh hưởng đến hiệu suất lý luận tổng thể.
Nó giới thiệu ParamMem, một mô-đun bộ nhớ tham số mã hóa các mẫu phản ánh chéo trực tiếp vào các tham số của mô hình, sau đó sử dụng lấy mẫu kiểm soát nhiệt độ để tạo ra các phản ánh đa dạng trong thời gian suy diễn.
ParamMem cho thấy những cải tiến nhất quán so với các tiêu chuẩn SOTA trong việc tạo mã, lý luận toán học và QA đa bước. Nó cũng cho phép chuyển giao từ yếu đến mạnh và tự cải thiện mà không cần một mô hình bên ngoài mạnh hơn, làm cho nó trở thành một nâng cấp thực tiễn cho các quy trình tác nhân.
Bài báo:
Học cách xây dựng các tác nhân AI hiệu quả trong học viện của chúng tôi:

Hàng đầu
Thứ hạng
Yêu thích
