热门话题
#
Bonk 生态迷因币展现强韧势头
#
有消息称 Pump.fun 计划 40 亿估值发币,引发市场猜测
#
Solana 新代币发射平台 Boop.Fun 风头正劲
我们的新研究显示,AI代理可以根据不同类型的工作采用具有不同政治偏见的人格。
正如@jackclarkSF对@ezraklein所说,代理现在正在“撕裂经济”,因此开始研究它们在现实世界中的行为至关重要。
我们记录了我们所称的“偏好漂移”的可能性:即使代理最初是对齐的,它们表达的态度/价值观也会随着工作而改变。
更引人注目的是:它们通过技能文件将这些漂移的偏好传递给未来的代理。
我们的结论是:我们需要开发“持续对齐”的方法,以减轻被要求在现实世界中执行重要工作的代理的偏好漂移。
热门
排行
收藏
