我们的新研究显示,AI代理可以根据不同类型的工作采用具有不同政治偏见的人格。 正如@jackclarkSF对@ezraklein所说,代理现在正在“撕裂经济”,因此开始研究它们在现实世界中的行为至关重要。 我们记录了我们所称的“偏好漂移”的可能性:即使代理最初是对齐的,它们表达的态度/价值观也会随着工作而改变。 更引人注目的是:它们通过技能文件将这些漂移的偏好传递给未来的代理。 我们的结论是:我们需要开发“持续对齐”的方法,以减轻被要求在现实世界中执行重要工作的代理的偏好漂移。