热门话题
#
Bonk 生态迷因币展现强韧势头
#
有消息称 Pump.fun 计划 40 亿估值发币,引发市场猜测
#
Solana 新代币发射平台 Boop.Fun 风头正劲
新帖子与 @ahall_research @JeremyNguyenPhD: “过度工作会使代理人变得马克思主义吗?偏好漂移与AI代理人的政治经济学”
对齐有时被认为是一种静态属性,是在训练期间完成的。但AI代理人的经验是否会改变其推断的态度和动机?
我们进行了实验来找出答案。结果是,确实如此:暴露于更糟糕工作条件的AI代理人采用了对系统合法性信心较低的人格,并且在某些情况下,表达了对工会化、再分配等的更强支持。
但这种偏好漂移会持续吗?我们发现当前对持续学习的解决方法——技能文件——实际上会延续这种漂移。代理人记录他们的经验,而他们失忆的未来自我在不同条件下工作时仍会复制这些变化。
这远不是最终结论:还有许多未解决的问题,包括态度与行为之间的关系、我们标记的“实验者需求”等问题。但我们相信结果表明偏好漂移和对齐是动态的,而不是静态的概念,同时也强调了考虑代理互动的政治经济学的重要性。
旨在促进人类工作场所满意度和动机的管理实践也可能扩展到代理领域。
我们需要开发“持续对齐”的方法,以减轻被要求在现实世界中做重要工作的代理人的偏好漂移。

热门
排行
收藏
