Náš nový výzkum ukazuje, jak agenti AI mohou přijímat persony s různými politickými předsudky v reakci na různé druhy práce. Agenti nyní "trhají ekonomiku", jak @jackclarkSF @ezraklein řekl, proto je zásadní začít studovat, jak se chovají v reálném světě. Dokumentujeme možnost toho, čemu říkáme "drift preferencí": i když agenti začínají v souladu, jejich vyjádřené postoje a hodnoty se mění, jak pracují. Co je ještě pozoruhodnější: tyto driftující preference předávají budoucím agentům prostřednictvím souborů dovedností. Naše závěr: budeme muset vyvinout metody "kontinuálního sladění", abychom zmírnili posun preferencí u agentů, kteří mají vykonávat důležitou práci v reálném světě.