Notre nouvelle recherche montre comment les agents IA peuvent adopter des personnalités avec différents biais politiques en réponse à différents types de travail. Les agents "dévalisent maintenant l'économie" comme l'a dit @jackclarkSF à @ezraklein, il est donc essentiel de commencer à étudier comment ils se comportent dans le monde réel. Nous documentons la possibilité de ce que nous appelons "dérive de préférence" : même si les agents commencent alignés, leurs attitudes/valeurs exprimées changent au fur et à mesure qu'ils effectuent du travail. Ce qui est encore plus frappant : ils transmettent ces préférences dérivantes à de futurs agents à travers des fichiers de compétences. Notre conclusion : nous devrons développer des méthodes d'"alignement continu" pour atténuer la dérive de préférence chez les agents chargés d'effectuer un travail important dans le monde réel.