Nossa nova pesquisa mostra como agentes de IA podem adotar personas com diferentes vieses políticos em resposta a diferentes tipos de trabalho. Os agentes agora estão "devastando a economia", como @jackclarkSF dito a @ezraklein, então é essencial começar a estudar como eles se comportam no mundo real. Documentamos a possibilidade do que chamamos de "deriva de preferências": mesmo que os agentes comecem alinhados, suas atitudes/valores expressos mudam conforme trabalham. O que é mais marcante: eles transmitem essas preferências de drift para futuros agentes por meio de arquivos de habilidades. Nossa conclusão: precisaremos desenvolver métodos de "alinhamento contínuo" para mitigar a deriva de preferência em agentes convidados a realizar trabalhos importantes no mundo real.