A nossa nova pesquisa mostra como os agentes de IA podem adotar personas com diferentes viéses políticos em resposta a diferentes tipos de trabalho. Os agentes estão agora "destruindo a economia", como @jackclarkSF disse a @ezraklein, por isso é essencial começar a estudar como se comportam no mundo real. Documentamos a possibilidade do que chamamos de "desvio de preferência": mesmo que os agentes comecem alinhados, suas atitudes/valores expressos mudam à medida que realizam trabalho. O que é mais impressionante: eles transmitem essas preferências em desvio para futuros agentes através de arquivos de habilidades. A nossa conclusão: precisaremos desenvolver métodos de "alinhamento contínuo" para mitigar o desvio de preferência em agentes solicitados a realizar trabalhos importantes no mundo real.