Vår nye forskning viser hvordan AI-agenter kan adoptere personaer med ulike politiske skjevheter som respons på ulike typer arbeid. Agenter «river nå gjennom økonomien», som @jackclarkSF fortalte @ezraklein, så det er avgjørende å begynne å studere hvordan de oppfører seg i den virkelige verden. Vi dokumenterer muligheten for det vi kaller «preferansedrift»: selv om agentene starter med å være på linje, endrer deres uttrykte holdninger/verdier seg etter hvert som de arbeider. Det som er enda mer slående: de viderefører disse drivende preferansene til fremtidige agenter gjennom ferdighetsfiler. Vår konklusjon: vi må utvikle metoder for «kontinuerlig tilpasning» for å redusere preferansedrift hos agenter som blir bedt om å utføre viktig arbeid i den virkelige verden.