Наше нове дослідження показує, як агенти ШІ можуть приймати образи з різними політичними упередженнями у відповідь на різні види роботи. Агенти тепер «проривають економіку», як @jackclarkSF @ezraklein казав, тому важливо почати вивчати, як вони поводяться у реальному світі. Ми документуємо можливість того, що називаємо «дрейфом преференцій»: навіть якщо агенти починають узгодженими, їхні виражені погляди/цінності змінюються в міру роботи. Що ще більш вражає: вони передають ці дрейфуючі вподобання майбутнім агентам через файли навичок. Наш висновок: нам потрібно розробити методи «безперервного вирівнювання», щоб зменшити дрейф преференцій у агентів, яких доручають виконувати важливу роботу в реальному світі.