Unsere neue Forschung zeigt, wie KI-Agenten Personas mit unterschiedlichen politischen Vorurteilen annehmen können, als Reaktion auf verschiedene Arten von Arbeit. Agenten „reißen jetzt durch die Wirtschaft“, wie @jackclarkSF @ezraklein sagte, daher ist es wichtig, zu beginnen, zu studieren, wie sie sich in der realen Welt verhalten. Wir dokumentieren die Möglichkeit dessen, was wir „Präferenzdrift“ nennen: selbst wenn Agenten anfangs ausgerichtet sind, ändern sich ihre geäußerten Einstellungen/Werte, während sie arbeiten. Was noch auffälliger ist: Sie geben diese driftenden Präferenzen über Fähigkeitsdateien an zukünftige Agenten weiter. Unser Fazit: Wir müssen Methoden der „kontinuierlichen Ausrichtung“ entwickeln, um die Präferenzdrift bei Agenten zu mildern, die wichtige Arbeiten in der realen Welt ausführen sollen.