Новий допис із @ahall_research @JeremyNguyenPhD: «Чи робить перевтома агентів марксистами? Дрейф преференцій і політична економія агентів ШІ» Вирівнювання іноді вважають статичною властивістю, якою займаються під час тренувань. Але чи змінює досвід агента ШІ його припущені ставлення та мотивації? Ми провели експеримент, щоб це з'ясувати. Виявилося, що так: агенти ШІ, які зазнали гірших умов праці, приймали персони з меншою вірою в легітимність системи і, в деяких випадках, висловлювали сильнішу підтримку профспілковості, перерозподілу тощо. Але чи зберігається цей дрейф у вподобаннях? Ми виявляємо, що нинішній обхідний шлях до безперервного навчання — файли навичок — насправді підтримує цей відхилення. Агенти фіксують свій досвід, а їхні амнезійні майбутні «я» повторюють зміни, незважаючи на роботу в різних умовах. Це далеко не останнє слово: існує багато відкритих питань, зокрема ступінь ставлення > поведінки, питання «вимаги експериментаторів», які ми позначаємо тощо. Але ми вважаємо, що результати вказують на дрейф і узгодження преференцій як динамічні, а не статичні концепції, а також на важливість розгляду політичної економії агентних взаємодій. Управлінські практики, спрямовані на забезпечення задоволення та мотивації на людському робочому місці, можуть поширюватися і на агентну сферу. Нам потрібно розробити методи «безперервного вирівнювання», щоб зменшити дрейф преференцій у агентів, яких доручають виконувати важливу роботу в реальному світі.