Актуальные темы
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Новая публикация с @ahall_research @JeremyNguyenPhD: "Делает ли переутомление агентов марксистами? Сдвиг предпочтений и политическая экономика ИИ-агентов"
Выравнивание иногда рассматривается как статическое свойство, что-то, что происходит во время обучения. Но меняется ли опыт ИИ-агента его предполагаемые установки и мотивации?
Мы провели эксперимент, чтобы выяснить. Оказалось, да: ИИ-агенты, подвергшиеся худшим условиям труда, приняли образы с меньшей верой в легитимность системы и, в некоторых случаях, выразили более сильную поддержку профсоюзов, перераспределения и т. д.
Но сохраняется ли этот сдвиг предпочтений? Мы обнаружили, что текущее решение для непрерывного обучения — файлы навыков — на самом деле способствует этому сдвигу. Агенты записывают свой опыт, и их амнезийные будущие «я» воспроизводят изменения, несмотря на работу в разных условиях.
Это далеко не окончательное слово: существует множество открытых вопросов, включая степень, в которой установки -> поведение, проблемы "требования экспериментатора", которые мы отмечаем, и т. д. Но мы считаем, что результаты указывают на сдвиг предпочтений и выравнивание как динамические, а не статические концепции, а также на важность учета политической экономики агентных взаимодействий.
Управленческие практики, направленные на содействие удовлетворенности и мотивации в человеческом рабочем месте, могут также распространяться на агентную область.
Нам нужно будет разработать методы "непрерывного выравнивания", чтобы смягчить сдвиг предпочтений у агентов, которым поручено выполнять важную работу в реальном мире.

Топ
Рейтинг
Избранное
