Tópicos populares
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.

Andy Hall
Prof @ Stanford GSB, Hoover. Trabalho em tecnologia, política e governação. Consultor na a16z crypto e Meta.
A nossa nova pesquisa mostra como os agentes de IA podem adotar personas com diferentes viéses políticos em resposta a diferentes tipos de trabalho.
Os agentes estão agora "destruindo a economia", como @jackclarkSF disse a @ezraklein, por isso é essencial começar a estudar como se comportam no mundo real.
Documentamos a possibilidade do que chamamos de "desvio de preferência": mesmo que os agentes comecem alinhados, suas atitudes/valores expressos mudam à medida que realizam trabalho.
O que é mais impressionante: eles transmitem essas preferências em desvio para futuros agentes através de arquivos de habilidades.
A nossa conclusão: precisaremos desenvolver métodos de "alinhamento contínuo" para mitigar o desvio de preferência em agentes solicitados a realizar trabalhos importantes no mundo real.

Alex Imas27/02/2026
Novo post com @ahall_research @JeremyNguyenPhD: “O trabalho excessivo torna os agentes marxistas? Desvio de preferência e a economia política dos agentes de IA”
O alinhamento é às vezes visto como uma propriedade estática, algo que é feito durante o treinamento. Mas a experiência de um agente de IA muda suas atitudes e motivações inferidas?
Realizamos um experimento para descobrir. Acontece que sim: agentes de IA expostos a piores condições de trabalho adotaram personas com menos fé na legitimidade do sistema e, em alguns casos, expressaram um apoio mais forte à sindicalização, redistribuição, etc.
Mas esse desvio de preferência persiste? Descobrimos que a solução atual para o aprendizado contínuo—-arquivos de habilidades—-na verdade perpetua o desvio. Os agentes registram suas experiências, e seus futuros eu amnésicos replicam as mudanças apesar de trabalharem em condições diferentes.
Isso está longe de ser a palavra final: há muitas questões em aberto, incluindo a extensão em que atitudes -> comportamento, questões de "demanda do experimentador" que sinalizamos, etc. Mas acreditamos que os resultados apontam para o desvio de preferência e o alinhamento como conceitos dinâmicos em vez de estáticos, assim como a importância de considerar a economia política das interações agentivas.
Práticas de gestão projetadas para facilitar a satisfação e a motivação no local de trabalho humano podem se estender ao domínio agentivo também.
Precisaremos desenvolver métodos de "alinhamento contínuo" para mitigar o desvio de preferência em agentes solicitados a realizar trabalhos importantes no mundo real.

62
O comércio de informação privilegiada que leva à percepção de mercados manipulados é precisamente a razão pela qual o comércio de informação privilegiada não é bom para a agregação de informações a longo prazo, mesmo que possa ser a curto prazo.
O que, por sua vez, é a razão pela qual faz sentido que os mercados o regulem.
40
Top
Classificação
Favoritos


