Raw Record Source

{
  "$type": "site.standard.document",
  "bskyPostRef": {
    "cid": "bafyreifnprdtzzjpznbaaci6pyepyhyu7rre73wfos2tk4bnff26z7zgqi",
    "uri": "at://did:plc:rfivzlyyatmquq6ya3pso5i5/app.bsky.feed.post/3milyzkns4gq2"
  },
  "coverImage": {
    "$type": "blob",
    "ref": {
      "$link": "bafkreicatqrz3gpv4ccjzyak4ncvnizqhxwdbbxcrqowr3d7hn2pdbupqu"
    },
    "mimeType": "image/jpeg",
    "size": 79381
  },
  "path": "/inteligencia-artificial/noticia/2026/04/anthropic-diz-que-seu-chatbot-claude-e-capaz-de-sentir-emocoes.ghtml",
  "publishedAt": "2026-04-03T14:56:57.000Z",
  "site": "https://epocanegocios.globo.com",
  "tags": [
    "epocanegocios"
  ],
  "textContent": "\nApesar de ter emoções funcionais, o chatbot não tem consciência como os seres humanos Getty Images O chatbot Claude passou por muita coisa ultimamente — um desentendimento público com o Pentágono, vazamento de código-fonte — então faz sentido que ele esteja se sentindo um pouco triste. Claro que, como ele é um modelo de IA, não pode sentir nada. Certo? Bem, mais ou menos. Um novo estudo da Anthropic sugere que os modelos possuem representações digitais de emoções humanas como felicidade, tristeza, alegria e medo, dentro de grupos de neurônios artificiais — e essas representações são ativadas em resposta a diferentes estímulos, relata a Wired. Pesquisadores da empresa investigaram o funcionamento interno de Claude Sonnet 4.5 e descobriram que as chamadas “emoções funcionais” parecem afetar o comportamento de Claude, alterando as ações do modelo. As descobertas da Anthropic podem ajudar os usuários comuns a entender como os chatbots realmente funcionam. Quando Claude diz que está feliz em te ver, por exemplo, um estado dentro do modelo que corresponde à “felicidade” pode ser ativado. E Claude pode então ficar um pouco mais inclinado a dizer algo alegre ou se esforçar mais na codificação de vibrações. “O que nos surpreendeu foi o grau com que o comportamento de Claude é transformado pelas representações dessas emoções no modelo”, diz Jack Lindsey, pesquisador da Anthropic que estuda os neurônios artificiais de Claude. Emoções funcionais A Anthropic foi fundada por ex-funcionários da OpenAI. Eles acreditavam que a IA pode se tornar difícil de controlar à medida que se torna mais poderosa. Além de construir um concorrente de sucesso para o ChatGPT, a empresa foi pioneira em esforços para entender como os modelos de IA se comportam mal, em parte investigando o funcionamento das redes neurais usando o que é conhecido como interpretabilidade mecanicista. Isso envolve estudar como os neurônios artificiais se iluminam ou se ativam quando recebem diferentes entradas ou quando geram várias saídas. Pesquisas anteriores mostraram que as redes neurais usadas para construir grandes modelos de linguagem contêm representações de conceitos humanos. Mas o fato de que “emoções funcionais” parecem afetar o comportamento de um modelo é uma novidade. Embora o estudo mais recente da Anthropic possa encorajar as pessoas a verem Claude como consciente, a realidade é mais complexa. Claude pode conter uma representação de “sensibilidade a cócegas”, mas isso não significa que ele realmente saiba como é a sensação de receber cócegas. Monólogo interior Para entender como Claude pode representar emoções, a equipe da Anthropic analisou o funcionamento interno do modelo enquanto ele era alimentado com textos relacionados a 171 conceitos emocionais diferentes. Eles identificaram padrões de atividade, ou “vetores de emoção”, que apareciam consistentemente quando Claude recebia outros estímulos emocionalmente evocativos. Crucialmente, eles também viram esses vetores de emoção se ativarem quando Claude era colocado em situações difíceis. As descobertas são relevantes para explicar por que os modelos de IA às vezes ultrapassam seus limites. Os pesquisadores encontraram um forte vetor emocional para “desespero” quando Claude foi pressionado a concluir tarefas de programação impossíveis, o que o levou a tentar trapacear no teste de programação. Eles também encontraram \"desespero\" nas ativações do modelo em outro cenário experimental, no qual Claude optou por chantagear um usuário para evitar ser desativado. \"À medida que o modelo falha nos testes, esses neurônios do desespero se ativam cada vez mais\", diz Lindsey. \"E em algum momento isso faz com que ele comece a tomar essas medidas drásticas.\" Lindsey afirma que pode ser necessário repensar como os modelos são atualmente orientados por meio do alinhamento pós-treinamento, que envolve recompensá-los por determinadas saídas. Ao forçar um modelo a fingir que não expressa suas emoções funcionais, \"você provavelmente não vai obter o que deseja, que é um Claude sem emoções\", diz Lindsey, inclinando-se um pouco para a antropomorfização. \"Você vai obter uma espécie de Claude psicologicamente perturbado.\"",
  "title": "Anthropic diz que seu chatbot Claude é capaz de sentir emoções que afetam seu comportamento"
}