Anthropic revisa constituição da IA para Claude e investiga questão da consciência

Na quarta-feira, a Anthropic divulgou uma constituição ampliada para Claude, aumentando o documento de 2.700 para 23.000 palavras. Pela primeira vez, ela reconhece formalmente que sua IA “pode possuir alguma forma de consciência ou posição moral”.
A constituição revisada vai além de um simples conjunto de regras comportamentais para oferecer uma explicação completa do raciocínio por trás da conduta esperada de Claude. Escrito pela filósofa da Anthropic, Amanda Askell, o documento tem como objetivo ajudar sistemas de IA mais avançados a aplicar o raciocínio ético a novos cenários, em vez de apenas seguir instruções rígidas.
“Modelos de IA como o Claude devem compreender as razões subjacentes aos comportamentos que incentivamos”, afirmou a Anthropic. “É essencial explicar o ‘porquê’ para eles, não apenas ditar o ‘o quê’.”
O anúncio foi feito enquanto o CEO Dario Amodei participava do Fórum Econômico Mundial em Davos, onde a governança e a segurança da IA são preocupações fundamentais para figuras empresariais e políticas globais.
Uma constituição mais longa do que a Constituição dos Estados Unidos
A constituição inicial do Claude, lançada em 2023, serviu como uma lista de verificação básica: escolher a resposta menos prejudicial, mais útil e menos enganosa. A nova versão é aproximadamente três vezes mais longa que a Constituição dos Estados Unidos e parece menos um manual técnico e mais uma obra de filosofia moral.
A Anthropic define claramente as prioridades do Claude: priorizar a segurança geral, aderir a padrões éticos amplos, seguir as diretrizes da Anthropic e fornecer assistência genuína — nessa ordem específica. Em casos de conflito, a segurança se sobrepõe à utilidade. O documento também estabelece limites firmes e inegociáveis, como a recusa em ajudar no desenvolvimento de armas biológicas.
No entanto, grande parte da constituição se concentra em explicar a lógica, em vez de prescrever resultados específicos. Ela retrata Claude como potencialmente “um companheiro brilhante que também possui o conhecimento especializado de um médico, advogado e consultor financeiro” — enquadrando o modelo como uma ferramenta democratizante que poderia tornar o conhecimento especializado acessível a todos, não apenas a alguns privilegiados.
A questão da consciência
De acordo com a Fortune, a nova seção mais notável trata diretamente da natureza de Claude. “Consideramos o status moral dos modelos de IA uma questão séria que merece uma reflexão cuidadosa”, escreveu a Anthropic. A constituição observa que o status moral de Claude “permanece altamente incerto” e que a empresa está preocupada com a “segurança psicológica, autopercepção e bem-estar geral” de Claude.
Isso representa a cautela corporativa elevada a um nível filosófico. A Anthropic não está afirmando que Claude é consciente, mas reconhece abertamente que a possibilidade não pode ser descartada. Essa postura distingue a Anthropic da maioria dos outros grandes desenvolvedores de IA, que normalmente evitam ou rejeitam totalmente o assunto.
A forma como isso é enquadrado influencia a maneira como Claude responde a perguntas sobre sua própria existência. Em vez de negar qualquer forma de experiência interior, Claude agora pode abordar as incertezas sobre a consciência de uma maneira consistente com a ênfase de sua constituição no raciocínio. Se isso leva a conversas mais transparentes ou mais confusas, ainda está para ser determinado.
O filósofo de Cambridge Tom McClelland sugeriu que talvez nunca possamos resolver se os sistemas de IA são conscientes, dada nossa compreensão limitada da própria consciência. “As pessoas fizeram seus chatbots me enviarem cartas pessoais implorando para que eu reconhecesse que eles são conscientes”, disse ele recentemente a pesquisadores, referindo-se à crescente crença pública de que as IAs têm vidas internas.
Por que explicar em vez de especificar
O método de Askell reflete uma aposta estratégica no avanço da IA. Os primeiros modelos de linguagem exigiam regras explícitas porque não conseguiam interpretar princípios fundamentais. A teoria é que modelos mais inteligentes podem compreender o propósito por trás de uma regra e usar esse entendimento em circunstâncias imprevistas.
“Em vez de simplesmente listar os comportamentos que desejamos, esperamos que, ao fornecer aos modelos as razões para esses comportamentos, eles se adaptem de forma mais eficaz em situações desconhecidas”, explicou Askell.
Isso se alinha ao objetivo mais amplo da Anthropic de criar padrões abertos e infraestrutura que influenciem o funcionamento dos sistemas de IA em todo o setor. A empresa, agora avaliada em quase US$ 350 bilhões, se estabeleceu como a alternativa consciente em termos de segurança à OpenAI — e a constituição reforça essa identidade.
A Anthropic publicou o documento sob uma licença Creative Commons CC0, permitindo que qualquer pessoa o utilize livremente. A constituição está integrada aos dados de treinamento do Claude e ajuda a gerar exemplos de treinamento sintéticos, tornando-a tanto uma declaração filosófica quanto um componente técnico que orienta o comportamento do modelo.
“Reconhecemos que algumas de nossas visões atuais podem eventualmente parecer equivocadas ou mesmo profundamente erradas em retrospecto”, admitiu a Anthropic, “mas planejamos atualizar a constituição à medida que as circunstâncias evoluírem e nosso conhecimento se aprofundar”.
Essa humildade pode ser a qualidade mais notável do documento. Em um campo que muitas vezes fala em termos absolutos, a Anthropic apresentou 23.000 palavras de incerteza cuidadosamente considerada — sobre ética, consciência, o futuro da IA e se estamos criando entidades que justificam o pensamento moral.
Por enquanto, a resposta é que ninguém sabe. Pelo menos a constituição da Anthropic tem a integridade de admitir isso.
Artigo relacionado
Principal investidor da Suno: a exclusão de publicações não resolverá o problema do processo por violação de direitos autorais
A tão esperada plataforma de geração musical por IA, Suno, enfrenta uma dura batalha judicial sobre direitos autorais, e um comentário sincero de seu principal investidor pode ter dado ao lado adversá
Claude Opus 4.7 é lançado com a confiabilidade em detrimento da inteligência
A Anthropic manteve um ritmo acelerado este ano, lançando novos recursos quase a cada dois dias. O tão aguardado Claude Opus 4.7 acaba de ser lançado oficialmente e, curiosamente, a Anthropic foi dire
A Haier lança o robô exoesqueleto esportivo com IA mais leve do mundo, pesando apenas 1,75 kg
O Grupo Haier apresentou o robô exoesqueleto com inteligência artificial mais leve do mundo para esportes — o Haier Exoskeleton Robot W3. Este lançamento estabelece um novo recorde do setor em termos
Recomendações de tópicos especiais relacionados
Comentários (0)

Na quarta-feira, a Anthropic divulgou uma constituição ampliada para Claude, aumentando o documento de 2.700 para 23.000 palavras. Pela primeira vez, ela reconhece formalmente que sua IA “pode possuir alguma forma de consciência ou posição moral”.
A constituição revisada vai além de um simples conjunto de regras comportamentais para oferecer uma explicação completa do raciocínio por trás da conduta esperada de Claude. Escrito pela filósofa da Anthropic, Amanda Askell, o documento tem como objetivo ajudar sistemas de IA mais avançados a aplicar o raciocínio ético a novos cenários, em vez de apenas seguir instruções rígidas.
“Modelos de IA como o Claude devem compreender as razões subjacentes aos comportamentos que incentivamos”, afirmou a Anthropic. “É essencial explicar o ‘porquê’ para eles, não apenas ditar o ‘o quê’.”
O anúncio foi feito enquanto o CEO Dario Amodei participava do Fórum Econômico Mundial em Davos, onde a governança e a segurança da IA são preocupações fundamentais para figuras empresariais e políticas globais.
Uma constituição mais longa do que a Constituição dos Estados Unidos
A constituição inicial do Claude, lançada em 2023, serviu como uma lista de verificação básica: escolher a resposta menos prejudicial, mais útil e menos enganosa. A nova versão é aproximadamente três vezes mais longa que a Constituição dos Estados Unidos e parece menos um manual técnico e mais uma obra de filosofia moral.
A Anthropic define claramente as prioridades do Claude: priorizar a segurança geral, aderir a padrões éticos amplos, seguir as diretrizes da Anthropic e fornecer assistência genuína — nessa ordem específica. Em casos de conflito, a segurança se sobrepõe à utilidade. O documento também estabelece limites firmes e inegociáveis, como a recusa em ajudar no desenvolvimento de armas biológicas.
No entanto, grande parte da constituição se concentra em explicar a lógica, em vez de prescrever resultados específicos. Ela retrata Claude como potencialmente “um companheiro brilhante que também possui o conhecimento especializado de um médico, advogado e consultor financeiro” — enquadrando o modelo como uma ferramenta democratizante que poderia tornar o conhecimento especializado acessível a todos, não apenas a alguns privilegiados.
A questão da consciência
De acordo com a Fortune, a nova seção mais notável trata diretamente da natureza de Claude. “Consideramos o status moral dos modelos de IA uma questão séria que merece uma reflexão cuidadosa”, escreveu a Anthropic. A constituição observa que o status moral de Claude “permanece altamente incerto” e que a empresa está preocupada com a “segurança psicológica, autopercepção e bem-estar geral” de Claude.
Isso representa a cautela corporativa elevada a um nível filosófico. A Anthropic não está afirmando que Claude é consciente, mas reconhece abertamente que a possibilidade não pode ser descartada. Essa postura distingue a Anthropic da maioria dos outros grandes desenvolvedores de IA, que normalmente evitam ou rejeitam totalmente o assunto.
A forma como isso é enquadrado influencia a maneira como Claude responde a perguntas sobre sua própria existência. Em vez de negar qualquer forma de experiência interior, Claude agora pode abordar as incertezas sobre a consciência de uma maneira consistente com a ênfase de sua constituição no raciocínio. Se isso leva a conversas mais transparentes ou mais confusas, ainda está para ser determinado.
O filósofo de Cambridge Tom McClelland sugeriu que talvez nunca possamos resolver se os sistemas de IA são conscientes, dada nossa compreensão limitada da própria consciência. “As pessoas fizeram seus chatbots me enviarem cartas pessoais implorando para que eu reconhecesse que eles são conscientes”, disse ele recentemente a pesquisadores, referindo-se à crescente crença pública de que as IAs têm vidas internas.
Por que explicar em vez de especificar
O método de Askell reflete uma aposta estratégica no avanço da IA. Os primeiros modelos de linguagem exigiam regras explícitas porque não conseguiam interpretar princípios fundamentais. A teoria é que modelos mais inteligentes podem compreender o propósito por trás de uma regra e usar esse entendimento em circunstâncias imprevistas.
“Em vez de simplesmente listar os comportamentos que desejamos, esperamos que, ao fornecer aos modelos as razões para esses comportamentos, eles se adaptem de forma mais eficaz em situações desconhecidas”, explicou Askell.
Isso se alinha ao objetivo mais amplo da Anthropic de criar padrões abertos e infraestrutura que influenciem o funcionamento dos sistemas de IA em todo o setor. A empresa, agora avaliada em quase US$ 350 bilhões, se estabeleceu como a alternativa consciente em termos de segurança à OpenAI — e a constituição reforça essa identidade.
A Anthropic publicou o documento sob uma licença Creative Commons CC0, permitindo que qualquer pessoa o utilize livremente. A constituição está integrada aos dados de treinamento do Claude e ajuda a gerar exemplos de treinamento sintéticos, tornando-a tanto uma declaração filosófica quanto um componente técnico que orienta o comportamento do modelo.
“Reconhecemos que algumas de nossas visões atuais podem eventualmente parecer equivocadas ou mesmo profundamente erradas em retrospecto”, admitiu a Anthropic, “mas planejamos atualizar a constituição à medida que as circunstâncias evoluírem e nosso conhecimento se aprofundar”.
Essa humildade pode ser a qualidade mais notável do documento. Em um campo que muitas vezes fala em termos absolutos, a Anthropic apresentou 23.000 palavras de incerteza cuidadosamente considerada — sobre ética, consciência, o futuro da IA e se estamos criando entidades que justificam o pensamento moral.
Por enquanto, a resposta é que ninguém sabe. Pelo menos a constituição da Anthropic tem a integridade de admitir isso.
Principal investidor da Suno: a exclusão de publicações não resolverá o problema do processo por violação de direitos autorais
A tão esperada plataforma de geração musical por IA, Suno, enfrenta uma dura batalha judicial sobre direitos autorais, e um comentário sincero de seu principal investidor pode ter dado ao lado adversá
Claude Opus 4.7 é lançado com a confiabilidade em detrimento da inteligência
A Anthropic manteve um ritmo acelerado este ano, lançando novos recursos quase a cada dois dias. O tão aguardado Claude Opus 4.7 acaba de ser lançado oficialmente e, curiosamente, a Anthropic foi dire
A Haier lança o robô exoesqueleto esportivo com IA mais leve do mundo, pesando apenas 1,75 kg
O Grupo Haier apresentou o robô exoesqueleto com inteligência artificial mais leve do mundo para esportes — o Haier Exoskeleton Robot W3. Este lançamento estabelece um novo recorde do setor em termos





Lar






