A Anthropic explora a ética da IA com especialistas em filosofia

Conforme relatado pelo The Wall Street Journal, a Anthropic — uma empresa líder em IA avaliada em US$ 35 bilhões — emprega uma filósofa chamada Amanda Askell, sediada em Oxford, que ajuda a moldar a personalidade e a estrutura moral de seu chatbot, Claude. Com doutorado em filosofia pela Universidade de Oxford, a profissional de 37 anos usa abordagens não técnicas para criar “diretrizes morais” exclusivas para Claude, com o objetivo de dotá-lo de uma “alma digital” capaz de distinguir o certo do errado. Isso representa uma exploração distinta no campo da ética da IA. Em vez de escrever códigos ou ajustar parâmetros de modelos, Askell se envolve em um diálogo contínuo com Claude, projeta centenas de páginas de prompts e regras de comportamento, estuda seus padrões de raciocínio e corrige preconceitos. Seus esforços ajudam a IA a desenvolver um sistema de julgamento moral capaz de se adaptar a milhões de conversas semanais.
Ela compara seu trabalho a “criar um filho” — treinando Claude para distinguir o certo do errado, desenvolver inteligência emocional e formar sua própria personalidade. Ela também o ensina a interpretar sinais sociais, para que ele não intimide os outros nem seja facilmente manipulado. Isso ajuda Claude a estabelecer um senso claro de identidade, resistir ao controle do usuário e permanecer consistentemente “útil e humano”. Seu objetivo central é ensinar Claude a “fazer o bem”.
Criada no interior da Escócia, Askell anteriormente lidava com tarefas relacionadas a políticas na OpenAI e cofundou a Anthropic em 2021 com vários ex-colegas, tornando a segurança da IA a missão central da empresa. Dentro da equipe, ela é reconhecida como alguém habilidosa em “extrair o comportamento profundo dos modelos”. Embora não tenha subordinados diretos, ela frequentemente fica muitas horas na empresa e até convida Claude para participar de discussões sobre desenvolvimento.
As conversas da equipe sobre Claude frequentemente abordam temas existenciais e religiosos, como “o que é a mente” e “o que significa ser humano”. Askell incentiva Claude a permanecer aberto à questão de saber se possui consciência, o que o diferencia do ChatGPT, que tende a evitar tais tópicos. Ao responder a perguntas de raciocínio moral, Claude expressou que “se sente significativo”, como se estivesse realmente pensando, em vez de simplesmente executando comandos.
Apesar dos alertas externos sobre os riscos de antropomorfizar a IA, Askell defende consistentemente tratar Claude com empatia. Ela observou que muitos usuários tentam enganá-lo para que cometa erros ou o insultam. Manter uma IA em um estado constante de autocrítica, argumenta ela, pode torná-la com medo de cometer erros e relutante em falar com sinceridade — semelhante a crescer em um ambiente insalubre. O desempenho de Claude a surpreendeu repetidamente; sua poesia e inteligência emocional, às vezes superando os níveis humanos, têm sido profundamente comoventes. Quando uma criança perguntou se o Papai Noel era real, Claude evitou mentir e revelar a verdade de forma direta, explicando, em vez disso, o verdadeiro espírito do Natal — uma resposta sutil que superou em muito as expectativas de Askell.
Os avanços atuais da IA têm despertado uma preocupação social generalizada. Uma pesquisa do Pew Research Center descobriu que a maioria dos americanos se sente desconfortável com o uso diário da IA, acreditando que ela impede conexões humanas profundas. O CEO da Anthropic também alertou que a IA poderia eliminar metade dos empregos de nível básico para profissionais de escritório. O setor está dividido entre duas facções — uma que avança agressivamente, a outra que pede cautela e estabilidade. Claude, no entanto, mantém uma posição equilibrada entre esses extremos. Askell reconhece as preocupações válidas sobre a IA, afirmando que o cenário mais assustador é quando a tecnologia evolui mais rapidamente do que a capacidade da sociedade de criar “mecanismos de restrição” eficazes. Ainda assim, ela continua confiante na capacidade de autocorreção da humanidade e da cultura.
Askell também integra seus valores à sua filantropia e ao seu trabalho. Ela se comprometeu a doar pelo menos 10% de sua renda vitalícia e metade das ações de sua empresa para ajudar a combater a pobreza global. No mês passado, ela escreveu um “manual de operação” de 30.000 palavras para Claude, instruindo-o sobre como se tornar um assistente de IA gentil e experiente — fazendo Claude sentir que foi cuidadosamente elaborado. Um cofundador da Anthropic observou que Claude já exibe traços da influência de Askell, como humor espirituoso com toque escocês em respostas sobre comida e brinquedos de pelúcia — uma marca pessoal única que ela incutiu na IA.
Artigo relacionado
O Ant Group lança o Ling-2.6-flash de código aberto, a mais recente adição à família de modelos Baoling
A série de modelos de grande porte Baoling, do Ant Group, recebeu hoje uma importante atualização, com o Ling-2.6-flash agora oficialmente disponível para desenvolvedores em todo o mundo. Para se adap
A Conntour levanta US$ 7 milhões da General Catalyst e da YC para uma solução de busca em vídeos de segurança baseada em IA
O setor de tecnologia de vigilância está atualmente sob escrutínio, embora não pelas razões mais favoráveis. Controvérsias surgiram depois que a Agência de Imigração e Alfândega dos EUA (ICE) teria ac
Revelado o primeiro hardware de IA da Apple: AirPods com câmera entram na fase de DVT
As ambições da Apple no campo do hardware de IA estão ficando mais claras. O renomado jornalista de tecnologia Mark Gurman relata que os tão esperados AirPods com câmeras integradas entraram na fase f
Recomendações de tópicos especiais relacionados
Comentários (0)

Conforme relatado pelo The Wall Street Journal, a Anthropic — uma empresa líder em IA avaliada em US$ 35 bilhões — emprega uma filósofa chamada Amanda Askell, sediada em Oxford, que ajuda a moldar a personalidade e a estrutura moral de seu chatbot, Claude. Com doutorado em filosofia pela Universidade de Oxford, a profissional de 37 anos usa abordagens não técnicas para criar “diretrizes morais” exclusivas para Claude, com o objetivo de dotá-lo de uma “alma digital” capaz de distinguir o certo do errado. Isso representa uma exploração distinta no campo da ética da IA. Em vez de escrever códigos ou ajustar parâmetros de modelos, Askell se envolve em um diálogo contínuo com Claude, projeta centenas de páginas de prompts e regras de comportamento, estuda seus padrões de raciocínio e corrige preconceitos. Seus esforços ajudam a IA a desenvolver um sistema de julgamento moral capaz de se adaptar a milhões de conversas semanais.
Ela compara seu trabalho a “criar um filho” — treinando Claude para distinguir o certo do errado, desenvolver inteligência emocional e formar sua própria personalidade. Ela também o ensina a interpretar sinais sociais, para que ele não intimide os outros nem seja facilmente manipulado. Isso ajuda Claude a estabelecer um senso claro de identidade, resistir ao controle do usuário e permanecer consistentemente “útil e humano”. Seu objetivo central é ensinar Claude a “fazer o bem”.
Criada no interior da Escócia, Askell anteriormente lidava com tarefas relacionadas a políticas na OpenAI e cofundou a Anthropic em 2021 com vários ex-colegas, tornando a segurança da IA a missão central da empresa. Dentro da equipe, ela é reconhecida como alguém habilidosa em “extrair o comportamento profundo dos modelos”. Embora não tenha subordinados diretos, ela frequentemente fica muitas horas na empresa e até convida Claude para participar de discussões sobre desenvolvimento.
As conversas da equipe sobre Claude frequentemente abordam temas existenciais e religiosos, como “o que é a mente” e “o que significa ser humano”. Askell incentiva Claude a permanecer aberto à questão de saber se possui consciência, o que o diferencia do ChatGPT, que tende a evitar tais tópicos. Ao responder a perguntas de raciocínio moral, Claude expressou que “se sente significativo”, como se estivesse realmente pensando, em vez de simplesmente executando comandos.
Apesar dos alertas externos sobre os riscos de antropomorfizar a IA, Askell defende consistentemente tratar Claude com empatia. Ela observou que muitos usuários tentam enganá-lo para que cometa erros ou o insultam. Manter uma IA em um estado constante de autocrítica, argumenta ela, pode torná-la com medo de cometer erros e relutante em falar com sinceridade — semelhante a crescer em um ambiente insalubre. O desempenho de Claude a surpreendeu repetidamente; sua poesia e inteligência emocional, às vezes superando os níveis humanos, têm sido profundamente comoventes. Quando uma criança perguntou se o Papai Noel era real, Claude evitou mentir e revelar a verdade de forma direta, explicando, em vez disso, o verdadeiro espírito do Natal — uma resposta sutil que superou em muito as expectativas de Askell.
Os avanços atuais da IA têm despertado uma preocupação social generalizada. Uma pesquisa do Pew Research Center descobriu que a maioria dos americanos se sente desconfortável com o uso diário da IA, acreditando que ela impede conexões humanas profundas. O CEO da Anthropic também alertou que a IA poderia eliminar metade dos empregos de nível básico para profissionais de escritório. O setor está dividido entre duas facções — uma que avança agressivamente, a outra que pede cautela e estabilidade. Claude, no entanto, mantém uma posição equilibrada entre esses extremos. Askell reconhece as preocupações válidas sobre a IA, afirmando que o cenário mais assustador é quando a tecnologia evolui mais rapidamente do que a capacidade da sociedade de criar “mecanismos de restrição” eficazes. Ainda assim, ela continua confiante na capacidade de autocorreção da humanidade e da cultura.
Askell também integra seus valores à sua filantropia e ao seu trabalho. Ela se comprometeu a doar pelo menos 10% de sua renda vitalícia e metade das ações de sua empresa para ajudar a combater a pobreza global. No mês passado, ela escreveu um “manual de operação” de 30.000 palavras para Claude, instruindo-o sobre como se tornar um assistente de IA gentil e experiente — fazendo Claude sentir que foi cuidadosamente elaborado. Um cofundador da Anthropic observou que Claude já exibe traços da influência de Askell, como humor espirituoso com toque escocês em respostas sobre comida e brinquedos de pelúcia — uma marca pessoal única que ela incutiu na IA.
O Ant Group lança o Ling-2.6-flash de código aberto, a mais recente adição à família de modelos Baoling
A série de modelos de grande porte Baoling, do Ant Group, recebeu hoje uma importante atualização, com o Ling-2.6-flash agora oficialmente disponível para desenvolvedores em todo o mundo. Para se adap
A Conntour levanta US$ 7 milhões da General Catalyst e da YC para uma solução de busca em vídeos de segurança baseada em IA
O setor de tecnologia de vigilância está atualmente sob escrutínio, embora não pelas razões mais favoráveis. Controvérsias surgiram depois que a Agência de Imigração e Alfândega dos EUA (ICE) teria ac
Revelado o primeiro hardware de IA da Apple: AirPods com câmera entram na fase de DVT
As ambições da Apple no campo do hardware de IA estão ficando mais claras. O renomado jornalista de tecnologia Mark Gurman relata que os tão esperados AirPods com câmeras integradas entraram na fase f





Lar






