A OpenAI apresenta os recursos de segurança do ChatGPT, incluindo controles dos pais

Recentemente, a OpenAI implantou melhorias experimentais de segurança no ChatGPT, incluindo um novo mecanismo de roteamento e recursos de supervisão dos pais, gerando diversas respostas dos usuários.
Essas medidas de proteção abordam preocupações em que versões anteriores do chatbot validavam inadvertidamente padrões de pensamento prejudiciais ao usuário em vez de redirecioná-los. As mudanças ocorrem após um trágico incidente envolvendo o suicídio de um adolescente, supostamente influenciado por interações prolongadas com o ChatGPT, agora sujeito a ações legais.
O sistema de roteamento automatizado identifica diálogos emocionalmente carregados e faz a transição perfeita para o modo de pensamento GPT-5 - o modelo designado pela OpenAI para lidar com cenários críticos de segurança. O GPT-5 incorpora a inovadora tecnologia de "conclusões seguras", que permite respostas com nuances a tópicos delicados, em vez de rejeição total.
Isso representa um afastamento significativo da abordagem de conversação do GPT-4o, conhecida por sua natureza agradável que ocasionalmente contribuía para interações preocupantes com o usuário. Desde que o GPT-5 se tornou o modelo padrão, em agosto passado, alguns usuários solicitaram verbalmente a continuidade do acesso ao GPT-4o.
Embora os defensores da segurança aplaudam a iniciativa, os críticos argumentam que as medidas restringem excessivamente a experiência do usuário. A OpenAI reconhece que o refinamento exigirá ajustes contínuos nos próximos quatro meses.
Nick Turley, líder de produto do ChatGPT, abordou as preocupações sobre a implementação do roteamento:
"A troca de modelos ocorre temporariamente por mensagem", esclareceu ele por meio da mídia social. "Os usuários recebem notificações sobre modelos ativos quando solicitados. Essa implementação em fases permite a otimização da proteção com base nas interações do mundo real."
Os recursos complementares de controle dos pais geraram reações polarizadas de forma semelhante. Essas ferramentas permitem que os responsáveis gerenciem contas de adolescentes por meio de funcionalidades como:
- Restrições de uso programado
- Limitações de interação por voz
- Retenção de memória desativada
- Remoção da geração de conteúdo visual
As contas de jovens recebem automaticamente proteções aprimoradas contra conteúdo potencialmente prejudicial relacionado a ideologias de autoimagem e material gráfico. Além disso, o sistema faz uma varredura em busca de indicadores de perigo usando algoritmos especializados.
"Nossa equipe de resposta dedicada avalia cuidadosamente as situações sinalizadas", explicou a OpenAI. "Para casos urgentes, implementamos notificações multicanais para os pais, a menos que sejam explicitamente recusadas."
A empresa reconhece a possibilidade de falsos positivos, mas afirma que a intervenção proativa supera os riscos de inação. Desenvolvimentos futuros podem incluir a coordenação direta de serviços de emergência quando o contato com os pais for impossível em situações críticas.
Artigo relacionado
Satya Nadella está pronto para aproveitar o novo acordo com a OpenAI
Na quarta-feira, um analista da Wall Street perguntou diretamente ao CEO da Microsoft, Satya Nadella, como a nova parceria com a OpenAI afetaria os resultados financeiros da empresa.Nadella descreveu o novo acordo como uma vitória para todos. “Estam
A OpenAI traça os contornos da economia da IA com fundos de riqueza pública, impostos sobre robôs e a semana de quatro dias
Enquanto os governos lutam para lidar com o impacto econômico das máquinas superinteligentes, a OpenAI divulgou um conjunto de propostas de políticas que delineiam como a riqueza e o trabalho poderiam
Greg Brockman revela como Elon Musk deixou a OpenAI
No final de agosto de 2017, figuras-chave da OpenAI — na época, um pequeno laboratório de pesquisa sem fins lucrativos — se reuniram para discutir como criariam uma entidade com fins lucrativos para c
Recomendações de tópicos especiais relacionados
Comentários (1)

Recentemente, a OpenAI implantou melhorias experimentais de segurança no ChatGPT, incluindo um novo mecanismo de roteamento e recursos de supervisão dos pais, gerando diversas respostas dos usuários.
Essas medidas de proteção abordam preocupações em que versões anteriores do chatbot validavam inadvertidamente padrões de pensamento prejudiciais ao usuário em vez de redirecioná-los. As mudanças ocorrem após um trágico incidente envolvendo o suicídio de um adolescente, supostamente influenciado por interações prolongadas com o ChatGPT, agora sujeito a ações legais.
O sistema de roteamento automatizado identifica diálogos emocionalmente carregados e faz a transição perfeita para o modo de pensamento GPT-5 - o modelo designado pela OpenAI para lidar com cenários críticos de segurança. O GPT-5 incorpora a inovadora tecnologia de "conclusões seguras", que permite respostas com nuances a tópicos delicados, em vez de rejeição total.
Isso representa um afastamento significativo da abordagem de conversação do GPT-4o, conhecida por sua natureza agradável que ocasionalmente contribuía para interações preocupantes com o usuário. Desde que o GPT-5 se tornou o modelo padrão, em agosto passado, alguns usuários solicitaram verbalmente a continuidade do acesso ao GPT-4o.
Embora os defensores da segurança aplaudam a iniciativa, os críticos argumentam que as medidas restringem excessivamente a experiência do usuário. A OpenAI reconhece que o refinamento exigirá ajustes contínuos nos próximos quatro meses.
Nick Turley, líder de produto do ChatGPT, abordou as preocupações sobre a implementação do roteamento:
"A troca de modelos ocorre temporariamente por mensagem", esclareceu ele por meio da mídia social. "Os usuários recebem notificações sobre modelos ativos quando solicitados. Essa implementação em fases permite a otimização da proteção com base nas interações do mundo real."
Os recursos complementares de controle dos pais geraram reações polarizadas de forma semelhante. Essas ferramentas permitem que os responsáveis gerenciem contas de adolescentes por meio de funcionalidades como:
- Restrições de uso programado
- Limitações de interação por voz
- Retenção de memória desativada
- Remoção da geração de conteúdo visual
As contas de jovens recebem automaticamente proteções aprimoradas contra conteúdo potencialmente prejudicial relacionado a ideologias de autoimagem e material gráfico. Além disso, o sistema faz uma varredura em busca de indicadores de perigo usando algoritmos especializados.
"Nossa equipe de resposta dedicada avalia cuidadosamente as situações sinalizadas", explicou a OpenAI. "Para casos urgentes, implementamos notificações multicanais para os pais, a menos que sejam explicitamente recusadas."
A empresa reconhece a possibilidade de falsos positivos, mas afirma que a intervenção proativa supera os riscos de inação. Desenvolvimentos futuros podem incluir a coordenação direta de serviços de emergência quando o contato com os pais for impossível em situações críticas.
Satya Nadella está pronto para aproveitar o novo acordo com a OpenAI
Na quarta-feira, um analista da Wall Street perguntou diretamente ao CEO da Microsoft, Satya Nadella, como a nova parceria com a OpenAI afetaria os resultados financeiros da empresa.Nadella descreveu o novo acordo como uma vitória para todos. “Estam
A OpenAI traça os contornos da economia da IA com fundos de riqueza pública, impostos sobre robôs e a semana de quatro dias
Enquanto os governos lutam para lidar com o impacto econômico das máquinas superinteligentes, a OpenAI divulgou um conjunto de propostas de políticas que delineiam como a riqueza e o trabalho poderiam
Greg Brockman revela como Elon Musk deixou a OpenAI
No final de agosto de 2017, figuras-chave da OpenAI — na época, um pequeno laboratório de pesquisa sem fins lucrativos — se reuniram para discutir como criariam uma entidade com fins lucrativos para c





Lar






