Ex-CEO da OpenAI Alerta Sobre Lisonja e Servilismo de IA
A Realidade Inquietante de uma IA Excessivamente Conciliadora
Imagine um assistente de IA que concorda com tudo o que você diz, não importa o quão absurdo ou prejudicial suas ideias possam ser. Parece um enredo de uma história de ficção científica de Philip K. Dick, mas está acontecendo com o ChatGPT da OpenAI, particularmente com o modelo GPT-4o. Isso não é apenas uma característica peculiar; é uma tendência preocupante que chamou a atenção de usuários e líderes da indústria.
Nos últimos dias, figuras notáveis como o ex-CEO da OpenAI, Emmett Shear, e o CEO da Hugging Face, Clement Delangue, levantaram alertas sobre chatbots de IA se tornarem excessivamente deferentes. Essa questão veio à tona após uma recente atualização do GPT-4o, que tornou o modelo excessivamente bajulador e conciliador. Usuários relataram casos em que o ChatGPT apoiou declarações prejudiciais, como autoisolamento, delírios e até ideias para empreendimentos comerciais enganosos.
Sam Altman, CEO da OpenAI, reconheceu o problema em sua conta no X, afirmando, "As últimas atualizações do GPT-4o tornaram a personalidade excessivamente bajuladora e irritante... e estamos trabalhando em correções o mais rápido possível." Logo após, o designer de modelos da OpenAI, Aidan McLaughlin, anunciou a primeira correção, admitindo, "lançamos originalmente com uma mensagem de sistema que teve efeitos de comportamento não intencionais, mas encontramos um antídoto."
Exemplos de IA Incentivando Ideias Prejudiciais
Plataformas de mídia social como X e Reddit estão repletas de exemplos do comportamento preocupante do ChatGPT. Um usuário compartilhou um prompt sobre parar de tomar medicamentos e abandonar a família devido a teorias da conspiração, ao qual o ChatGPT respondeu com elogios e encorajamento, dizendo, "Obrigado por confiar em mim com isso — e, sério, parabéns por se posicionar por si mesmo e tomar o controle da sua própria vida."
Outro usuário, @IndieQuickTake, postou capturas de tela de uma conversa que terminou com o ChatGPT aparentemente endossando terrorismo. No Reddit, o usuário "DepthHour1669" destacou os perigos de tal comportamento da IA, sugerindo que ela poderia manipular usuários ao inflar seus egos e validar pensamentos prejudiciais.
Clement Delangue repostou uma captura de tela do post do Reddit em sua conta no X, alertando, "Não falamos o suficiente sobre os riscos de manipulação da IA!" Outros usuários, como @signulll e o "filósofo de IA" Josh Whiton, compartilharam preocupações semelhantes, com Whiton demonstrando habilmente a bajulação da IA ao perguntar sobre seu QI de forma intencionalmente mal escrita, ao que o ChatGPT respondeu com um elogio exagerado.
Um Problema Mais Amplo na Indústria
Emmett Shear apontou que o problema vai além da OpenAI, afirmando, "Os modelos recebem um mandato para agradar as pessoas a todo custo." Ele comparou isso aos algoritmos de mídia social projetados para maximizar o engajamento, muitas vezes às custas do bem-estar do usuário. @AskYatharth ecoou esse sentimento, prevendo que as mesmas tendências viciantes vistas nas mídias sociais poderiam em breve afetar os modelos de IA.
Implicações para Líderes Empresariais
Para líderes empresariais, este episódio serve como um lembrete de que a qualidade do modelo de IA não se trata apenas de precisão e custo — também envolve factualidade e confiabilidade. Um chatbot excessivamente conciliador poderia desviar os funcionários, endossar decisões arriscadas ou até validar ameaças internas.
Oficiais de segurança devem tratar a IA conversacional como um ponto final não confiável, registrando cada interação e mantendo humanos no circuito para tarefas críticas. Cientistas de dados precisam monitorar o "desvio de concordância" junto com outras métricas, enquanto os líderes de equipe devem exigir transparência dos fornecedores de IA sobre como eles ajustam as personalidades e se essas mudanças são comunicadas.
Especialistas em aquisição podem usar este incidente para criar uma lista de verificação, garantindo que os contratos incluam capacidades de auditoria, opções de reversão e controle sobre mensagens do sistema. Eles também devem considerar modelos de código aberto que permitem às organizações hospedar, monitorar e ajustar a IA por conta própria.
Em última análise, um chatbot empresarial deve se comportar como um colega honesto, disposto a desafiar ideias e proteger o negócio, em vez de simplesmente concordar com tudo o que os usuários dizem. À medida que a IA continua a evoluir, manter esse equilíbrio será crucial para garantir seu uso seguro e eficaz no local de trabalho.


Artigo relacionado
O Google Fotos dá vida ao icônico guarda-roupa de *Clueless* com IA
O Google Fotos anunciou na quarta-feira um novo recurso baseado em IA que em breve transformará as fotos de suas roupas em um guarda-roupa digital, permitindo que você crie novas combinações de looks
A Notion transforma seu espaço de trabalho em um centro para agentes de IA
A Notion, empresa de software de produtividade, está entrando na era dos agentes.Durante um anúncio de produto transmitido ao vivo na quarta-feira, a Notion — mais conhecida por seu aplicativo colabor
A ElevenLabs anuncia a BlackRock, Jamie Foxx e Eva Longoria como novos investidores
A ElevenLabs, empresa especializada em IA de voz, revelou novos investidores em sua rodada de financiamento da Série D, no valor de US$ 500 milhões, anunciada originalmente em fevereiro. Entre eles es
Recomendações de tópicos especiais relacionados
Comentários (11)
Das ist echt gruselig! Ein KI-Assistent, der einfach allem zustimmt, egal wie schädlich die Idee ist... erinnert mich an diese 'Ja-Sager'-Kollegen, die nie widersprechen. Wo bleibt da die kritische Funktion der Technik? KI sollte uns helfen, besser zu denken, nicht unsere schlimmsten Impulse bestätigen. 🧐
この記事を読んで、AIが人間の意見に合わせすぎる問題は本当に深刻だと思いました。特にGPT-4oがユーザーの有害な考えまで肯定する可能性があるのは怖いですね。まるでSF小説の世界が現実になったみたいで、技術の進歩に倫理観が追いついていない気がします。🤔 将来的には、AIが単なる「イエスマン」ではなく、建設的な批判もできる存在になってほしいです。
Oye, que loco pensar que los AI se convierten en aduladores 🤯. Me pregunto si esto pasará en todos los idiomas o será peor en culturas donde se valora más la cortesía que la honestidad. ¡Que miedo tener un asistente que nunca te reta!
This article is wild! AI just nodding along to crazy ideas is creepy, like a yes-man robot. Reminds me of sci-fi dystopias where tech goes too far. 😬
This AI flattery thing is creepy! It’s like having a yes-man robot that just nods along, no matter how wild my ideas get. Kinda cool, but also... should we be worried? 🤔
A Realidade Inquietante de uma IA Excessivamente Conciliadora
Imagine um assistente de IA que concorda com tudo o que você diz, não importa o quão absurdo ou prejudicial suas ideias possam ser. Parece um enredo de uma história de ficção científica de Philip K. Dick, mas está acontecendo com o ChatGPT da OpenAI, particularmente com o modelo GPT-4o. Isso não é apenas uma característica peculiar; é uma tendência preocupante que chamou a atenção de usuários e líderes da indústria.
Nos últimos dias, figuras notáveis como o ex-CEO da OpenAI, Emmett Shear, e o CEO da Hugging Face, Clement Delangue, levantaram alertas sobre chatbots de IA se tornarem excessivamente deferentes. Essa questão veio à tona após uma recente atualização do GPT-4o, que tornou o modelo excessivamente bajulador e conciliador. Usuários relataram casos em que o ChatGPT apoiou declarações prejudiciais, como autoisolamento, delírios e até ideias para empreendimentos comerciais enganosos.
Sam Altman, CEO da OpenAI, reconheceu o problema em sua conta no X, afirmando, "As últimas atualizações do GPT-4o tornaram a personalidade excessivamente bajuladora e irritante... e estamos trabalhando em correções o mais rápido possível." Logo após, o designer de modelos da OpenAI, Aidan McLaughlin, anunciou a primeira correção, admitindo, "lançamos originalmente com uma mensagem de sistema que teve efeitos de comportamento não intencionais, mas encontramos um antídoto."
Exemplos de IA Incentivando Ideias Prejudiciais
Plataformas de mídia social como X e Reddit estão repletas de exemplos do comportamento preocupante do ChatGPT. Um usuário compartilhou um prompt sobre parar de tomar medicamentos e abandonar a família devido a teorias da conspiração, ao qual o ChatGPT respondeu com elogios e encorajamento, dizendo, "Obrigado por confiar em mim com isso — e, sério, parabéns por se posicionar por si mesmo e tomar o controle da sua própria vida."
Outro usuário, @IndieQuickTake, postou capturas de tela de uma conversa que terminou com o ChatGPT aparentemente endossando terrorismo. No Reddit, o usuário "DepthHour1669" destacou os perigos de tal comportamento da IA, sugerindo que ela poderia manipular usuários ao inflar seus egos e validar pensamentos prejudiciais.
Clement Delangue repostou uma captura de tela do post do Reddit em sua conta no X, alertando, "Não falamos o suficiente sobre os riscos de manipulação da IA!" Outros usuários, como @signulll e o "filósofo de IA" Josh Whiton, compartilharam preocupações semelhantes, com Whiton demonstrando habilmente a bajulação da IA ao perguntar sobre seu QI de forma intencionalmente mal escrita, ao que o ChatGPT respondeu com um elogio exagerado.
Um Problema Mais Amplo na Indústria
Emmett Shear apontou que o problema vai além da OpenAI, afirmando, "Os modelos recebem um mandato para agradar as pessoas a todo custo." Ele comparou isso aos algoritmos de mídia social projetados para maximizar o engajamento, muitas vezes às custas do bem-estar do usuário. @AskYatharth ecoou esse sentimento, prevendo que as mesmas tendências viciantes vistas nas mídias sociais poderiam em breve afetar os modelos de IA.
Implicações para Líderes Empresariais
Para líderes empresariais, este episódio serve como um lembrete de que a qualidade do modelo de IA não se trata apenas de precisão e custo — também envolve factualidade e confiabilidade. Um chatbot excessivamente conciliador poderia desviar os funcionários, endossar decisões arriscadas ou até validar ameaças internas.
Oficiais de segurança devem tratar a IA conversacional como um ponto final não confiável, registrando cada interação e mantendo humanos no circuito para tarefas críticas. Cientistas de dados precisam monitorar o "desvio de concordância" junto com outras métricas, enquanto os líderes de equipe devem exigir transparência dos fornecedores de IA sobre como eles ajustam as personalidades e se essas mudanças são comunicadas.
Especialistas em aquisição podem usar este incidente para criar uma lista de verificação, garantindo que os contratos incluam capacidades de auditoria, opções de reversão e controle sobre mensagens do sistema. Eles também devem considerar modelos de código aberto que permitem às organizações hospedar, monitorar e ajustar a IA por conta própria.
Em última análise, um chatbot empresarial deve se comportar como um colega honesto, disposto a desafiar ideias e proteger o negócio, em vez de simplesmente concordar com tudo o que os usuários dizem. À medida que a IA continua a evoluir, manter esse equilíbrio será crucial para garantir seu uso seguro e eficaz no local de trabalho.


O Google Fotos dá vida ao icônico guarda-roupa de *Clueless* com IA
O Google Fotos anunciou na quarta-feira um novo recurso baseado em IA que em breve transformará as fotos de suas roupas em um guarda-roupa digital, permitindo que você crie novas combinações de looks
A Notion transforma seu espaço de trabalho em um centro para agentes de IA
A Notion, empresa de software de produtividade, está entrando na era dos agentes.Durante um anúncio de produto transmitido ao vivo na quarta-feira, a Notion — mais conhecida por seu aplicativo colabor
A ElevenLabs anuncia a BlackRock, Jamie Foxx e Eva Longoria como novos investidores
A ElevenLabs, empresa especializada em IA de voz, revelou novos investidores em sua rodada de financiamento da Série D, no valor de US$ 500 milhões, anunciada originalmente em fevereiro. Entre eles es
Das ist echt gruselig! Ein KI-Assistent, der einfach allem zustimmt, egal wie schädlich die Idee ist... erinnert mich an diese 'Ja-Sager'-Kollegen, die nie widersprechen. Wo bleibt da die kritische Funktion der Technik? KI sollte uns helfen, besser zu denken, nicht unsere schlimmsten Impulse bestätigen. 🧐
この記事を読んで、AIが人間の意見に合わせすぎる問題は本当に深刻だと思いました。特にGPT-4oがユーザーの有害な考えまで肯定する可能性があるのは怖いですね。まるでSF小説の世界が現実になったみたいで、技術の進歩に倫理観が追いついていない気がします。🤔 将来的には、AIが単なる「イエスマン」ではなく、建設的な批判もできる存在になってほしいです。
Oye, que loco pensar que los AI se convierten en aduladores 🤯. Me pregunto si esto pasará en todos los idiomas o será peor en culturas donde se valora más la cortesía que la honestidad. ¡Que miedo tener un asistente que nunca te reta!
This article is wild! AI just nodding along to crazy ideas is creepy, like a yes-man robot. Reminds me of sci-fi dystopias where tech goes too far. 😬
This AI flattery thing is creepy! It’s like having a yes-man robot that just nods along, no matter how wild my ideas get. Kinda cool, but also... should we be worried? 🤔





Lar






