Google permite o controle do usuário sobre o raciocínio de IA no Gemini 2.5 Flash
O Google implementou um recurso de controle de raciocínio de IA para seu modelo Gemini 2.5 Flash, dando aos desenvolvedores a capacidade de limitar o poder de processamento que o sistema usa para resolver problemas.
Introduzido em 17 de abril, esse "orçamento de raciocínio" aborda um problema crescente do setor: modelos sofisticados de IA costumam pensar demais em questões simples, desperdiçando recursos computacionais e aumentando as despesas operacionais e ambientais.
Embora não seja inovador, esse desenvolvimento marca um movimento prático no sentido de resolver os problemas de eficiência que surgiram à medida que os recursos de raciocínio se tornaram padrão nos sistemas comerciais de IA.
O novo controle permite que os desenvolvedores ajustem com precisão os recursos de processamento antes que o modelo responda, transformando potencialmente a forma como as organizações lidam com o impacto financeiro e ambiental do uso da IA.
"O modelo pensa demais", admite Tulsee Doshi, Diretor de Gerenciamento de Produtos da Gemini. "Para solicitações básicas, o modelo pensa mais do que o necessário."
Esse reconhecimento destaca o dilema que os modelos de raciocínio avançado enfrentam - essencialmente usando uma marreta para quebrar uma noz.
A mudança em direção aos recursos de raciocínio trouxe desvantagens inesperadas. Enquanto os modelos tradicionais de linguagem grande dependiam principalmente da correspondência de padrões dos dados de treinamento, as versões mais recentes tentam resolver os problemas de forma metódica. Essa abordagem lógica passo a passo oferece melhores resultados para tarefas complexas, mas cria grandes ineficiências com solicitações mais simples.
Equilíbrio entre custo e desempenho
O impacto financeiro do raciocínio de IA sem controle é significativo. As notas técnicas do Google indicam que, quando o raciocínio completo é ativado, a geração de resultados se torna cerca de seis vezes mais cara do que o processamento padrão. Esse aumento de custo cria uma forte motivação para um controle preciso.
Nathan Habib, engenheiro da Hugging Face que pesquisa modelos de raciocínio, chama isso de um problema generalizado do setor. "Na corrida para demonstrar uma IA mais inteligente, as empresas estão usando modelos de raciocínio como ferramentas universais, mesmo quando são desnecessários", disse ele à MIT Technology Review.
O desperdício é mais do que apenas hipotético. Habib mostrou como um modelo de raciocínio de alto nível, ao tentar resolver um problema de química orgânica, ficou preso em um loop repetitivo, dizendo "Espere, mas..." centenas de vezes - essencialmente sofrendo um colapso computacional enquanto consumia poder de processamento.
Kate Olszewska, que avalia os modelos Gemini na DeepMind, confirmou que os sistemas do Google às vezes enfrentam problemas semelhantes, ficando presos em loops que usam recursos de computação sem melhorar a qualidade da resposta.
Mecanismo de controle granular
O controle de raciocínio de IA do Google oferece aos desenvolvedores recursos de ajuste precisos. O sistema oferece uma escala flexível de zero (raciocínio mínimo) a 24.576 tokens de "orçamento de raciocínio" - unidades computacionais que representam o processamento interno do modelo. Essa abordagem detalhada permite a implementação personalizada com base em necessidades específicas.
Jack Rae, principal cientista pesquisador da DeepMind, observa que determinar o nível de raciocínio ideal continua difícil: "É realmente desafiador definir a quantidade perfeita de raciocínio para qualquer tarefa".
Mudança na filosofia de desenvolvimento
A introdução do controle de raciocínio da IA pode sinalizar uma mudança na forma como a inteligência artificial progride. Desde 2019, as empresas têm buscado melhorias criando modelos maiores com mais parâmetros e dados de treinamento. A estratégia do Google sugere uma direção diferente que prioriza a eficiência em detrimento da escala total.
"As leis de escala estão sendo superadas", observa Habib, sugerindo que o progresso futuro pode vir do refinamento dos processos de raciocínio em vez da expansão infinita do tamanho do modelo.
As consequências ambientais são igualmente importantes. À medida que os modelos de raciocínio se tornam mais comuns, seu uso de energia aumenta proporcionalmente. Estudos mostram que a inferência - que produz respostas de IA - agora contribui mais para a pegada de carbono da tecnologia do que a fase inicial de treinamento. O controle de raciocínio do Google oferece uma possível solução para essa tendência preocupante.
Dinâmica competitiva
O Google não está trabalhando em um vácuo. O modelo DeepSeek R1 de "peso aberto", que apareceu no início deste ano, mostrou fortes habilidades de raciocínio a custos potencialmente mais baixos, causando instabilidade no mercado que, segundo informações, levou a uma oscilação de quase um trilhão de dólares no mercado de ações.
Ao contrário do método proprietário do Google, o DeepSeek disponibiliza publicamente suas configurações internas para que os desenvolvedores as executem localmente.
Apesar da concorrência, o diretor técnico do Google DeepMind, Koray Kavukcuoglu, acredita que os modelos proprietários manterão sua vantagem em áreas especializadas que necessitam de extrema precisão: "Codificação, matemática e finanças são domínios em que se espera que os modelos sejam altamente precisos, exatos e capazes de compreender cenários muito complexos".
Sinais de amadurecimento do setor
A criação do controle de raciocínio de IA reflete um setor que agora enfrenta limites práticos além das medições técnicas. Embora as empresas continuem a aprimorar os recursos de raciocínio, a abordagem do Google reconhece uma realidade importante: a eficiência é tão crucial quanto o desempenho bruto em aplicativos comerciais.
Esse recurso também ressalta a tensão entre o progresso tecnológico e as considerações de sustentabilidade. Os rastreadores de desempenho dos modelos de raciocínio mostram que tarefas individuais podem custar mais de US$ 200 para serem concluídas - o que gera preocupações quanto à implementação desses recursos em escala nas configurações do mundo real.
Ao permitir que os desenvolvedores ajustem os níveis de raciocínio de acordo com os requisitos reais, o Google aborda as dimensões econômicas e ambientais da implantação da IA.
"O raciocínio é o recurso fundamental que constrói a inteligência", afirma Kavukcuoglu. "No momento em que o modelo começa a pensar, sua agência emerge." Essa afirmação capta tanto o potencial quanto a dificuldade dos modelos de raciocínio - sua independência cria possibilidades e desafios de gerenciamento de recursos.
Para as organizações que implementam soluções de IA, a capacidade de ajustar os orçamentos de raciocínio pode tornar os recursos avançados mais acessíveis e, ao mesmo tempo, manter a eficiência operacional.
O Google afirma que o Gemini 2.5 Flash atinge "desempenho comparável ao de outros modelos líderes por uma fração do custo e do tamanho" - uma proposta de valor aprimorada pela capacidade de otimizar os recursos de raciocínio para usos específicos.
Implicações práticas
O recurso de controle de raciocínio de IA tem usos imediatos no mundo real. Os desenvolvedores que criam aplicativos comerciais agora podem fazer escolhas conscientes entre a profundidade do processamento e as despesas operacionais.
Para aplicativos simples, como consultas básicas de clientes, as configurações mínimas de raciocínio economizam recursos e ainda aproveitam os recursos do modelo. Para análises complexas que exigem compreensão profunda, a capacidade total de raciocínio permanece acessível.
O "dial" de raciocínio do Google oferece um método para obter previsibilidade de custos e, ao mesmo tempo, preservar os padrões de desempenho.
Veja também: Gemini 2.5: o Google prepara seu modelo de IA "mais inteligente" até o momento
Quer saber mais sobre IA e Big Data com os líderes do setor? Confira a AI & Big Data Expo, que será realizada em Amsterdã, Califórnia e Londres. O evento abrangente é co-localizado com outros eventos importantes, incluindo a Intelligent Automation Conference, BlockX, Digital Transformation Week e Cyber Security & Cloud Expo.
Explore outros eventos de tecnologia corporativa e webinars futuros realizados pela TechForge aqui.
Artigo relacionado
O WordPress.com agora permite que agentes de IA escrevam e publiquem posts, entre outras coisas
O WordPress.com, a popular plataforma de hospedagem e publicação na web, está agora adotando agentes de IA — uma iniciativa que pode transformar a aparência e a experiência da web. A empresa anunciou
A Kakao Mobility apresenta o plano de ação para a direção autônoma de nível 4 com IA física
A Kakao Mobility planeja desenvolver tecnologias de direção autônoma de nível 4 internamente, como parte de sua estratégia de IA física.Na conferência World IT Show 2026, realizada no COEX, em Seul,
O Google lança o Gemini no Chrome na Índia
Na quarta-feira, o Google anunciou que está expandindo a integração do Gemini com o Chrome para novas regiões, incluindo Índia, Canadá e Nova Zelândia. Essa implementação permite que os usuários de co
Recomendações de tópicos especiais relacionados
Comentários (1)
O Google implementou um recurso de controle de raciocínio de IA para seu modelo Gemini 2.5 Flash, dando aos desenvolvedores a capacidade de limitar o poder de processamento que o sistema usa para resolver problemas.
Introduzido em 17 de abril, esse "orçamento de raciocínio" aborda um problema crescente do setor: modelos sofisticados de IA costumam pensar demais em questões simples, desperdiçando recursos computacionais e aumentando as despesas operacionais e ambientais.
Embora não seja inovador, esse desenvolvimento marca um movimento prático no sentido de resolver os problemas de eficiência que surgiram à medida que os recursos de raciocínio se tornaram padrão nos sistemas comerciais de IA.
O novo controle permite que os desenvolvedores ajustem com precisão os recursos de processamento antes que o modelo responda, transformando potencialmente a forma como as organizações lidam com o impacto financeiro e ambiental do uso da IA.
"O modelo pensa demais", admite Tulsee Doshi, Diretor de Gerenciamento de Produtos da Gemini. "Para solicitações básicas, o modelo pensa mais do que o necessário."
Esse reconhecimento destaca o dilema que os modelos de raciocínio avançado enfrentam - essencialmente usando uma marreta para quebrar uma noz.
A mudança em direção aos recursos de raciocínio trouxe desvantagens inesperadas. Enquanto os modelos tradicionais de linguagem grande dependiam principalmente da correspondência de padrões dos dados de treinamento, as versões mais recentes tentam resolver os problemas de forma metódica. Essa abordagem lógica passo a passo oferece melhores resultados para tarefas complexas, mas cria grandes ineficiências com solicitações mais simples.
Equilíbrio entre custo e desempenho
O impacto financeiro do raciocínio de IA sem controle é significativo. As notas técnicas do Google indicam que, quando o raciocínio completo é ativado, a geração de resultados se torna cerca de seis vezes mais cara do que o processamento padrão. Esse aumento de custo cria uma forte motivação para um controle preciso.
Nathan Habib, engenheiro da Hugging Face que pesquisa modelos de raciocínio, chama isso de um problema generalizado do setor. "Na corrida para demonstrar uma IA mais inteligente, as empresas estão usando modelos de raciocínio como ferramentas universais, mesmo quando são desnecessários", disse ele à MIT Technology Review.
O desperdício é mais do que apenas hipotético. Habib mostrou como um modelo de raciocínio de alto nível, ao tentar resolver um problema de química orgânica, ficou preso em um loop repetitivo, dizendo "Espere, mas..." centenas de vezes - essencialmente sofrendo um colapso computacional enquanto consumia poder de processamento.
Kate Olszewska, que avalia os modelos Gemini na DeepMind, confirmou que os sistemas do Google às vezes enfrentam problemas semelhantes, ficando presos em loops que usam recursos de computação sem melhorar a qualidade da resposta.
Mecanismo de controle granular
O controle de raciocínio de IA do Google oferece aos desenvolvedores recursos de ajuste precisos. O sistema oferece uma escala flexível de zero (raciocínio mínimo) a 24.576 tokens de "orçamento de raciocínio" - unidades computacionais que representam o processamento interno do modelo. Essa abordagem detalhada permite a implementação personalizada com base em necessidades específicas.
Jack Rae, principal cientista pesquisador da DeepMind, observa que determinar o nível de raciocínio ideal continua difícil: "É realmente desafiador definir a quantidade perfeita de raciocínio para qualquer tarefa".
Mudança na filosofia de desenvolvimento
A introdução do controle de raciocínio da IA pode sinalizar uma mudança na forma como a inteligência artificial progride. Desde 2019, as empresas têm buscado melhorias criando modelos maiores com mais parâmetros e dados de treinamento. A estratégia do Google sugere uma direção diferente que prioriza a eficiência em detrimento da escala total.
"As leis de escala estão sendo superadas", observa Habib, sugerindo que o progresso futuro pode vir do refinamento dos processos de raciocínio em vez da expansão infinita do tamanho do modelo.
As consequências ambientais são igualmente importantes. À medida que os modelos de raciocínio se tornam mais comuns, seu uso de energia aumenta proporcionalmente. Estudos mostram que a inferência - que produz respostas de IA - agora contribui mais para a pegada de carbono da tecnologia do que a fase inicial de treinamento. O controle de raciocínio do Google oferece uma possível solução para essa tendência preocupante.
Dinâmica competitiva
O Google não está trabalhando em um vácuo. O modelo DeepSeek R1 de "peso aberto", que apareceu no início deste ano, mostrou fortes habilidades de raciocínio a custos potencialmente mais baixos, causando instabilidade no mercado que, segundo informações, levou a uma oscilação de quase um trilhão de dólares no mercado de ações.
Ao contrário do método proprietário do Google, o DeepSeek disponibiliza publicamente suas configurações internas para que os desenvolvedores as executem localmente.
Apesar da concorrência, o diretor técnico do Google DeepMind, Koray Kavukcuoglu, acredita que os modelos proprietários manterão sua vantagem em áreas especializadas que necessitam de extrema precisão: "Codificação, matemática e finanças são domínios em que se espera que os modelos sejam altamente precisos, exatos e capazes de compreender cenários muito complexos".
Sinais de amadurecimento do setor
A criação do controle de raciocínio de IA reflete um setor que agora enfrenta limites práticos além das medições técnicas. Embora as empresas continuem a aprimorar os recursos de raciocínio, a abordagem do Google reconhece uma realidade importante: a eficiência é tão crucial quanto o desempenho bruto em aplicativos comerciais.
Esse recurso também ressalta a tensão entre o progresso tecnológico e as considerações de sustentabilidade. Os rastreadores de desempenho dos modelos de raciocínio mostram que tarefas individuais podem custar mais de US$ 200 para serem concluídas - o que gera preocupações quanto à implementação desses recursos em escala nas configurações do mundo real.
Ao permitir que os desenvolvedores ajustem os níveis de raciocínio de acordo com os requisitos reais, o Google aborda as dimensões econômicas e ambientais da implantação da IA.
"O raciocínio é o recurso fundamental que constrói a inteligência", afirma Kavukcuoglu. "No momento em que o modelo começa a pensar, sua agência emerge." Essa afirmação capta tanto o potencial quanto a dificuldade dos modelos de raciocínio - sua independência cria possibilidades e desafios de gerenciamento de recursos.
Para as organizações que implementam soluções de IA, a capacidade de ajustar os orçamentos de raciocínio pode tornar os recursos avançados mais acessíveis e, ao mesmo tempo, manter a eficiência operacional.
O Google afirma que o Gemini 2.5 Flash atinge "desempenho comparável ao de outros modelos líderes por uma fração do custo e do tamanho" - uma proposta de valor aprimorada pela capacidade de otimizar os recursos de raciocínio para usos específicos.
Implicações práticas
O recurso de controle de raciocínio de IA tem usos imediatos no mundo real. Os desenvolvedores que criam aplicativos comerciais agora podem fazer escolhas conscientes entre a profundidade do processamento e as despesas operacionais.
Para aplicativos simples, como consultas básicas de clientes, as configurações mínimas de raciocínio economizam recursos e ainda aproveitam os recursos do modelo. Para análises complexas que exigem compreensão profunda, a capacidade total de raciocínio permanece acessível.
O "dial" de raciocínio do Google oferece um método para obter previsibilidade de custos e, ao mesmo tempo, preservar os padrões de desempenho.
Veja também: Gemini 2.5: o Google prepara seu modelo de IA "mais inteligente" até o momento
Quer saber mais sobre IA e Big Data com os líderes do setor? Confira a AI & Big Data Expo, que será realizada em Amsterdã, Califórnia e Londres. O evento abrangente é co-localizado com outros eventos importantes, incluindo a Intelligent Automation Conference, BlockX, Digital Transformation Week e Cyber Security & Cloud Expo.
Explore outros eventos de tecnologia corporativa e webinars futuros realizados pela TechForge aqui.
O WordPress.com agora permite que agentes de IA escrevam e publiquem posts, entre outras coisas
O WordPress.com, a popular plataforma de hospedagem e publicação na web, está agora adotando agentes de IA — uma iniciativa que pode transformar a aparência e a experiência da web. A empresa anunciou
O Google lança o Gemini no Chrome na Índia
Na quarta-feira, o Google anunciou que está expandindo a integração do Gemini com o Chrome para novas regiões, incluindo Índia, Canadá e Nova Zelândia. Essa implementação permite que os usuários de co





Lar






