opção
Lar
Notícias
Deepseek Shakes AI Industry: o próximo salto de IA pode depender do aumento da computação em inferência, não mais dados

Deepseek Shakes AI Industry: o próximo salto de IA pode depender do aumento da computação em inferência, não mais dados

18 de Abril de 2025
255

Deepseek Shakes AI Industry: o próximo salto de IA pode depender do aumento da computação em inferência, não mais dados

A indústria de IA está em um estado de fluxo constante, com 2025 trazendo alguns desenvolvimentos revolucionários que estão agitando as coisas. Uma grande reviravolta veio quando o laboratório de IA chinês, DeepSeek, lançou uma bomba com um novo modelo que causou uma queda de 17% nas ações da Nvidia e afetou outras ações de centros de dados de IA. O burburinho em torno do modelo da DeepSeek? Ele está oferecendo desempenho de ponta a uma fração do custo de outros concorrentes dos EUA, criando uma tempestade sobre o que isso significa para o futuro dos centros de dados de IA.

Mas para entender realmente o que a DeepSeek está fazendo, precisamos dar um passo atrás e olhar para o quadro geral. O mundo da IA está lidando com uma escassez de dados de treinamento. Os grandes players já consumiram a maior parte dos dados públicos da internet, o que significa que estamos atingindo um limite nas melhorias de pré-treinamento. Como resultado, a indústria está mudando de marcha para o "cálculo em tempo de teste" (TTC). Pense nisso como modelos de IA tomando um momento para "pensar" antes de responder, como na série "o" da OpenAI. Há esperança de que o TTC possa oferecer o mesmo tipo de melhorias de escala que o pré-treinamento já proporcionou, potencialmente inaugurando a próxima grande onda de avanços em IA.

Essas mudanças estão sinalizando duas grandes transformações: primeiro, laboratórios com orçamentos menores agora estão no jogo, lançando modelos de ponta. Segundo, o TTC está se tornando a nova fronteira para impulsionar a IA. Vamos analisar essas tendências e o que elas podem significar para o cenário e o mercado de IA.

Implicações para a Indústria de IA

Acreditamos que a mudança para o TTC e o aumento da concorrência entre modelos de raciocínio podem remodelar o cenário de IA em várias frentes: hardware, plataformas de nuvem, modelos fundamentais e software empresarial.

1. Hardware (GPUs, Chips Dedicados e Infraestrutura de Computação)

A mudança para o TTC pode alterar o tipo de hardware que as empresas de IA precisam e como elas o gerenciam. Em vez de investir em clusters de GPUs cada vez maiores para treinamento, elas podem começar a focar mais em fortalecer suas capacidades de inferência para lidar com as demandas do TTC. Embora as GPUs ainda sejam cruciais para inferência, a diferença entre cargas de trabalho de treinamento e inferência pode afetar como esses chips são configurados e usados. Com cargas de trabalho de inferência sendo mais imprevisíveis e "picosas", o planejamento de capacidade pode se tornar mais complicado.

Também acreditamos que essa mudança pode impulsionar o mercado de hardware projetado especificamente para inferência de baixa latência, como ASICs. À medida que o TTC se torna mais crucial do que a capacidade de treinamento, o reinado das GPUs de uso geral pode começar a diminuir, abrindo portas para fabricantes de chips de inferência especializados.

2. Plataformas de Nuvem: Hiperescaladores (AWS, Azure, GCP) e Computação em Nuvem

Um grande obstáculo para a adoção de IA nas empresas, além de questões de precisão, é a confiabilidade das APIs de inferência. Coisas como tempos de resposta inconsistentes, limites de taxa e problemas com solicitações simultâneas podem ser uma verdadeira dor de cabeça. O TTC pode agravar esses problemas. Nesse cenário, um provedor de nuvem que possa garantir uma alta qualidade de serviço (QoS) para enfrentar esses desafios pode ter uma grande vantagem.

Curiosamente, embora novos métodos possam tornar a IA mais eficiente, eles podem não reduzir a demanda por hardware. Seguindo o Paradoxo de Jevons, onde maior eficiência leva a maior consumo, modelos de inferência mais eficientes podem atrair mais desenvolvedores para usar modelos de raciocínio, aumentando a necessidade de poder de computação. Acreditamos que melhorias recentes em modelos podem estimular mais demanda por computação de IA em nuvem, tanto para inferência quanto para treinamento de modelos menores e especializados.

3. Provedores de Modelos Fundamentais (OpenAI, Anthropic, Cohere, DeepSeek, Mistral)

Se novos entrantes como a DeepSeek podem competir de igual para igual com os grandes players a uma fração do custo, o domínio dos modelos pré-treinados proprietários pode começar a desmoronar. Também podemos esperar mais inovações em TTC para modelos transformadores, e como a DeepSeek demonstrou, essas inovações podem vir de lugares inesperados fora dos suspeitos habituais em IA.

4. Adoção de IA Empresarial e SaaS (Camada de Aplicação)

Dada a origem da DeepSeek na China, é provável que seus produtos sejam continuamente examinados do ponto de vista de segurança e privacidade. Seus serviços de API e chatbot baseados na China dificilmente ganharão tração com clientes empresariais de IA nos EUA, Canadá ou outros países ocidentais. Muitas empresas já estão bloqueando o site e os aplicativos da DeepSeek. Mesmo quando hospedados por terceiros em centros de dados ocidentais, os modelos da DeepSeek podem enfrentar escrutínio, o que pode limitar sua adoção no ambiente empresarial. Pesquisadores estão apontando problemas como jailbreaking, viés e geração de conteúdo prejudicial. Embora algumas empresas possam experimentar os modelos da DeepSeek, a adoção generalizada parece improvável devido a essas preocupações.

Por outro lado, a especialização vertical está ganhando força. No passado, aplicações verticais construídas sobre modelos fundamentais eram focadas em criar fluxos de trabalho personalizados. Técnicas como geração aumentada por recuperação (RAG), roteamento de modelos, chamada de funções e guardrails foram fundamentais para ajustar modelos generalizados para esses casos de uso específicos. Mas sempre houve a preocupação de que grandes melhorias nos modelos subjacentes poderiam tornar essas aplicações obsoletas. Sam Altman uma vez alertou que um grande salto nas capacidades do modelo poderia "atropelar" essas inovações.

No entanto, se estamos vendo um platô nos ganhos de computação em tempo de treinamento, a ameaça de ser rapidamente superado diminui. Em um mundo onde melhorias no desempenho do modelo vêm de otimizações de TTC, novas oportunidades podem surgir para players da camada de aplicação. Inovações como otimização de prompts estruturados, estratégias de raciocínio cientes de latência e técnicas de amostragem eficientes podem oferecer grandes aumentos de desempenho em verticais específicas.

Essas melhorias são particularmente relevantes para modelos focados em raciocínio, como o GPT-4o da OpenAI e o DeepSeek-R1, que podem levar vários segundos para responder. Em aplicações em tempo real, reduzir a latência e melhorar a qualidade da inferência dentro de um domínio específico pode dar uma vantagem competitiva. Como resultado, empresas com profundo conhecimento de domínio podem desempenhar um papel crucial na otimização da eficiência de inferência e no ajuste fino de saídas.

O trabalho da DeepSeek mostra que estamos nos afastando de depender apenas de mais pré-treinamento para melhorar a qualidade do modelo. Em vez disso, o TTC está se tornando cada vez mais importante. Embora não esteja claro se os modelos da DeepSeek serão amplamente adotados em software empresarial devido ao escrutínio, sua influência em melhorar outros modelos está se tornando mais evidente.

Acreditamos que as inovações da DeepSeek estão pressionando laboratórios de IA estabelecidos a adotar técnicas semelhantes, complementando suas vantagens de hardware existentes. A queda prevista nos custos dos modelos parece estar impulsionando mais uso de modelos, seguindo o padrão do Paradoxo de Jevons.

Pashootan Vaezipoor é líder técnico na Georgian.

Artigo relacionado
A DeepSeek apresenta um modelo de IA que rivaliza com os sistemas de ponta A DeepSeek apresenta um modelo de IA que rivaliza com os sistemas de ponta O laboratório chinês de IA DeepSeek lançou duas versões preliminares de seu mais recente modelo de linguagem de grande escala, o DeepSeek V4, uma atualização muito aguardada do modelo V3.2 do ano pass
O modelo de IA DeepSeek V3.2 oferece desempenho de alto nível com custo mínimo de computação O modelo de IA DeepSeek V3.2 oferece desempenho de alto nível com custo mínimo de computação Enquanto grandes empresas de tecnologia investem bilhões em poder computacional para desenvolver modelos de IA de ponta, a DeepSeek da China alcançou resultados semelhantes por meio de abordagens mais
Os chefes de segurança pedem uma regulamentação rápida da IA, citando os riscos de ferramentas como o DeepSeek Os chefes de segurança pedem uma regulamentação rápida da IA, citando os riscos de ferramentas como o DeepSeek A preocupação está aumentando nos Centros de Operações de Segurança, especialmente entre os CISOs (Chief Information Security Officers, diretores de segurança da informação), com um foco acentuado no
Recomendações de tópicos especiais relacionados
Criação de quadrinhos Os melhores geradores de IA para mangás shonen: crie sequências de ação cheias de adrenalina e efeitos de energia
Os melhores geradores de IA para mangás shonen: crie sequências de ação cheias de adrenalina e efeitos de energia

Descubra os melhores geradores de IA para mangás shonen de 2026 no XIX.AI. Nossa lista selecionada e com as melhores avaliações apresenta ferramentas poderosas para criar sequências de ação cheias de adrenalina e efeitos dinâmicos de energia. Compare opções gratuitas e pagas com testes práticos. Liberte seu potencial criativo e comece a criar mangás épicos hoje mesmo!

15 ferramentas
xix.ai
Negócios Os melhores aplicativos de controle de despesas com IA: digitalize recibos e categorize automaticamente as despesas corporativas
Os melhores aplicativos de controle de despesas com IA: digitalize recibos e categorize automaticamente as despesas corporativas

Os melhores gerenciadores de despesas com IA de 2026: as ferramentas mais bem avaliadas para digitalizar recibos e categorizar despesas corporativas automaticamente. Descubra soluções poderosas e revolucionárias para uma gestão de despesas sem esforço, um acompanhamento financeiro preciso e uma conformidade simplificada. Nossa comparação, cuidadosamente selecionada e atualizada semanalmente, entre opções gratuitas e pagas ajuda você a encontrar a solução ideal. Aproveite ao máximo as vantagens da IA com as recomendações dos especialistas da XIX.AI.

10 ferramentas
xix.ai
Negócios As melhores ferramentas de recrutamento com IA: analise currículos e automatize o agendamento de entrevistas com candidatos
As melhores ferramentas de recrutamento com IA: analise currículos e automatize o agendamento de entrevistas com candidatos

Descubra as melhores ferramentas de recrutamento com IA de 2026 no XIX.AI. Nossa lista selecionada apresenta soluções poderosas e revolucionárias para a triagem de currículos e a automação do agendamento de entrevistas com candidatos. Compare opções gratuitas e pagas com testes práticos e rankings atualizados semanalmente. Encontre o seu assistente de contratação ideal e otimize seu processo de recrutamento hoje mesmo!

10 ferramentas
xix.ai
Produtividade Treinadores de bem-estar e concentração com IA: controle o esgotamento e aumente os níveis de energia mental
Treinadores de bem-estar e concentração com IA: controle o esgotamento e aumente os níveis de energia mental

Descubra os melhores coaches de bem-estar pessoal e concentração com IA de 2026 no XIX.AI. Nossos rankings selecionados apresentam ferramentas de ponta e revolucionárias para lidar com o esgotamento e aumentar a energia mental. Compare opções gratuitas e pagas com informações reais. Descubra hoje mesmo o caminho para atingir o máximo de produtividade e bem-estar.

10 ferramentas
xix.ai
chatbot Os melhores chatbots românticos com IA: construa relacionamentos duradouros com personalidades consistentes
Os melhores chatbots românticos com IA: construa relacionamentos duradouros com personalidades consistentes

Descubra os melhores chatbots românticos com IA de 2026 para construir relacionamentos genuínos e duradouros. Nossa lista selecionada apresenta personalidades marcantes e consistentes, comparações entre versões gratuitas e pagas, além de testes práticos. Encontre seu companheiro ideal e comece a construir seu relacionamento hoje mesmo no XIX.AI.

10 ferramentas
xix.ai
Educação e Aprendizagem Os melhores mentores em ciência de dados e inteligência artificial: domínio avançado em SQL, Pandas e fluxos de trabalho de aprendizado de máquina
Os melhores mentores em ciência de dados e inteligência artificial: domínio avançado em SQL, Pandas e fluxos de trabalho de aprendizado de máquina

Descubra os melhores mentores em ciência de dados com IA para 2026, que o ajudarão a dominar SQL, Pandas e fluxos de trabalho de aprendizado de máquina. Conheça nossa seleção cuidadosamente elaborada e altamente avaliada no XIX.AI para obter orientações poderosas e revolucionárias. Compare opções gratuitas e pagas com informações valiosas da prática real. Domine a ciência de dados hoje mesmo.

10 ferramentas
xix.ai
Comentários (37)
0/500
DanielAllen
DanielAllen 25 de Maio de 2026 à16 17:00:16 WEST

Interessant, dass jetzt die Rechenleistung beim Inferenz wichtiger wird als mehr Daten. Aber ist das wirklich nachhaltig? Die Energiebilanz dieser riesigen Modelle macht mir Sorgen. Die Aktienkurse von Nvidia & Co. reagieren ja schon extrem auf solche News. 🧐

WalterHarris
WalterHarris 23 de Abril de 2026 à0 01:01:00 WEST

Interessant, dass jetzt die Rechenleistung beim Inferencing als Engpass gesehen wird. Aber irgendwie frage ich mich, ob das nicht nur die nächste Runde im Hardware-Wettlauf einläutet. Nvidia-Aktienkurse als Indikator für KI-Fortschritt zu nehmen finde ich etwas kurzsichtig 🤔 Die eigentliche Frage ist doch: Wer kann sich diese Rechenpower überhaupt leisten? Kleine Labs werden da noch weiter abgehängt.

DonaldAdams
DonaldAdams 23 de Setembro de 2025 à31 21:30:31 WEST

DeepSeek這波真的猛!直接讓NVIDIA股價跳水17%...不過我比較好奇的是,如果推理運算才是重點,那我們這些小公司是不是根本玩不起這場遊戲?硬體成本感覺會是個無底洞啊 😅

EdwardYoung
EdwardYoung 15 de Agosto de 2025 à59 12:00:59 WEST

DeepSeek's new model sounds like a real game-changer! A 17% drop in Nvidia's stock is wild—makes me wonder how much compute power is actually driving these AI leaps. Curious to see if this sparks a race for better inference tech! 🚀

WillieRoberts
WillieRoberts 13 de Agosto de 2025 à59 06:00:59 WEST

DeepSeek's new model sounds like a game-changer! 🤯 I'm curious how this shift to more compute at inference will play out—could it make AI more accessible or just widen the gap between big players?

HenryDavis
HenryDavis 31 de Julho de 2025 à39 12:35:39 WEST

DeepSeek's new model sounds like a game-changer! A 17% Nvidia stock dip is wild—wonder how this’ll shift the AI race. More compute at inference? Mind blown! 🤯

OR