A Physical Intelligence apresenta um capacete robótico capaz de aprender tarefas inéditas

Lar

Notícias

19 de Maio de 2026

JimmyWilson

# Exclusive # Physical Intelligence

A Physical Intelligence, uma startup de robótica fundada há dois anos com sede em São Francisco e que se tornou uma das empresas de IA mais acompanhadas da Região da Baía, divulgou uma nova pesquisa nesta quinta-feira. Os resultados revelam que seu modelo mais recente é capaz de orientar robôs a realizar tarefas para as quais nunca foram especificamente treinados — uma capacidade que até mesmo os próprios pesquisadores da empresa admitem ter sido uma surpresa.

O novo modelo, chamado π0.7, marca o que a empresa chama de um passo inicial, mas significativo, em direção à ambição de longa data de um cérebro robótico de uso geral. Esse sistema pode ser direcionado para uma tarefa desconhecida, receber instruções em linguagem simples e concluí-la com sucesso. Se esses resultados resistirem a um exame minucioso, eles indicam que a IA robótica pode estar se aproximando de um ponto de inflexão semelhante à evolução dos grandes modelos de linguagem — onde as habilidades começam a se combinar de maneiras que superam o que os dados fundamentais poderiam sugerir.

No cerne do artigo está o conceito de generalização composicional: a capacidade de combinar habilidades aprendidas em contextos distintos para lidar com problemas inteiramente novos. Tradicionalmente, o treinamento de robôs tem se baseado na memorização mecânica — coletar dados para uma tarefa específica, treinar um modelo especializado com base neles e repetir o processo para cada nova tarefa. A Physical Intelligence afirma que o π0.7 rompe esse ciclo.

“Assim que ele ultrapassa o limiar de simplesmente replicar os dados exatos com os quais foi treinado para recombinar criativamente elementos de maneiras inovadoras”, explica Sergey Levine, cofundador da Physical Intelligence e professor da UC Berkeley especializado em IA para robótica, “as capacidades começam a aumentar a uma taxa maior do que a linear em relação ao volume de dados. Essa dinâmica de escalonamento mais favorável é algo que observamos em outros campos, como linguagem e visão.”

A demonstração mais convincente do artigo envolve uma fritadeira de ar quente à qual o modelo praticamente não teve exposição durante o treinamento. Após investigação, a equipe encontrou apenas dois casos relevantes em todo o conjunto de dados: um em que um robô diferente simplesmente empurrou a porta da fritadeira para fechá-la, e outro de um conjunto de dados de código aberto em que um robô colocou uma garrafa de plástico dentro dela sob comando. De alguma forma, o modelo sintetizou esses fragmentos, juntamente com dados de pré-treinamento mais amplos baseados na web, em uma compreensão prática de como o aparelho funciona.

“É incrivelmente difícil identificar exatamente de onde o conhecimento se origina ou prever onde ele terá sucesso ou fracassará”, observa Ashwin Balakrishna, pesquisador científico da Physical Intelligence e aluno de doutorado em ciência da computação em Stanford. No entanto, sem qualquer treinamento prévio, o modelo fez uma tentativa credível de usar o aparelho para cozinhar uma batata-doce. Quando recebeu instruções verbais passo a passo — essencialmente, um humano orientando o robô durante o processo, como se estivesse treinando um novo funcionário —, ele concluiu a tarefa com sucesso.

Essa capacidade de treinamento é significativa porque implica que os robôs poderiam ser implantados em novos ambientes e aperfeiçoados em tempo real, eliminando a necessidade de coleta adicional de dados ou retreinamento do modelo.

Então, quais são as implicações mais amplas? Os pesquisadores são sinceros quanto às limitações do modelo e cautelosos em relação a exagerar seu progresso. Em pelo menos um caso, eles atribuem uma falha diretamente à sua própria equipe.

“Às vezes, a falha não se deve ao robô ou ao modelo”, diz Balakrishna. “A culpa é nossa — não sermos hábeis na engenharia de prompts.” Ele cita um experimento inicial com uma fritadeira de ar quente que alcançou apenas uma taxa de sucesso de 5%. Depois de passar cerca de trinta minutos refinando a forma como a tarefa era explicada ao modelo, a taxa de sucesso disparou para 95%.

A Physical Intelligence, uma startup promissora da área de robótica, afirma que seu novo “cérebro robótico” é capaz de resolver tarefas que nunca lhe foram ensinadas

Créditos da imagem:Physical Intelligence

O modelo também ainda não é capaz de executar autonomamente tarefas complexas de várias etapas a partir de um único comando de alto nível. “Você não pode simplesmente dizer: ‘Vá fazer uma torrada para mim’”, afirma Levine. “Mas se você o orientar pelas etapas — ‘abra esta parte da torradeira, aperte aquele botão, faça isso’ —, ele tende a se sair muito bem.”

A equipe também reconhece a falta de padrões de referência padronizados na robótica, o que complica a validação externa de suas afirmações. Em vez disso, a empresa comparou o π0.7 com seus próprios modelos especializados anteriores — sistemas criados sob medida e treinados para tarefas individuais — e descobriu que o modelo generalista igualou o desempenho deles em uma variedade de atividades complexas, incluindo fazer café, dobrar roupa e montar caixas.

Talvez o aspecto mais notável da pesquisa — acreditando na palavra dos pesquisadores — não seja nenhuma demonstração isolada, mas o quanto os resultados surpreenderam justamente as pessoas cujo trabalho é conhecer os dados de treinamento de cor e, consequentemente, saber o que o modelo deve ou não ser capaz de fazer.

“Minha experiência sempre foi que, quando tenho um entendimento profundo dos dados, geralmente consigo prever o que o modelo será capaz de fazer”, reflete Balakrishna. “Raramente fico surpreso. Mas nos últimos meses foi a primeira vez que fiquei genuinamente surpreso. Comprei um conjunto de engrenagens aleatoriamente e perguntei ao robô: ‘Você consegue girar essa engrenagem?’ E simplesmente funcionou.”

Levine relembra o momento em que os pesquisadores testemunharam pela primeira vez o GPT-2 gerar uma história sobre unicórnios nos Andes. “Onde diabos ele aprendeu sobre unicórnios no Peru?”, diz ele. “É uma combinação tão estranha. Ver esse tipo de capacidade emergente na robótica é realmente especial.”

Naturalmente, os críticos vão destacar uma assimetria inerente: os modelos de linguagem foram treinados com toda a internet. Os robôs não têm esse luxo, e nenhuma quantidade de prompts inteligentes pode preencher totalmente essa lacuna. No entanto, quando questionado sobre onde ele antecipa ceticismo, Levine aponta para uma direção totalmente diferente.

“A crítica que sempre pode ser feita a qualquer demonstração de generalização robótica é que as tarefas parecem um tanto mundanas”, observa ele. “O robô não está dando um salto mortal para trás.” Ele desafia essa perspectiva, argumentando que a diferença entre uma demonstração robótica chamativa e um sistema que realmente generaliza é precisamente o ponto principal. A verdadeira generalização, sugere ele, sempre parecerá menos dramática do que uma manobra cuidadosamente orquestrada — mas é muito mais prática.

O próprio artigo emprega uma linguagem cautelosa ao longo de todo o texto, descrevendo o π0.7 como exibindo “sinais iniciais” de generalização e “demonstrações iniciais” de novas capacidades. Trata-se de resultados de pesquisa, não de um produto comercial, e a Physical Intelligence tem se mantido consistentemente reservada quanto ao seu cronograma de comercialização.

Quando questionado diretamente sobre quando um sistema baseado nessa pesquisa poderia estar pronto para uso no mundo real, Levine se recusa a especular. “Há bons motivos para otimismo, e o progresso é certamente mais rápido do que eu previa há alguns anos”, diz ele. “Mas é muito difícil para mim dar uma resposta definitiva.”

Até o momento, a Physical Intelligence levantou mais de US$ 1 bilhão e foi avaliada recentemente em US$ 5,6 bilhões. Uma parte significativa do entusiasmo dos investidores em torno da empresa está ligada ao cofundador Lachy Groom, que passou anos como um dos investidores-anjo mais respeitados do Vale do Silício — apoiando empresas como Figma, Notion e Ramp — antes de concluir que a Physical Intelligence era o empreendimento que ele vinha buscando. Esse histórico ajudou a startup a atrair financiamento institucional substancial, mesmo tendo se abstido de fornecer aos investidores um roteiro específico de comercialização.

A empresa estaria agora em negociações para uma nova rodada de financiamento que quase dobraria sua avaliação para US$ 11 bilhões. A equipe se recusou a comentar o assunto.

Artigo relacionado

A Trace arrecadou 3 milhões de dólares para superar os obstáculos na adoção de agentes de IA empresariais. Apesar de seu potencial, os agentes de IA têm tido dificuldades para ganhar espaço no ambiente empresarial. Uma startup emergente acredita que o problema central é a falta de contexto.Lançada como parte do grupo de verão de 2025 da Y Combinator, a T

A Hightouch atinge US$ 100 milhões em ARR com ferramentas de marketing baseadas em IA No passado, os profissionais de marketing dependiam de designers e outros especialistas em criação para produzir imagens e vídeos para campanhas publicitárias online personalizadas.No final de 2024, a

O aumento da produção de gás natural da Meta pode abastecer a rede elétrica de Dakota do Sul Os data centers cresceram tanto que seu consumo de eletricidade agora se equipara ao de estados inteiros dos EUA. Veja o caso do data center de IA Hyperion, da Meta: quando estiver concluído, consumir

Recomendações de tópicos especiais relacionados

escrita

Os melhores criadores de perfis de ficção com IA: gerar motivações consistentes para personagens e falhas fatais

Descubra os melhores criadores de perfis de ficção com IA de 2026 para criar personagens complexos. A lista selecionada pela XIX.AI apresenta ferramentas de ponta e revolucionárias que geram motivações consistentes e falhas fatais. Compare as opções gratuitas com as pagas por meio de testes práticos. Liberte agora o seu potencial narrativo.

10 ferramentas

xix.ai

Negócios

Os melhores softwares de otimização de preços com IA: acompanhe os concorrentes e ajuste automaticamente os preços da loja

Descubra os melhores softwares de otimização de preços com IA de 2026 no XIX.AI. Nossa lista selecionada apresenta ferramentas de ponta e revolucionárias que monitoram os concorrentes e ajustam automaticamente os preços da sua loja para maximizar o lucro. Compare opções gratuitas e pagas com testes práticos. Obtenha sua vantagem competitiva em preços agora mesmo.

10 ferramentas

xix.ai

código

Os melhores revisores de código com IA: automatize a conformidade com o código limpo e refatore arquivos de repositórios legados

Descubra os melhores revisores de código com IA de 2026 no XIX.AI. Nossa lista selecionada apresenta ferramentas de ponta e revolucionárias para automatizar a conformidade com o código limpo e refatorar arquivos de repositórios legados. Compare opções gratuitas e pagas com testes práticos e rankings atualizados semanalmente. Obtenha sua vantagem com IA hoje mesmo.

10 ferramentas

xix.ai

Conversão de texto para fala

Os melhores aplicativos de TTS com IA para dislexia: apoio à aprendizagem e à eficiência na leitura para alunos

Descubra os melhores aplicativos de TTS com IA de 2026, selecionados especialmente para auxiliar na dislexia. Nossas classificações especializadas comparam ferramentas gratuitas e pagas, destacando recursos avançados para melhorar a eficiência na leitura e na aprendizagem. Explore soluções inovadoras e imperdíveis para revelar o potencial dos alunos. Comece sua jornada no XIX.AI.

10 ferramentas

xix.ai

Criação de quadrinhos

Os melhores geradores de IA para mangás shonen: crie sequências de ação cheias de adrenalina e efeitos de energia

Descubra os melhores geradores de IA para mangás shonen de 2026 no XIX.AI. Nossa lista selecionada e com as melhores avaliações apresenta ferramentas poderosas para criar sequências de ação cheias de adrenalina e efeitos dinâmicos de energia. Compare opções gratuitas e pagas com testes práticos. Liberte seu potencial criativo e comece a criar mangás épicos hoje mesmo!

15 ferramentas

xix.ai

Negócios

Os melhores aplicativos de controle de despesas com IA: digitalize recibos e categorize automaticamente as despesas corporativas

Os melhores gerenciadores de despesas com IA de 2026: as ferramentas mais bem avaliadas para digitalizar recibos e categorizar despesas corporativas automaticamente. Descubra soluções poderosas e revolucionárias para uma gestão de despesas sem esforço, um acompanhamento financeiro preciso e uma conformidade simplificada. Nossa comparação, cuidadosamente selecionada e atualizada semanalmente, entre opções gratuitas e pagas ajuda você a encontrar a solução ideal. Aproveite ao máximo as vantagens da IA com as recomendações dos especialistas da XIX.AI.

10 ferramentas

xix.ai