opção
Lar
Notícias
2024: Ano de crescimento notável da IA

2024: Ano de crescimento notável da IA

10 de Abril de 2025
89

2024: Ano de crescimento notável da IA

Ao entrarmos em 2025, é emocionante refletir sobre os avanços incríveis que fizemos em 2024. Desde o lançamento dos modelos Gemini 2.0 adaptados para a era agêntica até o fortalecimento da expressão criativa, e desde o design de novos ligantes de proteínas até o avanço da neurociência habilitada por IA e computação quântica, temos expandido os limites da inteligência artificial de forma responsável e ousada. Todos esses esforços visam utilizar a IA para o bem maior da humanidade.

Como mencionamos em nosso ensaio *Por que focamos em IA* há dois anos, nossa abordagem ao desenvolvimento de IA está enraizada em nossa missão fundadora de organizar as informações do mundo e torná-las universalmente acessíveis e úteis. Essa missão impulsiona nosso compromisso de melhorar a vida do maior número de pessoas possível, um objetivo que permanece nossa estrela guia.

Em nossa Revisão do Ano de 2024, celebramos as conquistas notáveis das muitas equipes talentosas no Google que trabalharam incansavelmente para avançar nossa missão. Seus esforços prepararam o terreno para desenvolvimentos ainda mais empolgantes no próximo ano.

Inovação Incansável em Modelos, Produtos e Tecnologias

2024 foi marcado por experimentação, implantação rápida e entrega de nossas tecnologias mais recentes nas mãos dos desenvolvedores. Em dezembro, revelamos os primeiros modelos da série experimental Gemini 2.0, projetados especificamente para a era agêntica. Iniciamos com o Gemini 2.0 Flash, nosso cavalo de batalha versátil, seguido por protótipos de ponta de nossa pesquisa agêntica. Estes incluem uma versão atualizada do Project Astra, explorando o potencial de um assistente de IA universal; Project Mariner, um protótipo inicial capaz de realizar ações no Chrome como uma extensão experimental; e Jules, um agente de código alimentado por IA. Estamos ansiosos para integrar as capacidades do Gemini 2.0 em nossos produtos principais, e já começamos a testar em AI Overviews dentro da Pesquisa, usado por mais de um bilhão de pessoas para explorar novos tipos de perguntas.

Também lançamos o Deep Research, um novo recurso agêntico no Gemini Advanced que economiza horas de pesquisa ao criar e executar planos de várias etapas para responder a perguntas complexas. Além disso, introduzimos o Gemini 2.0 Flash Thinking Experimental, um modelo que exibe seu processo de pensamento de forma transparente.

No início do ano, fizemos avanços significativos ao integrar as capacidades do Gemini em mais produtos Google e lançar o Gemini 1.5 Pro e o Gemini 1.5 Flash. Este último, otimizado para velocidade e eficiência, tornou-se nosso modelo mais popular entre os desenvolvedores graças ao seu tamanho compacto e custo-benefício.

Também aprimoramos o AI Studio, tornando-o disponível como um aplicativo web progressivo (PWA) instalável em desktop, iOS e Android, fornecendo aos desenvolvedores um conjunto robusto de recursos. A resposta do público aos novos recursos do NotebookLM, como Audio Overviews, foi fantástica. Esses recursos podem gerar discussões aprofundadas a partir de materiais de origem carregados, tornando o aprendizado mais envolvente.

A entrada e saída de voz continuam sendo refinadas em produtos como Gemini Live, Project Astra, Journey Voices e a dublagem automática do YouTube, aprimorando a interação do usuário.

Fiel à nossa tradição de contribuir para a comunidade aberta, lançamos dois novos modelos do Gemma, nosso modelo aberto de ponta, construído com a mesma pesquisa e tecnologia do Gemini. O Gemma superou modelos de tamanho semelhante em áreas como resposta a perguntas, raciocínio e codificação. Também lançamos o Gemma Scope, uma ferramenta para ajudar pesquisadores a entender o funcionamento interno do Gemma 2.

Fizemos progressos na melhoria da factualidade de nossos modelos e na redução de alucinações. Em dezembro, publicamos o FACTS Grounding, um benchmark desenvolvido em colaboração com Google DeepMind, Google Research e Kaggle, para avaliar quão bem os grandes modelos de linguagem fundamentam suas respostas em materiais de origem fornecidos e evitam alucinações.

O conjunto de dados FACTS Grounding, com 1.719 exemplos, foi projetado para testar respostas de longa forma fundamentadas em documentos de contexto. Testamos os principais LLMs usando o FACTS Grounding, e estamos orgulhosos de relatar que o Gemini 2.0 Flash Experimental, Gemini 1.5 Flash e Gemini 1.5 Pro alcançaram as três maiores pontuações de factualidade, com o Gemini-2.0-flash-exp obtendo um impressionante 83,6%.

Também melhoramos a eficiência do ML por meio de técnicas inovadoras como decodificação paralela por bl pc, adiamento baseado em confiança e decodificação especulativa, que aceleram os tempos de inferência dos LLMs. Essas melhorias beneficiam os produtos Google e estabelecem padrões para a indústria.

No esporte, lançamos o TacticAI, um sistema de IA para táticas de futebol que fornece insights táticos, particularmente em escanteios.

Nosso compromisso com a liderança em pesquisa permanece forte. Uma pesquisa da WIPO de 2010-2023 sobre citações de IA generativa mostrou que o Google, incluindo Google Research e Google DeepMind, recebeu mais que o dobro das citações da segunda instituição mais citada.

Este gráfico da WIPO, baseado em dados de janeiro de 2024 da The Lens, destaca as contribuições significativas da Alphabet para a pesquisa em IA generativa na última década. Por fim, fizemos progressos com o Project Starline, nossa tecnologia de "janela mágica", em parceria com a HP para comercializá-la, visando integrá-la a serviços de videoconferência como Google Meet e Zoom.

Capacitando a Visão Criativa com IA Generativa

Acreditamos que a IA pode desbloquear novos reinos de criatividade, tornando a expressão criativa mais acessível e ajudando as pessoas a realizar suas visões artísticas. Em 2024, introduzimos uma série de atualizações para nossas ferramentas de mídia generativa, abrangendo imagens, música e vídeo.

No início do ano, lançamos o ImageFX e o MusicFX, ferramentas de IA generativa que criam imagens e clipes de áudio de até 70 segundos a partir de prompts de texto. No I/O, apresentamos o MusicFX DJ, projetado para tornar a criação de música ao vivo mais acessível. Em outubro, trabalhamos com Jacob Collier para simplificar o MusicFX DJ para músicos novos e aspirantes. Também atualizamos nosso kit de ferramentas de IA musical, Music AI Sandbox, e evoluímos nosso experimento Dream Track, permitindo que criadores dos EUA gerem trilhas sonoras instrumentais em vários gêneros usando modelos de texto para música.

Mais tarde no ano, lançamos o Veo 2 e o Imagen 3, nossos modelos mais recentes de imagem e vídeo. O Imagen 3, nosso modelo de texto para imagem de maior qualidade, gera imagens com detalhes superiores, iluminação e menos artefatos. O Veo 2 demonstrou uma melhor compreensão da física do mundo real e do movimento humano, aumentando o realismo. O Veo 2 marca um avanço significativo na geração de vídeos de alta qualidade.

Continuamos a explorar o potencial da IA na edição, usando-a para controlar atributos como transparência e rugosidade de objetos.

Esses exemplos mostram a capacidade da IA de editar propriedades de materiais usando geração de dados sintéticos.

Na geração de áudio, melhoramos a tecnologia de vídeo para áudio (V2A), gerando paisagens sonoras dinâmicas a partir de prompts de texto baseados na ação na tela, que podem ser combinados com vídeos gerados por IA do Veo.

Os jogos oferecem um playground perfeito para exploração criativa e treinamento de agentes incorporados. Em 2024, introduzimos o Genie 2, um modelo de mundo fundamental que gera ambientes 3D diversos e jogáveis para treinamento e avaliação de agentes incorporados. Isso seguiu o lançamento do SIMA, que pode seguir instruções em linguagem natural em vários cenários de jogos eletrônicos.

A Arquitetura da Inteligência: Avanços em Robótica, Hardware e Computação

À medida que nossos modelos multimodais se tornam mais adeptos a entender a física do mundo, eles estão possibilitando avanços empolgantes em robótica. Estamos mais próximos de nosso objetivo de robôs mais capazes e úteis.

Com o ALOHA Unleashed, nosso robô dominou tarefas como amarrar cadarços, pendurar camisas, reparar outros robôs, inserir engrenagens e limpar cozinhas.

No início do ano, introduzimos o AutoRT, SARA-RT e RT-Trajectory, extensões de nosso trabalho com Transformers de Robótica para ajudar robôs a navegar melhor em seus ambientes e tomar decisões mais rápidas. Também lançamos o ALOHA Unleashed, ensinando robôs a coordenar dois braços, e o DemoStart, que usa aprendizado por reforço para melhorar o desempenho no mundo real em uma mão robótica multifingida usando simulações.

O Robotic Transformer 2 (RT-2) aprende com dados da web e de robótica, permitindo realizar tarefas como colocar um morango em uma tigela. Além da robótica, nosso método de aprendizado por reforço AlphaChip está revolucionando o planejamento de layout de chips para data centers e smartphones. Lançamos um ponto de verificação pré-treinado para facilitar a adoção externa da versão de código aberto do AlphaChip. Também disponibilizamos o Trillium, nossa TPU de sexta geração, para clientes do Google Cloud, mostrando como a IA pode aprimorar o design de chips. O AlphaChip aprende a otimizar layouts de chips, melhorando com cada design que cria.

Nossa pesquisa também abordou a correção de erros em computadores quânticos. Em novembro, lançamos o AlphaQubit, um decodificador baseado em IA que identifica erros de computação quântica com alta precisão. Essa colaboração entre Google DeepMind e Google Research acelerou o progresso em direção a computadores quânticos confiáveis. Nos testes, o AlphaQubit reduziu os erros em 6% em comparação com métodos de rede tensorial e em 30% em comparação com correspondência correlacionada.

Em dezembro, a equipe de Quantum AI do Google revelou o Willow, nosso chip quântico mais recente. O Willow pode realizar uma computação de benchmark em menos de cinco minutos, que levaria aos supercomputadores mais rápidos de hoje 10 septilhões de anos. Usando correção de erros quânticos, o Willow reduziu a taxa de erro pela metade, alcançando um marco conhecido como "abaixo do limiar" e recebendo o Prêmio de Avanço em Física do Ano.

O Willow exibe desempenho de ponta em computação quântica.

Descobrindo Novas Soluções: Progresso em Ciência, Biologia e Matemática

Continuamos a acelerar o progresso científico com IA, lançando ferramentas e artigos que demonstram o poder da IA em avançar a ciência e a matemática. Aqui estão alguns destaques:

Em janeiro, introduzimos o AlphaGeometry, um sistema de IA para resolver problemas complexos de geometria. Nosso AlphaGeometry 2 atualizado e o AlphaProof, um sistema baseado em aprendizado por reforço para raciocínio matemático formal, alcançaram desempenho de medalhista de prata na Olimpíada Internacional de Matemática de julho de 2024.

O AlphaGeometry 2 resolveu o Problema 4 da Olimpíada Internacional de Matemática de julho de 2024 em apenas 19 segundos, provando que ∠KIL + ∠XPY é igual a 180°. Em colaboração com a Isomorphic Labs, introduzimos o AlphaFold 3, que prevê a estrutura e interações das moléculas da vida, visando transformar nosso entendimento da biologia e da descoberta de medicamentos.A arquitetura avançada e o treinamento do AlphaFold 3 abrangem todas as moléculas da vida, de proteínas a DNA. Também fizemos avanços significativos no design de proteínas com o AlphaProteo, um sistema de IA para criar ligantes de proteínas de alta resistência, que podem levar a novos medicamentos e biossensores.O AlphaProteo pode projetar novos ligantes de proteínas para vários alvos proteicos.

Em colaboração com o Lichtman Lab de Harvard, produzimos um mapeamento em nanoescala de uma peça do cérebro humano, o primeiro de seu tipo, e o disponibilizamos para pesquisadores. Isso segue nosso esforço de uma década em conectômica, agora estendendo-se ao mapeamento do cérebro humano.

Este projeto de mapeamento cerebral revela aglomerados de células espelhadas na camada mais profunda do córtex.

No final de novembro, co-organizamos o Fórum de IA para Ciência com a Royal Society, discutindo tópicos-chave como previsão de estrutura de proteínas, mapeamento do cérebro humano e uso de IA para previsão e detecção de incêndios florestais. Também hospedamos uma sessão de perguntas e respostas com quatro laureados com o Nobel no fórum, disponível no podcast do Google DeepMind.

2024 também foi um ano marcante, com Demis Hassabis, John Jumper e David Baker recebendo o Prêmio Nobel de Química por seu trabalho no AlphaFold 2, reconhecido por revolucionar o design de proteínas. Geoffrey Hinton, junto com John Hopfield, recebeu o Prêmio Nobel de Física por seu trabalho fundamental em aprendizado de máquina com redes neurais artificiais.

O Google também recebeu outras distinções, incluindo os Prêmios de Papel Teste do Tempo do NeurIPS 2024 e o Prêmio Beale—Orchard-Hays por Programação Linear Primal-Dual (PDLP), agora parte do Google OR Tools, auxiliando na programação linear em larga escala com aplicações no mundo real.

IA para o Benefício da Humanidade

Neste ano, fizemos avanços significativos em produtos e publicamos pesquisas demonstrando como a IA pode beneficiar diretamente e imediatamente as pessoas em áreas como saúde, preparação para desastres e educação.

Na saúde, a IA promete democratizar o cuidado de qualidade, particularmente na detecção precoce de doenças cardiovasculares. Nossa pesquisa mostrou que um dispositivo simples de ponta de dedo, combinado com metadados básicos, pode prever riscos à saúde do coração. Também avançamos em diagnósticos habilitados por IA para tuberculose, mostrando como a IA pode triar populações com altas taxas de TB e HIV de forma eficaz.

O Med-Gemini alcançou uma nova pontuação de ponta no benchmark MedQA, superando nosso melhor anterior, Med-PaLM 2, por 4,6%. Nosso modelo Gemini é uma ferramenta versátil para profissionais, e estamos desenvolvendo modelos ajustados para domínios específicos. O Med-Gemini, por exemplo, combina treinamento em dados médicos desidentificados com as capacidades do Gemini, alcançando 91,1% de precisão no benchmark de perguntas estilo USMLE do MedQA.

Também estamos explorando como o aprendizado de máquina pode abordar a escassez de expertise em imagem em campos como radiologia, dermatologia e patologia. Lançamos o Derm Foundation e o Path Foundation para tarefas diagnósticas e descoberta de biomarcadores, colaboramos com a Stanford Medicine no conjunto de dados Skin Condition Image Network (SCIN) e revelamos o CT Foundation para pesquisa em imagens médicas.

Na educação, introduzimos o LearnLM, uma família de modelos ajustados para aprendizado, aprimorando experiências na Pesquisa, YouTube e Gemini. O LearnLM superou outros modelos de IA líderes, e o disponibilizamos para desenvolvedores no AI Studio. Nosso companheiro de aprendizado conversacional, LearnAbout, e a ferramenta de discussão em áudio, Illuminate, enriquecem ainda mais as experiências de aprendizado.

Na previsão e preparação para desastres, introduzimos o GenCast, melhorando a previsão do tempo e de eventos extremos, e o NeuralGCM, capaz de simular milhares de dias de condições atmosféricas. O GraphCast, que ganhou o Prêmio MacRobert de 2024, fornece previsões meteorológicas detalhadas.

As previsões do GraphCast por 10 dias mostram umidade específica, temperatura da superfície e velocidade do vento.

Aprimoramos nosso modelo de previsão de inundações para prever inundações com sete dias de antecedência, expandindo a cobertura para 100 países e 700 milhões de pessoas.

Nosso modelo de previsão de inundações agora cobre mais de 100 países, com medidores virtuais em 150 países onde medidores físicos não estão disponíveis. A IA também ajuda na detecção e mitigação de incêndios florestais. Nossos Mapas de Limites de Incêndios Florestais agora estão disponíveis em 22 países, e criamos o FireSat, uma constelação de satélites que pode detectar pequenos incêndios florestais em 20 minutos.

Expandimos o Google Translate para incluir 110 novos idiomas, ajudando a derrubar barreiras para informação e oportunidade para mais de 614 milhões de falantes.

Esses novos idiomas no Google Translate representam 8% da população mundial.

Ajudando a Estabelecer o Padrão em IA Responsável

Continuamos nossa pesquisa líder na indústria em segurança de IA, desenvolvendo novas ferramentas e técnicas e integrando-as em nossos modelos mais recentes. Estamos comprometidos em colaborar para abordar riscos.

Nossa pesquisa sobre uso indevido descobriu que deep fakes e jailbreaks são os problemas mais comuns. Em maio, introduzimos o The Frontier Safety Framework para identificar capacidades emergentes em nossos modelos de IA avançados e lançamos nosso framework de Ciclo de Vida de Responsabilidade em IA. Em outubro, expandimos nosso Responsible GenAI Toolkit para trabalhar com qualquer LLM, ajudando desenvolvedores a construir IA de forma responsável.

Lançamos um artigo sobre A Ética dos Assistentes de IA Avançados, examinando o cenário técnico e moral dos assistentes de IA e as oportunidades e riscos que eles representam.

Expandimos as capacidades do SynthID para marcar textos gerados por IA no aplicativo e experiência web do Gemini e vídeos no Veo. Para aumentar a transparência online, juntamo-nos à Coalition for Content Provenance and Authenticity (C2PA) e trabalhamos em uma nova versão mais segura do padrão Content Credentials.

O SynthID ajusta as pontuações de probabilidade dos tokens previstos para garantir qualidade, precisão e criatividade em conteúdo gerado por IA.

Além dos LLMs, compartilhamos nossa abordagem de biossegurança para o AlphaFold 3, trabalhamos com parceiros da indústria para lançar a Coalition for Secure AI (CoSAI) e participamos do AI Seoul Summit para contribuir com a governança internacional de IA.

À medida que desenvolvemos novas tecnologias como agentes de IA, continuaremos a explorar questões de segurança, proteção e privacidade. Guiados por nossos Princípios de IA, estamos adotando uma abordagem deliberada e gradual, conduzindo pesquisas extensas, treinamentos de segurança e avaliações de risco com testadores confiáveis e especialistas externos.

Olhando para 2025

2024 foi um ano de progresso e entusiasmo incríveis em IA. Estamos ainda mais empolgados com o que está por vir em 2025.

À medida que continuamos a expandir os limites da pesquisa em IA em produtos, ciência, saúde e criatividade, devemos considerar cuidadosamente como e quando implantar essas tecnologias. Ao priorizar práticas de IA responsáveis e fomentar a colaboração, continuaremos a desempenhar um papel crucial na construção de um futuro onde a IA beneficie a humanidade.

Artigo relacionado
Salesforce Apresenta Companheiros Digitais de IA no Slack para Rivalizar com o Microsoft Copilot Salesforce Apresenta Companheiros Digitais de IA no Slack para Rivalizar com o Microsoft Copilot A Salesforce lançou uma nova estratégia de IA para o local de trabalho, introduzindo “companheiros digitais” especializados integrados às conversas do Slack, revelou a empresa na segunda-feira.A nova
Investimento de US$ 40 bilhões da Oracle em chips Nvidia impulsiona centro de dados de IA no Texas Investimento de US$ 40 bilhões da Oracle em chips Nvidia impulsiona centro de dados de IA no Texas A Oracle planeja investir aproximadamente US$ 40 bilhões em chips Nvidia para alimentar um grande novo centro de dados no Texas, desenvolvido pela OpenAI, conforme relatado pelo Financial Times. Este
Aplicativo Meta AI Introduzirá Nível Premium e Anúncios Aplicativo Meta AI Introduzirá Nível Premium e Anúncios O aplicativo de IA da Meta pode em breve apresentar uma assinatura paga, seguindo o exemplo de concorrentes como OpenAI, Google e Microsoft. Durante uma teleconferência de resultados do primeiro trime
Comentários (25)
0/200
FrankSmith
FrankSmith 23 de Abril de 2025 à56 02:42:56 WEST

¡2024 fue un año increíble para la IA! Desde Gemini 2.0 hasta la computación cuántica, es impresionante. Parece que estamos viviendo en una película de ciencia ficción. ¡No puedo esperar a ver qué nos trae 2025! 🚀

RalphGarcia
RalphGarcia 19 de Abril de 2025 à39 18:10:39 WEST

2024年のAIの進歩は本当に驚きでしたね!ジェミニ2.0から量子コンピューティングまで、まるでSF映画みたいです。2025年が楽しみです。🚀

CarlLewis
CarlLewis 18 de Abril de 2025 à13 12:58:13 WEST

2024 was insane with AI! From Gemini 2.0 to quantum computing, it felt like living in a sci-fi movie. The creativity boost was real, but sometimes I felt overwhelmed by the rapid changes. Still, it's exciting to see where AI will take us next! 🚀

RogerRoberts
RogerRoberts 14 de Abril de 2025 à16 23:22:16 WEST

¡2024 fue una locura con la IA! Desde Gemini 2.0 hasta la computación cuántica, parecía estar viviendo en una película de ciencia ficción. El impulso de creatividad fue real, pero a veces me sentí abrumado por los cambios rápidos. Aún así, ¡es emocionante ver a dónde nos llevará la IA a continuación! 🚀

RobertMartin
RobertMartin 13 de Abril de 2025 à17 11:55:17 WEST

2024年のAIの進歩は本当に驚きだった!ジェミニ2.0から量子コンピューティングまで、まるでSF映画にいるようだった。創造性の向上は確かにあったけど、急速な変化に圧倒されることもあった。それでも、AIが次にどこへ導いてくれるのか楽しみだよ!🚀

JimmyGarcia
JimmyGarcia 13 de Abril de 2025 à46 07:54:46 WEST

2024 foi louco com IA! Do Gemini 2.0 ao computador quântico, parecia estar vivendo em um filme de ficção científica. O aumento da criatividade foi real, mas às vezes me senti sobrecarregado com as mudanças rápidas. Ainda assim, é emocionante ver para onde a IA nos levará em seguida! 🚀

De volta ao topo
OR