opção
Lar
Notícias
2024: Ano de crescimento notável da IA

2024: Ano de crescimento notável da IA

10 de Abril de 2025
79

2024: Ano de crescimento notável da IA

À medida que entramos em 2025, é emocionante refletir sobre os avanços incríveis que fizemos em 2024. Desde o lançamento dos modelos Gemini 2.0, adaptados à era agêntica até capacitar a expressão criativa e projetar novos ligantes de proteínas ao avanço da neurociência Ai-iable e à computação quântica. Todos esses esforços visam aproveitar a IA para o bem maior da humanidade.

Como mencionamos em nosso ensaio * Por que nos concentramos em AI * há dois anos, nossa abordagem ao desenvolvimento da IA ​​está enraizada em nossa missão fundadora para organizar as informações do mundo e torná -las universalmente acessíveis e úteis. Essa missão impulsiona nosso compromisso de melhorar a vida de tantas pessoas quanto possível, uma meta que continua sendo nossa estrela do norte.

Em nossa revisão de 2024 anos, celebramos as notáveis ​​realizações de muitas equipes talentosas do Google que trabalharam incansavelmente para avançar em nossa missão. Seus esforços prepararam o terreno para desenvolvimentos ainda mais emocionantes no próximo ano.

Inovação implacável em modelos, produtos e tecnologias

2024 foi sobre experimentação, implantação rápida e colocação de nossas mais recentes tecnologias nas mãos dos desenvolvedores. Em dezembro, apresentamos os primeiros modelos de nossa série experimental Gemini 2.0, projetada especificamente para a era Agentic. Iniciamos as coisas com o Gemini 2.0 Flash, nosso versátil cavalo de trabalho, seguido de protótipos de ponta de nossa pesquisa agêntica. Isso inclui um projeto atualizado Astra, explorando o potencial de um assistente universal de IA; Projeto Mariner, um protótipo inicial capaz de executar ações no Chrome como uma extensão experimental; e Jules, um agente de código movido a IA. Estamos ansiosos para integrar as capacidades da Gemini 2.0 em nossos principais produtos, e já começamos a testar em visão geral da IA ​​na pesquisa, usada por mais de um bilhão de pessoas para explorar novos tipos de perguntas.

Também lançamos a Deep Research, um novo recurso Agentic na Gemini Advanced que salva horas de pesquisa, criando e executando planos de várias etapas para responder a perguntas complexas. Além disso, introduzimos o Gemini 2.0 Flash Thinking Experimental, um modelo que exibe transparentemente seu processo de pensamento.

No início do ano, fizemos avanços significativos, integrando os recursos da Gemini em mais produtos do Google e lançando o Gemini 1.5 Pro e Gemini 1.5 Flash. Este último, otimizado para velocidade e eficiência, tornou-se nosso modelo mais popular entre os desenvolvedores, graças ao seu tamanho compacto e custo-efetividade.

Também aprimoramos o estúdio de IA, disponibilizando -o como um aplicativo da Web (PWA) progressivo instalável no desktop, iOS e Android, fornecendo aos desenvolvedores um conjunto robusto de recursos. A resposta do público a novos recursos no Notebooklm, como visões gerais de áudio, tem sido fantástica. Esses recursos podem gerar discussões profundas sobre o material de origem carregado, tornando o aprendizado mais envolvente.

A entrada e saída de fala continuam refinadas em produtos como Gemini Live, Project Astra, Journey Voices e Dubbing automático do YouTube, aprimorando a interação do usuário.

De acordo com a nossa tradição de contribuir para a comunidade aberta, lançamos dois novos modelos da Gemma, nosso modelo aberto de última geração, construído sobre a mesma pesquisa e tecnologia que Gemini. A GEMMA superou modelos de tamanho semelhante em áreas como resposta a perguntas, raciocínio e codificação. Também lançamos a Gemma Scope, uma ferramenta para ajudar os pesquisadores a entender o funcionamento interno da Gemma 2.

Fizemos progressos para melhorar a factualidade de nossos modelos e reduzir as alucinações. Em dezembro, publicamos a base de fatos, uma referência desenvolvida em colaboração com o Google Deepmind, o Google Research e Kaggle, para avaliar como modelos de idiomas grandes fundamentam suas respostas no material de origem fornecido e evitam alucinações.

O conjunto de dados de aterramento de fatos, com 1.719 exemplos, foi projetado para testar respostas de formato longo, fundamentadas nos documentos de contexto. Testamos os LLMs líderes usando o aterramento de fatos e estamos orgulhosos de relatar que o Gemini 2.0 Flash Experimental, Gemini 1.5 Flash e Gemini 1.5 Pro alcançaram as três principais pontuações de factualidade, com Gemini-2.0-Flash-EXP-EXP marcando 83,6%impressionantes.

Também melhoramos a eficiência da ML por meio de técnicas inovadoras, como decodificação paralela em bloco, adiamento baseado em confiança e decodificação especulativa, que aceleram os tempos de inferência do LLMS. Essas melhorias beneficiam os produtos do Google e estabelecem padrões do setor.

Nos esportes, lançamos o Taticai, um sistema de IA para táticas de futebol que fornece informações táticas, principalmente em chutes de esquina.

Nosso compromisso com a liderança da pesquisa permanece forte. Uma pesquisa WIPO 2010-2023 sobre citações generativas de IA mostrou que o Google, incluindo o Google Research e o Google DeepMind, recebeu mais do que o dobro das citações da segunda instituição mais citada.

Este gráfico WIPO, com base nos dados de janeiro de 2024 da lente, destaca as contribuições significativas do Alphabet para a pesquisa generativa da IA ​​na última década. Finalmente, fizemos progresso com o Project Starline, nossa tecnologia "Janela Mágica", em parceria com a HP para comercializá -la, com o objetivo de integrá -la a serviços de videoconferência como o Google Meet e Zoom.

Capacitando a visão criativa com IA generativa

Acreditamos que a IA pode desbloquear novos reinos de criatividade, tornando a expressão criativa mais acessível e ajudando as pessoas a realizar suas visões artísticas. Em 2024, introduzimos uma série de atualizações de nossas ferramentas generativas de mídia, cobrindo imagens, músicas e vídeo.

No início do ano, lançamos o ImageFX e o MusicFX, ferramentas generativas de IA que criam imagens e clipes de áudio atualizados de 70 segundos a partir de prompts de texto. Na E/S, visualizamos o Musicfx DJ, projetado para tornar a criação de música ao vivo mais acessível. Em outubro, trabalhamos com Jacob Collier para simplificar o MusicFX DJ para músicos novos e aspirantes. Também atualizamos nosso kit de ferramentas de Ai Music, Music AI Sandbox e evoluímos nosso experimento de faixa dos sonhos, permitindo que os criadores dos EUA gerassem trilhas sonoras instrumentais em vários gêneros usando modelos de texto para música.

No final do ano, lançamos o Veo 2 e o Imagen 3, nossos mais recentes modelos de imagem e vídeo. Imagen 3, nosso modelo de texto para imagem da mais alta qualidade, gera imagens com detalhes superiores, iluminação e menos artefatos. O VEO 2 demonstrou uma melhor compreensão da física do mundo real e do movimento humano, aumentando o realismo. O Veo 2 marca um avanço significativo na geração de vídeo de alta qualidade.

Continuamos a explorar o potencial da IA ​​na edição, usando -o para controlar atributos como transparência e rugosidade dos objetos.

Esses exemplos mostram a capacidade da IA ​​de editar propriedades do material usando geração de dados sintéticos.

Na geração de áudio, aprimoramos a tecnologia de vídeo para áudio (V2A), gerando paisagens sonoras dinâmicas a partir de prompts de texto com base na ação na tela, que pode ser emparelhada com o vídeo gerado pela AI da Veo.

Os jogos oferecem um playground perfeito para agentes incorporados de exploração e treinamento criativos. Em 2024, introduzimos a Genie 2, um modelo mundial de fundação que gera diversos ambientes 3D jogáveis ​​para treinamento e avaliação de agentes incorporados. Isso se seguiu ao lançamento do SIMA, que pode seguir as instruções de linguagem natural em várias configurações de videogame.

A arquitetura da inteligência: avanços em robótica, hardware e computação

À medida que nossos modelos multimodais se tornam mais hábeis em entender a física do mundo, eles estão permitindo avanços interessantes na robótica. Estamos nos aproximando do nosso objetivo de robôs mais capazes e úteis.

Com a Aloha Unleashed, nossas tarefas dominadas por robôs como amarrar cadarços, camisas penduradas, reparar outros robôs, inserir engrenagens e limpar cozinhas.

No início do ano, introduzimos a Autort, Sara-RT e RT-Trajetória, extensões de nossos transformadores de robótica trabalham para ajudar os robôs a navegar melhor em seus ambientes e tomar decisões mais rápidas. Também lançamos Aloha Unleashed, ensinando robôs a coordenar dois braços e Demostart, que usa o aprendizado de reforço para melhorar o desempenho do mundo real em uma mão robótica com vários dedos usando simulações.

O Robotic Transformer 2 (RT-2) aprende com dados da Web e da robótica, permitindo que ele execute tarefas como colocar um morango em uma tigela. Além da robótica, nosso método de aprendizado de reforço de alfachip está revolucionando o chip piso planta para data centers e smartphones. Lançamos um ponto de verificação pré-treinado para facilitar a adoção externa da liberação de código aberto da Alphachip. Também disponibilizamos o Trillium, nossa TPU de sexta geração, disponível para clientes do Google Cloud, mostrando como a IA pode aprimorar o design do chip. Alphachip aprende a otimizar os layouts de chip, melhorando com cada design que cria.

Nossa pesquisa também abordou a correção de erros em computadores quânticos. Em novembro, lançamos o Alphaqubit, um decodificador baseado em IA que identifica erros de computação quântica com alta precisão. Essa colaboração entre o Google Deepmind e o Google Research acelerou o progresso em direção a computadores quânticos confiáveis. Nos testes, o alfaqubit reduziu os erros em 6% em comparação com os métodos de rede tensores e em 30% em comparação com a correspondência correlacionada.

Em dezembro, a equipe do Google Quantum AI revelou Willow, nosso mais recente chip quântico. Willow pode realizar um cálculo de referência em menos de cinco minutos que levariam os supercomputadores mais rápidos de hoje 10 anos de setembro. Usando a correção de erros quânticos, Willow reduziu pela metade a taxa de erro, alcançando um marco conhecido como "abaixo do limite" e ganhando o prêmio de Física do Ano.

Willow mostra o desempenho de ponta em computação quântica.

Descobrindo novas soluções: progresso em ciências, biologia e matemática

Continuamos a acelerar o progresso científico com a IA, liberando ferramentas e trabalhos que demonstram o poder da IA ​​no avanço da ciência e da matemática. Aqui estão alguns destaques:

Em janeiro, introduzimos a alfageometria, um sistema de IA para resolver problemas complexos de geometria. Nosso alfagelometria 2 e alfaproof atualizados, um sistema baseado em aprendizado de reforço para o raciocínio formal de matemática, alcançou o desempenho do medalhista de prata na Olimpíada Matemática Internacional de julho de 2024.

Alfageometria 2 Resolveu o Problema 4 da Olimpíada Matemática Internacional de julho de 2024 em apenas 19 segundos, provando que erokil + eroxpy é igual a 180 °. Em colaboração com laboratórios isomórficos, introduzimos o Alphafold 3, que prevê a estrutura e as interações das moléculas da vida, com o objetivo de transformar nossa compreensão da biologia e da descoberta de medicamentos.

A arquitetura e treinamento avançados da Alphafold 3 cobrem todas as moléculas da vida, de proteínas ao DNA. Também fizemos avanços significativos no projeto de proteínas com o Alphaproteo, um sistema de IA para criar ligantes de proteínas de alta resistência, o que pode levar a novos medicamentos e biossensores.

O Alphaproteo pode projetar novos ligantes de proteínas para várias proteínas -alvo.

Em colaboração com o Lichtman Lab, em Harvard, produzimos um mapeamento em escala de uma peça do cérebro humano, o primeiro de seu gênero, e o disponibilizou para os pesquisadores. Isso segue nosso esforço de uma década em Connectomics, agora estendendo-se ao mapeamento do cérebro humano.

Este projeto de mapeamento cerebral revela aglomerados de células de imagem espelhada na camada mais profunda do córtex.

No final de novembro, co-organizamos a IA para o fórum de ciências com a Royal Society, discutindo tópicos-chave como previsão da estrutura de proteínas, mapeamento do cérebro humano e usando IA para previsão e detecção de incêndios. Também organizamos uma sessão de perguntas e respostas com quatro ganhadores do Nobel no fórum, disponíveis no podcast do Google DeepMind.

2024 também foi um ano histórico como Demis Hassabis, John Jumper e David Baker receberam o Prêmio Nobel de Química por seu trabalho em Alphafold 2, reconhecido por revolucionar o design de proteínas. Geoffrey Hinton, juntamente com John Hopfield, recebeu o Prêmio Nobel de Física por trabalho fundamental em aprendizado de máquina com redes neurais artificiais.

O Google também recebeu elogios adicionais, incluindo o Prêmio Neurips 2024 Test of Time Paper e o Prêmio Beale-Orchard-Hays por programação linear Primal-Dual-Dual (PDLP), agora parte do Google ou ferramentas, ajudando em programação linear em larga escala com aplicações no mundo real.

Ai para o benefício da humanidade

Este ano, fizemos avanços significativos no produto e publicamos pesquisas demonstrando como a IA pode diretamente e imediatamente beneficiar pessoas em áreas como assistência médica, prontidão para desastres e educação.

Na área da saúde, a IA promete democratizar os cuidados de qualidade, particularmente na detecção precoce de doenças cardiovasculares. Nossa pesquisa mostrou que um dispositivo simples de ponta dos dedos, combinado com metadados básicos, pode prever riscos à saúde cardíaca. Também avançamos diagnósticos habilitados para a tuberculose, mostrando como a IA pode rastrear populações com altas taxas de TB e HIV de maneira eficaz.

A Med-Gigemini alcançou uma nova pontuação de última geração no benchmark MEDQA, superando o nosso melhor anterior, Med-Palm 2, em 4,6%. Nosso modelo Gemini é uma ferramenta versátil para profissionais e estamos desenvolvendo modelos de ajuste fino para domínios específicos. A Med-Gigemini, por exemplo, combina treinamento em dados médicos desidentificados com as capacidades da Gemini, alcançando 91,1% de precisão no benchmark de perguntas do estilo MedQA USMLE.

Também estamos explorando como o aprendizado de máquina pode abordar a escassez de experiência em imagens em áreas como radiologia, dermatologia e patologia. Lançamos a Derm Foundation e a Path Foundation para tarefas de diagnóstico e descoberta de biomarcadores, colaboramos com o conjunto de dados Stanford Medicine on the Skin Condition Image Network (SCIN) e revelou a Fundação de CT para pesquisa de imagem médica.

Na educação, introduzimos o Learnlm, uma família de modelos ajustada para aprender, aprimorando experiências em busca, youtube e gêmeos. O LearnlM superou outros modelos de IA líder, e o disponibilizamos aos desenvolvedores no estúdio de IA. Nosso companheiro de aprendizado de conversação, aprendizado e a ferramenta de discussão em áudio, iluminam, enriquecem ainda mais as experiências de aprendizado.

Na previsão e preparação para desastres, introduzimos o GENCAST, melhorando o clima e a previsão extrema de eventos, e neuralgcm, capazes de simular milhares de dias de condições atmosféricas. O Graphcast, que ganhou o prêmio MacroBert 2024, fornece previsões climáticas detalhadas.

As previsões do Graphcast ao longo de 10 dias mostram umidade específica, temperatura da superfície e velocidade do vento.

Melhoramos nosso modelo de previsão de inundações para prever inundações com sete dias de antecedência, expandindo a cobertura para 100 países e 700 milhões de pessoas.

Nosso modelo de previsão de inundações agora cobre mais de 100 países, com medidores virtuais em 150 países onde os medidores físicos não estão disponíveis. A IA também ajuda na detecção e mitigação de incêndios florestais. Nossos mapas de limite de incêndio florestal estão agora disponíveis em 22 países e criamos o Firesat, uma constelação de satélite que pode detectar pequenos incêndios em 20 minutos.

Expandimos o Google traduzido para incluir 110 novos idiomas, ajudando a dividir as barreiras às informações e a oportunidade de mais de 614 milhões de palestrantes.

Esses novos idiomas no Google Translate representam 8% da população mundial.

Ajudando a definir o padrão na IA responsável

Continuamos nossa pesquisa líder do setor em segurança de IA, desenvolvendo novas ferramentas e técnicas e integrando-as em nossos modelos mais recentes. Estamos comprometidos em colaborar para lidar com riscos.

Nossa pesquisa sobre uso indevido descobriu que falsificadores profundos e jailbreaks são os problemas mais comuns. Em maio, introduzimos a estrutura de segurança da Frontier para identificar recursos emergentes em nossos modelos avançados de IA e lançamos nossa estrutura de ciclo de vida de responsabilidade da IA. Em outubro, expandimos nosso responsável Genai Toolkit para trabalhar com qualquer LLM, ajudando os desenvolvedores a construir a IA com responsabilidade.

Lançamos um artigo sobre a ética dos assistentes avançados de IA, examinando o cenário técnico e moral dos assistentes de IA e as oportunidades e riscos que eles representam.

Expandimos os recursos do Synthid para o texto gerado por marca d'água no aplicativo Gemini e na Web Experience and Video no Veo. Para aprimorar a transparência on -line, ingressamos na Coalizão para Proveniência e Autenticidade de Conteúdo (C2PA) e trabalhamos em uma nova e mais segura versão do padrão de credenciais de conteúdo.

O sintídeo ajusta as pontuações de probabilidade de tokens previstos para garantir qualidade, precisão e criatividade no conteúdo gerado pela IA.

Além do LLMS, compartilhamos nossa abordagem de biossegurança para a Alphafold 3, trabalhamos com parceiros do setor para lançar a Coalizão para a AI Secure (COSAI) e participamos da cúpula da AI Seoul para contribuir com a governança internacional da IA.

À medida que desenvolvemos novas tecnologias, como agentes de IA, continuaremos a explorar questões de segurança, proteção e privacidade. Guiados por nossos princípios de IA, estamos adotando uma abordagem deliberada e gradual, realizando uma extensa pesquisa, treinamento de segurança e avaliações de risco com testadores confiáveis ​​e especialistas externos.

Olhando para o futuro 2025

2024 foi um ano de progresso e emoção incríveis na IA. Estamos ainda mais emocionados com o que está por vir em 2025.

À medida que continuamos a ultrapassar os limites da pesquisa de IA em produtos, ciências, saúde e criatividade, devemos considerar cuidadosamente como e quando implantar essas tecnologias. Ao priorizar as práticas responsáveis ​​de IA e promover a colaboração, continuaremos desempenhando um papel crucial na construção de um futuro em que a IA beneficia a humanidade.

Artigo relacionado
Nouvelle étude révèle combien de données les LLM mémorisent réellement Nouvelle étude révèle combien de données les LLM mémorisent réellement Combien les modèles d'IA mémorisent-ils réellement ? Une nouvelle recherche révèle des insights surprenantsNous savons tous que les grands modèles de langage (LLM) comme ChatGPT, Claude et Gemini sont
Potentiel de l'IA pour résoudre le puzzle de la productivité au Royaume-Uni Potentiel de l'IA pour résoudre le puzzle de la productivité au Royaume-Uni L'IA pourrait stimuler l'économie britannique de 400 milliards de livres – mais seulement si les travailleurs l'adoptentLe Royaume-Uni est à l'aube d'une opportunité économique massive—400 milliards d
9 Meilleurs Outils de Recrutement IA (Avril 2025) 9 Meilleurs Outils de Recrutement IA (Avril 2025) Les 10 meilleurs outils de recrutement IA transformant l'embauche en 2024L'intelligence artificielle révolutionne le recrutement, et pour cause. Les entreprises submergées par les CV et les plannings
Comentários (25)
0/200
JustinMartin
JustinMartin 12 de Abril de 2025 à0 00:00:00 GMT

2024 was a wild ride with AI! From Gemini 2.0 to quantum computing, it's like we're living in a sci-fi movie. Loved seeing all the creative stuff AI can do, but sometimes it felt a bit too much, you know? Can't wait to see what 2025 brings, but maybe slow down a bit, AI?

BillyEvans
BillyEvans 12 de Abril de 2025 à0 00:00:00 GMT

¡2024 fue increíble con la IA! Desde Gemini 2.0 hasta la computación cuántica, parece que vivimos en una película de ciencia ficción. Me encantó ver todo lo creativo que puede hacer la IA, pero a veces se sintió un poco abrumador, ¿sabes? Espero con ansias lo que 2025 traiga, pero tal vez, ¿puede la IA ralentizar un poco?

WalterWhite
WalterWhite 10 de Abril de 2025 à0 00:00:00 GMT

2024年はAIがすごかったね!ジェミニ2.0から量子コンピューティングまで、まるでSF映画に住んでいるみたい。AIができるクリエイティブなことが大好きだけど、時々少し多すぎる感じがするんだよね。2025年が楽しみだけど、AI、ちょっとペースを落とそうか?

WillieRodriguez
WillieRodriguez 11 de Abril de 2025 à0 00:00:00 GMT

2024 war ein wilder Ritt mit KI! Von Gemini 2.0 bis zur Quantencomputing, es fühlt sich an, als lebten wir in einem Sci-Fi-Film. Ich liebe das kreative Zeug, was KI kann, aber manchmal war es ein bisschen zu viel, weißt du? Ich freue mich auf 2025, aber vielleicht sollte die KI ein bisschen langsamer machen?

KeithJones
KeithJones 12 de Abril de 2025 à0 00:00:00 GMT

Năm 2024 thật tuyệt vời với trí tuệ nhân tạo! Từ Gemini 2.0 đến máy tính lượng tử, cảm giác như chúng ta đang sống trong phim khoa học viễn tưởng. Mình thích những điều sáng tạo mà AI có thể làm, nhưng đôi khi nó hơi quá sức, bạn biết đấy? Mong chờ năm 2025, nhưng có lẽ AI nên chậm lại một chút?

StephenRamirez
StephenRamirez 10 de Abril de 2025 à0 00:00:00 GMT

2024 was wild! AI's growth was insane, from Gemini 2.0 to protein binders. It's like every week there was something new and mind-blowing. Can't wait to see what 2025 brings, but 2024 set the bar high!

De volta ao topo
OR