вариант
Дом
Новости
2024: Год удивительного роста ИИ и инноваций

2024: Год удивительного роста ИИ и инноваций

10 апреля 2025 г.
79

2024: Год удивительного роста ИИ и инноваций

Когда мы вступаем в 2025 год, очень интересно подумать о невероятных шагах, которые мы сделали в 2024 году. От запуска моделей Gemini 2.0, адаптированных для агента эпохи, до расширения прав и возможностей творческого выражения, и от разработки новых белковых связующих до развития нейронауки с Ai-поддержкой и квантовой компьютеров, мы отталкивались по границам искусственного интеллектуального интеллекта. Все эти усилия направлены на использование ИИ для большего блага человечества.

Как мы упомянули в нашем эссе * Почему мы сосредоточены на AI * два года назад, наш подход к развитию ИИ основан на нашей основополагающей миссии по организации информации о мире и сделании ее универсально доступной и полезной. Эта миссия побуждает нашу приверженность улучшению жизни как можно большего количества людей, цель, которая остается нашей северной звездой.

В нашем 2024 году в год мы отмечаем замечательные достижения многих талантливых команд в Google, которые неустанно работали над продвижением нашей миссии. Их усилия подготовили почву для еще более захватывающих событий в предстоящем году.

Неустанные инновации в моделях, продуктах и ​​технологиях

2024 был посвящен экспериментам, быстрому развертыванию и получению наших последних технологий в руки разработчиков. В декабре мы представили первые модели нашей экспериментальной серии Gemini 2.0, разработанные специально для агентской эры. Мы начали все с Gemini 2.0 Flash, нашей универсальной рабочей лошадкой, а затем передовые прототипы из нашего агентского исследования. К ним относятся обновленный проект Astra, исследующий потенциал универсального помощника ИИ; Project Mariner, ранний прототип, способный выполнять действия в Chrome в качестве экспериментального расширения; и Жюль, кодовый агент с AI. Мы стремимся интегрировать возможности Gemini 2.0 в наши флагманские продукты, и мы уже начали тестировать в обзорах ИИ в поисках, используемых более миллиардами человек для изучения новых типов вопросов.

Мы также развернули Deep Research, новую агентскую функцию в Gemini Advanced, которая экономит часы исследований, создавая и выполняя многоэтапные планы для ответа на сложные вопросы. Кроме того, мы представили Gemini 2.0 Flash Speading Experimental, модель, которая прозрачно отображает его мыслительный процесс.

Ранее в этом году мы добились значительных успехов, интегрируя возможности Gemini в большее количество продуктов Google и запустив Gemini 1.5 Pro и Gemini 1.5 Flash. Последний, оптимизированный для скорости и эффективности, стал нашей самой популярной моделью среди разработчиков благодаря его компактному размеру и экономической эффективности.

Мы также улучшили AI Studio, сделав ее доступным в качестве прогрессивного веб -приложения (PWA), установленного на рабочем столе, iOS и Android, предоставляя разработчикам надежный набор ресурсов. Реакция общественности на новые функции в Notebooklm, такие как аудио -обзоры, был фантастическим. Эти функции могут генерировать глубокие дискуссии погружений из загруженного исходного материала, что делает обучение более привлекательным.

Ввод речи и вывод по -прежнему уточняются в таких продуктах, как Gemini Live, Project Astra, путешествия, и автоматическое дубинг YouTube, улучшая взаимодействие с пользователем.

В соответствии с нашей традицией участия в открытом сообществе, мы выпустили две новые модели из Gemma, нашей современной открытой модели, основанной на тех же исследованиях и технологиях, что и Gemini. Джемма превзошла модели аналогичного размера в таких областях, как ответный ответ, рассуждения и кодирование. Мы также выпустили Gemma Scope, инструмент, который поможет исследователям понять внутреннюю работу Gemma 2.

Мы добились успехов в улучшении фактического факта и сокращении галлюцинаций. В декабре мы опубликовали Facts Lounding, эталон, разработанный в сотрудничестве с Google DeepMind, Google Research и Kaggle, чтобы оценить, насколько хорошо крупные языковые модели обосновывали свои ответы в предоставленных исходных материалах и избегают галлюцинаций.

Набор данных заземления фактов с 1719 примерами предназначен для проверки длинных ответов, основанных на контекстных документах. Мы протестировали ведущие LLMS, используя заземления фактов, и мы с гордостью сообщаем, что Gemini 2.0 Flash Experimental, Gemini 1,5 Flash и Gemini 1.5 Pro достиг трех лучших показателей факта, а Gemini-2,0-Flash-EXP-впечатляющие 83,6%.

Мы также улучшили эффективность ML с помощью инновационных методов, таких как блокируемое параллельное декодирование, отсрочка, основанная на доверии и спекулятивное декодирование, которые ускоряют время вывода LLMS. Эти улучшения приносят пользу продуктам Google и устанавливают отраслевые стандарты.

В спорте мы запустили Tacticai, систему ИИ для футбольной тактики, которая обеспечивает тактическую информацию, особенно на угловых ударах.

Наша приверженность исследовательскому руководству остается сильной. Опрос WIPO 2010-2023 гг. По генеративным цитированиям искусственного интеллекта показал, что Google, включая Google Research и Google DeepMind, получил более чем вдвое больше цитирований второго наиболее цитируемого учреждения.

Этот график WIPO, основанный на данных января 2024 года из объектива, подчеркивает значительный вклад Alphabet в исследование ИИ за последнее десятилетие. Наконец, мы добились прогресса в Project Starline, нашей технологии «волшебного окна», сотрудничающей с HP для коммерциализации его, стремясь интегрировать ее в видеоконференции, такие как Google Meet и Zoom.

Расширение прав и возможностей творческого видения с генеративным ИИ

Мы считаем, что ИИ может открыть новые сферы творчества, делая творческое выражение более доступным и помогая людям реализовать свои художественные видения. В 2024 году мы представили серию обновлений для наших генеративных медиа -инструментов, охватывающих изображения, музыку и видео.

В начале года мы запустили ImageFX и MusicFX, генеративные инструменты искусственного интеллекта, которые создают изображения и на 70-секундные аудио-клипы из текстовых подсказок. В I/O мы предварительно просмотрели MusicFX DJ, разработанный для того, чтобы сделать создание живой музыки более доступным. В октябре мы работали с Джейкобом Коллиером, чтобы упростить DJ MusicFX для новых и начинающих музыкантов. Мы также обновили наш музыкальный инструментарий AI, Music AI Sandbox и разработали эксперимент на треке нашей мечты, позволяя нам создателям генерировать инструментальные саундтреки в разных жанрах, используя модели текста в музыку.

Позже в этом году мы выпустили Veo 2 и Imagen 3, наши последние модели изображений и видео. Imagen 3, наша модель высочайшего качества текста до изображения, генерирует изображения с превосходными деталями, освещением и меньшим количеством артефактов. VEO 2 продемонстрировал лучшее понимание реальной физики и человеческого движения, усиливая реализм. VEO 2 отмечает значительный прогресс в высококачественном генерации видео.

Мы продолжали исследовать потенциал ИИ в редактировании, используя его для управления такими атрибутами, как прозрачность и шероховатость объектов.

Эти примеры демонстрируют способность ИИ редактировать свойства материала с использованием генерации синтетических данных.

В генерации звука мы улучшили технологию видео-до-Аудио (V2A), генерируя динамические звуковые пейзажи из текстовых подсказок на основе действия на экране, которое может быть в сочетании с AI-сгенерированным видео от VEO.

Игры предлагают идеальную игровую площадку для творческих исследований и воплощенных агентов. В 2024 году мы представили Genie 2, мировой модели Foundation, которая генерирует разнообразные, играбельные 3D -среда для обучения и оценки воплощенных агентов. Это последовало за запуском SIMA, которая может следовать инструкциям по естественным языкам в различных настройках видеоигр.

Архитектура интеллекта: достижения в области робототехники, оборудования и вычислений

Поскольку наши мультимодальные модели становятся более искусными в понимании физики мира, они обеспечивают захватывающие достижения в области робототехники. Мы приближаемся к нашей цели более способных и полезных роботов.

С Aloha развязан, наш робот освоил задачи, такие как привязывание шнурков, подвесные рубашки, ремонт других роботов, вставки передач и чистящие кухни.

В начале года мы представили Autort, Sara-RT и RT-Trajectory, расширения наших трансформаторов робототехники работают, чтобы помочь роботам лучше ориентироваться в своей среде и более быстрые решения. Мы также выпустили Aloha развязать, обучая роботов для координации двух рук, и Demostart, который использует подкрепление обучения для повышения производительности реального мира на многоуровневой роботизированной руке с использованием симуляций.

Роботизированный трансформатор 2 (RT-2) учится на данных как веб-и робототехники, что позволяет ему выполнять такие задачи, как размещение клубники в миску. Помимо робототехники, наш метод обучения Alphachip Arefulsing Reblizing Chip Planning для центров обработки обработки данных и смартфонов. Мы выпустили предварительно обученную контрольную точку, чтобы облегчить внешнее принятие выпуска с открытым исходным кодом Alphachip. Мы также сделали Trillium, наш TPU шестого поколения, доступный для клиентов Google Cloud, демонстрируя, как ИИ может улучшить дизайн чипов. Alphachip учится оптимизировать макеты чипа, улучшая каждый дизайн, который он создает.

Наше исследование также касалось коррекции ошибок в квантовых компьютерах. В ноябре мы запустили Alphaqubit, декодер на основе AI, который с высокой точностью идентифицирует квантовые вычислительные ошибки. Это сотрудничество между Google DeepMind и Google Research ускорило прогресс в направлении надежных квантовых компьютеров. В тестах Alphaqubit уменьшал ошибки на 6% по сравнению с методами тензорной сети и на 30% по сравнению с коррелированным сопоставлением.

В декабре команда Google Quantum AI представила Willow, нашу последнюю квантовую чип. Willow может выполнить эталонные вычисления менее чем за пять минут, которые зайдут в сегодняшний самый быстрый суперкомпьютеры 10 септиллиона. Используя коррекцию квантовой ошибки, Willow вдвое сократило частоту ошибок, достигнув вехи, известной как «ниже порога», и заработав награду «Физический прорыв года».

Willow демонстрирует современную производительность в квантовых вычислениях.

Раскрытие новых решений: прогресс в науке, биологии и математике

Мы продолжали ускорять научный прогресс с ИИ, выпуская инструменты и статьи, которые демонстрируют власть ИИ в продвижении науки и математики. Вот несколько основных моментов:

В январе мы представили Alphageometry, систему ИИ для решения сложных задач геометрии. Наша обновленная Alphageometry 2 и Alphaproof, система, основанная на усиленном обучении для формальных математических рассуждений, достигла показателя серебряного медалиста на международной математической олимпиаде в июле 2024 года.

Alphageometry 2 Решала задача 4 от международной математической олимпиады в июле 2024 года всего за 19 секунд, доказывая, что 3.kil + omxpy равен 180 °. В сотрудничестве с изоморфными лабораториями мы представили Alphafold 3, который предсказывает структуру и взаимодействие молекул жизни, стремясь преобразовать наше понимание биологии и открытия лекарств.

Усовершенствованная архитектура и тренировка Alphafold 3 охватывают все молекулы Life, от белков до ДНК. Мы также добились значительных успехов в дизайне белка с Alphaproteo, системой ИИ для создания высокопрочных белковых связующих, которые могут привести к новым лекарствам и биосенсорам.

Alphaproteo может проектировать новые белковые связующие для различных целевых белков.

В сотрудничестве с Harvard's Lichtman Lab мы создали наномасштабное картирование куска человеческого мозга, первое в своем роде и сделали его доступным для исследователей. Это следует за нашими десятилетними усилиями в Connectomics, теперь распространяющихся на картирование человеческого мозга.

Этот проект картирования мозга показывает кластеры клеток зеркального изображения в самом глубоком слое коры.

В конце ноября мы были совместно участвовать в ИИ для научного форума с Королевским обществом, обсуждая ключевые темы, такие как прогноз структуры белка, картирование мозга человека и использование ИИ для прогнозирования и обнаружения лесных пожаров. Мы также организовали вопросы и ответы с четырьмя нобелевскими лауреатами на форуме, доступных на подкасте Google DeepMind.

2024 также был знаковым годом, когда Демис Хассабис, Джон Джампер и Дэвид Бейкер получили Нобелевскую премию по химии за свою работу на Alphafold 2, признанный за революцию в дизайне белка. Джеффри Хинтон вместе с Джоном Хопфилдом получил Нобелевскую премию по физике за основополагающие работы в области машинного обучения с искусственными нейронными сетями.

Google также получил дополнительные награды, в том числе награду Trake Paper Try Paper Neurips 2024 и приз Beale-Орчард-Хейс за первичное линейное программирование (PDLP), теперь является частью Google или инструментов, помогающих в крупномасштабных линейных программировании с реальными приложениями.

ИИ на благо человечества

В этом году мы добились значительных успехов в продукте и опубликовали исследования, демонстрирующие, как ИИ может непосредственно и сразу принести пользу людям в таких областях, как здравоохранение, готовность к стихийным бедствиям и образование.

В здравоохранении ИИ обещает демократизировать качественную помощь, особенно при раннем выявлении сердечно -сосудистых заболеваний. Наше исследование показало, что простое устройство кончика пальца в сочетании с основными метаданными, может предсказать риски для здоровья сердца. Мы также продвинули диагностику с поддержкой AI с туберкулезом, показывая, как ИИ может эффективно проверять популяции с высокими показателями ТБ и ВИЧ.

Med-Gemini достиг нового современного балла по тесту Medqa, превзойдя наш предыдущий лучший, Med-Palm 2, на 4,6%. Наша модель Близнецов является универсальным инструментом для профессионалов, и мы разрабатываем тонкие модели для конкретных областей. Например, Med-Gemini объединяет обучение по де-идентифицированным медицинским данным с возможностями Gemini, достигая 91,1% точности по сравнению с эталоном вопроса в стиле Medqa USMLE.

Мы также исследуем, как машинное обучение может учитывать нехватку опыта визуализации в таких областях, как радиология, дерматология и патология. Мы выпустили Derm Foundation и Path Foundation для диагностических задач и обнаружения биомаркеров, сотрудничали со Стэнфордской медициной в наборе данных Image Network (SCIN) и представили Фонд КТ для исследований медицинских визуализации.

В образовании мы представили Learnlm, семейство моделей, настраиваемых для обучения, улучшения опыта в поиске, YouTube и Gemini. Learnlm превзошел другие ведущие модели ИИ, и мы сделали его доступным для разработчиков в студии ИИ. Наш собеседник, обучение, обучение, и инструмент для обсуждения аудио, освещайте, еще больше обогащает опыт обучения.

В прогнозировании и готовности к стихийным бедствиям мы представили Gencast, улучшив погоду и экстремальное прогнозирование событий, а также NeuralGCM, способные моделировать тысячи дней атмосферных условий. График, которая выиграла премию Macrobert на 2024 год, предоставляет подробные прогнозы погоды.

Прогнозы графика за 10 дней демонстрируют конкретную влажность, температуру поверхности и скорость ветра.

Мы улучшили нашу модель прогнозирования наводнений, чтобы предсказать наводнение за семь дней, расширив покрытие до 100 стран и 700 миллионов человек.

Наша модель прогнозирования наводнений в настоящее время охватывает более 100 стран, с виртуальными датчиками в 150 странах, где физические датчики недоступны. ИИ также помогает в обнаружении и смягчении лесных пожаров. Наши граничные карты лесных пожаров теперь доступны в 22 странах, и мы создали Firesat, спутниковое созвездие, которое может обнаружить небольшие лесные пожары в течение 20 минут.

Мы расширили перевод Google, чтобы включить 110 новых языков, помогая преодолеть барьеры для информации и возможности для более чем 614 миллионов ораторов.

Эти новые языки в Google Translate представляют 8% населения мира.

Помогая установить стандарт в ответственном ИИ

Мы продолжили наше ведущее в отрасли исследования в области безопасности искусственного интеллекта, разрабатывая новые инструменты и методы и интегрируя их в наши последние модели. Мы стремимся сотрудничать для решения рисков.

Наше исследование неправильного использования показало, что глубокие подделки и джейлбрейки являются наиболее распространенными проблемами. В мае мы представили структуру безопасности Frontier для определения новых возможностей в наших современных моделях ИИ и запустили нашу структуру жизненного цикла ответственности искусственного интеллекта. В октябре мы расширили наш ответственный инструментарий Genai для работы с любым LLM, помогая разработчикам построить ИИ ответственно.

Мы выпустили статью об этике продвинутых помощников по искусственному интеллекту, изучая технический и моральный ландшафт помощников ИИ и возможностей и рисков, которые они представляют.

Мы расширили возможности Synthid для Watermark, сгенерированного AI текстом в приложении Gemini и веб-опыте и видео в VEO. Чтобы повысить прозрачность в Интернете, мы присоединились к Коалиции для продленса и подлинности контента (C2PA) и работали над новой, более безопасной версией стандарта учетных данных контента.

Synthid корректирует показатели вероятности прогнозируемых токенов, чтобы обеспечить качество, точность и креативность в контенте, сгенерированном AI.

Помимо LLMS, мы поделились нашим подходом к биологической безопасности для Alphafold 3, работали с партнерами по отрасли, чтобы запустить коалицию для безопасного ИИ (COSAI), и участвовали на саммите искусственного интеллекта в Сеул, чтобы внести свой вклад в международное управление искусственным интеллектом.

Поскольку мы разрабатываем новые технологии, такие как агенты искусственного интеллекта, мы будем продолжать изучать вопросы безопасности, безопасности и конфиденциальности. Под руководством наших принципов ИИ мы придерживаемся преднамеренного, постепенного подхода, проводя обширные исследования, обучение безопасности и оценки рисков с доверенными тестерами и внешними экспертами.

Заглядывая в будущее до 2025 года

2024 год был годом невероятного прогресса и волнения в ИИ. Мы еще более взволнованы тем, что будет в 2025 году.

Поскольку мы продолжаем раздвигать границы исследований искусственного интеллекта в области продуктов, науки, здоровья и творчества, мы должны вдумчиво рассмотреть, как и когда использовать эти технологии. Расположение приоритетов ответственной практики ИИ и содействия сотрудничеству, мы будем продолжать играть решающую роль в создании будущего, где ИИ приносит пользу человечеству.

Связанная статья
Nouvelle étude révèle combien de données les LLM mémorisent réellement Nouvelle étude révèle combien de données les LLM mémorisent réellement Combien les modèles d'IA mémorisent-ils réellement ? Une nouvelle recherche révèle des insights surprenantsNous savons tous que les grands modèles de langage (LLM) comme ChatGPT, Claude et Gemini sont
Potentiel de l'IA pour résoudre le puzzle de la productivité au Royaume-Uni Potentiel de l'IA pour résoudre le puzzle de la productivité au Royaume-Uni L'IA pourrait stimuler l'économie britannique de 400 milliards de livres – mais seulement si les travailleurs l'adoptentLe Royaume-Uni est à l'aube d'une opportunité économique massive—400 milliards d
9 Meilleurs Outils de Recrutement IA (Avril 2025) 9 Meilleurs Outils de Recrutement IA (Avril 2025) Les 10 meilleurs outils de recrutement IA transformant l'embauche en 2024L'intelligence artificielle révolutionne le recrutement, et pour cause. Les entreprises submergées par les CV et les plannings
Комментарии (25)
JustinMartin
JustinMartin 12 апреля 2025 г., 0:00:00 GMT

2024 was a wild ride with AI! From Gemini 2.0 to quantum computing, it's like we're living in a sci-fi movie. Loved seeing all the creative stuff AI can do, but sometimes it felt a bit too much, you know? Can't wait to see what 2025 brings, but maybe slow down a bit, AI?

BillyEvans
BillyEvans 12 апреля 2025 г., 0:00:00 GMT

¡2024 fue increíble con la IA! Desde Gemini 2.0 hasta la computación cuántica, parece que vivimos en una película de ciencia ficción. Me encantó ver todo lo creativo que puede hacer la IA, pero a veces se sintió un poco abrumador, ¿sabes? Espero con ansias lo que 2025 traiga, pero tal vez, ¿puede la IA ralentizar un poco?

WalterWhite
WalterWhite 10 апреля 2025 г., 0:00:00 GMT

2024年はAIがすごかったね!ジェミニ2.0から量子コンピューティングまで、まるでSF映画に住んでいるみたい。AIができるクリエイティブなことが大好きだけど、時々少し多すぎる感じがするんだよね。2025年が楽しみだけど、AI、ちょっとペースを落とそうか?

WillieRodriguez
WillieRodriguez 11 апреля 2025 г., 0:00:00 GMT

2024 war ein wilder Ritt mit KI! Von Gemini 2.0 bis zur Quantencomputing, es fühlt sich an, als lebten wir in einem Sci-Fi-Film. Ich liebe das kreative Zeug, was KI kann, aber manchmal war es ein bisschen zu viel, weißt du? Ich freue mich auf 2025, aber vielleicht sollte die KI ein bisschen langsamer machen?

KeithJones
KeithJones 12 апреля 2025 г., 0:00:00 GMT

Năm 2024 thật tuyệt vời với trí tuệ nhân tạo! Từ Gemini 2.0 đến máy tính lượng tử, cảm giác như chúng ta đang sống trong phim khoa học viễn tưởng. Mình thích những điều sáng tạo mà AI có thể làm, nhưng đôi khi nó hơi quá sức, bạn biết đấy? Mong chờ năm 2025, nhưng có lẽ AI nên chậm lại một chút?

StephenRamirez
StephenRamirez 10 апреля 2025 г., 0:00:00 GMT

2024 was wild! AI's growth was insane, from Gemini 2.0 to protein binders. It's like every week there was something new and mind-blowing. Can't wait to see what 2025 brings, but 2024 set the bar high!

Вернуться к вершине
OR