вариант
Дом
Новости
2024: Год удивительного роста ИИ и инноваций

2024: Год удивительного роста ИИ и инноваций

10 апреля 2025 г.
89

2024: Год удивительного роста ИИ и инноваций

Вступая в 2025 год, захватывающе оглянуться на невероятные успехи, достигнутые в 2024 году. От запуска моделей Gemini 2.0, адаптированных для агентской эры, до расширения возможностей творческого самовыражения, от разработки новых белковых связующих до продвижения нейронаук и квантовых вычислений с поддержкой ИИ — мы ответственно и смело раздвигаем границы искусственного интеллекта. Все эти усилия направлены на использование ИИ во благо человечества.

Как мы упомянули в нашем эссе *Почему мы фокусируемся на ИИ* два года назад, наш подход к развитию ИИ основан на нашей миссии основания — организовать информацию мира и сделать её общедоступной и полезной. Эта миссия определяет наше стремление улучшать жизнь как можно большего числа людей, что остаётся нашей путеводной звездой.

В нашем обзоре 2024 года мы отмечаем выдающиеся достижения множества талантливых команд в Google, которые неустанно работали над продвижением нашей миссии. Их усилия заложили основу для ещё более захватывающих разработок в предстоящем году.

Неустанная инновация в моделях, продуктах и технологиях

2024 год был посвящён экспериментам, быстрому внедрению и передаче наших новейших технологий в руки разработчиков. В декабре мы представили первые модели экспериментальной серии Gemini 2.0, разработанные специально для агентской эры. Мы начали с Gemini 2.0 Flash, нашего универсального труженика, за которым последовали передовые прототипы из наших агентских исследований. К ним относятся обновлённый Project Astra, исследующий потенциал универсального ИИ-ассистента; Project Mariner, ранний прототип, способный выполнять действия в Chrome как экспериментальное расширение; и Jules, агент с поддержкой ИИ для работы с кодом. Мы стремимся интегрировать возможности Gemini 2.0 в наши флагманские продукты, и мы уже начали тестирование в AI Overviews в рамках Search, используемого более чем миллиардом человек для изучения новых типов вопросов.

Мы также запустили Deep Research, новую агентскую функцию в Gemini Advanced, которая экономит часы исследований, создавая и выполняя многоэтапные планы для ответа на сложные вопросы. Кроме того, мы представили Gemini 2.0 Flash Thinking Experimental, модель, которая прозрачно отображает процесс своего мышления.

Ранее в этом году мы добились значительных успехов, интегрировав возможности Gemini в большее число продуктов Google и запустив Gemini 1.5 Pro и Gemini 1.5 Flash. Последняя, оптимизированная для скорости и эффективности, стала нашей самой популярной моделью среди разработчиков благодаря компактному размеру и экономичности.

Мы также улучшили AI Studio, сделав его доступным как прогрессивное веб-приложение (PWA), устанавливаемое на настольные компьютеры, iOS и Android, предоставляя разработчикам мощный набор ресурсов. Реакция публики на новые функции в NotebookLM, такие как Audio Overviews, была фантастической. Эти функции могут генерировать глубокие обсуждения на основе загруженных исходных материалов, делая обучение более увлекательным.

Речевой ввод и вывод продолжают совершенствоваться в продуктах, таких как Gemini Live, Project Astra, Journey Voices и автоматическое дублирование YouTube, улучшая взаимодействие с пользователями.

В соответствии с нашей традицией вклада в открытое сооб Society, мы выпустили две новые модели из Gemma, нашей передовой открытой модели, построенной на тех же исследованиях и технологиях, что и Gemini. Gemma превзошла модели аналогичного размера в таких областях, как ответы на вопросы, рассуждения и программирование. Мы также выпустили Gemma Scope, инструмент, помогающий исследователям понять внутренние механизмы Gemma 2.

Мы добились прогресса в улучшении фактической точности наших моделей и сокращении галлюцинаций. В декабре мы опубликовали FACTS Grounding, эталон, разработанный в сотрудничестве с Google DeepMind, Google Research и Kaggle, для оценки того, насколько хорошо большие языковые модели основывают свои ответы на предоставленных исходных материалах и избегают галлюцинаций.

Набор данных FACTS Grounding, содержащий 1719 примеров, предназначен для тестирования длинных ответов, основанных на контекстных документах. Мы протестировали ведущие большие языковые модели с использованием FACTS Grounding, и мы гордимся тем, что Gemini 2.0 Flash Experimental, Gemini 1.5 Flash и Gemini 1.5 Pro заняли первые три места по точности, при этом Gemini-2.0-flash-exp набрала впечатляющие 83,6%.

Мы также улучшили эффективность машинного обучения с помощью инновационных методов, таких как блочное параллельное декодирование, отсрочка на основе уверенности и спекулятивное декодирование, которые ускоряют время вывода больших языковых моделей. Эти улучшения приносят пользу продуктам Google и устанавливают отраслевые стандарты.

В спорте мы запустили TacticAI, систему ИИ для футбольной тактики, которая предоставляет тактические идеи, особенно по угловым ударам.

Наше стремление к лидерству в исследованиях остаётся сильным. Опрос WIPO за 2010–2023 годы по цитированию генеративного ИИ показал, что Google, включая Google Research и Google DeepMind, получил более чем в два раза больше цитат, чем учреждение, занявшее второе место.

Этот график WIPO, основанный на данных января 2024 года от The Lens, подчёркивает значительный вклад Alphabet в исследования генеративного ИИ за последнее десятилетие. Наконец, мы добились прогресса с Project Starline, нашей технологией «волшебного окна», сотрудничая с HP для её коммерциализации, стремясь интегрировать её в сервисы видеоконференций, такие как Google Meet и Zoom.

Расширение возможностей творческого видения с помощью генеративного ИИ

Мы верим, что ИИ может открыть новые горизонты творчества, делая творческое самовыражение более доступным и помогая людям реализовать свои художественные замыслы. В 2024 году мы представили ряд обновлений для наших генеративных медиаинструментов, охватывающих изображения, музыку и видео.

В начале года мы запустили ImageFX и MusicFX, генеративные инструменты ИИ, которые создают изображения и аудиоклипы длительностью до 70 секунд из текстовых подсказок. На I/O мы представили предварительную версию MusicFX DJ, предназначенную для упрощения создания живой музыки. В октябре мы работали с Джейкобом Колльером, чтобы упростить MusicFX DJ для новых и начинающих музыкантов. Мы также обновили наш музыкальный инструментарий ИИ, Music AI Sandbox, и развили эксперимент Dream Track, позволяющий создателям в США генерировать инструментальные саундтреки в различных жанрах с использованием моделей преобразования текста в музыку.

Позже в этом году мы выпустили Veo 2 и Imagen 3, наши последние модели для изображений и видео. Imagen 3, наша модель преобразования текста в изображение наивысшего качества, генерирует изображения с превосходной детализацией, освещением и меньшим количеством артефактов. Veo 2 продемонстрировал лучшее понимание физики реального мира и движений человека, повышая реализм. Veo 2 знаменует значительный прогресс в генерации высококачественного видео.

Мы продолжили исследовать потенциал ИИ в редактировании, используя его для управления такими атрибутами, как прозрачность и шероховатость объектов.

Эти примеры демонстрируют способность ИИ редактировать свойства материалов с использованием генерации синтетических данных.

В генерации аудио мы улучшили технологию видео-в-аудио (V2A), создавая динамичные звуковые ландшафты из текстовых подсказок на основе действий на экране, которые могут быть объединены с видео, сгенерированным ИИ от Veo.

Игры предоставляют идеальную площадку для творческих исследований и обучения воплощённых агентов. В 2024 году мы представили Genie 2, базовую мировую модель, которая генерирует разнообразные, играбельные 3D-среды для обучения и оценки воплощённых агентов. Это последовало за запуском SIMA, которая может следовать инструкциям на естественном языке в различных игровых настройках.

Архитектура интеллекта: прогресс в робототехнике, оборудовании и вычислениях

По мере того как наши мультимодальные модели становятся более искусными в понимании физики мира, они открывают захватывающие возможности в робототехнике. Мы приближаемся к нашей цели создания более способных и полезных роботов.

С ALOHA Unleashed наш робот освоил такие задачи, как завязывание шнурков, развешивание рубашек, ремонт других роботов, вставка шестерён и уборка кухонь.

В начале года мы представили AutoRT, SARA-RT и RT-Trajectory, расширения нашей работы с Robotics Transformers, чтобы помочь роботам лучше ориентироваться в окружающей среде и быстрее принимать решения. Мы также выпустили ALOHA Unleashed, обучая роботов координировать две руки, и DemoStart, который использует обучение с подкреплением для улучшения производительности в реальном мире на многопальцевой роботизированной руке с использованием симуляций.

Robotic Transformer 2 (RT-2) обучается на данных из интернета и робототехники, что позволяет ему выполнять такие задачи, как помещение клубники в миску. Помимо робототехники, наш метод обучения с подкреплением AlphaChip революционизирует планирование компоновки микросхем для дата-центров и смартфонов. Мы выпустили предварительно обученную контрольную точку, чтобы облегчить внешнее внедрение открытого исходного кода AlphaChip. Мы также сделали Trillium, наше TPU шестого поколения, доступным для клиентов Google Cloud, демонстрируя, как ИИ может улучшать дизайн микросхем. AlphaChip учится оптимизировать компоновку микросхем, улучшаясь с каждым созданным дизайном.

Наши исследования также затронули коррекцию ошибок в квантовых компьютерах. В ноябре мы запустили AlphaQubit, декодер на основе ИИ, который с высокой точностью определяет ошибки квантовых вычислений. Это сотрудничество между Google DeepMind и Google Research ускорило прогресс в направлении надёжных квантовых компьютеров. В тестах AlphaQubit снизил уровень ошибок на 6% по сравнению с методами тензорных сетей и на 30% по сравнению с коррелированным соответствием.

В декабре команда Google Quantum AI представила Willow, наш новейший квантовый чип. Willow может выполнить эталонное вычисление менее чем за пять минут, что заняло бы у самых быстрых современных суперкомпьютеров 10 септиллионов лет. Используя квантовую коррекцию ошибок, Willow вдвое сократил уровень ошибок, достигнув рубежа, известного как «ниже порога», и получил награду «Физический прорыв года».

Willow демонстрирует передовые показатели в квантовых вычислениях.

Открытие новых решений: прогресс в науке, биологии и математике

Мы продолжили ускорять научный прогресс с помощью ИИ, выпуская инструменты и статьи, демонстрирующие силу ИИ в продвижении науки и математики. Вот некоторые ключевые моменты:

В январе мы представили AlphaGeometry, систему ИИ для решения сложных геометрических задач. Наши обновлённые AlphaGeometry 2 и AlphaProof, система на основе обучения с подкреплением для формального математического рассуждения, достигли результатов на уровне серебряного медалиста на Международной математической олимпиаде в июле 2024 года.

AlphaGeometry 2 решила задачу 4 Международной математической олимпиады июля 2024 года всего за 19 секунд, доказав, что ∠KIL + ∠XPY равно 180°. В сотрудничестве с Isomorphic Labs мы представили AlphaFold 3, которая предсказывает структуру и взаимодействие молекул жизни, стремясь трансформировать наше понимание биологии и открытия лекарств.Продвинутая архитектура и обучение AlphaFold 3 охватывают все молекулы жизни, от белков до ДНК. Мы также добились значительных успехов в дизайне белков с AlphaProteo, системой ИИ для создания высокопрочных белковых связующих, которые могут привести к новым лекарствам и биосенсорам.AlphaProteo может разрабатывать новые белковые связующие для различных целевых белков.

В сотрудничестве с лабораторией Лихтмана в Гарварде мы создали наноразмерное картирование части человеческого мозга, первое в своём роде, и сделали его доступным для исследователей. Это продолжает наше десятилетнее усилие в области коннектомики, теперь распространяющееся на картирование человеческого мозга.

Этот проект картирования мозга выявил зеркальные кластеры клеток в самом глубоком слое коры.

В конце ноября мы совместно с Королевским обществом провели Форум ИИ для науки, обсуждая ключевые темы, такие как предсказание структуры белков, картирование человеческого мозга и использование ИИ для прогнозирования и обнаружения лесных пожаров. Мы также провели сессию вопросов и ответов с четырьмя лауреатами Нобелевской премии на форуме, доступную в подкасте Google DeepMind.

2024 год также стал знаковым, поскольку Демис Хассабис, Джон Джампер и Дэвид Бейкер получили Нобелевскую премию по химии за их работу над AlphaFold 2, признанную за революцию в дизайне белков. Джеффри Хинтон вместе с Джоном Хопфилдом получили Нобелевскую премию по физике за основополагающую работу в области машинного обучения с искусственными нейронными сетями.

Google также получил дополнительные награды, включая премии NeurIPS 2024 Test of Time Paper Awards и премию Била—Орчард-Хейса за Primal-Dual Linear Programming (PDLP), теперь часть Google OR Tools, помогающую в крупномасштабном линейном программировании с реальными приложениями.

ИИ на благо человечества

В этом году мы добились значительных успехов в продуктах и опубликовали исследования, демонстрирующие, как ИИ может непосредственно и немедленно приносить пользу людям в таких областях, как здравоохранение, готовность к стихийным бедствиям и образование.

В здравоохранении ИИ обещает демократизировать качественную медицинскую помощь, особенно в раннем выявлении сердечно-сосудистых заболеваний. Наши исследования показали, что простое устройство для кончиков пальцев в сочетании с базовыми метаданными может предсказывать риски для здоровья сердца. Мы также продвинули диагностику туберкулёза с помощью ИИ, показав, как ИИ может эффективно скринировать население с высоким уровнем туберкулёза и ВИЧ.

Med-Gemini достиг нового рекордного результата на эталоне MedQA, превзойдя наш предыдущий лучший результат, Med-PaLM 2, на 4,6%. Наша модель Gemini — универсальный инструмент для профессионалов, и мы разрабатываем тонко настроенные модели для конкретных доменов. Med-Gemini, например, сочетает обучение на обезличенных медицинских данных с возможностями Gemini, достигая точности 91,1% на эталоне вопросов в стиле USMLE MedQA.

Мы также исследуем, как машинное обучение может устранить нехватку экспертизы в визуализации в таких областях, как радиология, дерматология и патология. Мы выпустили Derm Foundation и Path Foundation для диагностических задач и обнаружения биомаркеров, сотрудничали со Stanford Medicine над набором данных Skin Condition Image Network (SCIN) и представили CT Foundation для исследований в области медицинской визуализации.

В образовании мы представили LearnLM, семейство моделей, тонко настроенных для обучения, улучшающих опыт в Search, YouTube и Gemini. LearnLM превзошёл другие ведущие модели ИИ, и мы сделали его доступным для разработчиков в AI Studio. Наш разговорный спутник для обучения, LearnAbout, и инструмент для аудиообсуждений, Illuminate, дополнительно обогащают образовательный опыт.

В прогнозировании и подготовке к стихийным бедствиям мы представили GenCast, улучшающий прогнозирование погоды и экстремальных событий, и NeuralGCM, способный моделировать тысячи дней атмосферных условий. GraphCast, получивший премию MacRobert Award 2024, предоставляет детализированные прогнозы погоды.

Прогнозы GraphCast на 10 дней демонстрируют удельную влажность, температуру поверхности и скорость ветра.

Мы улучшили нашу модель прогнозирования наводнений, чтобы предсказывать наводнения за семь дней, расширив охват до 100 стран и 700 миллионов человек.

Наша модель прогнозирования наводнений теперь охватывает более 100 стран, с виртуальными датчиками в 150 странах, где физические датчики недоступны. ИИ также помогает в обнаружении и смягчении лесных пожаров. Наши карты границ лесных пожаров теперь доступны в 22 странах, и мы создали FireSat, созвездие спутников, которое может обнаруживать небольшие лесные пожары в течение 20 минут.

Мы расширили Google Translate, добавив 110 новых языков, помогая устранить барьеры для информации и возможностей для более чем 614 миллионов носителей.

Эти новые языки в Google Translate представляют 8% населения мира.

Помощь в установлении стандартов ответственного ИИ

Мы продолжили наши ведущие в отрасли исследования в области безопасности ИИ, разрабатывая новые инструменты и методы и интегрируя их в наши последние модели. Мы привержены сотрудничеству для устранения рисков.

Наши исследования в области злоупотреблений показали, что дипфейки и взломы являются наиболее распространёнными проблемами. В мае мы представили The Frontier Safety Framework для выявления новых возможностей в наших продвинутых моделях ИИ и запустили наш фреймворк жизненного цикла ответственности ИИ. В октябре мы расширили наш инструментарий Responsible GenAI Toolkit для работы с любой большой языковой моделью, помогая разработчикам ответственно создавать ИИ.

Мы выпустили статью об этике продвинутых ИИ-ассистентов, исследуя технический и моральный ландшафт ИИ-ассистентов и возможности и риски, которые они представляют.

Мы расширили возможности SynthID для нанесения водяных знаков на текст, сгенерированный ИИ, в приложении и веб-интерфейсе Gemini, а также на видео в Veo. Для повышения прозрачности в интернете мы присоединились к Coalition for Content Provenance and Authenticity (C2PA) и работали над новой, более безопасной версией стандарта Content Credentials.

SynthID корректирует вероятностные оценки предсказанных токенов, чтобы обеспечить качество, точность и креативность в сгенерированном ИИ контенте.

Помимо больших языковых моделей, мы поделились нашим подходом к биобезопасности для AlphaFold 3, сотрудничали с отраслевыми партнёрами для запуска Coalition for Secure AI (CoSAI) и участвовали в саммите AI Seoul Summit, чтобы внести вклад в международное управление ИИ.

По мере разработки новых технологий, таких как ИИ-агенты, мы продолжим исследовать вопросы безопасности, защиты и конфиденциальности. Руководствуясь нашими принципами ИИ, мы применяем осторожный, постепенный подход, проводя обширные исследования, обучение безопасности и оценку рисков с доверенными тестировщиками и внешними экспертами.

Взгляд в 2025 год

2024 год стал годом невероятного прогресса и волнения в области ИИ. Мы ещё более взволнованы тем, что ждёт нас в 2025 году.

Продолжая раздвигать границы исследований ИИ в продуктах, науке, здравоохранении и творчестве, мы должны тщательно обдумать, как и когда внедрять эти технологии. Приоритизируя ответственные практики ИИ и способствуя сотрудничеству, мы продолжим играть ключевую роль в создании будущего, где ИИ приносит пользу человечеству.

Связанная статья
Salesforce представляет цифровых помощников с ИИ в Slack для конкуренции с Microsoft Copilot Salesforce представляет цифровых помощников с ИИ в Slack для конкуренции с Microsoft Copilot Salesforce запустила новую стратегию ИИ для рабочего места, представив специализированных «цифровых помощников», интегрированных в беседы Slack, сообщила компания в понедельник.Новый инструмент, Agent
Инвестиция Oracle в $40 млрд на чипы Nvidia для AI-датцентра в Техасе Инвестиция Oracle в $40 млрд на чипы Nvidia для AI-датцентра в Техасе Oracle планирует инвестировать около $40 млрд в чипы Nvidia для нового крупного дата-центра в Техасе, разработанного OpenAI, как сообщает Financial Times. Эта сделка, одна из крупнейших по закупке чип
Приложение Meta AI представит премиум-уровень и рекламу Приложение Meta AI представит премиум-уровень и рекламу Приложение Meta AI вскоре может предложить платную подписку, аналогичную предложениям конкурентов, таких как OpenAI, Google и Microsoft. Во время отчета о доходах за первый квартал 2025 года генеральн
Комментарии (25)
FrankSmith
FrankSmith 23 апреля 2025 г., 4:42:56 GMT+03:00

¡2024 fue un año increíble para la IA! Desde Gemini 2.0 hasta la computación cuántica, es impresionante. Parece que estamos viviendo en una película de ciencia ficción. ¡No puedo esperar a ver qué nos trae 2025! 🚀

RalphGarcia
RalphGarcia 19 апреля 2025 г., 20:10:39 GMT+03:00

2024年のAIの進歩は本当に驚きでしたね!ジェミニ2.0から量子コンピューティングまで、まるでSF映画みたいです。2025年が楽しみです。🚀

CarlLewis
CarlLewis 18 апреля 2025 г., 14:58:13 GMT+03:00

2024 was insane with AI! From Gemini 2.0 to quantum computing, it felt like living in a sci-fi movie. The creativity boost was real, but sometimes I felt overwhelmed by the rapid changes. Still, it's exciting to see where AI will take us next! 🚀

RogerRoberts
RogerRoberts 15 апреля 2025 г., 1:22:16 GMT+03:00

¡2024 fue una locura con la IA! Desde Gemini 2.0 hasta la computación cuántica, parecía estar viviendo en una película de ciencia ficción. El impulso de creatividad fue real, pero a veces me sentí abrumado por los cambios rápidos. Aún así, ¡es emocionante ver a dónde nos llevará la IA a continuación! 🚀

RobertMartin
RobertMartin 13 апреля 2025 г., 13:55:17 GMT+03:00

2024年のAIの進歩は本当に驚きだった!ジェミニ2.0から量子コンピューティングまで、まるでSF映画にいるようだった。創造性の向上は確かにあったけど、急速な変化に圧倒されることもあった。それでも、AIが次にどこへ導いてくれるのか楽しみだよ!🚀

JimmyGarcia
JimmyGarcia 13 апреля 2025 г., 9:54:46 GMT+03:00

2024 foi louco com IA! Do Gemini 2.0 ao computador quântico, parecia estar vivendo em um filme de ficção científica. O aumento da criatividade foi real, mas às vezes me senti sobrecarregado com as mudanças rápidas. Ainda assim, é emocionante ver para onde a IA nos levará em seguida! 🚀

Вернуться к вершине
OR