Объяснение ключевых терминов ИИ: От LLM до галлюцинаций

Мир искусственного интеллекта огромен и сложен. Эксперты в этой области часто используют технический жаргон для объяснения своей работы. Именно поэтому в наших материалах, посвященных индустрии искусственного интеллекта, встречаются эти специализированные термины. Мы составили этот глоссарий, чтобы пояснить ключевые слова и фразы, которые вы встретите в наших статьях.
Мы будем регулярно обновлять этот справочник по мере того, как исследователи будут разрабатывать новые методы и выявлять новые проблемы безопасности на переднем крае ИИ.
AGI
Искусственный интеллект общего назначения, или ИИО, - это широкий и часто обсуждаемый термин. Как правило, он описывает ИИ, превосходящий человеческие способности в широком спектре задач. Сэм Альтман из OpenAI описывает его как "среднего человека, которого вы могли бы нанять в качестве сотрудника", а устав OpenAI определяет AGI как "высокоавтономные системы, превосходящие человека в наиболее экономически выгодной работе". Google DeepMind предлагает несколько иную точку зрения, определяя AGI как "ИИ, который, по крайней мере, не уступает человеку в большинстве когнитивных задач". Концепция остается изменчивой даже среди ведущих исследователей ИИ.
Агент ИИ
ИИ-агент - это инструмент, использующий ИИ для автономного выполнения многоэтапных задач, выходящих за рамки простого взаимодействия с чатботом. Это может быть регистрация расходов, бронирование поездок или управление кодом. Определение "агента ИИ", как развивающейся области, может варьироваться, а необходимая инфраструктура все еще развивается. По сути, речь идет об автономной системе, которая может координировать работу нескольких моделей ИИ для достижения сложных целей.
Цепочка мышления
Люди могут мгновенно отвечать на простые вопросы, но сложные проблемы часто требуют разбивки на шаги. Например, решение логической головоломки о животных на ферме требует промежуточных вычислений.
В ИИ рассуждения по цепочке - это техника, при которой большие языковые модели декомпозируют проблему на более мелкие логические шаги. Этот процесс, хотя и более медленный, значительно повышает точность, особенно при решении логических задач или задач кодирования. Специализированные модели рассуждений строятся на основе традиционных LLM и оптимизируются для такого пошагового мышления с помощью обучения с подкреплением.
(См.: Большая языковая модель)
Присоединяйтесь к нам на TechCrunch Sessions: AI
Успейте занять место на нашем главном событии в области ИИ, где выступят представители OpenAI, Anthropic и Cohere. В течение ограниченного времени всего за 292 доллара США вы можете приобрести пропуск на целый день, где вас ждут выступления экспертов, семинары и мощный нетворкинг.
Участвуйте в выставке TechCrunch Sessions: AI
Покажите свои инновации 1 200+ лицам, принимающим решения, на TC Sessions: AI. Оформите стенд по доступной цене до 9 мая или пока есть свободные места.
Глубокое обучение
Сложное направление машинного обучения, в котором алгоритмы ИИ строятся на основе многоуровневых искусственных нейронных сетей. Такая архитектура позволяет им выявлять сложные закономерности и взаимосвязи, намного превосходящие более простые модели, такие как деревья решений. Вдохновленные человеческим мозгом, модели глубокого обучения автономно изучают ключевые характеристики данных, не требуя от человека их ручного определения. Они совершенствуются благодаря повторению и исправлению ошибок.
Однако для обучения этих моделей требуются огромные наборы данных (миллионы точек и более) и значительные вычислительные ресурсы, что приводит к увеличению стоимости разработки по сравнению с традиционным машинным обучением.
(См.: Нейронная сеть)
Диффузия
Диффузия - это основная технология, лежащая в основе многих современных моделей ИИ, создающих произведения искусства, музыку и текст. Вдохновленные физикой, эти системы постепенно добавляют шум к данным, таким как изображение или звук, пока их первоначальная структура не станет полностью непонятной. В отличие от необратимого процесса в природе, диффузионные модели ИИ учатся обращать вспять это разрушение, восстанавливая связные данные из шума, что наделяет их мощными генеративными способностями.
Дистилляция
Дистилляция - это метод "учитель-ученик", позволяющий передавать знания от большой модели ИИ к меньшей. Разработчики запрашивают модель-учитель и записывают ее результаты, которые затем используются для обучения модели-ученика, чтобы подражать поведению учителя. Этот процесс позволяет создать более компактную, быструю и эффективную модель с минимальными потерями производительности. Считается, что этот метод лежит в основе таких версий, как GPT-4 Turbo.
Хотя этот метод широко используется внутри компании, дистилляция из модели конкурента обычно нарушает условия обслуживания API, что вызывает этические и юридические вопросы в отрасли.
Тонкая настройка
Это дополнительное обучение уже существующей модели искусственного интеллекта с целью специализации ее работы для конкретной задачи или области. Это предполагает подачу модели новых данных, ориентированных на конкретную задачу. Многие ИИ-стартапы начинают с создания крупной языковой модели общего назначения, а затем дорабатывают ее с помощью собственных данных, чтобы повысить ее полезность для конкретной отрасли, например юриспруденции или медицины.
(См.: Большая языковая модель [LLM])
GAN
Генеративная адверсарная сеть (Generative Adversarial Network, или GAN) - это система машинного обучения, которая позволяет добиваться успехов в создании реалистичных данных, в том числе глубоких подделок. Она использует две конкурирующие нейронные сети: генератор, который создает данные, и дискриминатор, который оценивает их подлинность. Этот состязательный процесс подталкивает генератор к созданию все более реалистичных результатов без постоянного вмешательства человека. GAN отлично работают в специализированных приложениях, таких как генерация изображений, но меньше подходят для ИИ общего назначения.
Галлюцинация
Галлюцинация - это отраслевой термин, обозначающий случаи, когда модели ИИ генерируют неверную или сфабрикованную информацию. Это серьезная проблема для надежности и безопасности ИИ. Вводящие в заблуждение результаты могут представлять реальную опасность, например, давать вредные медицинские советы. Хотя большинство инструментов GenAI содержат предупреждения об отказе от ответственности, проблема сохраняется из-за недостатка обучающих данных, особенно для моделей с широким фундаментом. Эта проблема стимулирует развитие более специализированных, вертикальных моделей ИИ, которые работают в более узких и четко определенных областях знаний, чтобы уменьшить количество ошибок.
Выводы
Вывод - это процесс использования обученной модели ИИ для прогнозирования или получения выводов на основе новых данных. Это этап применения, который следует за обучением. Выводы могут выполняться на различном оборудовании, от смартфонов до облачных серверов со специализированными чипами ИИ, но их производительность сильно различается. Большие модели медленно работают на потребительском оборудовании по сравнению со специализированными высокопроизводительными системами.
[См.: Обучение].
Большая языковая модель (LLM)
Большие языковые модели, или LLM, используются в таких популярных ИИ-помощниках, как ChatGPT, Claude и Gemini. Когда вы взаимодействуете с этими инструментами, вы взаимодействуете с LLM, часто дополненной такими возможностями, как просмотр веб-страниц. Модель, лежащая в основе (например, GPT от OpenAI), и потребительский продукт (например, ChatGPT) могут иметь разные названия.
LLM - это глубокие нейронные сети с миллиардами параметров, которые изучают закономерности на основе огромного количества текста. Они создают сложное, многомерное представление языка. В ответ на запрос они генерируют ответы, предсказывая наиболее вероятную последовательность слов на основе статистических закономерностей, полученных в процессе обучения.
(См.: Нейронная сеть)
Нейронная сеть
Нейронная сеть - это многоуровневая алгоритмическая структура, лежащая в основе глубокого обучения и современного бурного развития ИИ. Хотя концептуально нейронная сеть была создана на основе человеческого мозга в 1940-х годах, ее практическая мощь была раскрыта с появлением графических процессоров в игровой индустрии. Эти чипы эффективно обучают многоуровневые сети, что позволило совершить прорыв в таких областях, как распознавание речи, автономная навигация и генеративный ИИ.
(См.: Большая языковая модель [LLM])
Обучение
Обучение - это процесс подачи данных в модель машинного обучения, чтобы она могла изучать закономерности и улучшать свои результаты. Изначально модель - это просто структура случайных чисел; в процессе обучения она превращается в функциональный инструмент, будь то распознавание изображений или написание текста. Этот процесс может быть ресурсоемким, требующим огромных объемов данных и вычислительных мощностей. Гибридные подходы, такие как тонкая настройка системы на основе правил, могут помочь справиться с этими расходами.
[См.: Вывод].
Трансферное обучение
Метод, при котором модель, обученная для одной задачи, используется в качестве отправной точки для смежной, но другой задачи. При этом используются ранее полученные знания, что позволяет сэкономить время и ресурсы, особенно если данные для новой задачи ограничены. Однако для достижения хороших результатов модели обычно требуется дополнительное обучение на специфических данных новой области.
(См.: Тонкая настройка)
Веса
Веса - это основные числовые параметры в модели ИИ, которые определяют важность различных входных признаков в процессе обучения. Изначально они задаются случайным образом и систематически корректируются по мере обучения модели, формируя ее конечный результат. Например, в модели, прогнозирующей цены на жилье, весовые коэффициенты будут установлены для таких характеристик, как количество спален или местоположение, определяя их влияние на конечную цену на основе данных обучения.
Связанная статья
Разбираемся с распространенными терминами в области ИИ, о которых вы наверняка слышали
Искусственный интеллект меняет наш мир, и в процессе этого появляется совершенно новый словарный запас для описания его принципов работы. Потратьте всего несколько минут на чтение о ИИ, и вы столкнете
TechCrunch раскрывает всеобъемлющий глоссарий AI
Искусственный интеллект-это сложная и постоянно развивающаяся область. Ученые, погружающиеся в эту область, часто используют специализированную терминологию, которая может сделать так, чтобы остальные из нас не отставали. Вот почему мы создали этот глоссарий, чтобы помочь вам понять ключевые термины и фразы, которые мы используем в нашем освещении
Snowflake инвестирует более 600 млн долларов в разработку специализированных чипов для AWS в рамках продвижения ИИ в корпоративном секторе
Snowflake, гигант в сфере облачных данных, объявил о планах инвестировать более 600 миллионов долларов в течение следующих шести лет в приобретение процессоров серии Graviton и ускорителей искусственн
Рекомендации по связанным специальным темам
Комментарии (0)

Мир искусственного интеллекта огромен и сложен. Эксперты в этой области часто используют технический жаргон для объяснения своей работы. Именно поэтому в наших материалах, посвященных индустрии искусственного интеллекта, встречаются эти специализированные термины. Мы составили этот глоссарий, чтобы пояснить ключевые слова и фразы, которые вы встретите в наших статьях.
Мы будем регулярно обновлять этот справочник по мере того, как исследователи будут разрабатывать новые методы и выявлять новые проблемы безопасности на переднем крае ИИ.
AGI
Искусственный интеллект общего назначения, или ИИО, - это широкий и часто обсуждаемый термин. Как правило, он описывает ИИ, превосходящий человеческие способности в широком спектре задач. Сэм Альтман из OpenAI описывает его как "среднего человека, которого вы могли бы нанять в качестве сотрудника", а устав OpenAI определяет AGI как "высокоавтономные системы, превосходящие человека в наиболее экономически выгодной работе". Google DeepMind предлагает несколько иную точку зрения, определяя AGI как "ИИ, который, по крайней мере, не уступает человеку в большинстве когнитивных задач". Концепция остается изменчивой даже среди ведущих исследователей ИИ.
Агент ИИ
ИИ-агент - это инструмент, использующий ИИ для автономного выполнения многоэтапных задач, выходящих за рамки простого взаимодействия с чатботом. Это может быть регистрация расходов, бронирование поездок или управление кодом. Определение "агента ИИ", как развивающейся области, может варьироваться, а необходимая инфраструктура все еще развивается. По сути, речь идет об автономной системе, которая может координировать работу нескольких моделей ИИ для достижения сложных целей.
Цепочка мышления
Люди могут мгновенно отвечать на простые вопросы, но сложные проблемы часто требуют разбивки на шаги. Например, решение логической головоломки о животных на ферме требует промежуточных вычислений.
В ИИ рассуждения по цепочке - это техника, при которой большие языковые модели декомпозируют проблему на более мелкие логические шаги. Этот процесс, хотя и более медленный, значительно повышает точность, особенно при решении логических задач или задач кодирования. Специализированные модели рассуждений строятся на основе традиционных LLM и оптимизируются для такого пошагового мышления с помощью обучения с подкреплением.
(См.: Большая языковая модель)
Присоединяйтесь к нам на TechCrunch Sessions: AI
Успейте занять место на нашем главном событии в области ИИ, где выступят представители OpenAI, Anthropic и Cohere. В течение ограниченного времени всего за 292 доллара США вы можете приобрести пропуск на целый день, где вас ждут выступления экспертов, семинары и мощный нетворкинг.
Участвуйте в выставке TechCrunch Sessions: AI
Покажите свои инновации 1 200+ лицам, принимающим решения, на TC Sessions: AI. Оформите стенд по доступной цене до 9 мая или пока есть свободные места.
Глубокое обучение
Сложное направление машинного обучения, в котором алгоритмы ИИ строятся на основе многоуровневых искусственных нейронных сетей. Такая архитектура позволяет им выявлять сложные закономерности и взаимосвязи, намного превосходящие более простые модели, такие как деревья решений. Вдохновленные человеческим мозгом, модели глубокого обучения автономно изучают ключевые характеристики данных, не требуя от человека их ручного определения. Они совершенствуются благодаря повторению и исправлению ошибок.
Однако для обучения этих моделей требуются огромные наборы данных (миллионы точек и более) и значительные вычислительные ресурсы, что приводит к увеличению стоимости разработки по сравнению с традиционным машинным обучением.
(См.: Нейронная сеть)
Диффузия
Диффузия - это основная технология, лежащая в основе многих современных моделей ИИ, создающих произведения искусства, музыку и текст. Вдохновленные физикой, эти системы постепенно добавляют шум к данным, таким как изображение или звук, пока их первоначальная структура не станет полностью непонятной. В отличие от необратимого процесса в природе, диффузионные модели ИИ учатся обращать вспять это разрушение, восстанавливая связные данные из шума, что наделяет их мощными генеративными способностями.
Дистилляция
Дистилляция - это метод "учитель-ученик", позволяющий передавать знания от большой модели ИИ к меньшей. Разработчики запрашивают модель-учитель и записывают ее результаты, которые затем используются для обучения модели-ученика, чтобы подражать поведению учителя. Этот процесс позволяет создать более компактную, быструю и эффективную модель с минимальными потерями производительности. Считается, что этот метод лежит в основе таких версий, как GPT-4 Turbo.
Хотя этот метод широко используется внутри компании, дистилляция из модели конкурента обычно нарушает условия обслуживания API, что вызывает этические и юридические вопросы в отрасли.
Тонкая настройка
Это дополнительное обучение уже существующей модели искусственного интеллекта с целью специализации ее работы для конкретной задачи или области. Это предполагает подачу модели новых данных, ориентированных на конкретную задачу. Многие ИИ-стартапы начинают с создания крупной языковой модели общего назначения, а затем дорабатывают ее с помощью собственных данных, чтобы повысить ее полезность для конкретной отрасли, например юриспруденции или медицины.
(См.: Большая языковая модель [LLM])
GAN
Генеративная адверсарная сеть (Generative Adversarial Network, или GAN) - это система машинного обучения, которая позволяет добиваться успехов в создании реалистичных данных, в том числе глубоких подделок. Она использует две конкурирующие нейронные сети: генератор, который создает данные, и дискриминатор, который оценивает их подлинность. Этот состязательный процесс подталкивает генератор к созданию все более реалистичных результатов без постоянного вмешательства человека. GAN отлично работают в специализированных приложениях, таких как генерация изображений, но меньше подходят для ИИ общего назначения.
Галлюцинация
Галлюцинация - это отраслевой термин, обозначающий случаи, когда модели ИИ генерируют неверную или сфабрикованную информацию. Это серьезная проблема для надежности и безопасности ИИ. Вводящие в заблуждение результаты могут представлять реальную опасность, например, давать вредные медицинские советы. Хотя большинство инструментов GenAI содержат предупреждения об отказе от ответственности, проблема сохраняется из-за недостатка обучающих данных, особенно для моделей с широким фундаментом. Эта проблема стимулирует развитие более специализированных, вертикальных моделей ИИ, которые работают в более узких и четко определенных областях знаний, чтобы уменьшить количество ошибок.
Выводы
Вывод - это процесс использования обученной модели ИИ для прогнозирования или получения выводов на основе новых данных. Это этап применения, который следует за обучением. Выводы могут выполняться на различном оборудовании, от смартфонов до облачных серверов со специализированными чипами ИИ, но их производительность сильно различается. Большие модели медленно работают на потребительском оборудовании по сравнению со специализированными высокопроизводительными системами.
[См.: Обучение].
Большая языковая модель (LLM)
Большие языковые модели, или LLM, используются в таких популярных ИИ-помощниках, как ChatGPT, Claude и Gemini. Когда вы взаимодействуете с этими инструментами, вы взаимодействуете с LLM, часто дополненной такими возможностями, как просмотр веб-страниц. Модель, лежащая в основе (например, GPT от OpenAI), и потребительский продукт (например, ChatGPT) могут иметь разные названия.
LLM - это глубокие нейронные сети с миллиардами параметров, которые изучают закономерности на основе огромного количества текста. Они создают сложное, многомерное представление языка. В ответ на запрос они генерируют ответы, предсказывая наиболее вероятную последовательность слов на основе статистических закономерностей, полученных в процессе обучения.
(См.: Нейронная сеть)
Нейронная сеть
Нейронная сеть - это многоуровневая алгоритмическая структура, лежащая в основе глубокого обучения и современного бурного развития ИИ. Хотя концептуально нейронная сеть была создана на основе человеческого мозга в 1940-х годах, ее практическая мощь была раскрыта с появлением графических процессоров в игровой индустрии. Эти чипы эффективно обучают многоуровневые сети, что позволило совершить прорыв в таких областях, как распознавание речи, автономная навигация и генеративный ИИ.
(См.: Большая языковая модель [LLM])
Обучение
Обучение - это процесс подачи данных в модель машинного обучения, чтобы она могла изучать закономерности и улучшать свои результаты. Изначально модель - это просто структура случайных чисел; в процессе обучения она превращается в функциональный инструмент, будь то распознавание изображений или написание текста. Этот процесс может быть ресурсоемким, требующим огромных объемов данных и вычислительных мощностей. Гибридные подходы, такие как тонкая настройка системы на основе правил, могут помочь справиться с этими расходами.
[См.: Вывод].
Трансферное обучение
Метод, при котором модель, обученная для одной задачи, используется в качестве отправной точки для смежной, но другой задачи. При этом используются ранее полученные знания, что позволяет сэкономить время и ресурсы, особенно если данные для новой задачи ограничены. Однако для достижения хороших результатов модели обычно требуется дополнительное обучение на специфических данных новой области.
(См.: Тонкая настройка)
Веса
Веса - это основные числовые параметры в модели ИИ, которые определяют важность различных входных признаков в процессе обучения. Изначально они задаются случайным образом и систематически корректируются по мере обучения модели, формируя ее конечный результат. Например, в модели, прогнозирующей цены на жилье, весовые коэффициенты будут установлены для таких характеристик, как количество спален или местоположение, определяя их влияние на конечную цену на основе данных обучения.
Разбираемся с распространенными терминами в области ИИ, о которых вы наверняка слышали
Искусственный интеллект меняет наш мир, и в процессе этого появляется совершенно новый словарный запас для описания его принципов работы. Потратьте всего несколько минут на чтение о ИИ, и вы столкнете
TechCrunch раскрывает всеобъемлющий глоссарий AI
Искусственный интеллект-это сложная и постоянно развивающаяся область. Ученые, погружающиеся в эту область, часто используют специализированную терминологию, которая может сделать так, чтобы остальные из нас не отставали. Вот почему мы создали этот глоссарий, чтобы помочь вам понять ключевые термины и фразы, которые мы используем в нашем освещении
Snowflake инвестирует более 600 млн долларов в разработку специализированных чипов для AWS в рамках продвижения ИИ в корпоративном секторе
Snowflake, гигант в сфере облачных данных, объявил о планах инвестировать более 600 миллионов долларов в течение следующих шести лет в приобретение процессоров серии Graviton и ускорителей искусственн





Дом






