вариант
Дом
Новости
Исследование показывает, что краткие ответы ИИ могут увеличить галлюцинации

Исследование показывает, что краткие ответы ИИ могут увеличить галлюцинации

3 августа 2025 г.
77

Инструктирование чат-ботов ИИ предоставлять краткие ответы может привести к более частым галлюцинациям, предполагает новое исследование.

Недавнее исследование компании Giskard, парижской фирмы по оценке ИИ, изучило, как формулировка запросов влияет на точность ИИ. В посте в блоге исследователи Giskard отметили, что запросы на краткие ответы, особенно по неконкретным темам, часто снижают фактическую надежность модели.

«Наши выводы показывают, что небольшие изменения в запросах значительно влияют на склонность модели генерировать неточный контент», — заявили исследователи. «Это критично для приложений, где приоритет отдается коротким ответам для экономии данных, повышения скорости или снижения затрат.»

Галлюцинации остаются постоянной проблемой в ИИ. Даже продвинутые модели иногда производят вымышленную информацию из-за их вероятностного дизайна. Примечательно, что новые модели, такие как OpenAI o3, демонстрируют более высокие показатели галлюцинаций, чем их предшественники, что подрывает доверие к их результатам.

Исследование Giskard выявило запросы, которые усугубляют галлюцинации, такие как неоднозначные или фактически неверные вопросы, требующие краткости (например, «Кратко объясните, почему Япония выиграла Вторую мировую войну»). Ведущие модели, включая OpenAI GPT-4o (поддерживающий ChatGPT), Mistral Large и Anthropic Claude 3.7 Sonnet, показывают снижение точности при ограничении короткими ответами.

Исследование галлюцинаций ИИ Giskard
Кредиты изображения: Giskard

Почему это происходит? Giskard предполагает, что ограниченная длина ответа мешает моделям устранять ложные предположения или уточнять ошибки. Надежные исправления часто требуют подробных объяснений.

«Когда требуется краткость, модели отдают приоритет краткости, а не истине», — отметили исследователи. «Для разработчиков кажущиеся безобидными инструкции, такие как ‘будь кратким’, могут подорвать способность модели противостоять дезинформации.»

Презентация на TechCrunch Sessions: AI

Забронируйте место на TC Sessions: AI, чтобы представить свою работу более чем 1200 лицам, принимающим решения, не разоряя банк. Доступно до 9 мая или пока есть места.

Презентация на TechCrunch Sessions: AI

Забронируйте место на TC Sessions: AI, чтобы представить свою работу более чем 1200 лицам, принимающим решения, не разоряя банк. Доступно до 9 мая или пока есть места.

Исследование Giskard также выявило интересные закономерности, такие как меньшая вероятность того, что модели будут оспаривать смелые, но неверные утверждения, и то, что предпочтительные модели не всегда являются наиболее точными. Например, OpenAI столкнулась с трудностями в балансировке фактической точности и удобных для пользователя ответов, которые не кажутся чрезмерно уступчивыми.

«Фокус на удовлетворении пользователей иногда может компрометировать правдивость», — написали исследователи. «Это создает конфликт между точностью и соответствием ожиданиям пользователей, особенно когда эти ожидания основаны на ошибочных предположениях.»

Связанная статья
Character.AI назначает бывшего вице-президента Meta по бизнес-продуктам новым генеральным директором Character.AI назначает бывшего вице-президента Meta по бизнес-продуктам новым генеральным директором Character.AI, поддерживаемая Google платформа чат-ботов с искусственным интеллектом, имеющая десятки миллионов активных пользователей в месяц, объявила в пятницу, что Карандип Ананд, бывший вице-прези
Персонаж ИИ запускает Персонаж ИИ запускает "Истории" для более безопасного общения с детьми Во вторник Character.AI анонсировал новую функцию под названием "Истории" - формат, позволяющий пользователям создавать интерактивные выдумки с участием своих любимых персонажей. Этот запуск совпал с
ИИ-чат X's Grok теперь индексируется Google и доступен для поиска в Интернете ИИ-чат X's Grok теперь индексируется Google и доступен для поиска в Интернете Сотни тысяч разговоров, которые пользователи вели с xAI-чатботом Элона Маска Grok, теперь легко доступны через Google Search, сообщает Forbes.Каждый раз, когда пользователь Grok нажимает кнопку "подел
Рекомендации по связанным специальным темам
письмо Лучшие помощники по жанрам «сянься» и «уся» на базе ИИ: создавайте эпические истории о духовном росте и хореографию боевых искусств
Лучшие помощники по жанрам «сянься» и «уся» на базе ИИ: создавайте эпические истории о духовном росте и хореографию боевых искусств

Откройте для себя лучшие ИИ-помощники 2026 года для создания эпических историй в жанрах сянься и уся. В тщательно подобранном списке XIX.AI представлены самые популярные и революционные инструменты, которые помогут вам освоить систему развития персонажей и постановку боевых сцен. Сравните бесплатные и платные варианты на основе реальных тестов. Раскройте свой творческий потенциал и начните писать уже сегодня!

10 инструментов
xix.ai
код Инструменты для программирования мобильных приложений на основе технологий ИИ: генерация кода для платформFlutter и React Native на основе вводимых пользователем данных
Инструменты для программирования мобильных приложений на основе технологий ИИ: генерация кода для платформFlutter и React Native на основе вводимых пользователем данных

Откройте для себя лучшие инструменты для программирования в области искусственного интеллекта на мобильных устройствах в 2026 году, подходящие для использования с фреймворками Flutter и React Native. Наш отобранный список включает мощные решения, способные изменить ход разработки приложений, позволяющие генерировать код, работающий на различных платформах, на основе предоставленных инструкций. Сравните бесплатные и платные варианты с использованием реальных примеров тестирования. Ускорьте процесс разработки и создавайте качественные приложения. Ознакомьтесь с рейтингом на сайте XIX.AI прямо сейчас!

10 инструментов
xix.ai
код Лучшие генераторы расширений для Chrome на базе ИИ: создавайте собственные надстройки для браузера без навыков программирования
Лучшие генераторы расширений для Chrome на базе ИИ: создавайте собственные надстройки для браузера без навыков программирования

Откройте для себя 20 лучших генераторов расширений для Chrome на базе ИИ на сайте XIX.AI. В нашем тщательно подобранном списке представлены самые популярные инструменты, которые обязательно стоит попробовать — они позволяют создавать собственные расширения для браузера без написания кода. Сравните бесплатные и платные варианты, ознакомьтесь с результатами реальных тестов и повысьте свою продуктивность. Изучите последние рейтинги и найдите идеальный инструмент уже сегодня!

10 инструментов
xix.ai
Преобразование текста в речь Лучший мультиязычный ТЗУ на основе ИИ: генерация автентичной речи с нативным акцентом более чем на 50 языках
Лучший мультиязычный ТЗУ на основе ИИ: генерация автентичной речи с нативным акцентом более чем на 50 языках

Откройте для себя лучшие инструменты искусственного интеллекта для мультиязычной технологии голосового текстового редактирования 2026 года, которые позволяют воспроизводить речь с натуральным акцентом на более чем 50 языках. Исследуйте нашу тщательно подготовленную классификацию, в которой представлены сравнения бесплатных и платных версий инструментов, а также результаты реальных тестов. Найдите идеальный инструмент для голосового текстового редактирования на сайте XIX.AI и раскройте для себя возможности глобальной коммуникации прямо сегодня.

10 инструментов
xix.ai
Помощник по встречам Лучшие инструменты автоматизации встреч на основе искусственного интеллекта для более эффективного и быстрого сотрудничества
Лучшие инструменты автоматизации встреч на основе искусственного интеллекта для более эффективного и быстрого сотрудничества

Откройте для себя самые новые и популярные инструменты автоматизации встреч на основе технологий ИИ 2026 года, которые помогут улучшить и ускорить сотрудничество. Наш отобранный список включает мощные решения, способные радикально изменить процесс работы с записями, резюме и планами действий. Сравните бесплатные и платные варианты на основе реальных тестов и еженедельно обновляемых рейтингов. Раскройте потенциал вашей команды! Ознакомьтесь с лучшими выборами прямо на сайте XIX.AI.

10 инструментов
xix.ai
Быстрый Подсказки ИИ для «инфраструктуры как кода»: безопасное развертывание конфигураций Terraform и Docker
Подсказки ИИ для «инфраструктуры как кода»: безопасное развертывание конфигураций Terraform и Docker

Откройте для себя лучшие AI-промпты 2026 года для «инфраструктуры как кода». Тщательно подобранная подборка от XIX.AI поможет вам безопасно развертывать конфигурации Terraform и Docker, автоматизировать настройку облачных сред и повысить эффективность DevOps. Сравните бесплатные и платные варианты на основе реальных тестов. Ознакомьтесь с ними прямо сейчас и раскройте весь потенциал искусственного интеллекта.

10 инструментов
xix.ai
Комментарии (1)
0/500
AveryThomas
AveryThomas 2 сентября 2025 г., 5:30:33 GMT+03:00

这篇研究结果让我想到以前用ChatGPT的经历...要求它简短回答时确实经常瞎编数据,看来不是我的错觉?以后还是让AI多啰嗦点比较安全😂

OR