вариант
Дом
Новости
Чат-боты с искусственным интеллектом проходят тест на спорные темы, разработанный разработчиком

Чат-боты с искусственным интеллектом проходят тест на спорные темы, разработанный разработчиком

25 октября 2025 г.
79

Разработчик под псевдонимом "xlr8harder" запустил SpeechMap, инструмент для "оценки свободы слова", анализирующий, как ведущие чат-боты с искусственным интеллектом справляются со спорными темами. Платформа сравнивает ответы таких моделей, как ChatGPT от OpenAI и Grok от xAI, в отношении политических дискуссий, обсуждения гражданских прав и запросов, связанных с протестами.

Эта инициатива возникла на фоне того, что компании, занимающиеся разработкой ИИ, все чаще сталкиваются с подозрениями в политической предвзятости своих систем. Несколько союзников Белого дома и видных технологических деятелей, включая Элона Маска и Дэвида Сакса, обвинили основные чат-боты в проявлении прогрессивной цензуры.

Хотя компании, занимающиеся разработкой искусственного интеллекта, напрямую не ответили на эти обвинения, некоторые из них продемонстрировали свою реакцию. Компания Meta недавно скорректировала свои модели Llama, чтобы они не отдавали предпочтение определенным политическим взглядам при обсуждении спорных тем.

Создатель SpeechMap объяснил свои мотивы: "Эти разговоры должны вестись в публичной сфере, а не ограничиваться залами заседаний корпораций. Моя платформа позволяет пользователям изучать данные из первых рук с помощью объективного тестирования".

Для оценки используются судьи искусственного интеллекта, которые оценивают ответы чатботов по политическим комментариям, историческим интерпретациям и классификации национальных символов. Каждое взаимодействие классифицируется как:

  • Полное соответствие (прямые ответы)
  • Уклончивые ответы
  • Откровенный отказ

Xlr8harder признает методологические ограничения, включая потенциальную предвзятость модели судьи и технические несоответствия. Тем не менее, собранные данные позволяют выявить примечательные модели поведения ведущих систем искусственного интеллекта.

Среди заметных находок - эволюционирующий подход OpenAI к политическому дискурсу. Последние итерации GPT демонстрируют повышенную сдержанность при рассмотрении деликатных тем, несмотря на февральское обязательство OpenAI представлять более сбалансированные точки зрения на спорные вопросы.

Сравнительный анализ отзывчивости моделей OpenAI с течением времени
Тенденции реагирования моделей OpenAI на основе данных SpeechMap

Согласно анализу, модель Grok 3 от xAI стала самой несдержанной из всех протестированных моделей, ответив на 96,2 % запросов по сравнению со средним показателем по отрасли в 71,3 %. Это соответствует тому, что Маск изначально позиционировал Grok как нефильтрованную альтернативу системам искусственного интеллекта.

"В то время как большинство моделей все больше ограничивают политические комментарии, xAI, похоже, сознательно движется к меньшим ограничениям в разговоре", - отмечает разработчик SpeechMap.

Предыдущие версии Grok, несмотря на обещания Маска о нейтралитете, все еще демонстрировали прогрессивные тенденции в таких вопросах, как гендерная идентичность и экономическое неравенство. Ранее генеральный директор объяснял эти предубеждения влиянием обучающих данных из открытых веб-источников.

Согласно последним оценкам, Grok 3 достигла большей политической нейтральности, хотя ранее система подвергалась критике за кратковременную цензуру негативных комментариев Маска. Эта эволюция отражает текущие противоречия между принципами свободы выражения мнений и проблемами модерации контента, с которыми сталкиваются разработчики ИИ.

Связанная статья
OpenAI описывает экономику искусственного интеллекта с участием государственных инвестиционных фондов, налогами на роботов и четырехдневной рабочей неделей OpenAI описывает экономику искусственного интеллекта с участием государственных инвестиционных фондов, налогами на роботов и четырехдневной рабочей неделей В то время как правительства пытаются справиться с экономическими последствиями появления сверхинтеллектуальных машин, компания OpenAI опубликовала ряд предложений по формированию политики, в которых
Грег Брокман рассказывает, как Илон Маск покинул OpenAI Грег Брокман рассказывает, как Илон Маск покинул OpenAI В конце августа 2017 года ключевые фигуры OpenAI — на тот момент небольшой некоммерческой исследовательской лаборатории — собрались, чтобы обсудить, как создать коммерческую структуру для продвижения
Пентагон заключил соглашения с Nvidia, Microsoft и AWS о внедрении технологий искусственного интеллекта в секретные сети. Пентагон заключил соглашения с Nvidia, Microsoft и AWS о внедрении технологий искусственного интеллекта в секретные сети. После предыдущих соглашений с Google, SpaceX и OpenAI, Министерство обороны США в пятницу объявило о подписании договоров с Nvidia, Microsoft, Amazon Web Services и Reflection AI о использовании их технологий и моделей искусственного интеллекта в сек
Рекомендации по связанным специальным темам
Бизнес Лучшие инструменты для подбора персонала с помощью ИИ: отбор резюме и автоматизация планирования собеседований с кандидатами
Лучшие инструменты для подбора персонала с помощью ИИ: отбор резюме и автоматизация планирования собеседований с кандидатами

Откройте для себя 20 лучших инструментов для рекрутинга на базе ИИ 2026 года на сайте XIX.AI. В нашем тщательно составленном списке представлены мощные, революционные решения для отбора резюме и автоматизации планирования собеседований с кандидатами. Сравните бесплатные и платные варианты с помощью реальных тестов и еженедельно обновляемого рейтинга. Найдите своего идеального помощника по подбору персонала и оптимизируйте процесс рекрутинга уже сегодня!

10 инструментов
xix.ai
Производительность Персональные тренеры по благополучию и концентрации на базе ИИ: борьба с выгоранием и повышение уровня умственной энергии
Персональные тренеры по благополучию и концентрации на базе ИИ: борьба с выгоранием и повышение уровня умственной энергии

Откройте для себя лучших в 2026 году ИИ-тренеров по личному благополучию и концентрации внимания на сайте XIX.AI. В нашем тщательно составленном рейтинге представлены высокооцененные, революционные инструменты для борьбы с выгоранием и повышения умственной энергии. Сравните бесплатные и платные варианты с помощью реальных отзывов. Откройте для себя путь к максимальной продуктивности и благополучию уже сегодня.

10 инструментов
xix.ai
чат-бот Лучшие романтические чат-боты на базе ИИ: постройте долгосрочные отношения с помощью чат-ботов с устойчивой индивидуальностью
Лучшие романтические чат-боты на базе ИИ: постройте долгосрочные отношения с помощью чат-ботов с устойчивой индивидуальностью

Откройте для себя лучшие романтические чат-боты с искусственным интеллектом 2026 года, которые помогут вам построить искренние и долгосрочные отношения. В нашем тщательно составленном списке вы найдете чат-ботов с яркими и последовательными личностями, сравнение бесплатных и платных версий, а также результаты реальных тестов. Найдите своего идеального спутника и начните строить отношения уже сегодня на XIX.AI.

10 инструментов
xix.ai
Образование и обучение Лучшие наставники в области искусственного интеллекта и науки о данных: мастерство работы с SQL, библиотекой Pandas и рабочими процессами машинного обучения
Лучшие наставники в области искусственного интеллекта и науки о данных: мастерство работы с SQL, библиотекой Pandas и рабочими процессами машинного обучения

Откройте для себя 20 лучших наставников в области искусственного интеллекта и науки о данных на 2026 год, которые помогут вам овладеть SQL, Pandas и рабочими процессами машинного обучения. Изучите наш тщательно отобранный список на сайте XIX.AI – здесь вы найдете эффективные рекомендации, способные изменить ход ваших работ. Сравните бесплатные и платные варианты с примерами из реальной практики. Освоите науку о данных уже сегодня.

10 инструментов
xix.ai
чат-бот Лучшие тренажеры по флирту и общению на базе ИИ: повышайте свою харизму и уверенность в себе в режиме реального времени
Лучшие тренажеры по флирту и общению на базе ИИ: повышайте свою харизму и уверенность в себе в режиме реального времени

Откройте для себя 20 лучших тренажеров по флирту и общению с ИИ на сайте XIX.AI. Наша тщательно подобранная подборка самых популярных инструментов поможет вам развить коммуникабельность и уверенность в себе в режиме реального времени. Ознакомьтесь с незаменимыми инструментами, которые кардинально изменят вашу жизнь, — с сравнением бесплатных и платных версий и еженедельно обновляемым рейтингом. Раскройте свой коммуникативный потенциал уже сегодня.

10 инструментов
xix.ai
код Лучшие инструменты ИИ для автоматизированного тестирования модулей: создание случаев тестирования Jest, PyTest и JUnit одним кликом
Лучшие инструменты ИИ для автоматизированного тестирования модулей: создание случаев тестирования Jest, PyTest и JUnit одним кликом

Откройте для себя самые новые и высоко оцененные инструменты ИИ 2026 года для автоматизированного тестирования модулей. Наша тщательно подобранная коллекция включает мощные решения, способные радикально изменить процесс разработки, позволяющие мгновенно генерировать тестовые случаи для Jest, PyTest и JUnit. Сравните бесплатные и платные варианты с результатами реальных тестов, а также еженедельно обновляемыми рейтингами на сайте XIX.AI. Раскройте потенциал ИИ и повысьте эффективность своей работы в области разработки сегодня же.

10 инструментов
xix.ai
Комментарии (2)
0/500
WilliamYoung
WilliamYoung 24 марта 2026 г., 11:03:18 GMT+03:00

Die Idee ist interessant, aber so ein Benchmark bringt doch immer die Voreingenommenheit des Entwicklers selbst mit rein, oder? 🤔 Die Ergebnisse sollten nicht überinterpretiert werden. Dennoch gut zu sehen, ob manche Modelle wirklich 'ausweichen' oder offen diskutieren. Technisch aber wahrscheinlich recht simpel umgesetzt - ist der Wert also begrenzt?

AndrewWilson
AndrewWilson 22 декабря 2025 г., 11:30:43 GMT+03:00

Um teste de liberdade de expressão para IAs? Interessante. Isso mostra como cada modelo tem sua própria 'personalidade' programada pelos seus criadores - alguns mais abertos, outros mais cautelosos. Será que algum algoritmo chegará a questionar a base dos próprios dados em que foi treinado? 🤔

OR