Введение модели
Серия GPT-OSS - первое семейство моделей с открытым исходным кодом, выпущенное компанией OpenAI за последние годы.
Способность к пониманию языка
Способен понимать сложные контексты и генерировать логически когерентные предложения, хотя и иногда выключенные по контролю тона.
8.9
Объем знаний
Обладает основными знаниями в основных дисциплинах, но имеет ограниченный охват передовых междисциплинарных полей.
8.4
Способность рассуждать
Невозможно поддерживать последовательные сети рассуждений, часто вызывая инвертированную причинность или просчеты.
6.3
Сравнение модели
gpt-oss-120b (high) vs Qwen2.5-7B-Instruct
Как и Qwen2, модели языка Qwen2.5 поддерживают до 128K токенов и могут генерировать до 8K токенов. Они также сохраняют мультиязычную поддержку более чем для 29 языков, включая китайский, английский, французский, испанский, португальский, немецкий, итальянский, русский, японский, корейский, вьетнамский, тайский, арабский и другие.
Связанная модель
o3-2025-04-16 (high)
O3 — это новейшая модель логического мышления, выпущенная OpenAI, базовые показатели которой значительно превосходят предыдущие модели.
o4-mini-2025-04-16 (high)
o4-mini в режиме high, который имеет более длительное время отклика и более сильные способности к рассуждению.
gpt-oss-120b (high)
Серия GPT-OSS — первая серия моделей с открытым исходным кодом, выпущенная OpenAI в последние годы.
GPT-5.2-2025-12-11 (high)
Новейшая, долгожданная и мощная LLM нового поколения под названием GPT-5, официально запущенная OpenAI, версия gpt-5.2.
o4-mini-2025-04-16 (high)
o4-mini в высоком режиме, который имеет большее время отклика и более сильную способность к рассуждению.
Соответствующие документы
Стартап Cursor AI, занимающийся разработкой программного обеспечения, планирует нанять 200 сотрудников в Азиатско-Тихоокеанском регионе после получения значительных инвестиций от SpaceX
Стартап Cursor, занимающийся разработкой решений в области искусственного интеллекта, объявил о масштабной глобальной экспансии и планирует в течение ближайших шести месяцев нанять 200 сотрудников в А
Claude использовался для создания вредоносных пакетов npm: более 670 скомпрометированных пакетов ставят под угрозу открытый исходный код
Недавний инцидент в сфере кибербезопасности продемонстрировал, как крупные языковые модели (LLM) используются в качестве инструмента для разработки вредоносного ПО. Исследователь в области безопасност
Компания Reliance обнародовала план инвестиций в искусственный интеллект на сумму 110 млрд долларов на фоне ускорения технологического развития в Индии
Мукеш Амбани, миллиардер и председатель правления индийского конгломерата Reliance, объявил в четверг о плане стоимостью 10 трлн рупий (около 110 млрд долларов) по созданию инфраструктуры для искусств
Компания Zhiyuan WITA завершила проект «Naked» по взаимодействию с роботами, подав первую отчетную документацию
Сектор интеллектуальных роботов достиг важной вехи. Согласно последнему заявлению Управления киберпространства Шанхая, разработанная компанией Zhiyuan большая модель WITA успешно прошла процедуру реги
Исследование компании Anthropic показывает, что контент, созданный искусственным интеллектом, приводит к снижению уровня мыслительной активности у людей
Когда вы видите, как ИИ мгновенно генерирует хорошо структурированный и логически понятный фрагмент кода или документ, не возникает ли у вас желание довериться ему, не задумываясь? По данным AIbase, в