opción
Hogar
Noticias
OpenAI Presenta Dos Modelos Avanzados de IA de Peso Abierto

OpenAI Presenta Dos Modelos Avanzados de IA de Peso Abierto

28 de agosto de 2025
0

OpenAI anunció el martes el lanzamiento de dos modelos de razonamiento de IA de peso abierto, con capacidades comparables a su serie o. Ambos modelos están disponibles para descarga gratuita en Hugging Face, con OpenAI destacándolos como "de alto rendimiento" en múltiples puntos de referencia para modelos abiertos.

Los modelos se ofrecen en dos variantes: el robusto gpt-oss-120b, operable en una sola GPU Nvidia, y el ligero gpt-oss-20b, diseñado para ejecutarse en una laptop estándar con 16 GB de memoria.

Este lanzamiento representa el primer modelo de lenguaje abierto de OpenAI desde GPT-2, presentado hace más de cinco años.

Durante una sesión informativa, OpenAI señaló que sus modelos abiertos pueden manejar consultas complejas al conectarse a sistemas de IA basados en la nube más avanzados, como informó previamente TechCrunch. Esto permite a los desarrolladores vincular el modelo abierto a los modelos propietarios de OpenAI para tareas como el procesamiento de imágenes cuando sea necesario.

Aunque OpenAI inicialmente adoptó modelos de IA de código abierto, en gran medida ha cambiado a un modelo de desarrollo propietario, impulsando un negocio próspero al proporcionar acceso a API para empresas y desarrolladores.

En enero, el CEO Sam Altman reconoció que OpenAI podría haber cometido un error al no priorizar las tecnologías de código abierto. La empresa ahora enfrenta una fuerte competencia de laboratorios de IA chinos como DeepSeek, Alibaba’s Qwen y Moonshot AI, que han ganado terreno con sus modelos abiertos altamente capaces. (Los modelos Llama de Meta, una vez líderes en el espacio de IA abierta, se han quedado atrás en el último año.)

En julio, la administración Trump alentó a los desarrolladores de IA estadounidenses a abrir más tecnología para avanzar en una IA alineada con los valores estadounidenses a nivel global.

Líderes Tecnológicos y de Capital de Riesgo Encabezan Disrupt 2025

Netflix, ElevenLabs, Wayve y Sequoia Capital están entre los nombres destacados en la agenda de Disrupt 2025, compartiendo ideas para impulsar el éxito y la innovación de startups. No te pierdas el 20º aniversario de TechCrunch Disrupt para tener la oportunidad de aprender de las principales voces tecnológicas: asegura tu entrada ahora y ahorra hasta $675 antes de que los precios aumenten el 7 de agosto.

Líderes Tecnológicos y de Capital de Riesgo Encabezan Disrupt 2025

Netflix, ElevenLabs, Wayve y Sequoia Capital están entre los nombres destacados en la agenda de Disrupt 2025, compartiendo ideas para impulsar el éxito y la innovación de startups. No te pierdas el 20º aniversario de TechCrunch Disrupt para tener la oportunidad de aprender de las principales voces tecnológicas: asegura tu entrada ahora y ahorra hasta $675 antes de que los precios aumenten.

San Francisco | 27-29 de octubre de 2025 REGÍSTRATE AHORA

Con gpt-oss, OpenAI busca ganarse a los desarrolladores y alinearse con el impulso de la administración Trump, ya que ambos han notado el auge de los laboratorios de IA chinos en el ámbito del código abierto.

“Desde nuestra fundación en 2015, la misión de OpenAI ha sido avanzar en la AGI en beneficio de toda la humanidad,” dijo el CEO Sam Altman en un comunicado a TechCrunch. “Estamos emocionados de ver al mundo construyendo sobre un marco de IA abierto arraigado en los valores democráticos de EE. UU., de acceso libre y ampliamente beneficioso.”

CEO de Open AI Sam Altman
(Foto por Tomohiro Ohsumi/Getty Images) Créditos de la imagen: Tomohiro Ohsumi / Getty Images

Resumen del Rendimiento de los Modelos

OpenAI diseñó su modelo abierto para liderar entre los sistemas de IA de peso abierto, y la empresa afirma que ha alcanzado este objetivo.

En pruebas de codificación competitiva en Codeforces (con herramientas), gpt-oss-120b obtuvo 2622 y gpt-oss-20b obtuvo 2516, superando al R1 de DeepSeek pero quedándose atrás de o3 y o4-mini.

Rendimiento del modelo abierto de OpenAI en Codeforces (crédito: OpenAI).

En el Último Examen de la Humanidad, una prueba rigurosa de origen colectivo que abarca múltiples materias (con herramientas), gpt-oss-120b y gpt-oss-20b lograron un 19% y un 17.3%, respectivamente, superando a los principales modelos abiertos de DeepSeek y Qwen pero quedándose cortos frente a o3.

Rendimiento del modelo abierto de OpenAI en HLE (crédito: OpenAI).

Notablemente, los modelos abiertos de OpenAI muestran tasas de alucinación significativamente más altas que sus últimos modelos de razonamiento, o3 y o4-mini.

Las alucinaciones se han vuelto más pronunciadas en los recientes modelos de razonamiento de IA de OpenAI, con la empresa admitiendo que aún está investigando la causa. En un informe técnico, OpenAI señaló que “los modelos más pequeños, con menos conocimiento del mundo, se espera que alucinen más que los modelos de frontera más grandes.”

En PersonQA, el punto de referencia interno de OpenAI para evaluar la precisión del modelo sobre individuos, gpt-oss-120b y gpt-oss-20b alucinaron en un 49% y un 53% de las respuestas, respectivamente, más del triple de la tasa del modelo o1 (16%) y superior a o4-mini (36%).

Entrenamiento de los Nuevos Modelos

OpenAI afirma que sus modelos abiertos fueron desarrollados utilizando técnicas similares a sus modelos propietarios. Cada uno utiliza un enfoque de mezcla de expertos (MoE), activando menos parámetros por consulta para mayor eficiencia. Para gpt-oss-120b, con 117 mil millones de parámetros totales, solo se utilizan 5.1 mil millones por token.

Los modelos abiertos fueron entrenados con aprendizaje por refuerzo de alto cómputo (RL), un método de posentrenamiento que utiliza clústeres de GPU Nvidia para refinar la toma de decisiones de IA en entornos simulados. Esto refleja el entrenamiento de la serie o de OpenAI e incluye un proceso de cadena de pensamiento, que requiere tiempo y recursos adicionales para razonar las respuestas.

Este entrenamiento permite a los modelos abiertos destacar en la alimentación de agentes de IA, soportando herramientas como búsqueda web o ejecución de código Python dentro de su proceso de razonamiento. Sin embargo, están limitados a tareas solo de texto, incapaces de procesar o generar imágenes o audio, a diferencia de otros modelos de OpenAI.

Los modelos gpt-oss-120b y gpt-oss-20b se lanzan bajo la licencia Apache 2.0, permitiendo a las empresas monetizarlos sin tarifas ni permisos de OpenAI.

A diferencia de los modelos completamente de código abierto de laboratorios como AI2, OpenAI no divulgará los datos de entrenamiento de sus modelos abiertos, una decisión probablemente influenciada por demandas en curso que alegan el uso indebido de material con derechos de autor en el entrenamiento de IA.

OpenAI pospuso el lanzamiento de sus modelos abiertos varias veces para abordar preocupaciones de seguridad. Más allá de los protocolos de seguridad estándar, la empresa evaluó si actores maliciosos podrían ajustar gpt-oss para fines dañinos, como ciberataques o la creación de armas biológicas o químicas.

Las pruebas de OpenAI y evaluadores externos encontraron que gpt-oss puede mejorar ligeramente las capacidades biológicas, pero no alcanza el umbral de “alta capacidad” de peligro de la empresa, incluso después de ajustes.

Aunque los modelos de OpenAI lideran entre los modelos abiertos, los desarrolladores están anticipando el lanzamiento del R2 de DeepSeek y un nuevo modelo abierto del laboratorio de superinteligencia de Meta.

Artículo relacionado
El Senado de EE.UU. retira la moratoria de la IA del proyecto de presupuesto en medio de la polémica El Senado de EE.UU. retira la moratoria de la IA del proyecto de presupuesto en medio de la polémica El Senado deroga por abrumadora mayoría la moratoria a la regulación de la IAEn una rara muestra de unidad bipartidista, los legisladores estadounidenses votaron casi por unanimidad el martes para e
ByteDance Presenta el Modelo de IA Seed-Thinking-v1.5 para Mejorar las Capacidades de Razonamiento ByteDance Presenta el Modelo de IA Seed-Thinking-v1.5 para Mejorar las Capacidades de Razonamiento La carrera por una IA avanzada en razonamiento comenzó con el modelo o1 de OpenAI en septiembre de 2024, ganando impulso con el lanzamiento de R1 de DeepSeek en enero de 2025.Los principales desarroll
Inversión de Oracle de $40 mil millones en chips Nvidia impulsa el centro de datos de IA en Texas Inversión de Oracle de $40 mil millones en chips Nvidia impulsa el centro de datos de IA en Texas Oracle planea invertir aproximadamente $40 mil millones en chips Nvidia para alimentar un importante centro de datos nuevo en Texas, desarrollado por OpenAI, según informó el Financial Times. Este acu
comentario (0)
0/200
Volver arriba
OR