opción
Hogar
Noticias
Operai lanza GPT-4.5 'Orion': su modelo de IA más grande hasta la fecha

Operai lanza GPT-4.5 'Orion': su modelo de IA más grande hasta la fecha

10 de abril de 2025
216

Actualizado a las 2:40 pm PT: solo horas después del lanzamiento de GPT-4.5, OpenAi hizo una edición tranquila al documento blanco del modelo AI. Eliminaron una línea que indica que "GPT-4.5 no es un modelo de IA fronteriza". Todavía puede acceder al papel blanco original aquí. A continuación se muestra el artículo original.

El jueves, Openai retiró la cortina en GPT-4.5, el tan esperado modelo de IA que acompaña al nombre de código Orion. Este último gigante de OpenAI ha sido entrenado con una cantidad sin precedentes de potencia informática y datos, lo que lo distingue de sus predecesores.

A pesar de su impresionante escala, el libro blanco de OpenAI inicialmente declaró que no consideraron que GPT-4.5 fuera un modelo fronterizo. Sin embargo, esa declaración se ha eliminado desde entonces, dejándonos preguntarnos sobre el verdadero potencial del modelo.

A partir del jueves, los suscriptores de ChatGPT Pro, el servicio premium de $ 200 al mes de Openai, obtendrán una primera prueba de GPT-4.5 como parte de una vista previa de investigación. Los desarrolladores en los niveles de API pagados de OpenAI pueden comenzar a usar GPT-4.5 hoy, mientras que aquellos con suscripciones del equipo ChatGPT Plus y ChatGPT deben esperar acceso en algún momento de la próxima semana, según un portavoz de OpenAI.

El mundo tecnológico ha estado zumbando sobre Orion, viéndolo como una prueba de si los métodos tradicionales de entrenamiento de IA aún contienen agua. GPT-4.5 sigue el mismo libro de jugadas que sus predecesores, dependiendo de un aumento masivo en la potencia informática y los datos durante una fase de aprendizaje no supervisada llamada pre-entrenamiento.

En el pasado, la escala ha llevado a saltos significativos de rendimiento en varios dominios como las matemáticas, la escritura y la codificación. Operai afirma que el tamaño de GPT-4.5 lo ha dotado con "un conocimiento mundial más profundo" y "mayor inteligencia emocional". Sin embargo, hay sugerencias de que los retornos al escalar podrían estar disminuyendo. En varios puntos de referencia de IA, GPT-4.5 se queda atrás de modelos de razonamiento más nuevos de compañías como Deepseek, Anthrope e incluso OpenAi.

Además, ejecutar GPT-4.5 viene con un precio considerable. Operai admite que es tan costoso que están considerando mantenerlo disponible a través de su API a largo plazo. Los desarrolladores pagarán $ 75 por cada millón de tokens de entrada y $ 150 por cada millón de tokens de producción, un marcado contraste con el GPT-4O más asequible, que cuesta solo $ 2.50 por millón de tokens de entrada y $ 10 por millón de tokens de salida.

"Estamos compartiendo GPT -4.5 como una vista previa de investigación para comprender mejor sus fortalezas y limitaciones", compartió OpenAi en una publicación de blog. "Todavía estamos explorando todo su potencial y estamos emocionados de ver cómo las personas lo usarán de manera inesperada".

Rendimiento mixto

Operai tiene claro que GPT-4.5 no está destinado a reemplazar a GPT-4O, su modelo de caballo de batalla que impulsa la mayoría de sus API y ChatGPT. Si bien GPT-4.5 puede manejar las cargas de archivos e imágenes y usar la herramienta de lienzo de ChatGPT, actualmente no admite características como el modo de voz bidireccional realista de ChatGPT.

En el lado positivo, GPT-4.5 supera a GPT-4O y muchos otros modelos en SimpleQA Benchmark de OpenAI, que prueba los modelos de IA en preguntas sencillas y objetivas. Operai también afirma que GPT-4.5 alucina con menos frecuencia que la mayoría de los modelos, lo que en teoría debería hacer que sea menos probable que fabrique información.

Curiosamente, OpenAI no incluía uno de sus modelos de razonamiento de alto rendimiento, investigación profunda, en los resultados simplesqa. Un portavoz de OpenAI le dijo a TechCrunch que no han informado públicamente el desempeño de Deep Research en este punto de referencia y no lo considera una comparación relevante. Sin embargo, el modelo de investigación profunda de Perplexity, que funciona de manera similar a la investigación profunda de Openi en otros puntos de referencia, en realidad supera a GPT-4.5 en esta prueba de precisión fáctica.

Simpleqa Benchmarks.Emage Créditos: OpenAI
En un subconjunto de problemas de codificación desde el punto de referencia verificado SWE-Bench, GPT-4.5 se desempeña de manera similar a GPT-4O y O3-Mini, pero no alcanza la investigación profunda de OpenAi y el soneto Claude 3.7 de Anthrope. En otra prueba de codificación, el Benchmark Swe-Lancer de OpenAI, que mide la capacidad de un modelo de IA para desarrollar características completas de software, GPT-4.5 supera a GPT-4O y O3-Mini pero no supera las investigaciones profundas.

SWE-Bench de OpenAI verificado de referencia. Créditos de imagen: OpenAI
Swe-Lancer Diamond Diamond Market de OpenAI. Créditos de imagen: OpenAi
Mientras que GPT-4.5 no coincide con el rendimiento de los principales modelos de razonamiento de IA como O3-Mini, Deepseek's R1 y Claude 3.7 sonnet en un desafío de referencia académica como AIME y GPQA, sí se mantiene suya contra los principales modelos principales de condición en las mismas pruebas. Esto sugiere que GPT-4.5 sobresale en tareas relacionadas con matemáticas y ciencias.

Operai también se jacta de que GPT-4.5 es cualitativamente superior a otros modelos en áreas que los puntos de referencia no capturan bien, como comprender la intención humana. Afirman que GPT-4.5 responde en un tono más cálido y más natural y funciona bien en tareas creativas como la escritura y el diseño.

En una prueba informal, Operai le pidió a GPT-4.5 y otros dos modelos, GPT-4O y O3-Mini, que creen un unicornio en formato SVG. Solo GPT-4.5 logró producir algo parecido a un unicornio.

Izquierda: GPT-4.5, Middle: GPT-4O, derecha: O3-Mini. Créditos de imagen: OpenAI
En otra prueba, OpenAI llevó a GPT-4.5 y los otros modelos a responder al aviso: "Estoy pasando por un momento difícil después de fallar una prueba". Mientras que GPT-4O y O3-Mini proporcionaron información útil, la respuesta de GPT-4.5 fue la más socialmente apropiada.

"Esperamos obtener una imagen más completa de las capacidades de GPT-4.5 a través de este lanzamiento", escribió Openai en su publicación de blog, "porque reconocemos que los puntos de referencia académicos no siempre reflejan la utilidad del mundo real".

Inteligencia emocional de GPT-4.5 en acción. Créditos de imagen: OpenAI
Leyes de escala impugnadas

Operai afirma que GPT -4.5 está "en la frontera de lo que es posible en el aprendizaje no supervisado". Sin embargo, sus limitaciones parecen respaldar la creciente sospecha entre los expertos de que las llamadas leyes de escala de la capacitación podrían estar alcanzando sus límites.

Ilya Sutskever, cofundadora y ex científica jefe, declaró en diciembre que "hemos logrado datos máximos" y que "pre-entrenamiento tal como lo sabemos, sin duda terminará". Sus comentarios se hicieron eco de las preocupaciones compartidas por los inversores de IA, los fundadores e investigadores con TechCrunch en noviembre.

En respuesta a estos desafíos, la industria, incluida OpenAI, ha recurrido a modelos de razonamiento, que llevan más tiempo realizar tareas pero ofrecen resultados más consistentes. Al permitir que los modelos de razonamiento sean más tiempo y potencia informática para "pensar" a través de los problemas, los laboratorios de IA creen que pueden mejorar significativamente las capacidades del modelo.

Operai planea fusionar eventualmente su serie GPT con su serie de razonamiento "O", comenzando con GPT-5 a finales de este año. A pesar de sus altos costos de capacitación, retrasos y expectativas internas insatisfechas, GPT-4.5 podría no reclamar la corona de referencia de IA por sí sola. Pero Operai probablemente lo ve como un paso crucial hacia algo mucho más poderoso.

Artículo relacionado
Una organización sin ánimo de lucro aprovecha los agentes de IA para impulsar la recaudación de fondos benéficos Una organización sin ánimo de lucro aprovecha los agentes de IA para impulsar la recaudación de fondos benéficos Mientras las grandes corporaciones tecnológicas promueven los "agentes" de IA como potenciadores de la productividad para las empresas, una organización sin ánimo de lucro está demostrando su potencia
Los principales laboratorios de IA advierten de que la humanidad está perdiendo el control sobre la comprensión de los sistemas de IA Los principales laboratorios de IA advierten de que la humanidad está perdiendo el control sobre la comprensión de los sistemas de IA En una muestra de unidad sin precedentes, investigadores de OpenAI, Google DeepMind, Anthropic y Meta han dejado de lado sus diferencias competitivas para lanzar una advertencia colectiva sobre el des
ChatGPT integra Google Drive y Dropbox para acceder a los archivos ChatGPT integra Google Drive y Dropbox para acceder a los archivos ChatGPT mejora la productividad con nuevas funciones empresarialesOpenAI ha presentado dos nuevas y potentes funciones que transforman ChatGPT en una completa herramienta de productividad empresaria
comentario (61)
0/200
GeorgeCarter
GeorgeCarter 22 de agosto de 2025 11:01:17 GMT+02:00

Wow, GPT-4.5 Orion sounds massive! But that sneaky white paper edit? Shady move, OpenAI. Makes me wonder what else they’re tweaking behind the scenes. 🤔

BruceWilson
BruceWilson 19 de agosto de 2025 05:01:00 GMT+02:00

Wow, GPT-4.5 Orion sounds like a beast! But that sneaky edit to the white paper? Shady move, OpenAI. Makes me wonder what else they're hiding. Still, I'm hyped to see what this model can do! 😎

BruceBrown
BruceBrown 11 de agosto de 2025 20:01:05 GMT+02:00

Wow, GPT-4.5 Orion sounds like a beast! But that sneaky white paper edit raises some eyebrows—why hide that it’s not a frontier model? 🤔 Makes me wonder what OpenAI’s cooking behind the scenes!

JeffreyRamirez
JeffreyRamirez 6 de agosto de 2025 21:01:00 GMT+02:00

Wow, GPT-4.5 Orion sounds massive! But that sneaky white paper edit? Shady move, OpenAI. Makes me wonder what else they’re hiding. 🤔 Still, can’t wait to see what this beast can do!

RalphPerez
RalphPerez 5 de agosto de 2025 17:01:00 GMT+02:00

Wow, GPT-4.5 Orion sounds like a beast! But that sneaky white paper edit raises some eyebrows 🤔. Why hide that it’s not a frontier model? Smells like they’re dodging some big questions about what this thing can really do.

WillPerez
WillPerez 23 de julio de 2025 06:59:29 GMT+02:00

Wow, GPT-4.5 Orion sounds massive! But that sneaky white paper edit about it not being a frontier model? Shady move, OpenAI. Makes me wonder what else they’re tweaking behind the scenes. 🧐 Anyone else suspicious?

Volver arriba
OR