Ai2 presenta un modelo de IA compacto que supera a los rivales de Google y Meta

Los modelos de IA pequeños están causando sensación esta semana.
El jueves, Ai2, un grupo de investigación de IA sin fines de lucro, lanzó Olmo 2 1B, un modelo de 1 mil millones de parámetros que supera a modelos de tamaño similar de Google, Meta y Alibaba en múltiples puntos de referencia. Los parámetros, a menudo llamados pesos, son los elementos internos que determinan el rendimiento de un modelo.
Olmo 2 1B está disponible gratuitamente bajo una licencia Apache 2.0 en Hugging Face, una plataforma para desarrolladores de IA. A diferencia de la mayoría de los modelos, puede ser completamente recreado, ya que Ai2 comparte el código y los conjuntos de datos (Olmo-mix-1124, Dolmino-mix-1124) utilizados en su desarrollo.
Aunque los modelos más pequeños pueden carecer de la potencia de los más grandes, no requieren hardware de alta gama, lo que los hace ideales para desarrolladores y aficionados que usan laptops estándar o dispositivos de consumo.
En los últimos días ha habido un aumento en los lanzamientos de modelos pequeños, desde la familia de razonamiento Phi 4 de Microsoft hasta Qwen 2.5 Omni 3B. La mayoría, incluido Olmo 2 1B, puede funcionar sin problemas en laptops modernas o incluso en dispositivos móviles.
Ai2 señala que Olmo 2 1B fue entrenado con 4 billones de tokens de fuentes públicas, generadas por IA y seleccionadas. Un millón de tokens equivale aproximadamente a 750,000 palabras.
En pruebas de razonamiento aritmético como GSM8K, Olmo 2 1B supera a Gemma 3 1B de Google, Llama 3.2 1B de Meta y Qwen 2.5 1.5B de Alibaba. También destaca en TruthfulQA, un punto de referencia para la precisión factual.
Exhibición en TechCrunch Sessions: AI
Reclama tu espacio en TC Sessions: AI para presentar tu trabajo a más de 1,200 tomadores de decisiones sin gastar una fortuna. Disponible hasta el 9 de mayo o mientras haya plazas.
Exhibición en TechCrunch Sessions: AI
Reclama tu espacio en TC Sessions: AI para presentar tu trabajo a más de 1,200 tomadores de decisiones sin gastar una fortuna. Disponible hasta el 9 de mayo o mientras haya plazas.
Berkeley, CA | 5 de junio
RESERVA AHORA
Este modelo fue preentrenado con 4 billones de tokens de datos de alta calidad, siguiendo el mismo estándar de preentrenamiento en recocido de alta calidad de nuestros modelos de 7, 13 y 32B. Subimos puntos de control intermedios cada 1000 pasos en el entrenamiento.
Accede al modelo base: https://t.co/xofyWJmo85 pic.twitter.com/7uSJ6sYMdL
— Ai2 (@allen_ai) 1 de mayo de 2025
Ai2 advierte que Olmo 2 1B tiene riesgos. Como todos los modelos de IA, puede generar resultados problemáticos, incluidos contenidos dañinos o sensibles e información inexacta. Ai2 desaconseja su uso en aplicaciones comerciales.
Artículo relacionado
¿Qué hay dentro del LLM? Ai2 Olmotrace 'rastreará' la fuente
Comprender la conexión entre la salida de un modelo de lenguaje grande (LLM) y sus datos de entrenamiento siempre ha sido un poco rompecabezas para Enterprise IT. Esta semana, el Allen Institute for AI (AI2) lanzó una nueva y emocionante iniciativa de código abierto llamada Olmotrace, que tiene como objetivo desmitificar este relati
El principal inversor de Suno: eliminar las publicaciones no tapará el agujero de la demanda por derechos de autor
La tan esperada plataforma de generación musical con IA, Suno, se enfrenta a una dura batalla por los derechos de autor, y un comentario sincero de su principal inversor podría haber proporcionado a l
Claude Opus 4.7 sale al mercado apostando por la fiabilidad por encima de la inteligencia
Anthropic ha mantenido un ritmo frenético este año, lanzando nuevas funciones casi cada dos días. El tan esperado Claude Opus 4.7 acaba de salir oficialmente al mercado y, curiosamente, Anthropic fue
Recomendaciones de temas especiales relacionados
comentario (4)
0/500
Interesting to see a nonprofit like Ai2 pushing the boundaries with Olmo 2 1B! It really makes you wonder if the future of AI innovation lies more with smaller, specialized teams rather than just the tech giants. The efficiency gains here could be huge for real-world applications. 🧠
Olmo 2 1B par Ai2 est vraiment impressionnant! Un modèle d'1 milliard de paramètres qui bat ceux de Google et Meta? Ça montre qu'en IA, la taille n'est pas tout. J'adore voir des recherches orientées sur l'efficacité plutôt que la course aux plus gros modèles. C'est plus accessible et peut-être plus durable à long terme! 👏
Honestly, 1B参数的小模型能超越谷歌和Meta的对手,这太令人惊喜了!🥳 感觉大公司们的优势在被慢慢蚕食,这种非营利性组织的创新对整个生态是件好事,更轻量级的AI或许能让更多开发者参与进来。期待看到更多实际应用!

Los modelos de IA pequeños están causando sensación esta semana.
El jueves, Ai2, un grupo de investigación de IA sin fines de lucro, lanzó Olmo 2 1B, un modelo de 1 mil millones de parámetros que supera a modelos de tamaño similar de Google, Meta y Alibaba en múltiples puntos de referencia. Los parámetros, a menudo llamados pesos, son los elementos internos que determinan el rendimiento de un modelo.
Olmo 2 1B está disponible gratuitamente bajo una licencia Apache 2.0 en Hugging Face, una plataforma para desarrolladores de IA. A diferencia de la mayoría de los modelos, puede ser completamente recreado, ya que Ai2 comparte el código y los conjuntos de datos (Olmo-mix-1124, Dolmino-mix-1124) utilizados en su desarrollo.
Aunque los modelos más pequeños pueden carecer de la potencia de los más grandes, no requieren hardware de alta gama, lo que los hace ideales para desarrolladores y aficionados que usan laptops estándar o dispositivos de consumo.
En los últimos días ha habido un aumento en los lanzamientos de modelos pequeños, desde la familia de razonamiento Phi 4 de Microsoft hasta Qwen 2.5 Omni 3B. La mayoría, incluido Olmo 2 1B, puede funcionar sin problemas en laptops modernas o incluso en dispositivos móviles.
Ai2 señala que Olmo 2 1B fue entrenado con 4 billones de tokens de fuentes públicas, generadas por IA y seleccionadas. Un millón de tokens equivale aproximadamente a 750,000 palabras.
En pruebas de razonamiento aritmético como GSM8K, Olmo 2 1B supera a Gemma 3 1B de Google, Llama 3.2 1B de Meta y Qwen 2.5 1.5B de Alibaba. También destaca en TruthfulQA, un punto de referencia para la precisión factual.
Exhibición en TechCrunch Sessions: AI
Reclama tu espacio en TC Sessions: AI para presentar tu trabajo a más de 1,200 tomadores de decisiones sin gastar una fortuna. Disponible hasta el 9 de mayo o mientras haya plazas.
Exhibición en TechCrunch Sessions: AI
Reclama tu espacio en TC Sessions: AI para presentar tu trabajo a más de 1,200 tomadores de decisiones sin gastar una fortuna. Disponible hasta el 9 de mayo o mientras haya plazas.
Berkeley, CA | 5 de junio RESERVA AHORAEste modelo fue preentrenado con 4 billones de tokens de datos de alta calidad, siguiendo el mismo estándar de preentrenamiento en recocido de alta calidad de nuestros modelos de 7, 13 y 32B. Subimos puntos de control intermedios cada 1000 pasos en el entrenamiento.
— Ai2 (@allen_ai) 1 de mayo de 2025
Accede al modelo base: https://t.co/xofyWJmo85 pic.twitter.com/7uSJ6sYMdL
Ai2 advierte que Olmo 2 1B tiene riesgos. Como todos los modelos de IA, puede generar resultados problemáticos, incluidos contenidos dañinos o sensibles e información inexacta. Ai2 desaconseja su uso en aplicaciones comerciales.
¿Qué hay dentro del LLM? Ai2 Olmotrace 'rastreará' la fuente
Comprender la conexión entre la salida de un modelo de lenguaje grande (LLM) y sus datos de entrenamiento siempre ha sido un poco rompecabezas para Enterprise IT. Esta semana, el Allen Institute for AI (AI2) lanzó una nueva y emocionante iniciativa de código abierto llamada Olmotrace, que tiene como objetivo desmitificar este relati
El principal inversor de Suno: eliminar las publicaciones no tapará el agujero de la demanda por derechos de autor
La tan esperada plataforma de generación musical con IA, Suno, se enfrenta a una dura batalla por los derechos de autor, y un comentario sincero de su principal inversor podría haber proporcionado a l
Claude Opus 4.7 sale al mercado apostando por la fiabilidad por encima de la inteligencia
Anthropic ha mantenido un ritmo frenético este año, lanzando nuevas funciones casi cada dos días. El tan esperado Claude Opus 4.7 acaba de salir oficialmente al mercado y, curiosamente, Anthropic fue
Interesting to see a nonprofit like Ai2 pushing the boundaries with Olmo 2 1B! It really makes you wonder if the future of AI innovation lies more with smaller, specialized teams rather than just the tech giants. The efficiency gains here could be huge for real-world applications. 🧠
Olmo 2 1B par Ai2 est vraiment impressionnant! Un modèle d'1 milliard de paramètres qui bat ceux de Google et Meta? Ça montre qu'en IA, la taille n'est pas tout. J'adore voir des recherches orientées sur l'efficacité plutôt que la course aux plus gros modèles. C'est plus accessible et peut-être plus durable à long terme! 👏
Honestly, 1B参数的小模型能超越谷歌和Meta的对手,这太令人惊喜了!🥳 感觉大公司们的优势在被慢慢蚕食,这种非营利性组织的创新对整个生态是件好事,更轻量级的AI或许能让更多开发者参与进来。期待看到更多实际应用!





Hogar






