opción
Hogar Noticias AI de código abierto se defiende con el lanzamiento de Meta's Llama 4

AI de código abierto se defiende con el lanzamiento de Meta's Llama 4

Fecha de lanzamiento Fecha de lanzamiento 15 de abril de 2025
Autor Autor PatrickLewis
vistas vistas 40

En los últimos años, el paisaje de IA se ha transformado de un ámbito de colaboración abierta a uno donde los sistemas patentados reinan supremos. Incluso Openai, una compañía que comenzó con "Abierta" en su nombre, cambió a mantener sus modelos más poderosos en secreto después de 2019. Otros jugadores como Anthrope y Google siguieron su ejemplo, construyendo su IA de vanguardia detrás de las paredes de API, accesibles solo en sus términos. Este cambio a menudo estaba justificado por las preocupaciones sobre la seguridad y los intereses comerciales, pero dejó a muchos en la comunidad de IA nostálgica por los días de la camaradería de código abierto.

Ahora, la marea está girando. El espíritu de IA de código abierto está regresando, encabezado por el lanzamiento de Meta de los modelos Llama 4. Este movimiento es un intento audaz de devolver la AI de código abierto a la vanguardia, e incluso aquellos tradicionalmente secretos se están dando cuenta. El CEO de Openai, Sam Altman, reconoció recientemente que la compañía había estado "en el lado equivocado de la historia" con respecto a los modelos abiertos y anunció planes para una nueva variante de "peso abierto" de GPT-4. Claramente, la IA de código abierto está organizando un avivamiento, y el significado de "abierto" está evolucionando.

(Fuente: Meta)

Llama 4: Meta's Open Challenger a GPT-4O, Claude y Gemini

La presentación de Meta's Invelo de Llama 4 marca un desafío directo a los últimos modelos de los gigantes de IA, posicionándolo como una alternativa de peso abierto. Llama 4 viene en dos versiones disponibles hoy: Llama 4 Scout y Llama 4 Maverick, cada una con impresionantes especificaciones técnicas. Ambos son modelos de mezcla de expertos (MOE), lo que significa que activan solo una fracción de sus parámetros por consulta, lo que permite un tamaño total masivo sin disparar costos de tiempo de ejecución. Scout y Maverick usan cada uno de los 17 mil millones de parámetros "activos" para cualquier entrada dada, pero Scout distribuye estos en 16 expertos (109B de parámetros en total), mientras que Maverick los extiende en 128 expertos (400B en total). El resultado es que los modelos LLAMA 4 ofrecen un rendimiento de primer nivel, junto con ventajas únicas que incluso algunos modelos cerrados no pueden igualar.

Por ejemplo, Llama 4 Scout cuenta con una ventana de contexto de 10 millones de tokens, superando mucho a la mayoría de los competidores. Esto le permite procesar y analizar documentos o bases masivos en una sola pasada. A pesar de su escala, Scout puede funcionar de manera eficiente en una sola GPU H100 cuando está muy cuantificada, lo que sugiere que los desarrolladores no necesitarán una supercomputadora para jugar con ella.

Por otro lado, Llama 4 Maverick está optimizado para el rendimiento máximo. Las pruebas tempranas indican que Maverick puede coincidir o incluso superar a los modelos cerrados líderes en tareas de razonamiento, codificación y visión. Meta ya está insinuando un modelo aún más grande, Llama 4 Behemoth, actualmente en entrenamiento, que, según los informes , "supera a GPT-4.5, Claude 3.7 Sonnet y Gemini 2.0 Pro en varios puntos de referencia STEM". El mensaje es claro: los modelos abiertos ya no están reproduciendo el segundo violín; Llama 4 apunta a la cima.

Además, Meta ha puesto a Llama 4 inmediatamente disponible para descargar y usar. Los desarrolladores pueden acceder a Scout y Maverick desde el sitio oficial o abrazar la cara bajo la licencia comunitaria de LLAMA 4. Esto significa que cualquier persona, desde un desarrollador en solitario hasta una gran corporación, puede sumergirse en el modelo, ajustarlo a sus necesidades específicas y ejecutarlo en su propio hardware o nube. Este es un marcado contraste con modelos patentados como el GPT-4O de OpenAI o Claude 3.7 de Anthrope, a los que solo se pueden acceder a través de API pagas sin acceso a los pesos subyacentes.

Meta enfatiza que la apertura de Llama 4 se trata de empoderar a los usuarios: "Estamos compartiendo los primeros modelos en el rebaño de Llama 4, lo que permitirá a las personas construir experiencias multimodales más personalizadas". En esencia, Llama 4 es un conjunto de herramientas diseñado para estar en manos de desarrolladores e investigadores de todo el mundo. Al liberar modelos que pueden enfrentarse cara a cara con personas como GPT-4 y Claude, Meta está dando nueva vida a la idea de que la IA de primer nivel no debería estar bloqueada detrás de un muro de pago.

(Fuente: Meta)

¿El idealismo auténtico o el juego estratégico?

Meta presenta la Llama 4 con un sentido de idealismo y altruismo. "Nuestro modelo de IA de código abierto, LLAMA, se ha descargado más de mil millones de veces", anunció recientemente el CEO Mark Zuckerberg, y agregó que "los modelos de AI de abastecimiento abierto es esencial para garantizar que las personas de todas partes tengan acceso a los beneficios de la IA". Esta representación posiciona a Meta como un campeón de la IA democratizada, una compañía dispuesta a compartir sus modelos de judía corona para el bien mayor. La popularidad de la familia Llama apoya esta narrativa: los modelos se han descargado a un ritmo sorprendente (saltando de 650 millones a mil millones de descargas totales en solo unos meses), y ya están en uso por compañías como Spotify, AT&T y Doordash.

Meta destaca que los desarrolladores aprecian la "transparencia, personalización y seguridad" de tener modelos abiertos que pueden ejecutar ellos mismos, lo que "ayuda a alcanzar nuevos niveles de creatividad e innovación", en comparación con la naturaleza opaca de las API de caja negra. Esto suena como el clásico espíritu de software de código abierto (piense en Linux o Apache) aplicado a la IA, una clara victoria para la comunidad.

Sin embargo, hay un ángulo estratégico para la apertura de Meta. Meta no es una organización benéfica, y la "fuente abierta" en este contexto viene con cadenas adjuntas. Llama 4 se libera bajo una licencia comunitaria especial, no una licencia permisiva estándar, por lo que si bien los pesos del modelo son gratuitos, existen restricciones (por ejemplo, ciertos casos de uso de alta recepción pueden requerir permiso, y la licencia es "propietaria" en el sentido de que está elaborado por Meta). Esto no se alinea con la definición aprobada de la Iniciativa de Corriente Abierta (OSI) de código abierto, lo que lleva a algunos a argumentar que las empresas están mal utilizando el término.

En la práctica, el enfoque de Meta a menudo se etiqueta como una IA "de peso abierto" o "disponible": el código y los pesos se comparten, pero Meta retiene cierto control y no revela todo (como los datos de entrenamiento). Si bien esto no reduce la utilidad para los usuarios, muestra que Meta está estratégicamente abierto, manteniendo suficiente control para protegerse (y tal vez su ventaja competitiva). Muchas empresas están aplicando etiquetas de "código abierto" a los modelos de IA mientras retienen los detalles clave, lo que socava el verdadero espíritu de apertura.

¿Por qué se abriría meta? El panorama competitivo proporciona algunas respuestas. Liberar modelos poderosos de forma gratuita puede construir rápidamente una amplia base de usuarios de desarrolladores y empresas: Mistral AI, una startup francesa, hizo esto con sus primeros modelos abiertos para establecerse como un laboratorio de nivel superior.

Al inundar el mercado con Llama, Meta asegura que su tecnología se vuelve fundamental en el ecosistema de IA, lo que puede generar beneficios a largo plazo. Es una estrategia clásica de abrazo y extensión: si todos usan su modelo "abierto", establece indirectamente los estándares y tal vez incluso guía a las personas hacia sus plataformas (por ejemplo, Meta's AI Assistant Products Approundlama). También hay un PR y un ángulo de posicionamiento. Meta puede desempeñar el papel del innovador benevolente, especialmente en contraste con OpenAI, que ha enfrentado críticas por su enfoque cerrado. De hecho, el cambio de corazón de OpenAI en los modelos abiertos resalta en parte cuán efectivo ha sido el movimiento de Meta.

Después de que el innovador modelo abierto chino Deepseek-R1 surgió en enero y saltó a los modelos anteriores, Altman indicó que OpenAi no quería quedarse en el "lado equivocado de la historia". Ahora Openai promete un modelo abierto con fuertes habilidades de razonamiento en el futuro, marcando un cambio de actitud. Es difícil no ver la influencia de Meta en ese cambio. La postura de código abierto de Meta está dirigida genuinamente a ampliar el acceso de IA y una obra estratégica para superar a los rivales y dar forma al futuro del mercado en los términos de Meta.

Implicaciones para desarrolladores, empresas y el futuro de AI

Para los desarrolladores, el resurgimiento de modelos abiertos como Llama 4 es un cambio bienvenido. En lugar de estar encerrados en el ecosistema y las tarifas de un solo proveedor, ahora tienen la libertad de ejecutar una poderosa IA en su propia infraestructura o personalizarlo como mejor les parezca.

Esta es una ventaja significativa para las empresas en sectores sensibles (piense en las finanzas, la salud o el gobierno, que tienen cuidado con la alimentación de datos confidenciales en la caja negra de otra persona. Con Llama 4, un banco u hospital podría desplegar un modelo de idioma de última generación detrás de su propio firewall, ajustándolo en datos privados, sin compartir una token con una entidad externa. También hay un beneficio de costo. Si bien las tarifas de API basadas en el uso para los principales modelos pueden aumentar rápidamente, un modelo abierto no tiene un peaje de uso: solo paga por el poder informático para ejecutarlo. Las empresas que amplían las cargas de trabajo de IA pesadas pueden ahorrar considerablemente al elegir una solución abierta que pueden administrar internamente.

No es de extrañar que las empresas muestren más interés en los modelos abiertos; Muchos se están dando cuenta de que el control y la seguridad ofrecidos por la IA de código abierto satisfacen mejor sus necesidades que los servicios único cerrados.

Los desarrolladores también se benefician de una mayor innovación. Con el acceso al modelo interno, pueden ajustar y mejorar la IA para los dominios de nicho (ley, biotecnología, idiomas regionales: lo que sea) de manera que una API cerrada nunca pueda atender. La explosión de proyectos impulsados ​​por la comunidad en torno a los modelos de LLAMA anteriores, desde chatbots ajustados en el conocimiento médico hasta aplicaciones de teléfonos inteligentes aficionados que ejecutan versiones en miniatura, demostró cómo los modelos abiertos pueden democratizar la experimentación.

Sin embargo, el renacimiento del modelo abierto también plantea preguntas importantes. ¿La "democratización" realmente sucede si solo aquellos con recursos informáticos significativos pueden ejecutar un modelo de 400b-paraméter? Si bien Llama 4 Scout y Maverick reducen la barrera de hardware en comparación con los modelos monolíticos, todavía son pesos pesados, un punto que no se pierde en algunos desarrolladores cuyas PC no pueden manejarlas sin soporte de nubes.

La esperanza es que las técnicas como la compresión del modelo, la destilación o las variantes expertas más pequeñas harán que el poder de Llama 4 sea más accesible. Otra preocupación es el mal uso. Operai y otros largos argumentaron que liberar modelos poderosos abiertamente podría permitir actores maliciosos (para generar desinformación, código de malware, etc.).

Estas preocupaciones permanecen: un Claude o GPT de código abierto podría usarse mal sin los filtros de seguridad que las empresas hacen cumplir con sus API. Por otro lado, los proponentes argumentan que la apertura permite a la comunidad identificar y solucionar problemas, haciendo que los modelos sean más robustos y transparentes con el tiempo que cualquier sistema secreto. Hay evidencia de que las comunidades de modelos abiertos se toman en serio la seguridad, desarrollan sus propias barandillas y comparten las mejores prácticas, pero es una tensión continua.

Lo que está cada vez más claro es que nos dirigimos hacia un paisaje híbrido de IA donde los modelos abiertos y cerrados coexisten, cada uno influyendo en el otro. Los proveedores cerrados como OpenAi, Anthrope y Google todavía tienen una ventaja en un rendimiento absoluto, por ahora. De hecho, a fines de 2024, la investigación sugirió que los modelos abiertos seguían aproximadamente un año detrás de los mejores modelos cerrados en capacidad. Pero esa brecha se está cerrando rápidamente.

En el mercado actual, "AI de código abierto" ya no solo significa proyectos de pasatiempo o modelos más antiguos, ahora está en el corazón de la estrategia de IA para gigantes tecnológicos y nuevas empresas por igual. El lanzamiento de Meta's Llama 4 es un recordatorio potente del valor en evolución de la apertura. Es una posición filosófica para democratizar la tecnología y un movimiento táctico en una batalla de la industria de alto riesgo. Para los desarrolladores y las empresas, abre nuevas puertas a la innovación y la autonomía, incluso cuando complica las decisiones con las nuevas compensaciones. Y para el ecosistema más amplio, aumenta la esperanza de que los beneficios de la IA no se bloqueen en manos de algunas corporaciones, si el espíritu de código abierto puede mantenerse firme.

Artículo relacionado
Meta捍衛Llama 4版本,引用Bug作為混合質量報告的原因 Meta捍衛Llama 4版本,引用Bug作為混合質量報告的原因 在周末,Facebook,Instagram,WhatsApp和Quest VR背後的強大力量Meta通過揭露其最新的AI語言模型Llama 4。不僅是一個,而且引入了三個新版本,每個版本都具有增強功能,這要歸功於“ Architecturs” Architecturs”
法學教授支持作者在AI的版權與META的版權之戰中 法學教授支持作者在AI的版權與META的版權之戰中 一組版權法學教授在起訴元的作者後面提供了支持,指控這家科技巨頭未經作者同意就在電子書上訓練了其Llama AI模型。教授於週五在美國加利福尼亞北區的美國地方法院提交了一份法庭之友。
Meta AI很快將培訓歐盟用戶的數據 Meta AI很快將培訓歐盟用戶的數據 Meta最近透露了其使用其平台的歐盟用戶(例如Facebook和Instagram)的數據培訓其AI的計劃。該倡議將利用與元AI的公開帖子,評論,甚至是聊天歷史,但請放心,您與朋友和家人的私人消息是限制的。
comentario (5)
0/200
KevinAnderson
KevinAnderson 16 de abril de 2025 06:43:16 GMT

Meta's Llama 4 release is a breath of fresh air in the AI world! Open-source fighting back against the proprietary giants is epic. 😎 Now we can tinker and innovate without restrictions. Hope more companies follow suit and keep AI accessible to all! 🌍

BenHernández
BenHernández 16 de abril de 2025 20:30:47 GMT

MetaのLlama 4リリースはAI業界に新鮮な風を吹き込んだね!オープンソースが専有の大手に対抗するのはエピックだよ。😎 今なら制限なしでいじくり回して革新できる。もっと多くの企業がこれに続いて、AIを全員にアクセス可能にしてほしい!🌍

LarryMartin
LarryMartin 16 de abril de 2025 04:52:10 GMT

메타의 Llama 4 출시는 AI 세계에 신선한 바람을 불어넣었어! 오픈 소스가 독점 거대 기업에 맞서 싸우는 건 정말 멋져. 😎 이제 제한 없이 만지고 혁신할 수 있어. 더 많은 기업이 이에 동참해서 AI를 모두에게 접근 가능하게 했으면 좋겠어! 🌍

CharlesRoberts
CharlesRoberts 15 de abril de 2025 18:09:05 GMT

O lançamento do Llama 4 da Meta é um sopro de ar fresco no mundo da IA! O código aberto lutando contra os gigantes proprietários é épico. 😎 Agora podemos mexer e inovar sem restrições. Espero que mais empresas sigam o exemplo e mantenham a IA acessível a todos! 🌍

JustinAnderson
JustinAnderson 17 de abril de 2025 02:07:46 GMT

¡El lanzamiento de Llama 4 de Meta es un soplo de aire fresco en el mundo de la IA! Que el código abierto luche contra los gigantes propietarios es épico. 😎 Ahora podemos trastear e innovar sin restricciones. Espero que más empresas sigan el ejemplo y mantengan la IA accesible para todos! 🌍

Volver arriba
OR