Hogar
Mistral presenta el modelo de incrustación de código avanzado superando a OpenAi y cohere en tareas de recuperación del mundo real
Mistral entra en el terreno de la incrustación con Codestral Embed
A medida que la generación aumentada de recuperación empresarial (RAG) sigue ganando adeptos, el mercado está maduro para la innovación en modelos de incrustación. Mistral es una empresa francesa conocida por ampliar los límites del desarrollo de la inteligencia artificial. Recientemente ha presentado Codestral Embed, su primer modelo de incrustación adaptado específicamente al código.
Según Mistral, Codestral Embed eclipsa a los modelos existentes en pruebas comparativas como SWE-Bench. El modelo brilla más cuando se trata de recuperar datos de código del mundo real, ofreciendo un rendimiento impresionante en escenarios de recuperación. Disponible para los desarrolladores a 0,15 dólares por millón de tokens, Codestral Embed ofrece una opción asequible pero potente para mejorar las aplicaciones relacionadas con el código.
En un anuncio reciente, Mistral declaró con orgullo que Codestral Embed supera a los principales incrustadores de código como Voyage Code 3, Cohere Embed v4.0 y Text Embedding 3 Large de OpenAI. Esta audaz afirmación captó la atención de la comunidad tecnológica, suscitando debates en plataformas como X (antes Twitter).
Estamos muy contentos de anunciar @MistralAI Codestral Embed, nuestro primer modelo de incrustación especializado en código.
Funciona especialmente bien en casos de recuperación de datos de código del mundo real. pic.twitter.com/ET321cRNli
- Sophia Yang, Ph.D. (@sophiamyang) 28 de mayo de 2025
Codestral Embed, que forma parte de la familia de modelos de codificación Codestral de Mistral, genera incrustaciones que convierten el código y los datos en representaciones numéricas, lo que lo hace ideal para RAG. El modelo presume de flexibilidad en las dimensiones y precisiones de salida, ofreciendo un equilibrio entre la calidad de la recuperación y los costes de almacenamiento. Como señala Mistral, incluso Codestral Embed con una dimensión de 256 y precisión int8 supera a los modelos de la competencia.
Rendimiento de referencia
Mistral ha sometido a Codestral Embed a rigurosas pruebas de rendimiento, como SWE-Bench y Text2Code de GitHub. En ambos casos, el modelo demostró un rendimiento superior en comparación con los modelos de incrustación líderes del sector.


Posibles casos de uso
Mistral prevé que Codestral Embed destaque en la recuperación de código de alto rendimiento y la comprensión semántica. El modelo satisface varios casos de uso clave:
- RAG: Facilita una recuperación de información más rápida para tareas y procesos agénticos.
- Búsqueda semántica de código: Los desarrolladores pueden encontrar fragmentos de código mediante consultas en lenguaje natural, agilizando los flujos de trabajo en plataformas como sistemas de documentación y copilotos de codificación.
- Búsqueda por similitud: Ayuda a identificar segmentos de código duplicados o similares, ayudando a las empresas a aplicar políticas de reutilización.
- Análisis de código: Admite la agrupación semántica del código en función de su funcionalidad o estructura, lo que permite conocer mejor la arquitectura del código.
Dinámica del mercado y competencia
La entrada de Mistral en el mercado de la incrustación se produce en un contexto de creciente competencia. La empresa ha ampliado activamente su oferta, lanzando Mistral Medium 3 -una versión de tamaño medio de su modelo de lenguaje de gran tamaño (LLM)- e introduciendo la API Agents para crear agentes orientados a tareas.
Los observadores del sector están tomando nota. Algunos observadores señalan que el momento elegido por Mistral coincide con el aumento de la competencia en el sector de la incrustación. Aunque Codestral Embed compite con modelos de código cerrado de gigantes como OpenAI y Cohere, también se enfrenta a la dura competencia de alternativas de código abierto como Qodo-Embed-1-1.5 B.
VentureBeat se puso en contacto con Mistral para obtener más detalles sobre las opciones de licencia de Codestral Embed, lo que pone de relieve el creciente interés por esta tecnología emergente.
Un futuro prometedor
Gracias a su enfoque en la optimización específica del código y a sus precios competitivos, Codestral Embed se posiciona como un fuerte competidor en el panorama de la incrustación. Dado que los desarrolladores siguen buscando soluciones innovadoras para los retos relacionados con el código, la última oferta de Mistral podría hacerse un hueco que la impulse en este campo en rápida evolución.
Artículo relacionado
Snowflake invierte más de 600 millones de dólares en chips personalizados de AWS para impulsar la IA empresarial
Snowflake, el gigante de los datos en la nube, ha anunciado sus planes de invertir más de 600 millones de dólares en los próximos seis años para adquirir procesadores de la serie Graviton y acelerador
China Telecom invierte en Mianbi Intelligence y aumenta su capital a 713 000 yuanes para modelos de lenguaje a gran escala (LLM) e infraestructura de datos
El «equipo nacional» y la figura destacada de la Universidad de Tsinghua en el ámbito de los modelos a gran escala están profundizando en su alineación estratégica. El 1 de marzo de 2026, según los úl
El Grupo Taotian acelera su reestructuración centrada en la IA y concede a los becarios cuotas de tokens gratuitas
El Grupo TaoTian ha presentado recientemente el «Plan de Productividad con IA», diseñado para acelerar la integración de la tecnología de IA en las operaciones de comercio electrónico y los flujos de
Recomendaciones de temas especiales relacionados
comentario (3)
0/500
Wow, Mistral’s Codestral Embed sounds like a game-changer! Outperforming OpenAI and Cohere in retrieval tasks is no small feat. I’m curious how this’ll shake up enterprise RAG—more efficient embeddings could mean faster, smarter AI apps. Anyone else excited to see where this goes? 🚀
Wow, Mistral's Codestral Embed sounds like a game-changer! Beating OpenAI and Cohere in retrieval tasks is no small feat. I'm curious how this'll shake up enterprise RAG. Anyone tried it yet? 😎
Mistral entra en el terreno de la incrustación con Codestral Embed
A medida que la generación aumentada de recuperación empresarial (RAG) sigue ganando adeptos, el mercado está maduro para la innovación en modelos de incrustación. Mistral es una empresa francesa conocida por ampliar los límites del desarrollo de la inteligencia artificial. Recientemente ha presentado Codestral Embed, su primer modelo de incrustación adaptado específicamente al código.
Según Mistral, Codestral Embed eclipsa a los modelos existentes en pruebas comparativas como SWE-Bench. El modelo brilla más cuando se trata de recuperar datos de código del mundo real, ofreciendo un rendimiento impresionante en escenarios de recuperación. Disponible para los desarrolladores a 0,15 dólares por millón de tokens, Codestral Embed ofrece una opción asequible pero potente para mejorar las aplicaciones relacionadas con el código.
En un anuncio reciente, Mistral declaró con orgullo que Codestral Embed supera a los principales incrustadores de código como Voyage Code 3, Cohere Embed v4.0 y Text Embedding 3 Large de OpenAI. Esta audaz afirmación captó la atención de la comunidad tecnológica, suscitando debates en plataformas como X (antes Twitter).
Estamos muy contentos de anunciar @MistralAI Codestral Embed, nuestro primer modelo de incrustación especializado en código.
Funciona especialmente bien en casos de recuperación de datos de código del mundo real. pic.twitter.com/ET321cRNli
- Sophia Yang, Ph.D. (@sophiamyang) 28 de mayo de 2025
Codestral Embed, que forma parte de la familia de modelos de codificación Codestral de Mistral, genera incrustaciones que convierten el código y los datos en representaciones numéricas, lo que lo hace ideal para RAG. El modelo presume de flexibilidad en las dimensiones y precisiones de salida, ofreciendo un equilibrio entre la calidad de la recuperación y los costes de almacenamiento. Como señala Mistral, incluso Codestral Embed con una dimensión de 256 y precisión int8 supera a los modelos de la competencia.
Rendimiento de referencia
Mistral ha sometido a Codestral Embed a rigurosas pruebas de rendimiento, como SWE-Bench y Text2Code de GitHub. En ambos casos, el modelo demostró un rendimiento superior en comparación con los modelos de incrustación líderes del sector.


Posibles casos de uso
Mistral prevé que Codestral Embed destaque en la recuperación de código de alto rendimiento y la comprensión semántica. El modelo satisface varios casos de uso clave:
- RAG: Facilita una recuperación de información más rápida para tareas y procesos agénticos.
- Búsqueda semántica de código: Los desarrolladores pueden encontrar fragmentos de código mediante consultas en lenguaje natural, agilizando los flujos de trabajo en plataformas como sistemas de documentación y copilotos de codificación.
- Búsqueda por similitud: Ayuda a identificar segmentos de código duplicados o similares, ayudando a las empresas a aplicar políticas de reutilización.
- Análisis de código: Admite la agrupación semántica del código en función de su funcionalidad o estructura, lo que permite conocer mejor la arquitectura del código.
Dinámica del mercado y competencia
La entrada de Mistral en el mercado de la incrustación se produce en un contexto de creciente competencia. La empresa ha ampliado activamente su oferta, lanzando Mistral Medium 3 -una versión de tamaño medio de su modelo de lenguaje de gran tamaño (LLM)- e introduciendo la API Agents para crear agentes orientados a tareas.
Los observadores del sector están tomando nota. Algunos observadores señalan que el momento elegido por Mistral coincide con el aumento de la competencia en el sector de la incrustación. Aunque Codestral Embed compite con modelos de código cerrado de gigantes como OpenAI y Cohere, también se enfrenta a la dura competencia de alternativas de código abierto como Qodo-Embed-1-1.5 B.
VentureBeat se puso en contacto con Mistral para obtener más detalles sobre las opciones de licencia de Codestral Embed, lo que pone de relieve el creciente interés por esta tecnología emergente.
Un futuro prometedor
Gracias a su enfoque en la optimización específica del código y a sus precios competitivos, Codestral Embed se posiciona como un fuerte competidor en el panorama de la incrustación. Dado que los desarrolladores siguen buscando soluciones innovadoras para los retos relacionados con el código, la última oferta de Mistral podría hacerse un hueco que la impulse en este campo en rápida evolución.
Snowflake invierte más de 600 millones de dólares en chips personalizados de AWS para impulsar la IA empresarial
Snowflake, el gigante de los datos en la nube, ha anunciado sus planes de invertir más de 600 millones de dólares en los próximos seis años para adquirir procesadores de la serie Graviton y acelerador
China Telecom invierte en Mianbi Intelligence y aumenta su capital a 713 000 yuanes para modelos de lenguaje a gran escala (LLM) e infraestructura de datos
El «equipo nacional» y la figura destacada de la Universidad de Tsinghua en el ámbito de los modelos a gran escala están profundizando en su alineación estratégica. El 1 de marzo de 2026, según los úl
El Grupo Taotian acelera su reestructuración centrada en la IA y concede a los becarios cuotas de tokens gratuitas
El Grupo TaoTian ha presentado recientemente el «Plan de Productividad con IA», diseñado para acelerar la integración de la tecnología de IA en las operaciones de comercio electrónico y los flujos de
Wow, Mistral’s Codestral Embed sounds like a game-changer! Outperforming OpenAI and Cohere in retrieval tasks is no small feat. I’m curious how this’ll shake up enterprise RAG—more efficient embeddings could mean faster, smarter AI apps. Anyone else excited to see where this goes? 🚀
Wow, Mistral's Codestral Embed sounds like a game-changer! Beating OpenAI and Cohere in retrieval tasks is no small feat. I'm curious how this'll shake up enterprise RAG. Anyone tried it yet? 😎











