Mistral presenta el modelo de incrustación de código avanzado superando a OpenAi y cohere en tareas de recuperación del mundo real

Hogar

Noticias

7 de junio de 2025

DanielLewis

Mistral entra en el terreno de la incrustación con Codestral Embed

A medida que la generación aumentada de recuperación empresarial (RAG) sigue ganando adeptos, el mercado está maduro para la innovación en modelos de incrustación. Mistral es una empresa francesa conocida por ampliar los límites del desarrollo de la inteligencia artificial. Recientemente ha presentado Codestral Embed, su primer modelo de incrustación adaptado específicamente al código.

Según Mistral, Codestral Embed eclipsa a los modelos existentes en pruebas comparativas como SWE-Bench. El modelo brilla más cuando se trata de recuperar datos de código del mundo real, ofreciendo un rendimiento impresionante en escenarios de recuperación. Disponible para los desarrolladores a 0,15 dólares por millón de tokens, Codestral Embed ofrece una opción asequible pero potente para mejorar las aplicaciones relacionadas con el código.

En un anuncio reciente, Mistral declaró con orgullo que Codestral Embed supera a los principales incrustadores de código como Voyage Code 3, Cohere Embed v4.0 y Text Embedding 3 Large de OpenAI. Esta audaz afirmación captó la atención de la comunidad tecnológica, suscitando debates en plataformas como X (antes Twitter).

Estamos muy contentos de anunciar @MistralAI Codestral Embed, nuestro primer modelo de incrustación especializado en código.
Funciona especialmente bien en casos de recuperación de datos de código del mundo real. pic.twitter.com/ET321cRNli
- Sophia Yang, Ph.D. (@sophiamyang) 28 de mayo de 2025

Codestral Embed, que forma parte de la familia de modelos de codificación Codestral de Mistral, genera incrustaciones que convierten el código y los datos en representaciones numéricas, lo que lo hace ideal para RAG. El modelo presume de flexibilidad en las dimensiones y precisiones de salida, ofreciendo un equilibrio entre la calidad de la recuperación y los costes de almacenamiento. Como señala Mistral, incluso Codestral Embed con una dimensión de 256 y precisión int8 supera a los modelos de la competencia.

Rendimiento de referencia

Mistral ha sometido a Codestral Embed a rigurosas pruebas de rendimiento, como SWE-Bench y Text2Code de GitHub. En ambos casos, el modelo demostró un rendimiento superior en comparación con los modelos de incrustación líderes del sector.

SWE-Bench

Texto2Código

Posibles casos de uso

Mistral prevé que Codestral Embed destaque en la recuperación de código de alto rendimiento y la comprensión semántica. El modelo satisface varios casos de uso clave:

RAG: Facilita una recuperación de información más rápida para tareas y procesos agénticos.
Búsqueda semántica de código: Los desarrolladores pueden encontrar fragmentos de código mediante consultas en lenguaje natural, agilizando los flujos de trabajo en plataformas como sistemas de documentación y copilotos de codificación.
Búsqueda por similitud: Ayuda a identificar segmentos de código duplicados o similares, ayudando a las empresas a aplicar políticas de reutilización.
Análisis de código: Admite la agrupación semántica del código en función de su funcionalidad o estructura, lo que permite conocer mejor la arquitectura del código.

Dinámica del mercado y competencia

La entrada de Mistral en el mercado de la incrustación se produce en un contexto de creciente competencia. La empresa ha ampliado activamente su oferta, lanzando Mistral Medium 3 -una versión de tamaño medio de su modelo de lenguaje de gran tamaño (LLM)- e introduciendo la API Agents para crear agentes orientados a tareas.

Los observadores del sector están tomando nota. Algunos observadores señalan que el momento elegido por Mistral coincide con el aumento de la competencia en el sector de la incrustación. Aunque Codestral Embed compite con modelos de código cerrado de gigantes como OpenAI y Cohere, también se enfrenta a la dura competencia de alternativas de código abierto como Qodo-Embed-1-1.5 B.

VentureBeat se puso en contacto con Mistral para obtener más detalles sobre las opciones de licencia de Codestral Embed, lo que pone de relieve el creciente interés por esta tecnología emergente.

Un futuro prometedor

Gracias a su enfoque en la optimización específica del código y a sus precios competitivos, Codestral Embed se posiciona como un fuerte competidor en el panorama de la incrustación. Dado que los desarrolladores siguen buscando soluciones innovadoras para los retos relacionados con el código, la última oferta de Mistral podría hacerse un hueco que la impulse en este campo en rápida evolución.

Artículo relacionado

Topaz DeNoise AI: Mejor herramienta de reducción de ruido en 2025 - Guía completa En el competitivo mundo de la fotografía digital, la claridad de imagen sigue siendo primordial. Fotógrafos de todos los niveles se enfrentan al ruido digital que compromete tomas que de otro modo ser

Maestro Esmeralda Kaizo Nuzlocke: Guía definitiva de supervivencia y estrategia Kaizo Esmeralda se erige como uno de los hacks de ROMs de Pokémon más formidables jamás concebidos. Aunque intentar una ejecución Nuzlocke aumenta exponencialmente el desafío, la victoria sigue siendo

Cartas de presentación con IA: Guía de expertos para la presentación de trabajos a revistas En el competitivo entorno actual de las publicaciones académicas, la elaboración de una carta de presentación eficaz puede marcar la diferencia decisiva en la aceptación de su manuscrito. Descubra cóm

comentario (3)

0/200

Entregar

BillyAdams

12 de agosto de 2025 08:01:01 GMT+02:00

Wow, Mistral’s Codestral Embed sounds like a game-changer! Outperforming OpenAI and Cohere in retrieval tasks is no small feat. I’m curious how this’ll shake up enterprise RAG—more efficient embeddings could mean faster, smarter AI apps. Anyone else excited to see where this goes? 🚀

RogerLopez

8 de agosto de 2025 08:38:17 GMT+02:00

Wow, Mistral's Codestral Embed sounds like a game-changer! Beating OpenAI and Cohere in retrieval tasks is no small feat. I'm curious how this'll shake up enterprise RAG. Anyone tried it yet? 😎

JoeWalker

4 de agosto de 2025 08:48:52 GMT+02:00

Mistral's new embedding model sounds like a game-changer! Beating OpenAI and Cohere in retrieval tasks is no small feat. Can't wait to see how it performs in real-world apps. 😎 Anyone tried it yet?

Noticias principales

Generadores de Video AI Top de 2025: Pika Labs vs Alternativas Gemini 2.5 Pro ahora ilimitado y más barato que Claude, GPT-4O Doblaje AI: Guía Definitiva para la Creación de Voz Realista La IA de Cambium transforma la madera de los desechos en madera AI Builder y Power Automate Revolucionan la Sumarización de Documentos Operai mejora el asistente de voz de IA para mejores chats Cómo garantizar que sus datos sean confiables para la integración de IA Notebooklm se expande a nivel mundial, agrega diapositivas y verificación de hechos mejorada Los ajustes a los centros de datos de EE. UU. Podrían desbloquear 76 GW de nueva capacidad de potencia Google utiliza IA para suspender más de 39 millones de cuentas publicitarias por sospecha de fraude

Más

Presentado