Hogar
Cohere presenta Embed 4: un modelo de IA multimodal que permite realizar búsquedas en documentos de hasta 200 páginas.
La generación aumentada de recuperación empresarial (RAG) sigue siendo fundamental para la actual ola de innovación en IA agencial. Aprovechando el entusiasmo sostenido por los agentes de IA, Cohere ha lanzado la última versión de su modelo de incrustaciones, que presenta ventanas de contexto significativamente ampliadas y capacidades multimodales mejoradas.
El modelo Embed 4 de Cohere mejora la base multimodal establecida por Embed 3, introduciendo una mayor competencia en el manejo de datos no estructurados. Con una ventana de contexto que admite 128 000 tokens, las empresas ahora pueden generar incrustaciones para documentos extensos, equivalentes a unas 200 páginas.
«Los modelos de incrustación tradicionales suelen carecer de una comprensión innata de los documentos empresariales complejos y multimodales. Esto obliga a las empresas a crear intrincados sistemas de preprocesamiento que solo producen ganancias marginales en precisión», señaló Cohere en un anuncio en su blog. «Embed 4 aborda este desafío fundamental, permitiendo a las empresas y a sus equipos descubrir de manera eficiente información valiosa oculta en vastos repositorios de información que antes no se podía buscar».
Para mejorar la seguridad de los datos, las empresas pueden implementar Embed 4 en entornos de nube privada virtual o en infraestructura tecnológica local.
Las empresas utilizan incrustaciones para convertir documentos y diversos tipos de datos en representaciones numéricas adecuadas para aplicaciones RAG. A continuación, los agentes de IA pueden aprovechar estas incrustaciones para proporcionar respuestas precisas a las consultas de los usuarios.
Conocimientos específicos del dominio
Según la empresa, Embed 4 es especialmente adecuado para sectores con un alto nivel de cumplimiento normativo, como las finanzas, la sanidad y la fabricación. Como proveedor de IA centrado en las empresas, Cohere diseña sus modelos teniendo en cuenta los estrictos requisitos de seguridad de los sectores regulados, lo que garantiza una profunda comprensión de los contextos empresariales.
El modelo se entrenó para ser resistente a las irregularidades típicas de los datos empresariales del mundo real. Mantiene una alta precisión incluso cuando se encuentra con imperfecciones comunes, como errores ortográficos y formatos inconsistentes.
«También ofrece un rendimiento sólido al buscar en documentos escaneados y texto manuscrito, formatos muy habituales en contratos legales, facturas de seguros y recibos de gastos. Esta capacidad elimina la necesidad de realizar complejos flujos de trabajo de preparación o preprocesamiento de datos, lo que supone un importante ahorro de tiempo y gastos operativos para las empresas», explicó Cohere.
Las organizaciones pueden aplicar Embed 4 a una amplia gama de materiales, incluyendo presentaciones para inversores, archivos de diligencia debida, informes de ensayos clínicos, manuales de reparación de equipos y documentación de productos.
Al igual que su predecesor, el modelo ofrece soporte para más de 100 idiomas.

Agora, un cliente de Cohere, integró Embed 4 en su motor de búsqueda de IA y observó la eficacia del modelo para recuperar información relevante sobre los productos.
«Los datos del comercio electrónico son intrínsecamente complejos, ya que combinan imágenes con descripciones de texto multifacéticas. La creación de una representación unificada de nuestros productos ha acelerado nuestra funcionalidad de búsqueda y ha mejorado enormemente la eficiencia de nuestras herramientas internas», afirmó Param Jaggi, fundador de Agora, en la entrada del blog.
Casos de uso de agentes
Cohere postula que modelos como Embed 4 mejorarán significativamente las aplicaciones de IA agencial, posicionándolo como una base de búsqueda óptima para asistentes de IA y agentes autónomos en toda la empresa.
«Más allá de su gran precisión en diversos tipos de datos, el modelo está diseñado para ofrecer una eficiencia de nivel empresarial», afirmó Cohere. «Esto le permite escalar de forma eficaz para satisfacer las demandas de las grandes organizaciones».
Cohere destacó además que Embed 4 genera incrustaciones de datos comprimidos, lo que ayuda a reducir los costes de almacenamiento, a menudo prohibitivos.
Mediante el uso de incrustaciones y la búsqueda basada en RAG, un agente de IA puede localizar y consultar documentos específicos para ejecutar solicitudes orientadas a tareas. Este enfoque se considera ampliamente como el que ofrece resultados más fiables, minimizando el riesgo de que los agentes proporcionen respuestas incorrectas o alucinadas.
En el panorama competitivo, Embed 4 compite con otros modelos como Qodo-Embed-1-1.5B de Qodo y las ofertas de Voyage AI, esta última recientemente adquirida por el proveedor de bases de datos MongoDB.
Artículo relacionado
Cohere presenta una familia de modelos de IA multilingües de código abierto
La empresa de IA empresarial Cohere ha presentado una nueva familia de modelos multilingües, denominada Tiny Aya, durante la Cumbre de IA de la India que se está celebrando estos días. Estos modelos d
Cohere y Aleph Alpha anuncian su fusión
La startup canadiense de IA Cohere va a adquirir la alemana Aleph Alpha con el respaldo del Grupo Schwarz, la empresa matriz de la cadena de supermercados Lidl. Con el apoyo del Gobierno, las empresas
Cohere lanza una plataforma segura de inteligencia artificial para empresas North
Las herramientas de agentes de IA tienen el potencial de reducir las tareas repetitivas en los flujos de trabajo diarios, pero muchas organizaciones siguen mostrándose cautelosas a la hora de adoptarl
Recomendaciones de temas especiales relacionados
comentario (2)
0/500
Cohere kommt mal wieder mit einem starken Release! Embed 4 klingt nach einem Game-Changer für die Unternehmens-RAG. 200 Seiten auf einmal durchsuchen zu können, ist genau das, was viele brauchen, um ihre internen Dokumente endlich effektiv nutzbar zu machen. Spannend wird sein, wie es sich gegen die etablierten Lösungen von OpenAI oder anderen schlägt. Der Wettbewerb im Embedding-Bereich heizt sich richtig an 🔥
La generación aumentada de recuperación empresarial (RAG) sigue siendo fundamental para la actual ola de innovación en IA agencial. Aprovechando el entusiasmo sostenido por los agentes de IA, Cohere ha lanzado la última versión de su modelo de incrustaciones, que presenta ventanas de contexto significativamente ampliadas y capacidades multimodales mejoradas.
El modelo Embed 4 de Cohere mejora la base multimodal establecida por Embed 3, introduciendo una mayor competencia en el manejo de datos no estructurados. Con una ventana de contexto que admite 128 000 tokens, las empresas ahora pueden generar incrustaciones para documentos extensos, equivalentes a unas 200 páginas.
«Los modelos de incrustación tradicionales suelen carecer de una comprensión innata de los documentos empresariales complejos y multimodales. Esto obliga a las empresas a crear intrincados sistemas de preprocesamiento que solo producen ganancias marginales en precisión», señaló Cohere en un anuncio en su blog. «Embed 4 aborda este desafío fundamental, permitiendo a las empresas y a sus equipos descubrir de manera eficiente información valiosa oculta en vastos repositorios de información que antes no se podía buscar».
Para mejorar la seguridad de los datos, las empresas pueden implementar Embed 4 en entornos de nube privada virtual o en infraestructura tecnológica local.
Las empresas utilizan incrustaciones para convertir documentos y diversos tipos de datos en representaciones numéricas adecuadas para aplicaciones RAG. A continuación, los agentes de IA pueden aprovechar estas incrustaciones para proporcionar respuestas precisas a las consultas de los usuarios.
Conocimientos específicos del dominio
Según la empresa, Embed 4 es especialmente adecuado para sectores con un alto nivel de cumplimiento normativo, como las finanzas, la sanidad y la fabricación. Como proveedor de IA centrado en las empresas, Cohere diseña sus modelos teniendo en cuenta los estrictos requisitos de seguridad de los sectores regulados, lo que garantiza una profunda comprensión de los contextos empresariales.
El modelo se entrenó para ser resistente a las irregularidades típicas de los datos empresariales del mundo real. Mantiene una alta precisión incluso cuando se encuentra con imperfecciones comunes, como errores ortográficos y formatos inconsistentes.
«También ofrece un rendimiento sólido al buscar en documentos escaneados y texto manuscrito, formatos muy habituales en contratos legales, facturas de seguros y recibos de gastos. Esta capacidad elimina la necesidad de realizar complejos flujos de trabajo de preparación o preprocesamiento de datos, lo que supone un importante ahorro de tiempo y gastos operativos para las empresas», explicó Cohere.
Las organizaciones pueden aplicar Embed 4 a una amplia gama de materiales, incluyendo presentaciones para inversores, archivos de diligencia debida, informes de ensayos clínicos, manuales de reparación de equipos y documentación de productos.
Al igual que su predecesor, el modelo ofrece soporte para más de 100 idiomas.

Agora, un cliente de Cohere, integró Embed 4 en su motor de búsqueda de IA y observó la eficacia del modelo para recuperar información relevante sobre los productos.
«Los datos del comercio electrónico son intrínsecamente complejos, ya que combinan imágenes con descripciones de texto multifacéticas. La creación de una representación unificada de nuestros productos ha acelerado nuestra funcionalidad de búsqueda y ha mejorado enormemente la eficiencia de nuestras herramientas internas», afirmó Param Jaggi, fundador de Agora, en la entrada del blog.
Casos de uso de agentes
Cohere postula que modelos como Embed 4 mejorarán significativamente las aplicaciones de IA agencial, posicionándolo como una base de búsqueda óptima para asistentes de IA y agentes autónomos en toda la empresa.
«Más allá de su gran precisión en diversos tipos de datos, el modelo está diseñado para ofrecer una eficiencia de nivel empresarial», afirmó Cohere. «Esto le permite escalar de forma eficaz para satisfacer las demandas de las grandes organizaciones».
Cohere destacó además que Embed 4 genera incrustaciones de datos comprimidos, lo que ayuda a reducir los costes de almacenamiento, a menudo prohibitivos.
Mediante el uso de incrustaciones y la búsqueda basada en RAG, un agente de IA puede localizar y consultar documentos específicos para ejecutar solicitudes orientadas a tareas. Este enfoque se considera ampliamente como el que ofrece resultados más fiables, minimizando el riesgo de que los agentes proporcionen respuestas incorrectas o alucinadas.
En el panorama competitivo, Embed 4 compite con otros modelos como Qodo-Embed-1-1.5B de Qodo y las ofertas de Voyage AI, esta última recientemente adquirida por el proveedor de bases de datos MongoDB.
Cohere presenta una familia de modelos de IA multilingües de código abierto
La empresa de IA empresarial Cohere ha presentado una nueva familia de modelos multilingües, denominada Tiny Aya, durante la Cumbre de IA de la India que se está celebrando estos días. Estos modelos d
Cohere y Aleph Alpha anuncian su fusión
La startup canadiense de IA Cohere va a adquirir la alemana Aleph Alpha con el respaldo del Grupo Schwarz, la empresa matriz de la cadena de supermercados Lidl. Con el apoyo del Gobierno, las empresas
Cohere lanza una plataforma segura de inteligencia artificial para empresas North
Las herramientas de agentes de IA tienen el potencial de reducir las tareas repetitivas en los flujos de trabajo diarios, pero muchas organizaciones siguen mostrándose cautelosas a la hora de adoptarl
Cohere kommt mal wieder mit einem starken Release! Embed 4 klingt nach einem Game-Changer für die Unternehmens-RAG. 200 Seiten auf einmal durchsuchen zu können, ist genau das, was viele brauchen, um ihre internen Dokumente endlich effektiv nutzbar zu machen. Spannend wird sein, wie es sich gegen die etablierten Lösungen von OpenAI oder anderen schlägt. Der Wettbewerb im Embedding-Bereich heizt sich richtig an 🔥











