La IA agiliza el camino hacia los agentes de atención al cliente humanos

Hogar

Noticias

15 de enero de 2026

BrianRoberts

Una nueva investigación revela que los sistemas de inteligencia artificial de código abierto, al estilo de ChatGPT, pueden utilizar el lenguaje natural para conectar a las personas que llaman con la persona adecuada en un centro de llamadas, evitando la necesidad de navegar por sistemas de menús frustrantes y que cambian con frecuencia, que a menudo parecen deliberadamente obstructivos.

Llegar a un agente en vivo puede ser una experiencia frustrante, ya que los usuarios deben navegar lentamente por opciones de selección múltiple, a menudo sin saber cuál se ajusta a su problema específico. Cuando ninguna lo hace, los usuarios expertos suelen desarrollar trucos y soluciones alternativas para llegar a un representante humano y escapar del «infierno de las opciones». Para muchos, esta experiencia resulta hostil y poco intuitiva.

No es de extrañar que los centros de llamadas sean uno de los principales objetivos de la ampliación o sustitución de la IA. A pesar de que algunos expertos instan a la cautela, la automatización de los centros de llamadas sigue siendo un objetivo fácil para los titulares tecnológicos y un área prometedora para la innovación impulsada por la IA que puede ofrecer un retorno de la inversión inusualmente rápido.

Tienda cerrada

Sin embargo, los principios del código abierto y los datos disponibles públicamente rara vez se aplican en este ámbito, y por una buena razón. Las empresas que automatizan sus sistemas de respuesta al cliente tienen pocos incentivos para compartir los datos, las metodologías o la propiedad intelectual corporativa que sustenta su ventaja competitiva.

Compartir esos recursos erosionaría su ventaja en el mercado. Y lo que es más importante, dado que los sistemas de IA pueden ser propensos a filtrar información confidencial, también conllevan importantes riesgos legales.

Esto ha llevado a varias empresas bien financiadas a desarrollar de forma independiente sistemas de centros de llamadas basados en IA, lo que inevitablemente ha supuesto una duplicación de esfuerzos. También ha impulsado un auge de las empresas emergentes B2B y de los actores consolidados que pretenden satisfacer la creciente demanda de capacidades de servicio al cliente impulsadas por la IA.

Un asistente de voz PolyAI abre una llamada de atención al cliente para una empresa ficticia.

Un asistente de voz de PolyAI inicia una llamada de atención al cliente para la ficticia «Augusta Lawn Care», aprovechando las extensas conversaciones de formación para automatizar las respuestas dentro de la infraestructura existente del centro de llamadas. Fuente

Además, el impulso para eliminar la frustración de los complejos menús de los centros de llamadas ha estimulado los esfuerzos de investigación. Sin embargo, la mayoría de los resultados no se publican en Arxiv ni en otras plataformas abiertas, lo que refleja la naturaleza típicamente privada del desarrollo de la respuesta de voz interactiva (IVR).

En consecuencia, la investigación, los datos y la inteligencia empresarial relacionados con la automatización de la IA en el servicio de atención al cliente se guardan celosamente. Existen muy pocas alternativas de código abierto, incluso si el uso de dichos sistemas con datos legalmente seguros fuera una opción viable, lo cual es dudoso.

Llamada local

En este contexto, un nuevo artículo de Colombia supone un intento bienvenido de sacar el desarrollo de IVR un poco de su caja fuerte corporativa. El conciso estudio, titulado «Más allá de los tonos de llamada IVR: enrutamiento de la intención del cliente mediante LLM», procede de un investigador de la Universidad Distrital Francisco José de Caldas de Bogotá. Afirma ser el primer proyecto no propietario que utiliza modelos de lenguaje grandes (LLM) para crear un esquema funcional para un sistema de enrutamiento de la intención del cliente (CIR).

En lugar de utilizar datos de llamadas reales o estructuras de menús patentadas, el proyecto genera todos los componentes desde cero utilizando tres modelos de IA: uno para diseñar un menú realista para el centro de llamadas, otro para simular cientos de quejas de los usuarios y un tercero para funcionar como chatbot, dirigiendo estas consultas al destino correcto.

El resultado es un entorno de prueba totalmente sintético, pero convincente, con una empresa de telecomunicaciones ficticia y 920 consultas distintas de los usuarios. Esta configuración permite al experimento explorar la capacidad de la IA actual para interpretar el lenguaje vago y desestructurado y dirigir adecuadamente a las personas que llaman, todo ello evitando riesgos legales.

Las pruebas demuestran que el sistema puede asignar con precisión las quejas de los usuarios en formato libre al destino correcto con una precisión de hasta el 89,13 %, especialmente cuando se le proporcionan opciones de menú «simplificadas» en lugar de descripciones detalladas.

El estudio también reveló que la IA cometía más errores cuando los usuarios utilizaban un lenguaje informal o variado. Sin embargo, algunos errores se debían no a que la IA malinterpretara, sino a que el propio menú telefónico era confuso.

Ejemplos de interacciones con clientes compartidos como parte del nuevo proyecto. Fuente

Los datos del proyecto se han puesto a disposición del público.

Método

El enfoque tripartito comenzó con un modelo que creaba un menú telefónico detallado para una empresa de telecomunicaciones ficticia. Un segundo modelo generó mensajes únicos de los usuarios, algunos directos, otros reformulados o más coloquiales, para simular patrones de habla realistas. Se generaron un total de 920 ejemplos.

El tercer modelo tenía la tarea de conectar a cada persona que llamaba con el departamento adecuado basándose únicamente en el mensaje y en una versión del menú. Este marco hizo que el experimento fuera totalmente reproducible sin necesidad de datos de llamadas reales ni de exponer la información de los clientes.

Los tres sistemas elegidos para el enfoque tripartito. [Fuente] https://arxiv.org/pdf/2510.21715

Los tres sistemas seleccionados para el enfoque tripartito. Fuente

Los modelos utilizados fueron gpt-3.5-turbo, gpt-4o-mini y gpt-4.1-mini, respectivamente.

Para simular un entorno de atención al cliente auténtico, fue necesario sintetizar desde cero un menú telefónico complejo. Debido a la falta de conjuntos de datos relevantes, se pidió al modelo gpt-3.5-turbo que generara una estructura completa con múltiples ramificaciones para un proveedor de telecomunicaciones ficticio.

Cada rama representaba áreas de servicio como facturación, asistencia técnica, gestión de cuentas y nuevos servicios, con subopciones realistas y diferentes niveles de profundidad. Se crearon dos versiones del menú para las pruebas: una jerarquía de texto sin formato que imitaba un formato legible para los humanos y una lista de puntos finales con las secuencias de botones correspondientes.

Esto permitió realizar pruebas tanto en una versión detallada como en una simplificada del problema de enrutamiento:

Se proporcionaron dos versiones del menú telefónico a la IA: una jerarquía de texto detallada y una lista simplificada de opciones de menú directas, para comparar la eficacia de cada formato a la hora de dirigir a las personas que llamaban al lugar adecuado.

Para generar los mensajes de las personas que llamaban para la prueba, un segundo modelo lingüístico produjo un conjunto de quejas o solicitudes originales, con diez ejemplos únicos por punto final del menú.

A continuación, cada uno de ellos se reformuló en varias variaciones para reflejar las diversas formas en que las personas reales expresan sus problemas, incorporando cambios en la longitud, el tono e incluso pequeños errores o palabras de relleno.

Los 920 mensajes iniciales se elaboraron para probar la precisión del sistema y simular la imprevisibilidad de una conversación natural.

En la tercera etapa, se probó la capacidad del modelo final para asignar cada mensaje al destino correcto del menú utilizando los dos formatos diferentes de presentación del IVR.

Para la primera versión, la IA recibió un esquema descriptivo completo del árbol telefónico. Para la segunda, solo vio una lista de destinos finales con sus secuencias de botones.

El objetivo era determinar si un menú simplificado ayudaría al modelo a enrutar las llamadas de forma más eficaz. En ambos casos, el sistema procesó un mensaje cada vez y se le indicó que devolviera solo la ruta, sin texto adicional, para permitir la puntuación automatizada.

Aislamiento

Para evitar la contaminación de los resultados de las pruebas, cada modelo se mantuvo aislado. El primer modelo redactó el menú telefónico, pero se finalizó manualmente para que los demás sistemas no lo reconocieran.

Los mensajes de las personas que llamaban fueron generados por separado por gpt-4o-mini, utilizando solo los nombres de los puntos finales sin acceso a la estructura del menú. Por último, gpt-4.1-mini, que realizaba el enrutamiento, solo tenía acceso al texto del menú y a los mensajes entrantes, sin participar en su creación.

Métricas

Se evaluó el rendimiento del sistema de enrutamiento mediante dos métricas estándar: la precisión, definida como el porcentaje de casos en los que el modelo proporcionó la ruta correcta exacta (por ejemplo, 1-2-3). También se generaron matrices de confusión* para localizar los errores. Las evaluaciones se realizaron en Python utilizando las bibliotecas pandas y scikit-learn.

Resultados

Las pruebas revelaron que la precisión del modelo dependía en gran medida de la presentación del menú. Con una lista plana de rutas de menú, el sistema alcanzó una precisión del 89,13 % en el conjunto de datos más sencillo, frente al 81,30 % con el menú descriptivo completo.

Precisión de enrutamiento para el tercer modelo (LLM3), en diferentes formatos de indicaciones y tipos de conjuntos de datos, lo que indica que las rutas de menú planas superaron sistemáticamente a las descripciones jerárquicas, y que la precisión disminuyó ligeramente cuando las entradas se complementaron con lenguaje parafraseado o informal.

La precisión de enrutamiento del tercer modelo (LLM3), en diferentes formatos de solicitud y tipos de conjuntos de datos, mostró que las rutas de menú aplanadas superaban sistemáticamente a las descripciones jerárquicas, y que la precisión disminuía ligeramente con entradas de lenguaje parafraseado o informal.

Esta tendencia continuó con el conjunto de datos más grande y lingüísticamente más diverso, donde la versión aplanada volvió a obtener mejores resultados, con una puntuación del 86,52 % frente al 77,07 % del formato descriptivo.

El artículo señala que estos resultados sugieren que las indicaciones más simples, basadas en listas, ayudaron al modelo a emparejar las consultas de forma más fiable que las descripciones jerárquicas extensas.

La precisión también disminuyó ligeramente cuando se introdujeron mensajes parafraseados e informales de las personas que llamaban, lo que indica que, si bien el aumento de la variedad mejoró el realismo, también dificultó la clasificación.

El artículo concluye:

«Nuestros resultados demuestran que los LLM dirigen las intenciones de los clientes con mayor precisión cuando se les proporcionan rutas IVR aplanadas (hasta un 89,13 %) en comparación con descripciones de menús verbosas (tan solo un 77,07 %). Esto sugiere que las indicaciones concisas y estructuradas reducen el ruido y son más adecuadas para las tareas de enrutamiento.

Esto respalda la idea de que la claridad y la brevedad mejoran el rendimiento de los LLM en escenarios de clasificación.

Además, la conversión de menús en rutas simplificadas es un proceso sencillo y automatizable para su implementación en el mundo real».

Conclusión

Es alentador ver cómo surge la investigación abierta en un campo que suele caracterizarse por el secretismo y la exclusividad. Queda una pregunta clave: ¿los sistemas futuros requerirán arquitecturas de «enmarcado» para contextualizar los LLM, o los modelos simplemente necesitarán acceder a la inteligencia empresarial disponible localmente, eliminando la necesidad de que las empresas compartan datos con terceros?

En última instancia, parece probable que los principios básicos de diseño explorados aquí sean adoptados de forma natural por los futuros sistemas de IA, incluso más allá del servicio al cliente, sin necesidad de una adaptación específica para ese caso de uso.

* Consulte el documento original para obtener más detalles.

Publicado por primera vez el miércoles, 29 de octubre de 2025.

Artículo relacionado

Cursor Composer 2 frente a Claude Opus 4.6: una prueba de rendimiento reaviva el debate sobre la programación con IA El 19 de marzo, Cursor lanzó oficialmente su modelo de programación propio, Composer 2. El anuncio desató un debate inmediato en la comunidad de desarrolladores: según Cursor, Composer 2 obtuvo una pu

StrictlyVC San Francisco reunirá a líderes de TDK Ventures, Replit y otras empresas El primer evento de StrictlyVC del año llega a San Francisco antes de lo que imaginas. Aún quedan entradas disponibles para nuestro encuentro del 30 de abril en el Centro Cultural Filipino Sentro, que

Notion convierte su espacio de trabajo en un centro para agentes de IA Notion, la empresa de software de productividad, se adentra en la era de los agentes.Durante un anuncio de producto retransmitido en directo el miércoles, Notion —conocida sobre todo por su aplicación

Recomendaciones de temas especiales relacionados

escribiendo

Los mejores herramientas de scripting AI para la radio y los podcasts: Crea anuncios de audio atractivos.

Descubra los mejores herramientas de scripting de IA para la radio y los podcasts en 2026 en XIX.AI. Nuestra lista seleccionada y altamente valorada incluye soluciones poderosas que cambiarán completamente la forma en que crea anuncios de audio atractivos. Compare opciones gratuitas y pagadas mediante pruebas reales y clasificaciones actualizadas semanalmente. ¡Despliegue todo su potencial creativo hoy mismo!

10 herramientas

xix.ai

Negocio

El mejor software de revisión de contratos con IA: detecta al instante las lagunas legales y los riesgos de cumplimiento normativo

Descubre el mejor software de revisión de contratos con IA de 2026 en XIX.AI. Nuestra lista, cuidadosamente seleccionada y con las mejores valoraciones, incluye potentes herramientas que detectan al instante las lagunas legales y los riesgos de cumplimiento normativo. Compara las opciones gratuitas con las de pago gracias a pruebas en condiciones reales y a clasificaciones que se actualizan semanalmente. Encuentra la solución revolucionaria que necesitas para un análisis de contratos seguro y eficiente. Explora ahora la guía definitiva.

10 herramientas

xix.ai

Creación de animación

Generador de anime AI para Donghua: Crea personajes para novelas web y avatares para cómics

Descubra los mejores generadores de anime de IA para donghua en 2026. Nuestra lista seleccionada y calificada incluye herramientas poderosas para crear increíbles personajes para novelas web y avatares de cómics. Compare opciones gratuitas y pagadas a través de pruebas reales. Encuentre su compañero creativo ideal y dé vida a sus historias hoy mismo en XIX.AI.

10 herramientas

xix.ai

Creación de cómics

Las mejores herramientas de coloración automática con IA para manga: aplica colores planos sin ningún error de coherencia

Descubre las mejores herramientas de coloración automática con IA para manga de 2026 en XIX.AI. Nuestra lista seleccionada incluye soluciones revolucionarias y mejor valoradas que aplican colores planos sin ningún error de consistencia, lo que potencia tu productividad. Explora comparativas entre opciones gratuitas y de pago, pruebas en condiciones reales y clasificaciones actualizadas semanalmente para encontrar la opción perfecta para ti. Aprovecha hoy mismo las ventajas de la IA.

10 herramientas

xix.ai

escribiendo

Los mejores creadores de perfiles de ficción con IA: cómo generar motivaciones y defectos fatales coherentes para los personajes

Descubre los mejores creadores de perfiles de ficción con IA de 2026 para dar vida a personajes profundos. La selección de XIX.AI incluye herramientas de primera categoría y revolucionarias que generan motivaciones coherentes y defectos fatales. Compara las opciones gratuitas con las de pago mediante pruebas en el mundo real. Libera ahora tu potencial narrativo.

10 herramientas

xix.ai

Negocio

El mejor software de optimización de precios con IA: realiza un seguimiento de la competencia y ajusta automáticamente los precios de la tienda

Descubre el mejor software de optimización de precios con IA de 2026 en XIX.AI. Nuestra selección incluye herramientas de primera categoría y revolucionarias que analizan a la competencia y ajustan automáticamente los precios de tu tienda para maximizar los beneficios. Compara las opciones gratuitas con las de pago mediante pruebas reales. Aprovecha ahora tu ventaja competitiva en materia de precios.

10 herramientas

xix.ai