Una nueva investigación revela que los sistemas de inteligencia artificial de código abierto, al estilo de ChatGPT, pueden utilizar el lenguaje natural para conectar a las personas que llaman con la persona adecuada en un centro de llamadas, evitando la necesidad de navegar por sistemas de menús frustrantes y que cambian con frecuencia, que a menudo parecen deliberadamente obstructivos.
Llegar a un agente en vivo puede ser una experiencia frustrante, ya que los usuarios deben navegar lentamente por opciones de selección múltiple, a menudo sin saber cuál se ajusta a su problema específico. Cuando ninguna lo hace, los usuarios expertos suelen desarrollar trucos y soluciones alternativas para llegar a un representante humano y escapar del «infierno de las opciones». Para muchos, esta experiencia resulta hostil y poco intuitiva.
No es de extrañar que los centros de llamadas sean uno de los principales objetivos de la ampliación o sustitución de la IA. A pesar de que algunos expertos instan a la cautela, la automatización de los centros de llamadas sigue siendo un objetivo fácil para los titulares tecnológicos y un área prometedora para la innovación impulsada por la IA que puede ofrecer un retorno de la inversión inusualmente rápido.
Tienda cerrada
Sin embargo, los principios del código abierto y los datos disponibles públicamente rara vez se aplican en este ámbito, y por una buena razón. Las empresas que automatizan sus sistemas de respuesta al cliente tienen pocos incentivos para compartir los datos, las metodologías o la propiedad intelectual corporativa que sustenta su ventaja competitiva.
Compartir esos recursos erosionaría su ventaja en el mercado. Y lo que es más importante, dado que los sistemas de IA pueden ser propensos a filtrar información confidencial, también conllevan importantes riesgos legales.
Esto ha llevado a varias empresas bien financiadas a desarrollar de forma independiente sistemas de centros de llamadas basados en IA, lo que inevitablemente ha supuesto una duplicación de esfuerzos. También ha impulsado un auge de las empresas emergentes B2B y de los actores consolidados que pretenden satisfacer la creciente demanda de capacidades de servicio al cliente impulsadas por la IA.
Un asistente de voz de PolyAI inicia una llamada de atención al cliente para la ficticia «Augusta Lawn Care», aprovechando las extensas conversaciones de formación para automatizar las respuestas dentro de la infraestructura existente del centro de llamadas. Fuente
Además, el impulso para eliminar la frustración de los complejos menús de los centros de llamadas ha estimulado los esfuerzos de investigación. Sin embargo, la mayoría de los resultados no se publican en Arxiv ni en otras plataformas abiertas, lo que refleja la naturaleza típicamente privada del desarrollo de la respuesta de voz interactiva (IVR).
En consecuencia, la investigación, los datos y la inteligencia empresarial relacionados con la automatización de la IA en el servicio de atención al cliente se guardan celosamente. Existen muy pocas alternativas de código abierto, incluso si el uso de dichos sistemas con datos legalmente seguros fuera una opción viable, lo cual es dudoso.
Llamada local
En este contexto, un nuevo artículo de Colombia supone un intento bienvenido de sacar el desarrollo de IVR un poco de su caja fuerte corporativa. El conciso estudio, titulado «Más allá de los tonos de llamada IVR: enrutamiento de la intención del cliente mediante LLM», procede de un investigador de la Universidad Distrital Francisco José de Caldas de Bogotá. Afirma ser el primer proyecto no propietario que utiliza modelos de lenguaje grandes (LLM) para crear un esquema funcional para un sistema de enrutamiento de la intención del cliente (CIR).
En lugar de utilizar datos de llamadas reales o estructuras de menús patentadas, el proyecto genera todos los componentes desde cero utilizando tres modelos de IA: uno para diseñar un menú realista para el centro de llamadas, otro para simular cientos de quejas de los usuarios y un tercero para funcionar como chatbot, dirigiendo estas consultas al destino correcto.
El resultado es un entorno de prueba totalmente sintético, pero convincente, con una empresa de telecomunicaciones ficticia y 920 consultas distintas de los usuarios. Esta configuración permite al experimento explorar la capacidad de la IA actual para interpretar el lenguaje vago y desestructurado y dirigir adecuadamente a las personas que llaman, todo ello evitando riesgos legales.
Las pruebas demuestran que el sistema puede asignar con precisión las quejas de los usuarios en formato libre al destino correcto con una precisión de hasta el 89,13 %, especialmente cuando se le proporcionan opciones de menú «simplificadas» en lugar de descripciones detalladas.
El estudio también reveló que la IA cometía más errores cuando los usuarios utilizaban un lenguaje informal o variado. Sin embargo, algunos errores se debían no a que la IA malinterpretara, sino a que el propio menú telefónico era confuso.
Ejemplos de interacciones con clientes compartidos como parte del nuevo proyecto. Fuente
Los datos del proyecto se han puesto a disposición del público.
Método
El enfoque tripartito comenzó con un modelo que creaba un menú telefónico detallado para una empresa de telecomunicaciones ficticia. Un segundo modelo generó mensajes únicos de los usuarios, algunos directos, otros reformulados o más coloquiales, para simular patrones de habla realistas. Se generaron un total de 920 ejemplos.
El tercer modelo tenía la tarea de conectar a cada persona que llamaba con el departamento adecuado basándose únicamente en el mensaje y en una versión del menú. Este marco hizo que el experimento fuera totalmente reproducible sin necesidad de datos de llamadas reales ni de exponer la información de los clientes.
Los tres sistemas seleccionados para el enfoque tripartito. Fuente
Los modelos utilizados fueron gpt-3.5-turbo, gpt-4o-mini y gpt-4.1-mini, respectivamente.
Para simular un entorno de atención al cliente auténtico, fue necesario sintetizar desde cero un menú telefónico complejo. Debido a la falta de conjuntos de datos relevantes, se pidió al modelo gpt-3.5-turbo que generara una estructura completa con múltiples ramificaciones para un proveedor de telecomunicaciones ficticio.
Cada rama representaba áreas de servicio como facturación, asistencia técnica, gestión de cuentas y nuevos servicios, con subopciones realistas y diferentes niveles de profundidad. Se crearon dos versiones del menú para las pruebas: una jerarquía de texto sin formato que imitaba un formato legible para los humanos y una lista de puntos finales con las secuencias de botones correspondientes.
Esto permitió realizar pruebas tanto en una versión detallada como en una simplificada del problema de enrutamiento:
Se proporcionaron dos versiones del menú telefónico a la IA: una jerarquía de texto detallada y una lista simplificada de opciones de menú directas, para comparar la eficacia de cada formato a la hora de dirigir a las personas que llamaban al lugar adecuado.
Para generar los mensajes de las personas que llamaban para la prueba, un segundo modelo lingüístico produjo un conjunto de quejas o solicitudes originales, con diez ejemplos únicos por punto final del menú.
A continuación, cada uno de ellos se reformuló en varias variaciones para reflejar las diversas formas en que las personas reales expresan sus problemas, incorporando cambios en la longitud, el tono e incluso pequeños errores o palabras de relleno.
Los 920 mensajes iniciales se elaboraron para probar la precisión del sistema y simular la imprevisibilidad de una conversación natural.
En la tercera etapa, se probó la capacidad del modelo final para asignar cada mensaje al destino correcto del menú utilizando los dos formatos diferentes de presentación del IVR.
Para la primera versión, la IA recibió un esquema descriptivo completo del árbol telefónico. Para la segunda, solo vio una lista de destinos finales con sus secuencias de botones.
El objetivo era determinar si un menú simplificado ayudaría al modelo a enrutar las llamadas de forma más eficaz. En ambos casos, el sistema procesó un mensaje cada vez y se le indicó que devolviera solo la ruta, sin texto adicional, para permitir la puntuación automatizada.
Aislamiento
Para evitar la contaminación de los resultados de las pruebas, cada modelo se mantuvo aislado. El primer modelo redactó el menú telefónico, pero se finalizó manualmente para que los demás sistemas no lo reconocieran.
Los mensajes de las personas que llamaban fueron generados por separado por gpt-4o-mini, utilizando solo los nombres de los puntos finales sin acceso a la estructura del menú. Por último, gpt-4.1-mini, que realizaba el enrutamiento, solo tenía acceso al texto del menú y a los mensajes entrantes, sin participar en su creación.
Métricas
Se evaluó el rendimiento del sistema de enrutamiento mediante dos métricas estándar: la precisión, definida como el porcentaje de casos en los que el modelo proporcionó la ruta correcta exacta (por ejemplo, 1-2-3). También se generaron matrices de confusión* para localizar los errores. Las evaluaciones se realizaron en Python utilizando las bibliotecas pandas y scikit-learn.
Resultados
Las pruebas revelaron que la precisión del modelo dependía en gran medida de la presentación del menú. Con una lista plana de rutas de menú, el sistema alcanzó una precisión del 89,13 % en el conjunto de datos más sencillo, frente al 81,30 % con el menú descriptivo completo.
La precisión de enrutamiento del tercer modelo (LLM3), en diferentes formatos de solicitud y tipos de conjuntos de datos, mostró que las rutas de menú aplanadas superaban sistemáticamente a las descripciones jerárquicas, y que la precisión disminuía ligeramente con entradas de lenguaje parafraseado o informal.
Esta tendencia continuó con el conjunto de datos más grande y lingüísticamente más diverso, donde la versión aplanada volvió a obtener mejores resultados, con una puntuación del 86,52 % frente al 77,07 % del formato descriptivo.
El artículo señala que estos resultados sugieren que las indicaciones más simples, basadas en listas, ayudaron al modelo a emparejar las consultas de forma más fiable que las descripciones jerárquicas extensas.
La precisión también disminuyó ligeramente cuando se introdujeron mensajes parafraseados e informales de las personas que llamaban, lo que indica que, si bien el aumento de la variedad mejoró el realismo, también dificultó la clasificación.
El artículo concluye:
«Nuestros resultados demuestran que los LLM dirigen las intenciones de los clientes con mayor precisión cuando se les proporcionan rutas IVR aplanadas (hasta un 89,13 %) en comparación con descripciones de menús verbosas (tan solo un 77,07 %). Esto sugiere que las indicaciones concisas y estructuradas reducen el ruido y son más adecuadas para las tareas de enrutamiento.
Esto respalda la idea de que la claridad y la brevedad mejoran el rendimiento de los LLM en escenarios de clasificación.
Además, la conversión de menús en rutas simplificadas es un proceso sencillo y automatizable para su implementación en el mundo real».
Conclusión
Es alentador ver cómo surge la investigación abierta en un campo que suele caracterizarse por el secretismo y la exclusividad. Queda una pregunta clave: ¿los sistemas futuros requerirán arquitecturas de «enmarcado» para contextualizar los LLM, o los modelos simplemente necesitarán acceder a la inteligencia empresarial disponible localmente, eliminando la necesidad de que las empresas compartan datos con terceros?
En última instancia, parece probable que los principios básicos de diseño explorados aquí sean adoptados de forma natural por los futuros sistemas de IA, incluso más allá del servicio al cliente, sin necesidad de una adaptación específica para ese caso de uso.
* Consulte el documento original para obtener más detalles.
Publicado por primera vez el miércoles, 29 de octubre de 2025.
Descubra los mejores herramientas de scripting de IA para la radio y los podcasts en 2026 en XIX.AI. Nuestra lista seleccionada y altamente valorada incluye soluciones poderosas que cambiarán completamente la forma en que crea anuncios de audio atractivos. Compare opciones gratuitas y pagadas mediante pruebas reales y clasificaciones actualizadas semanalmente. ¡Despliegue todo su potencial creativo hoy mismo!
Descubre el mejor software de revisión de contratos con IA de 2026 en XIX.AI. Nuestra lista, cuidadosamente seleccionada y con las mejores valoraciones, incluye potentes herramientas que detectan al instante las lagunas legales y los riesgos de cumplimiento normativo. Compara las opciones gratuitas con las de pago gracias a pruebas en condiciones reales y a clasificaciones que se actualizan semanalmente. Encuentra la solución revolucionaria que necesitas para un análisis de contratos seguro y eficiente. Explora ahora la guía definitiva.
Descubra los mejores generadores de anime de IA para donghua en 2026. Nuestra lista seleccionada y calificada incluye herramientas poderosas para crear increíbles personajes para novelas web y avatares de cómics. Compare opciones gratuitas y pagadas a través de pruebas reales. Encuentre su compañero creativo ideal y dé vida a sus historias hoy mismo en XIX.AI.
Descubre las mejores herramientas de coloración automática con IA para manga de 2026 en XIX.AI. Nuestra lista seleccionada incluye soluciones revolucionarias y mejor valoradas que aplican colores planos sin ningún error de consistencia, lo que potencia tu productividad. Explora comparativas entre opciones gratuitas y de pago, pruebas en condiciones reales y clasificaciones actualizadas semanalmente para encontrar la opción perfecta para ti. Aprovecha hoy mismo las ventajas de la IA.
Descubre los mejores creadores de perfiles de ficción con IA de 2026 para dar vida a personajes profundos. La selección de XIX.AI incluye herramientas de primera categoría y revolucionarias que generan motivaciones coherentes y defectos fatales. Compara las opciones gratuitas con las de pago mediante pruebas en el mundo real. Libera ahora tu potencial narrativo.
Descubre el mejor software de optimización de precios con IA de 2026 en XIX.AI. Nuestra selección incluye herramientas de primera categoría y revolucionarias que analizan a la competencia y ajustan automáticamente los precios de tu tienda para maximizar los beneficios. Compara las opciones gratuitas con las de pago mediante pruebas reales. Aprovecha ahora tu ventaja competitiva en materia de precios.
Al hacer clic en "Aceptar todos los cookies", usted acepta el almacenamiento de cookies en su dispositivo para mejorar la navegación por el sitio, analizar el uso del sitio y ayudar en nuestros esfuerzos de marketing.Política de privacidad Aviso
Al visitar cualquier sitio web, este puede almacenar o recuperar información en su navegador, principalmente en forma de cookies. Esta información puede referirse a usted, sus preferencias o su dispositivo y se usa principalmente para que el sitio funcione como espera. Por lo general, la información no lo identifica directamente, pero puede brindarle una experiencia web más personalizada. Debido a que respetamos su derecho a la privacidad, puede optar por no permitir algunos tipos de cookies. Haga clic en los diferentes títulos de categoría para obtener más información y cambiar nuestros ajustes predeterminados. Sin embargo, bloquear algunos tipos de cookies puede afectar su experiencia en el sitio y los servicios que podemos ofrecer. Política de privacidadDeclaración
Gestionar preferencias
Cookie estrictamente necesario
Siempre activo
Estos cookies son necesarios para que el sitio web funcione y no pueden ser desactivados en nuestros sistemas. Por lo general, solo se establecen en respuesta a acciones que realice usted que equivalen a una solicitud de servicios, como configurar sus preferencias de privacidad, iniciar sesión o completar formularios. Puede configurar su navegador para bloquear estos cookies o alertarle sobre ellos, pero algunas partes del sitio no funcionarán luego. Estos cookies no almacenan ninguna información que permita identificar personalmente.