Desentrañando los términos habituales de la IA que has oído

Hogar

Noticias

25 de mayo de 2026

AmeliaAdams

# Glossary # artificial intelligence # evergreens

Desentrañando los términos habituales de la IA que has oído

La inteligencia artificial está transformando nuestro mundo y, en el proceso, está creando un vocabulario completamente nuevo para describir cómo funciona. Basta con dedicar unos minutos a leer sobre IA para toparse con términos como LLM, RAG, RLHF y docenas más que pueden hacer que incluso los profesionales tecnológicos más experimentados se sientan desbordados. Este glosario es nuestro intento de desmitificar ese lenguaje. Lo actualizamos periódicamente a medida que avanza el campo, así que considéralo un documento vivo, muy similar a los sistemas de IA que explica.

AGI

La inteligencia artificial general, o AGI, es un concepto algo vago. En términos generales, se refiere a una IA que es más capaz que el ser humano medio en una amplia gama de tareas, si no en la mayoría de ellas. El director ejecutivo de OpenAI, Sam Altman, describió una vez la AGI como «el equivalente a un ser humano medio al que podrías contratar como compañero de trabajo». Por su parte, los estatutos de OpenAI la definen como «sistemas altamente autónomos que superan a los humanos en la mayoría de los trabajos de mayor valor económico». Google DeepMind tiene una visión ligeramente diferente, ya que considera la AGI como «una IA que es al menos tan capaz como los humanos en la mayoría de las tareas cognitivas». ¿Confuso? No te preocupes: los expertos a la vanguardia de la investigación en IA también suelen estarlo.

Agente de IA

Un agente de IA es una herramienta que aprovecha la IA para realizar una secuencia de tareas de forma autónoma en tu nombre. Va más allá de lo que puede hacer un chatbot básico, gestionando acciones como la tramitación de gastos, la reserva de viajes o de mesa en un restaurante, o incluso la escritura y el mantenimiento de código. Sin embargo, como hemos señalado, se trata de un campo emergente con muchas variables, por lo que el término «agente de IA» puede significar cosas diferentes para cada persona. La infraestructura necesaria para materializar plenamente sus capacidades previstas aún se encuentra en fase de desarrollo. En esencia, el concepto implica un sistema autónomo que puede utilizar múltiples modelos de IA para ejecutar tareas de varios pasos.

Puntos finales de API

Piensa en los puntos finales de API como «botones» en la parte trasera de una aplicación de software que otros programas pueden pulsar para desencadenar acciones específicas. Los desarrolladores utilizan estas interfaces para crear integraciones; por ejemplo, permitiendo que una aplicación extraiga datos de otra, o permitiendo que un agente de IA controle servicios de terceros directamente sin intervención humana manual. La mayoría de los dispositivos domésticos inteligentes y las plataformas conectadas tienen estos botones ocultos disponibles, aunque los usuarios habituales nunca los vean ni interactúen con ellos. A medida que los agentes de IA se vuelven más sofisticados, son cada vez más capaces de descubrir y utilizar estos puntos finales de forma independiente, lo que abre posibilidades potentes —y a veces sorprendentes— para la automatización.

Cadena de pensamiento

Ante una pregunta sencilla, el cerebro humano suele responder sin pensar mucho en ello, como en preguntas del tipo: «¿Qué animal es más alto, una jirafa o un gato?». Pero para problemas más complejos, es posible que necesites lápiz y papel para resolver los pasos intermedios. Por ejemplo, si un granjero tiene pollos y vacas con un total de 40 cabezas y 120 patas, probablemente escribirías una ecuación sencilla para hallar la respuesta (20 pollos y 20 vacas).

En IA, el razonamiento en cadena para los grandes modelos de lenguaje implica desglosar un problema en pasos intermedios más pequeños para mejorar la precisión del resultado final. Este enfoque suele tardar más en producir una respuesta, pero es más probable que el resultado sea correcto, especialmente en contextos de lógica o programación. Los modelos de razonamiento se desarrollan a partir de los LLM tradicionales y se optimizan para este pensamiento paso a paso mediante técnicas como el aprendizaje por refuerzo.

(Véase: Modelo de lenguaje grande)

Se trata de un concepto más específico que el de un «agente de IA» general. Un agente de programación es un programa especializado que puede realizar acciones paso a paso de forma autónoma para completar un objetivo de desarrollo de software. En lugar de limitarse a sugerir código para que un humano lo revise e inserte, un agente de programación puede escribir, probar y depurar código de forma independiente, encargándose del trabajo iterativo de prueba y error que suele ocupar la jornada de un desarrollador. Estos agentes pueden operar en bases de código completas, identificando errores, ejecutando pruebas e implementando correcciones con una supervisión humana mínima. Piensa en ello como contratar a un becario increíblemente rápido que nunca duerme ni pierde la concentración; aunque, como con cualquier becario, un humano sigue teniendo que revisar el trabajo final.

Computación

Aunque el término puede tener múltiples significados, «computación» se refiere generalmente a la potencia computacional esencial que necesitan los modelos de IA para funcionar. Esta capacidad de procesamiento impulsa el sector de la IA, permitiendo el entrenamiento y la implementación de potentes modelos. El término suele ser una forma abreviada de referirse al hardware que proporciona esta potencia: componentes como GPU, CPU, TPU y otras infraestructuras que constituyen la base del ecosistema moderno de la IA.

Aprendizaje profundo

Un subconjunto del aprendizaje automático que se mejora a sí mismo, en el que los algoritmos de IA se construyen con una estructura de red neuronal artificial (RNA) de múltiples capas. Esto les permite identificar patrones y relaciones más complejos que los sistemas de aprendizaje automático más simples, como los modelos lineales o los árboles de decisión. El diseño de los algoritmos de aprendizaje profundo se inspira en la red interconectada de neuronas del cerebro humano.

Los modelos de aprendizaje profundo pueden identificar por sí mismos características clave en los datos, sin necesidad de que los ingenieros las predefinan. Esta estructura también admite algoritmos que aprenden de los errores y, mediante la repetición y el ajuste, mejoran sus resultados con el tiempo. Sin embargo, los sistemas de aprendizaje profundo requieren grandes cantidades de datos (millones de puntos o más) para ofrecer buenos resultados. Además, suelen tardar más en entrenarse que los algoritmos de aprendizaje automático más simples, lo que conlleva mayores costes de desarrollo.

(Véase: Red neuronal)

Difusión

La difusión es la tecnología central detrás de muchos modelos de IA que generan arte, música y texto. Inspirados en la física, los sistemas de difusión «destruyen» gradualmente la estructura de los datos —como fotos o canciones— añadiendo ruido hasta que no queda nada reconocible. En física, la difusión es espontánea e irreversible (el azúcar disuelto en el café no puede volver a su forma de terrón). Pero los sistemas de difusión de IA pretenden aprender un proceso de «difusión inversa» para reconstruir los datos originales a partir del ruido, adquiriendo así la capacidad de generar nuevos datos desde cero.

Destilación

La destilación es una técnica para transferir conocimiento de un modelo de IA grande (el «profesor») a uno más pequeño (el «alumno»). Los desarrolladores envían consultas al modelo profesor y registran sus resultados, a veces comparándolos con un conjunto de datos para evaluar la precisión. Estos resultados se utilizan luego para entrenar al modelo alumno a imitar el comportamiento del profesor.

La destilación puede crear un modelo más pequeño y eficiente basado en uno más grande con una pérdida mínima de rendimiento. Probablemente así es como OpenAI desarrolló GPT-4 Turbo, una versión más rápida de GPT-4.

Aunque todas las empresas de IA utilizan la destilación internamente, es posible que algunas también la hayan utilizado para ponerse al nivel de los modelos líderes. Sin embargo, destilar el conocimiento del modelo de un competidor suele infringir los términos de servicio de las API de IA y los asistentes de chat.

Ajuste fino

Esto se refiere al entrenamiento adicional de un modelo de IA para optimizar su rendimiento en una tarea o ámbito específico más allá de su enfoque de entrenamiento original. Esto se suele hacer alimentando al modelo con datos nuevos y especializados relevantes para el área de destino.

Muchas startups de IA comienzan con un modelo de lenguaje grande como base para un producto comercial. A continuación, pretenden mejorar su utilidad para un sector o tarea específicos ajustándolo con sus propios conocimientos y experiencia específicos del dominio, complementando los ciclos de entrenamiento anteriores del modelo.

(Véase: Modelo de lenguaje grande [LLM])

GAN

Una red generativa adversaria (GAN) es un tipo de marco de aprendizaje automático que ha impulsado avances significativos en la IA generativa, especialmente para la creación de datos realistas, incluidas herramientas para deepfakes. Las GAN implican dos redes neuronales que trabajan una contra otra: una (el generador) crea una salida basada en sus datos de entrenamiento, y la otra (el discriminador) evalúa esa salida.

Los dos modelos están programados, en esencia, para competir entre sí. El generador intenta producir resultados lo suficientemente convincentes como para engañar al discriminador, mientras que el discriminador se encarga de detectar los datos generados artificialmente. Este proceso adversarial puede optimizar los resultados de la IA para que sean más realistas sin intervención humana adicional. Las GAN son más eficaces para aplicaciones específicas, como la generación de fotos o vídeos realistas, que para la IA de uso general.

Alucinación

«Alucinación» es el término que utiliza la industria de la IA para referirse a cuando los modelos generan información incorrecta o inventada. Se trata de un gran desafío para la calidad y la fiabilidad de la IA.

Las alucinaciones pueden producir resultados generativos de la IA engañosos con riesgos potenciales en el mundo real, como consejos médicos perjudiciales a partir de una consulta de salud.

Se cree que este problema de la fabricación de datos por parte de la IA se debe a lagunas en los datos de entrenamiento. La prevalencia de las alucinaciones está impulsando una tendencia hacia modelos de IA más especializados y verticales —sistemas específicos de un dominio con conocimientos más limitados— como forma de reducir las lagunas de conocimiento y minimizar el riesgo de desinformación.

Inferencia

La inferencia es el proceso de ejecutar un modelo de IA entrenado para realizar predicciones o extraer conclusiones a partir de nuevos datos. Es importante señalar que la inferencia no puede tener lugar sin un entrenamiento previo; un modelo debe aprender primero los patrones de un conjunto de datos antes de poder extrapolar eficazmente a partir de ese conocimiento.

Hay muchos tipos de hardware capaces de realizar inferencias, desde procesadores de teléfonos inteligentes hasta potentes GPU o aceleradores de IA personalizados. Sin embargo, no todo el hardware tiene la misma capacidad. Los modelos muy grandes tardarían un tiempo excesivamente largo en ejecutarse en un portátil estándar en comparación con un servidor en la nube equipado con chips de IA de gama alta.

[Ver: Entrenamiento]

Modelos de lenguaje a gran escala (LLM)

Los modelos de lenguaje a gran escala (LLM) son los modelos de IA que impulsan asistentes populares como ChatGPT, Claude, Gemini de Google, Llama de Meta, Microsoft Copilot y Le Chat de Mistral. Cuando interactúas con un asistente de IA, estás interactuando con un LLM que procesa tu solicitud directamente o con la ayuda de diversas herramientas, como la navegación web o los intérpretes de código.

Los LLM son redes neuronales profundas compuestas por miles de millones de parámetros numéricos (o pesos) que aprenden las relaciones entre palabras y frases, creando una representación multidimensional del lenguaje: una especie de mapa lingüístico.

Estos modelos se entrenan analizando patrones en miles de millones de libros, artículos y transcripciones. Cuando le das una indicación a un LLM, este genera el patrón lingüístico más probable que se ajusta a tu entrada.

(Véase: Red neuronal)

Caché de memoria

La caché de memoria se refiere a un proceso que mejora la inferencia (la generación de respuestas de la IA). Esencialmente, el almacenamiento en caché es una técnica de optimización diseñada para hacer que la inferencia sea más eficiente. La IA se basa en cálculos matemáticos intensivos, cada uno de los cuales consume energía. El almacenamiento en caché reduce el número de cálculos que un modelo debe realizar al almacenar computaciones específicas para su reutilización en futuras consultas. Existen diferentes tipos de almacenamiento en caché de memoria, siendo el almacenamiento en caché KV (clave-valor) un ejemplo muy conocido para los modelos basados en transformadores. El almacenamiento en caché KV aumenta la eficiencia y acelera las respuestas al reducir el tiempo y el esfuerzo computacional necesarios para generar respuestas.

(Véase: Inferencia)

Red neuronal

Una red neuronal es la estructura algorítmica multicapa que sustenta el aprendizaje profundo y, en términos más generales, el auge de la IA generativa tras el surgimiento de los grandes modelos de lenguaje.

Aunque la idea de inspirarse en las neuronas interconectadas del cerebro humano para los algoritmos de procesamiento de datos se remonta a la década de 1940, fue la proliferación más reciente de las unidades de procesamiento gráfico (GPU), impulsada por la industria de los videojuegos, la que realmente liberó el potencial de esta teoría. Estos chips demostraron ser excepcionalmente adecuados para entrenar algoritmos con muchas más capas de las que antes era posible, lo que permitió a los sistemas de IA basados en redes neuronales alcanzar un rendimiento superior en áreas como el reconocimiento de voz, la navegación autónoma y el descubrimiento de fármacos.

(Véase: Modelo de lenguaje grande [LLM])

Código abierto

El código abierto se refiere al software —o, cada vez más, a los modelos de IA— cuyo código subyacente está disponible públicamente para que cualquiera pueda utilizarlo, inspeccionarlo o modificarlo. En IA, la familia de modelos Llama de Meta es un ejemplo destacado; en sistemas operativos, Linux es el clásico paralelo histórico. El enfoque de código abierto permite a investigadores, desarrolladores y empresas de todo el mundo aprovechar el trabajo de los demás, acelerando el progreso y permitiendo auditorías de seguridad independientes que los sistemas cerrados no pueden ofrecer fácilmente. Código cerrado significa que el código es privado: se puede utilizar el producto, pero no ver cómo funciona, como ocurre con los modelos GPT de OpenAI. Esta distinción se ha convertido en un debate central dentro del sector de la IA.

Paralelización

La paralelización consiste en realizar muchas operaciones simultáneamente en lugar de secuencialmente, como si diez empleados trabajaran en diferentes partes de un proyecto a la vez, en lugar de que una sola persona lo hiciera todo paso a paso. En la IA, la paralelización es fundamental tanto para el entrenamiento como para la inferencia. Las GPU modernas están diseñadas específicamente para realizar miles de cálculos en paralelo, una razón clave por la que se han convertido en la columna vertebral del hardware del sector. A medida que los sistemas de IA se vuelven más complejos y los modelos más grandes, la capacidad de paralelizar el trabajo entre muchos chips y máquinas se ha convertido en un factor crítico para determinar la rapidez y la rentabilidad con la que se pueden construir e implementar los modelos. La investigación de mejores estrategias de paralelización es ahora un campo de estudio por derecho propio.

RAMageddon

RAMageddon es el nuevo y jocoso término que designa una grave tendencia que se extiende por la industria tecnológica: la creciente escasez de chips de memoria de acceso aleatorio (RAM), que alimentan casi todos los productos tecnológicos que utilizamos a diario. A medida que la industria de la IA ha experimentado un crecimiento explosivo, las principales empresas tecnológicas y los laboratorios de IA —todos compitiendo por construir la IA más potente y eficiente— están adquiriendo cantidades tan enormes de RAM para sus centros de datos que apenas queda nada para los demás. Este cuello de botella en el suministro está haciendo subir los precios de las existencias restantes.

El impacto se extiende a sectores como el de los videojuegos (donde las empresas han subido los precios de las consolas debido a la escasez de chips de memoria), la electrónica de consumo (donde la escasez podría provocar la mayor caída en las ventas de smartphones en más de una década) y la informática empresarial en general (ya que las empresas tienen dificultades para conseguir suficiente RAM para sus propios centros de datos). Se espera que las subidas de precios continúen hasta que termine la escasez, pero, por desgracia, hay pocos indicios de que eso vaya a suceder pronto.

Aprendizaje por refuerzo

El aprendizaje por refuerzo es un método de entrenamiento en el que un sistema de IA aprende por ensayo y error, recibiendo recompensas por las acciones correctas, de forma similar a cómo se adiestra a una mascota con golosinas, salvo que la «mascota» es una red neuronal y la «golosina» es una señal matemática que indica el éxito. A diferencia del aprendizaje supervisado, en el que un modelo se entrena con un conjunto de datos fijo de ejemplos etiquetados, el aprendizaje por refuerzo permite que un modelo explore su entorno, realice acciones y actualice continuamente su comportamiento basándose en la retroalimentación. Este enfoque ha demostrado ser especialmente eficaz para entrenar a la IA a jugar a videojuegos, controlar robots y, más recientemente, agudizar las capacidades de razonamiento de los grandes modelos de lenguaje. Técnicas como el aprendizaje por refuerzo a partir de la retroalimentación humana (RLHF) son ahora fundamentales para que los principales laboratorios de IA ajusten sus modelos para que sean más útiles, precisos y seguros.

Token

La comunicación entre humanos y máquinas presenta retos evidentes: las personas utilizan el lenguaje humano, mientras que los programas de IA ejecutan tareas a través de procesos algorítmicos complejos basados en datos. Los tokens tienden un puente entre ambos. Son los componentes fundamentales de la comunicación entre humanos e IA, y representan segmentos discretos de datos procesados o producidos por un LLM. Se crean mediante la tokenización, que descompone el texto sin procesar en unidades digeribles que un modelo de lenguaje puede entender, de forma similar a como un compilador traduce el lenguaje humano a código binario para un ordenador. En el contexto empresarial, los tokens también determinan el coste: la mayoría de las empresas de IA cobran por el uso de los LLM por token, lo que significa que cuanto más utiliza una empresa, más paga.

Rendimiento de tokens

Una vez más, los tokens son pequeños fragmentos de texto —a menudo partes de palabras— en los que los modelos de lenguaje de IA descomponen el lenguaje para su procesamiento; son más o menos análogos a las «palabras» a la hora de comprender las cargas de trabajo de la IA. El rendimiento se refiere a la cantidad que se puede procesar en un tiempo determinado, por lo que el rendimiento de tokens mide esencialmente la cantidad de trabajo de IA que un sistema puede gestionar simultáneamente. Un alto rendimiento de tokens es un objetivo clave para los equipos de infraestructura de IA, ya que determina a cuántos usuarios puede atender un modelo a la vez y con qué rapidez recibe cada uno una respuesta. El investigador de IA Andrej Karpathy ha descrito la ansiedad que siente cuando sus suscripciones de IA permanecen inactivas —haciéndose eco de su preocupación en la universidad por el hardware caro infrautilizado—, un sentimiento que refleja por qué maximizar el rendimiento de tokens se ha convertido en una obsesión en el sector.

Entrenamiento

El desarrollo de la IA basada en el aprendizaje automático implica un proceso denominado entrenamiento. En pocas palabras, consiste en introducir datos en un modelo para que pueda aprender patrones y generar resultados útiles. Es el proceso mediante el cual el sistema responde a las características de los datos, adaptando sus resultados hacia un objetivo deseado, ya sea identificar imágenes de gatos o componer un haiku bajo demanda.

El entrenamiento puede resultar costoso porque requiere cantidades masivas de datos, y los volúmenes necesarios siguen aumentando. Por eso, los enfoques híbridos, como el ajuste fino de una IA basada en reglas con datos específicos, pueden ayudar a gestionar los costes sin tener que empezar desde cero.

[Véase: Inferencia]

Aprendizaje por transferencia

Técnica en la que se utiliza un modelo de IA preentrenado como punto de partida para desarrollar un nuevo modelo destinado a una tarea diferente, aunque normalmente relacionada. Esto permite reutilizar los conocimientos adquiridos en ciclos de entrenamiento anteriores.

El aprendizaje por transferencia puede impulsar la eficiencia al acortar el desarrollo del modelo. También resulta útil cuando los datos para la nueva tarea son limitados. Sin embargo, el enfoque tiene limitaciones. Los modelos que se basan en el aprendizaje por transferencia para obtener capacidades generalizadas probablemente requerirán un entrenamiento adicional con datos específicos del dominio para funcionar bien en su área de especialización.

(Véase: Ajuste fino)

Ponderaciones

Los pesos son fundamentales para el entrenamiento de la IA, ya que determinan la importancia (o «peso») asignada a las diferentes características (o variables de entrada) en los datos de entrenamiento, configurando así la salida del modelo.

En otras palabras, los pesos son parámetros numéricos que definen qué es lo más significativo en un conjunto de datos para una tarea de entrenamiento determinada. Funcionan multiplicando las entradas. El entrenamiento del modelo suele comenzar con pesos asignados aleatoriamente, que se ajustan a medida que el modelo itera para producir resultados que se ajusten mejor al objetivo.

Por ejemplo, un modelo de IA entrenado con datos históricos del sector inmobiliario para predecir los precios de la vivienda podría tener pesos para características como el número de dormitorios y baños, el tipo de propiedad (unifamiliar o adosada), la disponibilidad de aparcamiento, el garaje, etc. Los pesos que el modelo asigna a cada entrada reflejan su influencia en el valor de la propiedad según el conjunto de datos.

Pérdida de validación

La pérdida de validación es una métrica que indica el grado de aprendizaje de un modelo de IA durante el entrenamiento; cuanto menor sea el valor, mejor. Los investigadores la supervisan de cerca como un informe de rendimiento en tiempo real, utilizándola para decidir cuándo detener el entrenamiento, ajustar los hiperparámetros o investigar posibles problemas. Una preocupación clave que ayuda a identificar es el sobreajuste, una condición en la que un modelo memoriza sus datos de entrenamiento en lugar de aprender patrones generalizables. Piensa en ello como la diferencia entre un estudiante que realmente entiende la materia y otro que simplemente memorizó el examen del año pasado: la pérdida de validación ayuda a revelar qué camino está tomando tu modelo.

Este artículo se actualiza periódicamente con nueva información.