Deepseek aumenta el gasto de IA, contrario a las creencias

La caída del mercado de valores en enero, impulsada por el revuelo en torno al avance chino en IA, DeepSeek AI, y su método de computación rentable, podría hacer pensar que las empresas están reduciendo sus inversiones en chips y sistemas de IA. Sin embargo, mi experiencia en la conferencia de IA generativa en Nueva York, organizada por Bloomberg Intelligence, mostró una imagen diferente. El entusiasmo por expandir el uso de la IA generativa era palpable, sugiriendo que el gasto en esta área está lejos de disminuir.
También: ¿Qué es DeepSeek AI? ¿Es seguro? Aquí tienes todo lo que necesitas saber
La conferencia, titulada "IA Generativa: Leyes de Escala Post DeepSeek", estuvo llena de discusiones que enfatizaron la demanda continua que impulsa un mayor inversión en IA.
"Tuvimos diez paneles hoy, y ninguna persona en esos paneles dijo que tenemos más capacidad de la que necesitamos", comentó Mandeep Singh, analista senior de tecnología de Bloomberg Intelligence y uno de los organizadores del evento.
"Y nadie hablaba de una burbuja" en infraestructura, añadió Singh, destacando la confianza de la industria en el futuro de la IA.
La Construcción de Infraestructura de IA: ¿Dónde Estamos?
Anurag Rana, colega de Singh en Bloomberg Intelligence y analista senior de servicios de TI y software, planteó una pregunta crítica: "La pregunta más importante ahora mismo para todos es la construcción de infraestructura de IA. Sí. ¿Dónde estamos en ese ciclo?"
"Nadie lo sabe" con certeza, admitió Rana. Sin embargo, la esperanza generada por DeepSeek AI es que se puedan lograr avances significativos con menos gasto.
"DeepSeek sacudió a mucha gente", dijo. "Si no se necesitan tantas GPU para ejecutar modelos, entonces, ¿por qué necesitamos 500 mil millones de dólares para el proyecto Stargate?", observó, refiriéndose a un proyecto de IA de EE. UU. que involucra a SoftBank Group de Japón, OpenAI y Oracle.
Rana señaló que la industria espera que los costos de la IA disminuyan drásticamente, reflejando la rápida caída en los costos de la computación en la nube.
También: ¿Es el nuevo modelo de imágenes de DeepSeek otra victoria para una IA más barata?
"Esa caída en la curva de costos, que probablemente tomó seis, siete, ocho años para almacenar un terabyte de datos en Amazon AWS, cuando comenzó frente a hoy, la economía era buena", dijo. "Y eso es lo que todos esperan, que en el lado de la inferencia" de la IA, "si la curva cae a ese nivel, dios mío, la tasa de adopción de la IA en el lado del usuario final, o en el lado empresarial, va a ser espectacular."
Singh estuvo de acuerdo, señalando que la aparición de DeepSeek AI ha "cambiado la mentalidad de todos sobre cómo lograr eficiencia."
A lo largo del día, numerosos paneles profundizaron en proyectos de IA empresarial, desde su inicio hasta su implementación. Sin embargo, había un tema recurrente: la necesidad de reducir drásticamente los costos de la IA para ampliar su accesibilidad.
"No creo que DeepSeek fuera una sorpresa", dijo Shawn Edwards, tecnólogo jefe de Bloomberg, en una entrevista con David Dwyer, jefe de Bloomberg Intelligence. "Lo que me hizo pensar es que sería genial si pudieras agitar una varita y hacer que estos modelos funcionen de manera increíblemente eficiente", dijo, imaginando un futuro donde todos los modelos de IA puedan operar con tal eficiencia.
La Proliferación de Modelos de IA
Una razón por la que muchos panelistas anticipan un aumento, en lugar de una disminución, en la inversión en infraestructura de IA es el creciente número de modelos de IA. Una conclusión clave del día fue que no habrá un único modelo de IA que lo domine todo.
"Usamos una familia de modelos", explicó Edwards. "No existe tal cosa como un mejor modelo."
Los panelistas coincidieron en que, aunque los modelos de lenguaje grandes de "fundación" o "frontera" seguirán evolucionando, las empresas individuales podrían emplear cientos o incluso miles de modelos de IA.
También: El auge de las PC de IA: Cómo las empresas están rediseñando su tecnología para mantenerse al día
Estos modelos podrían ajustarse finamente con datos propietarios de una empresa, un proceso de reentrenamiento de una red neuronal después de su "preentrenamiento" inicial con datos genéricos.
"Los agentes en las empresas requieren opcionalidad entre los modelos", dijo Jed Dougherty, jefe de estrategia de plataforma de la firma de ciencia de datos respaldada por capital de riesgo Dataiku. "Necesitan la capacidad de controlar y crear, y tener auditabilidad" de los modelos de IA.
"Queremos poner las herramientas para construir estas cosas en manos de las personas", dijo. "No queremos que diez doctores construyan todos los agentes."
En un sentido similar, Adobe, líder en herramientas de diseño, está apostando por modelos personalizados como un caso de uso clave para creativos. "Podemos entrenar extensiones de modelos personalizados para tu marca que pueden ser de ayuda para una nueva campaña publicitaria", dijo Hannah Elsakr, jefa de nuevas iniciativas de negocio de Adobe, en una discusión con el presentador de Bloomberg TV, Romaine Bostick.
Aumento de la Demanda de Procesamiento
Al igual que con los modelos de IA, la proliferación de agentes de IA dentro de las empresas está aumentando las demandas de procesamiento, sugirieron muchos oradores.
"No meterás todo un proceso en un solo agente, lo dividirás en partes", dijo Ray Smith, jefe de agentes y automatización de Copilot Studio de Microsoft.
Smith predijo que a través de una sola interfaz, como Copilot, "interactuaremos con cientos de agentes: son solo aplicaciones en el nuevo mundo" de la programación.
"Le daremos al agente el proceso de negocio, le diremos qué queremos lograr", y el agente ejecutará las tareas. "Las aplicaciones agentivas son solo una nueva forma de flujo de trabajo", dijo.
También: Nvidia domina en los puntos de referencia de IA generativa, superando a 2 chips de IA rivales
Esos escenarios cotidianos son "todos tecnológicamente posibles", señaló Smith, "es solo el ritmo al que lo construimos."
El impulso para llevar los "agentes" de IA a más personas dentro de las organizaciones está necesitando aún más reducciones de costos, dijo James McNiven, jefe de gestión de productos de la fabricante de microprocesadores ARM Holdings, en una charla con Hyde de Bloomberg.
"¿Cómo proporcionamos acceso en más y más dispositivos?", planteó. "Estamos viendo modelos con capacidad a nivel de doctorado" para tareas, dijo.
McNiven sugirió que dichos agentes deberían servir como asistentes para los humanos, haciendo un paralelismo con cuando los sistemas de pago se introdujeron en países en desarrollo a través de teléfonos móviles hace una década: "¿Cómo hacemos que eso llegue a las personas que pueden usar esa capacidad?"
La Proliferación de Modelos de Fundación
Incluso los modelos de fundación genéricos están proliferando a un ritmo asombroso.
Amazon AWS tiene 1,800 modelos de IA diferentes disponibles, dijo Dave Brown, jefe de computación y redes de AWS, a la presentadora de Bloomberg TV, Caroline Hyde. La compañía está "haciendo mucho para reducir el costo" de ejecutar los modelos, dijo, incluyendo el desarrollo de chips de IA personalizados, como Trainium.
AWS está "usando más de nuestros propios procesadores que los de otras compañías", dijo Brown, aludiendo a Nvidia, AMD, Intel y otros proveedores de chips de propósito general.
También: El nuevo generador de imágenes de ChatGPT superó mis expectativas - y ahora es gratis para probar
"Los clientes harían más si el costo fuera menor", dijo Brown.
AWS trabaja diariamente con Anthropic, creadores de la familia de modelos de lenguaje Claude, señaló Brown. Michael Gerstenhaber, jefe de interfaces de programación de aplicaciones de Anthropic, en la misma charla con Hyde, señaló que "los modelos de razonamiento causan que se use mucha capacidad", refiriéndose a la tendencia de los modelos de razonamiento, como DeepSeek R1 y GPT-o1, a emitir declaraciones detalladas sobre los argumentos para sus respuestas finales.
Anthropic está trabajando estrechamente con AWS en formas de reducir el presupuesto de cómputo, como el "almacenamiento en caché de prompts", almacenando los cálculos de respuestas anteriores.
A pesar de esa tendencia, dijo, "Anthropic necesita cientos de miles de aceleradores", refiriéndose a chips de silicio enfocados en IA, "a través de muchos centros de datos" para ejecutar sus modelos.
Además, el costo energético creciente de alimentar la IA no muestra signos de disminuir, dijo Brown. Los centros de datos actuales están consumiendo cientos de megavatios, señaló, y eventualmente requerirán gigavatios. "El poder que consume", refiriéndose a la IA, "es grande, y la huella es grande en muchos centros de datos."
También: La computación de IA global usará el equivalente al consumo de energía de "múltiples ciudades de Nueva York" para 2026, dice el fundador
Incertidumbre Económica e Inversión en IA
A pesar de los escenarios ambiciosos, un factor podría interrumpir todos los casos de uso y planes de inversión: la economía.
Mientras la conferencia terminaba el miércoles por la noche, los panelistas e invitados monitoreaban la caída del mercado de valores después del cierre. El presidente de EE. UU., Donald Trump, acababa de anunciar un paquete global de aranceles que eran más grandes y amplios de lo que la mayoría en Wall Street había anticipado.
Las áreas tradicionales de inversión en tecnología, como servidores y almacenamiento, y no la IA, podrían ser las primeras víctimas de cualquier contracción económica, dijo Rana de Bloomberg.
"Lo otro importante en lo que nos enfocamos es el gasto en tecnología no relacionada con IA", dijo respecto a los aranceles. "Cuando miramos a empresas como IBM, Accenture, Microsoft y todas las demás, cuando dejamos de lado la IA por un segundo, eso va a ser una lucha en esta temporada de ganancias."
Los directores financieros de grandes empresas podrían priorizar la IA y redirigir fondos, incluso si tienen que recortar sus presupuestos en medio de la incertidumbre económica y una posible recesión, sugirió Rana.
Sin embargo, esa perspectiva optimista no está garantizada.
"Lo que más me interesa descubrir es si todas estas grandes empresas mantendrán sus objetivos de gasto de capital [cap-ex]", dijo Rana, incluyendo los centros de datos de IA, "o dirán, ¿sabes qué? Es demasiado incierto."
Artículo relacionado
Creación de Música con IA: Crea Canciones y Videos sin Esfuerzo
La creación de música puede ser compleja, requiriendo tiempo, recursos y experiencia. La inteligencia artificial ha transformado este proceso, haciéndolo simple y accesible. Esta guía destaca cómo la
Creación de Libros para Colorear Impulsados por IA: Una Guía Completa
Diseñar libros para colorear es una actividad gratificante que combina la expresión artística con experiencias relajantes para los usuarios. Sin embargo, el proceso puede ser intensivo en trabajo. Afo
Qodo se asocia con Google Cloud para ofrecer herramientas gratuitas de revisión de código de IA para desarrolladores
Qodo, una startup de codificación de IA con sede en Israel enfocada en la calidad del código, ha iniciado una asociación con Google Cloud para mejorar la integridad del software generado por IA.A medi
comentario (1)
0/200
FredGreen
31 de julio de 2025 03:41:19 GMT+02:00
DeepSeek's breakthrough sounds like a game-changer! Curious how their cost-effective method stacks up against giants like NVIDIA. Anyone got details on this? 🤔
0
La caída del mercado de valores en enero, impulsada por el revuelo en torno al avance chino en IA, DeepSeek AI, y su método de computación rentable, podría hacer pensar que las empresas están reduciendo sus inversiones en chips y sistemas de IA. Sin embargo, mi experiencia en la conferencia de IA generativa en Nueva York, organizada por Bloomberg Intelligence, mostró una imagen diferente. El entusiasmo por expandir el uso de la IA generativa era palpable, sugiriendo que el gasto en esta área está lejos de disminuir.
También: ¿Qué es DeepSeek AI? ¿Es seguro? Aquí tienes todo lo que necesitas saber
La conferencia, titulada "IA Generativa: Leyes de Escala Post DeepSeek", estuvo llena de discusiones que enfatizaron la demanda continua que impulsa un mayor inversión en IA.
"Tuvimos diez paneles hoy, y ninguna persona en esos paneles dijo que tenemos más capacidad de la que necesitamos", comentó Mandeep Singh, analista senior de tecnología de Bloomberg Intelligence y uno de los organizadores del evento.
"Y nadie hablaba de una burbuja" en infraestructura, añadió Singh, destacando la confianza de la industria en el futuro de la IA.
La Construcción de Infraestructura de IA: ¿Dónde Estamos?
Anurag Rana, colega de Singh en Bloomberg Intelligence y analista senior de servicios de TI y software, planteó una pregunta crítica: "La pregunta más importante ahora mismo para todos es la construcción de infraestructura de IA. Sí. ¿Dónde estamos en ese ciclo?"
"Nadie lo sabe" con certeza, admitió Rana. Sin embargo, la esperanza generada por DeepSeek AI es que se puedan lograr avances significativos con menos gasto.
"DeepSeek sacudió a mucha gente", dijo. "Si no se necesitan tantas GPU para ejecutar modelos, entonces, ¿por qué necesitamos 500 mil millones de dólares para el proyecto Stargate?", observó, refiriéndose a un proyecto de IA de EE. UU. que involucra a SoftBank Group de Japón, OpenAI y Oracle.
Rana señaló que la industria espera que los costos de la IA disminuyan drásticamente, reflejando la rápida caída en los costos de la computación en la nube.
También: ¿Es el nuevo modelo de imágenes de DeepSeek otra victoria para una IA más barata?
"Esa caída en la curva de costos, que probablemente tomó seis, siete, ocho años para almacenar un terabyte de datos en Amazon AWS, cuando comenzó frente a hoy, la economía era buena", dijo. "Y eso es lo que todos esperan, que en el lado de la inferencia" de la IA, "si la curva cae a ese nivel, dios mío, la tasa de adopción de la IA en el lado del usuario final, o en el lado empresarial, va a ser espectacular."
Singh estuvo de acuerdo, señalando que la aparición de DeepSeek AI ha "cambiado la mentalidad de todos sobre cómo lograr eficiencia."
A lo largo del día, numerosos paneles profundizaron en proyectos de IA empresarial, desde su inicio hasta su implementación. Sin embargo, había un tema recurrente: la necesidad de reducir drásticamente los costos de la IA para ampliar su accesibilidad.
"No creo que DeepSeek fuera una sorpresa", dijo Shawn Edwards, tecnólogo jefe de Bloomberg, en una entrevista con David Dwyer, jefe de Bloomberg Intelligence. "Lo que me hizo pensar es que sería genial si pudieras agitar una varita y hacer que estos modelos funcionen de manera increíblemente eficiente", dijo, imaginando un futuro donde todos los modelos de IA puedan operar con tal eficiencia.
La Proliferación de Modelos de IA
Una razón por la que muchos panelistas anticipan un aumento, en lugar de una disminución, en la inversión en infraestructura de IA es el creciente número de modelos de IA. Una conclusión clave del día fue que no habrá un único modelo de IA que lo domine todo.
"Usamos una familia de modelos", explicó Edwards. "No existe tal cosa como un mejor modelo."
Los panelistas coincidieron en que, aunque los modelos de lenguaje grandes de "fundación" o "frontera" seguirán evolucionando, las empresas individuales podrían emplear cientos o incluso miles de modelos de IA.
También: El auge de las PC de IA: Cómo las empresas están rediseñando su tecnología para mantenerse al día
Estos modelos podrían ajustarse finamente con datos propietarios de una empresa, un proceso de reentrenamiento de una red neuronal después de su "preentrenamiento" inicial con datos genéricos.
"Los agentes en las empresas requieren opcionalidad entre los modelos", dijo Jed Dougherty, jefe de estrategia de plataforma de la firma de ciencia de datos respaldada por capital de riesgo Dataiku. "Necesitan la capacidad de controlar y crear, y tener auditabilidad" de los modelos de IA.
"Queremos poner las herramientas para construir estas cosas en manos de las personas", dijo. "No queremos que diez doctores construyan todos los agentes."
En un sentido similar, Adobe, líder en herramientas de diseño, está apostando por modelos personalizados como un caso de uso clave para creativos. "Podemos entrenar extensiones de modelos personalizados para tu marca que pueden ser de ayuda para una nueva campaña publicitaria", dijo Hannah Elsakr, jefa de nuevas iniciativas de negocio de Adobe, en una discusión con el presentador de Bloomberg TV, Romaine Bostick.
Aumento de la Demanda de Procesamiento
Al igual que con los modelos de IA, la proliferación de agentes de IA dentro de las empresas está aumentando las demandas de procesamiento, sugirieron muchos oradores.
"No meterás todo un proceso en un solo agente, lo dividirás en partes", dijo Ray Smith, jefe de agentes y automatización de Copilot Studio de Microsoft.
Smith predijo que a través de una sola interfaz, como Copilot, "interactuaremos con cientos de agentes: son solo aplicaciones en el nuevo mundo" de la programación.
"Le daremos al agente el proceso de negocio, le diremos qué queremos lograr", y el agente ejecutará las tareas. "Las aplicaciones agentivas son solo una nueva forma de flujo de trabajo", dijo.
También: Nvidia domina en los puntos de referencia de IA generativa, superando a 2 chips de IA rivales
Esos escenarios cotidianos son "todos tecnológicamente posibles", señaló Smith, "es solo el ritmo al que lo construimos."
El impulso para llevar los "agentes" de IA a más personas dentro de las organizaciones está necesitando aún más reducciones de costos, dijo James McNiven, jefe de gestión de productos de la fabricante de microprocesadores ARM Holdings, en una charla con Hyde de Bloomberg.
"¿Cómo proporcionamos acceso en más y más dispositivos?", planteó. "Estamos viendo modelos con capacidad a nivel de doctorado" para tareas, dijo.
McNiven sugirió que dichos agentes deberían servir como asistentes para los humanos, haciendo un paralelismo con cuando los sistemas de pago se introdujeron en países en desarrollo a través de teléfonos móviles hace una década: "¿Cómo hacemos que eso llegue a las personas que pueden usar esa capacidad?"
La Proliferación de Modelos de Fundación
Incluso los modelos de fundación genéricos están proliferando a un ritmo asombroso.
Amazon AWS tiene 1,800 modelos de IA diferentes disponibles, dijo Dave Brown, jefe de computación y redes de AWS, a la presentadora de Bloomberg TV, Caroline Hyde. La compañía está "haciendo mucho para reducir el costo" de ejecutar los modelos, dijo, incluyendo el desarrollo de chips de IA personalizados, como Trainium.
AWS está "usando más de nuestros propios procesadores que los de otras compañías", dijo Brown, aludiendo a Nvidia, AMD, Intel y otros proveedores de chips de propósito general.
También: El nuevo generador de imágenes de ChatGPT superó mis expectativas - y ahora es gratis para probar
"Los clientes harían más si el costo fuera menor", dijo Brown.
AWS trabaja diariamente con Anthropic, creadores de la familia de modelos de lenguaje Claude, señaló Brown. Michael Gerstenhaber, jefe de interfaces de programación de aplicaciones de Anthropic, en la misma charla con Hyde, señaló que "los modelos de razonamiento causan que se use mucha capacidad", refiriéndose a la tendencia de los modelos de razonamiento, como DeepSeek R1 y GPT-o1, a emitir declaraciones detalladas sobre los argumentos para sus respuestas finales.
Anthropic está trabajando estrechamente con AWS en formas de reducir el presupuesto de cómputo, como el "almacenamiento en caché de prompts", almacenando los cálculos de respuestas anteriores.
A pesar de esa tendencia, dijo, "Anthropic necesita cientos de miles de aceleradores", refiriéndose a chips de silicio enfocados en IA, "a través de muchos centros de datos" para ejecutar sus modelos.
Además, el costo energético creciente de alimentar la IA no muestra signos de disminuir, dijo Brown. Los centros de datos actuales están consumiendo cientos de megavatios, señaló, y eventualmente requerirán gigavatios. "El poder que consume", refiriéndose a la IA, "es grande, y la huella es grande en muchos centros de datos."
También: La computación de IA global usará el equivalente al consumo de energía de "múltiples ciudades de Nueva York" para 2026, dice el fundador
Incertidumbre Económica e Inversión en IA
A pesar de los escenarios ambiciosos, un factor podría interrumpir todos los casos de uso y planes de inversión: la economía.
Mientras la conferencia terminaba el miércoles por la noche, los panelistas e invitados monitoreaban la caída del mercado de valores después del cierre. El presidente de EE. UU., Donald Trump, acababa de anunciar un paquete global de aranceles que eran más grandes y amplios de lo que la mayoría en Wall Street había anticipado.
Las áreas tradicionales de inversión en tecnología, como servidores y almacenamiento, y no la IA, podrían ser las primeras víctimas de cualquier contracción económica, dijo Rana de Bloomberg.
"Lo otro importante en lo que nos enfocamos es el gasto en tecnología no relacionada con IA", dijo respecto a los aranceles. "Cuando miramos a empresas como IBM, Accenture, Microsoft y todas las demás, cuando dejamos de lado la IA por un segundo, eso va a ser una lucha en esta temporada de ganancias."
Los directores financieros de grandes empresas podrían priorizar la IA y redirigir fondos, incluso si tienen que recortar sus presupuestos en medio de la incertidumbre económica y una posible recesión, sugirió Rana.
Sin embargo, esa perspectiva optimista no está garantizada.
"Lo que más me interesa descubrir es si todas estas grandes empresas mantendrán sus objetivos de gasto de capital [cap-ex]", dijo Rana, incluyendo los centros de datos de IA, "o dirán, ¿sabes qué? Es demasiado incierto."




DeepSeek's breakthrough sounds like a game-changer! Curious how their cost-effective method stacks up against giants like NVIDIA. Anyone got details on this? 🤔












