Hogar
Una alucinación en la aplicación de música de Google lleva a su fundador a realizar un Soundslice ficticio
A principios de este mes, Adrian Holovaty, fundador de la plataforma de educación musical Soundslice, resolvió un caso que le había desconcertado durante semanas. En el sitio seguían apareciendo imágenes extrañas, claramente capturas de pantalla de sesiones de ChatGPT.
Al resolver el misterio, descubrió que ChatGPT se había convertido en uno de los mayores promotores de su empresa y, por desgracia, también estaba difundiendo información errónea sobre las capacidades reales de su aplicación.
Holovaty es ampliamente conocido como cocreador del proyecto Django, un popular marco web de código abierto en Python (aunque dejó de dirigirlo en 2014). Lanzó Soundslice en 2012, una empresa que, según confirma a TechCrunch, ha sido "orgullosamente bootstrapped". En la actualidad, su atención se divide entre su carrera musical y sus proyectos empresariales.
Soundslice es una aplicación de educación musical utilizada tanto por estudiantes como por profesores. Es especialmente conocida por su reproductor de vídeo, que se sincroniza a la perfección con las notaciones musicales para mostrar a los usuarios exactamente cómo tocar las notas.
La aplicación también incluye una función de "escáner de partituras". Mediante IA, permite a los usuarios subir una imagen de una partitura impresa y convertirla automáticamente en una partitura interactiva con todas las anotaciones.
Holovaty explicó que supervisa con diligencia los registros de errores de esta función para detectar problemas y orientar futuras mejoras.
Fue en estos registros donde vio por primera vez las capturas de pantalla de la sesión ChatGPT.
Evento Techcrunch Ahorra hasta 475 $ en tu pase TechCrunch All Stage
Construye de forma más inteligente. Escala más rápido. Conecta más. Únete a visionarios de Precursor Ventures, NEA, Index Ventures, Underscore VC, y otras empresas líderes para un día de ideas estratégicas, talleres prácticos, y la creación de redes valiosas.
Ahorra 450 dólares en tu pase TechCrunch All Stage
Construye de forma más inteligente. Escala más rápido. Conecta más. Únete a visionarios de Precursor Ventures, NEA, Index Ventures, Underscore VC, y otras empresas líderes para un día de ideas estratégicas, talleres prácticos, y la creación de redes valiosas.
Boston, MA | 15 de julio REGÍSTRESE AHORA Estas cargas generaban numerosos registros de error. Las imágenes no contenían partituras; en su lugar, mostraban conversaciones de texto y cuadros de símbolos conocidos como tablatura ASCII. Se trata de un sencillo sistema de notación para guitarra basado en texto que utiliza caracteres de teclado estándar. (Después de todo, no encontrarás una clave de sol en un teclado QWERTY típico).

Créditos de la imagen:Adrian Holovaty Holovaty observó que el volumen de estas imágenes ChatGPT no era lo bastante elevado como para generar costes de almacenamiento significativos o sobrecargar el ancho de banda de su aplicación. Como escribió en una entrada de su blog sobre el incidente, estaba simplemente perplejo.
"Nuestro sistema de escaneado nunca se diseñó para manejar este tipo de anotaciones. Entonces, ¿por qué de repente nos inundaron con capturas de pantalla de pestañas ASCII de ChatGPT? Estuve perplejo durante semanas, hasta que decidí experimentar yo mismo con ChatGPT".
Fue entonces cuando lo vio: ChatGPT indicaba a la gente que podía escuchar la música creando una cuenta en Soundslice y subiendo una captura de pantalla de la sesión de chat. El problema era que no podían. Subir estas imágenes no transformaba mágicamente la tablatura ASCII en audio reproducible.
Esto creó un nuevo problema de reputación. "El principal coste fue para nuestra reputación: Los nuevos usuarios llegaban con expectativas totalmente falsas. Se les había asegurado que podíamos hacer algo que nuestra aplicación sencillamente no hace", explica a TechCrunch.
Él y su equipo pensaron en sus opciones: llenar el sitio de advertencias aclarando que no podían convertir una sesión de ChatGPT en música audible o, por el contrario, crear la funcionalidad para que fuera realmente compatible con ese inusual sistema de notación.
Decidió crear la función.
"Tengo sentimientos encontrados al respecto. Me alegra poder ofrecer una herramienta que ayude a la gente. Pero me da la sensación de que nos han presionado de una forma muy extraña. ¿Debería una empresa desarrollar funciones en respuesta directa a la desinformación generada por la IA?", escribió.
También se preguntaba si era el primer caso conocido de una empresa que tenía que implementar una nueva función porque ChatGPT alucinaba repetidamente con su existencia a una gran audiencia.
Otros programadores de Hacker News ofrecieron una perspectiva interesante: varios comentaron que esta situación no es diferente de la de un vendedor humano demasiado entusiasta que hace grandes promesas a clientes potenciales, lo que obliga al equipo de desarrollo a apresurarse y cumplirlas.
"Creo que es una comparación muy adecuada y bastante divertida". coincidió Holovaty.
Artículo relacionado
Stability AI presenta un modelo de audio capaz de generar canciones de seis minutos
Stability AI, la empresa creadora de Stable Diffusion, ha presentado una nueva serie de modelos de audio denominada Stability Audio 3.0. Según la empresa, el modelo insignia es capaz de producir pieza
OpenAI refuerza la seguridad de ChatGPT mediante una colaboración con Yubico para mejorar la protección de las cuentas
OpenAI está tomando medidas importantes para mejorar la seguridad de las cuentas.El jueves, la empresa presentó «Advanced Account Security», un conjunto de protecciones opcionales para los usuarios de
OpenAI lanza ChatGPT para la gestión de las finanzas personales con integración de cuentas bancarias
El viernes, OpenAI presentó un nuevo conjunto de herramientas de finanzas personales en fase de prueba para los suscriptores de ChatGPT Pro residentes en EE. UU. Esta función permite a los usuarios vi
Recomendaciones de temas especiales relacionados
comentario (1)
0/500
Ich hab mal Soundslice ausprobiert, echt coole Idee 🎸 Aber dass AI jetzt sogar so was zusammenfantasiert? Das ist schon ein bisschen beängstigend. Was, wenn Musiker ihre Ideen aus KI-Halluzinationen kriegen...? Auf jeden Fall ein krasses Beispiel für unerwartete Nebenwirkungen der Technologie. Ich frag mich, ob Google schon eine Lösung hat 🤔
A principios de este mes, Adrian Holovaty, fundador de la plataforma de educación musical Soundslice, resolvió un caso que le había desconcertado durante semanas. En el sitio seguían apareciendo imágenes extrañas, claramente capturas de pantalla de sesiones de ChatGPT.
Al resolver el misterio, descubrió que ChatGPT se había convertido en uno de los mayores promotores de su empresa y, por desgracia, también estaba difundiendo información errónea sobre las capacidades reales de su aplicación.
Holovaty es ampliamente conocido como cocreador del proyecto Django, un popular marco web de código abierto en Python (aunque dejó de dirigirlo en 2014). Lanzó Soundslice en 2012, una empresa que, según confirma a TechCrunch, ha sido "orgullosamente bootstrapped". En la actualidad, su atención se divide entre su carrera musical y sus proyectos empresariales.
Soundslice es una aplicación de educación musical utilizada tanto por estudiantes como por profesores. Es especialmente conocida por su reproductor de vídeo, que se sincroniza a la perfección con las notaciones musicales para mostrar a los usuarios exactamente cómo tocar las notas.
La aplicación también incluye una función de "escáner de partituras". Mediante IA, permite a los usuarios subir una imagen de una partitura impresa y convertirla automáticamente en una partitura interactiva con todas las anotaciones.
Holovaty explicó que supervisa con diligencia los registros de errores de esta función para detectar problemas y orientar futuras mejoras.
Fue en estos registros donde vio por primera vez las capturas de pantalla de la sesión ChatGPT.
Evento TechcrunchAhorra hasta 475 $ en tu pase TechCrunch All Stage
Construye de forma más inteligente. Escala más rápido. Conecta más. Únete a visionarios de Precursor Ventures, NEA, Index Ventures, Underscore VC, y otras empresas líderes para un día de ideas estratégicas, talleres prácticos, y la creación de redes valiosas.
Ahorra 450 dólares en tu pase TechCrunch All Stage
Construye de forma más inteligente. Escala más rápido. Conecta más. Únete a visionarios de Precursor Ventures, NEA, Index Ventures, Underscore VC, y otras empresas líderes para un día de ideas estratégicas, talleres prácticos, y la creación de redes valiosas.
Boston, MA | 15 de julio REGÍSTRESE AHORAEstas cargas generaban numerosos registros de error. Las imágenes no contenían partituras; en su lugar, mostraban conversaciones de texto y cuadros de símbolos conocidos como tablatura ASCII. Se trata de un sencillo sistema de notación para guitarra basado en texto que utiliza caracteres de teclado estándar. (Después de todo, no encontrarás una clave de sol en un teclado QWERTY típico).

Holovaty observó que el volumen de estas imágenes ChatGPT no era lo bastante elevado como para generar costes de almacenamiento significativos o sobrecargar el ancho de banda de su aplicación. Como escribió en una entrada de su blog sobre el incidente, estaba simplemente perplejo.
"Nuestro sistema de escaneado nunca se diseñó para manejar este tipo de anotaciones. Entonces, ¿por qué de repente nos inundaron con capturas de pantalla de pestañas ASCII de ChatGPT? Estuve perplejo durante semanas, hasta que decidí experimentar yo mismo con ChatGPT".
Fue entonces cuando lo vio: ChatGPT indicaba a la gente que podía escuchar la música creando una cuenta en Soundslice y subiendo una captura de pantalla de la sesión de chat. El problema era que no podían. Subir estas imágenes no transformaba mágicamente la tablatura ASCII en audio reproducible.
Esto creó un nuevo problema de reputación. "El principal coste fue para nuestra reputación: Los nuevos usuarios llegaban con expectativas totalmente falsas. Se les había asegurado que podíamos hacer algo que nuestra aplicación sencillamente no hace", explica a TechCrunch.
Él y su equipo pensaron en sus opciones: llenar el sitio de advertencias aclarando que no podían convertir una sesión de ChatGPT en música audible o, por el contrario, crear la funcionalidad para que fuera realmente compatible con ese inusual sistema de notación.
Decidió crear la función.
"Tengo sentimientos encontrados al respecto. Me alegra poder ofrecer una herramienta que ayude a la gente. Pero me da la sensación de que nos han presionado de una forma muy extraña. ¿Debería una empresa desarrollar funciones en respuesta directa a la desinformación generada por la IA?", escribió.
También se preguntaba si era el primer caso conocido de una empresa que tenía que implementar una nueva función porque ChatGPT alucinaba repetidamente con su existencia a una gran audiencia.
Otros programadores de Hacker News ofrecieron una perspectiva interesante: varios comentaron que esta situación no es diferente de la de un vendedor humano demasiado entusiasta que hace grandes promesas a clientes potenciales, lo que obliga al equipo de desarrollo a apresurarse y cumplirlas.
"Creo que es una comparación muy adecuada y bastante divertida". coincidió Holovaty.
Stability AI presenta un modelo de audio capaz de generar canciones de seis minutos
Stability AI, la empresa creadora de Stable Diffusion, ha presentado una nueva serie de modelos de audio denominada Stability Audio 3.0. Según la empresa, el modelo insignia es capaz de producir pieza
OpenAI refuerza la seguridad de ChatGPT mediante una colaboración con Yubico para mejorar la protección de las cuentas
OpenAI está tomando medidas importantes para mejorar la seguridad de las cuentas.El jueves, la empresa presentó «Advanced Account Security», un conjunto de protecciones opcionales para los usuarios de
OpenAI lanza ChatGPT para la gestión de las finanzas personales con integración de cuentas bancarias
El viernes, OpenAI presentó un nuevo conjunto de herramientas de finanzas personales en fase de prueba para los suscriptores de ChatGPT Pro residentes en EE. UU. Esta función permite a los usuarios vi
Ich hab mal Soundslice ausprobiert, echt coole Idee 🎸 Aber dass AI jetzt sogar so was zusammenfantasiert? Das ist schon ein bisschen beängstigend. Was, wenn Musiker ihre Ideen aus KI-Halluzinationen kriegen...? Auf jeden Fall ein krasses Beispiel für unerwartete Nebenwirkungen der Technologie. Ich frag mich, ob Google schon eine Lösung hat 🤔











