Hogar
Las notas de las reuniones de Talat generadas por IA se guardan en tu dispositivo, no en la nube

Granola, la aplicación para tomar notas basada en IA valorada en 250 millones de dólares, ha ganado popularidad entre los fundadores de empresas tecnológicas y los inversores de capital riesgo. Sin embargo, un desarrollador ve la necesidad de una alternativa más privada y totalmente local, disponible mediante un pago único sin suscripción. Esa visión dio lugar a una nueva aplicación para Mac llamada Talat.
Nick Payne, un autodenominado friki de la informática afincado en Yorkshire, Inglaterra, afirma que la idea de una aplicación local de toma de notas con IA surgió en gran medida de una serie de afortunadas coincidencias.
«Creo que Granola es increíble; es un ejemplo brillante de lo que se puede lograr con una aplicación Electron cuando le dedicas suficiente cariño y atención», declaró a TechCrunch. «Cuando la probé por primera vez, me fascinó cómo conseguía grabar el audio del sistema en mi Mac sin grabar también vídeo, que era la solución habitual en aquel momento. Eso desencadenó una gran cantidad de investigación, lo que me llevó a descubrir una API de Apple relativamente nueva y poco documentada».
Para facilitar el trabajo con esa API (Core Audio Taps, que permite a los desarrolladores acceder a los flujos de audio de un Mac), Payne decidió crear una biblioteca de audio de código abierto llamada AudioTee.
«Durante ese tiempo, fui reuniendo poco a poco un conjunto de herramientas, pero nunca encontré nada que me pareciera que pudiera funcionar por sí solo como un producto, en lugar de ser solo una demostración tecnológica interesante», dijo Payne. «Los modelos de transcripción alojados de última generación —los mismos que utilizan aplicaciones como Granola— son increíbles, y resulta realmente genial ver cómo tu discurso se despliega en pantalla casi en tiempo real. Pero siempre me molestaba que la contrapartida fuera tener que proporcionar no solo mis datos, sino mis datos de audio; mi propia voz», añadió.
Entonces se topó con un kit de herramientas de software llamado FluidAudio, un marco de trabajo de Swift que permite una IA de audio totalmente local y de baja latencia en dispositivos Apple. Permite que pequeños y rápidos modelos de transcripción se ejecuten directamente en el Neural Engine del Mac —el hardware dedicado de Apple para el procesamiento de IA—.
Esa fue la pieza que hizo que Payne se diera cuenta de que podía convertir su investigación en un producto real, uno en el que tu audio nunca sale de tu Mac y tus transcripciones no se almacenan en los servidores de otra empresa.
Talat, creado junto con Mike Franklin, amigo de toda la vida y antiguo compañero de Payne, es el resultado del interés de Payne por el ámbito del audio. El resultado es una descarga de 20 MB con un precio de compra único, sin necesidad de crear una cuenta y sin que se compartan datos analíticos con los desarrolladores. Tampoco hay cuotas de suscripción.
Aunque algunas aplicaciones de toma de notas con IA pueden ofrecer más funciones y extras, Talat proporciona un conjunto de características optimizado. Captura el audio del micrófono de tu ordenador durante las reuniones en aplicaciones como Zoom, Teams, Meet y otras, transcribiéndolo en tiempo real. La aplicación intenta asignar a los hablantes en tiempo real, pero puedes reasignarlos según sea necesario. También puedes tomar notas, así como editar, eliminar o dividir segmentos de la transcripción. Cuando finaliza la reunión, un modelo de lenguaje grande (LLM) local genera un resumen con los puntos clave, las decisiones y las acciones a realizar.
Las notas, las transcripciones y los resúmenes se pueden buscar dentro de Talat.
Además del aspecto de la privacidad, Payne dijo que el objetivo es ofrecer a los usuarios más flexibilidad.
«Nos centramos en la configurabilidad y permitimos a los usuarios controlar dónde van sus datos: elige tu propio LLM, exporta automáticamente a [la aplicación de toma de notas] Obsidian, webhooks que envían los datos cuando termina una reunión, un servidor MCP», que es una forma estandarizada para que las herramientas de IA se conecten a fuentes de datos externas, «para recuperarlos bajo demanda», explicó.
En el fondo, la IA es una mezcla —«en su mayor parte ensamblada y abstraída tras FluidAudio», señaló Payne, atribuyendo a FluidAudio gran parte del trabajo pesado. En cuanto a la parte de resumen, la aplicación utiliza por defecto un modelo de IA llamado Qwen3-4B-4bit, que puede ejecutarse en un hardware bastante modesto.
Sin embargo, los usuarios pueden optar por cambiarlo por cualquier proveedor de LLM en la nube de su elección, o elegir entre dos variantes de Parakeet —modelos de reconocimiento de voz desarrollados por Nvidia— o dirigirlo a Ollama (una herramienta para ejecutar modelos de IA localmente), lo que les da más control sobre la experiencia. Con el tiempo, Talat añadirá compatibilidad con más opciones integradas y se integrará con otras aplicaciones, como Google Calendar y Notion.
En el momento del lanzamiento, los usuarios con ordenadores Mac de la serie M (los que funcionan con los procesadores propios de Apple, a partir del M1) pueden descargar la aplicación y probarla gratis con 10 horas de grabaciones antes de decidirse a comprarla.
Talat está disponible por 49 $ en esta versión preliminar, que aún se encuentra en fase de desarrollo activo.
Cuando la aplicación llegue a la versión 1.0, el precio aumentará a 99 dólares.
Payne y Franklin están financiando Talat con fondos propios y planean mantener el producto básico como una compra única en el futuro.
Artículo relacionado
BuzzFeed presenta aplicaciones de contenido basadas en IA para generar nuevos ingresos
BuzzFeed, la empresa de medios de comunicación con sede en Estados Unidos conocida por sus cuestionarios, sus artículos en forma de lista y una breve etapa con una división periodística ganadora del P
Las aplicaciones de IA generan ingresos, pero enfrentan desafíos en la retención de usuarios, revelan los datos
Con las tiendas de aplicaciones repletas de aplicaciones impulsadas por inteligencia artificial, muchos desarrolladores creen que integrar esta tecnología es la clave para obtener rentabilidad. Sin embargo, un nuevo estudio que analiza el panorama de
DeepL, conocida por la traducción de textos, se centra ahora en la traducción de voz
DeepL, una empresa de traducción conocida principalmente por sus herramientas de texto, ha lanzado hoy un paquete de traducción de voz a voz diseñado para situaciones como reuniones, conversaciones po
Recomendaciones de temas especiales relacionados
comentario (0)
0/500

Granola, la aplicación para tomar notas basada en IA valorada en 250 millones de dólares, ha ganado popularidad entre los fundadores de empresas tecnológicas y los inversores de capital riesgo. Sin embargo, un desarrollador ve la necesidad de una alternativa más privada y totalmente local, disponible mediante un pago único sin suscripción. Esa visión dio lugar a una nueva aplicación para Mac llamada Talat.
Nick Payne, un autodenominado friki de la informática afincado en Yorkshire, Inglaterra, afirma que la idea de una aplicación local de toma de notas con IA surgió en gran medida de una serie de afortunadas coincidencias.
«Creo que Granola es increíble; es un ejemplo brillante de lo que se puede lograr con una aplicación Electron cuando le dedicas suficiente cariño y atención», declaró a TechCrunch. «Cuando la probé por primera vez, me fascinó cómo conseguía grabar el audio del sistema en mi Mac sin grabar también vídeo, que era la solución habitual en aquel momento. Eso desencadenó una gran cantidad de investigación, lo que me llevó a descubrir una API de Apple relativamente nueva y poco documentada».
Para facilitar el trabajo con esa API (Core Audio Taps, que permite a los desarrolladores acceder a los flujos de audio de un Mac), Payne decidió crear una biblioteca de audio de código abierto llamada AudioTee.
«Durante ese tiempo, fui reuniendo poco a poco un conjunto de herramientas, pero nunca encontré nada que me pareciera que pudiera funcionar por sí solo como un producto, en lugar de ser solo una demostración tecnológica interesante», dijo Payne. «Los modelos de transcripción alojados de última generación —los mismos que utilizan aplicaciones como Granola— son increíbles, y resulta realmente genial ver cómo tu discurso se despliega en pantalla casi en tiempo real. Pero siempre me molestaba que la contrapartida fuera tener que proporcionar no solo mis datos, sino mis datos de audio; mi propia voz», añadió.
Entonces se topó con un kit de herramientas de software llamado FluidAudio, un marco de trabajo de Swift que permite una IA de audio totalmente local y de baja latencia en dispositivos Apple. Permite que pequeños y rápidos modelos de transcripción se ejecuten directamente en el Neural Engine del Mac —el hardware dedicado de Apple para el procesamiento de IA—.
Esa fue la pieza que hizo que Payne se diera cuenta de que podía convertir su investigación en un producto real, uno en el que tu audio nunca sale de tu Mac y tus transcripciones no se almacenan en los servidores de otra empresa.
Talat, creado junto con Mike Franklin, amigo de toda la vida y antiguo compañero de Payne, es el resultado del interés de Payne por el ámbito del audio. El resultado es una descarga de 20 MB con un precio de compra único, sin necesidad de crear una cuenta y sin que se compartan datos analíticos con los desarrolladores. Tampoco hay cuotas de suscripción.
Aunque algunas aplicaciones de toma de notas con IA pueden ofrecer más funciones y extras, Talat proporciona un conjunto de características optimizado. Captura el audio del micrófono de tu ordenador durante las reuniones en aplicaciones como Zoom, Teams, Meet y otras, transcribiéndolo en tiempo real. La aplicación intenta asignar a los hablantes en tiempo real, pero puedes reasignarlos según sea necesario. También puedes tomar notas, así como editar, eliminar o dividir segmentos de la transcripción. Cuando finaliza la reunión, un modelo de lenguaje grande (LLM) local genera un resumen con los puntos clave, las decisiones y las acciones a realizar.
Las notas, las transcripciones y los resúmenes se pueden buscar dentro de Talat.
Además del aspecto de la privacidad, Payne dijo que el objetivo es ofrecer a los usuarios más flexibilidad.
«Nos centramos en la configurabilidad y permitimos a los usuarios controlar dónde van sus datos: elige tu propio LLM, exporta automáticamente a [la aplicación de toma de notas] Obsidian, webhooks que envían los datos cuando termina una reunión, un servidor MCP», que es una forma estandarizada para que las herramientas de IA se conecten a fuentes de datos externas, «para recuperarlos bajo demanda», explicó.
En el fondo, la IA es una mezcla —«en su mayor parte ensamblada y abstraída tras FluidAudio», señaló Payne, atribuyendo a FluidAudio gran parte del trabajo pesado. En cuanto a la parte de resumen, la aplicación utiliza por defecto un modelo de IA llamado Qwen3-4B-4bit, que puede ejecutarse en un hardware bastante modesto.
Sin embargo, los usuarios pueden optar por cambiarlo por cualquier proveedor de LLM en la nube de su elección, o elegir entre dos variantes de Parakeet —modelos de reconocimiento de voz desarrollados por Nvidia— o dirigirlo a Ollama (una herramienta para ejecutar modelos de IA localmente), lo que les da más control sobre la experiencia. Con el tiempo, Talat añadirá compatibilidad con más opciones integradas y se integrará con otras aplicaciones, como Google Calendar y Notion.
En el momento del lanzamiento, los usuarios con ordenadores Mac de la serie M (los que funcionan con los procesadores propios de Apple, a partir del M1) pueden descargar la aplicación y probarla gratis con 10 horas de grabaciones antes de decidirse a comprarla.
Talat está disponible por 49 $ en esta versión preliminar, que aún se encuentra en fase de desarrollo activo.
Cuando la aplicación llegue a la versión 1.0, el precio aumentará a 99 dólares.
Payne y Franklin están financiando Talat con fondos propios y planean mantener el producto básico como una compra única en el futuro.
BuzzFeed presenta aplicaciones de contenido basadas en IA para generar nuevos ingresos
BuzzFeed, la empresa de medios de comunicación con sede en Estados Unidos conocida por sus cuestionarios, sus artículos en forma de lista y una breve etapa con una división periodística ganadora del P
Las aplicaciones de IA generan ingresos, pero enfrentan desafíos en la retención de usuarios, revelan los datos
Con las tiendas de aplicaciones repletas de aplicaciones impulsadas por inteligencia artificial, muchos desarrolladores creen que integrar esta tecnología es la clave para obtener rentabilidad. Sin embargo, un nuevo estudio que analiza el panorama de
DeepL, conocida por la traducción de textos, se centra ahora en la traducción de voz
DeepL, una empresa de traducción conocida principalmente por sus herramientas de texto, ha lanzado hoy un paquete de traducción de voz a voz diseñado para situaciones como reuniones, conversaciones po











