Дом
Заметки Талата по искусственному интеллекту хранятся прямо на вашем устройстве, а не в облаке

Granola — приложение для ведения заметок на базе искусственного интеллекта, оцениваемое в 250 миллионов долларов, — завоевало популярность среди основателей технологических компаний и венчурных инвесторов. Однако один из разработчиков увидел спрос на более конфиденциальную, полностью локальную альтернативу, доступную за единовременную плату без подписки. Эта идея привела к созданию нового приложения для Mac под названием Talat.
Ник Пейн, самопровозглашенный компьютерный гик из Йоркшира, Англия, говорит, что идея локального приложения для ведения заметок на базе ИИ возникла в основном благодаря ряду счастливых случайностей.
«Я считаю, что Granola — потрясающее приложение; это яркий пример того, чего можно достичь с помощью приложения Electron, если уделить ему достаточно внимания и заботы», — сказал он TechCrunch. «Когда я впервые попробовал его, я был очарован тем, как ему удалось записывать системный звук на моем Mac без записи видео, что в то время было стандартным обходным решением. Это дало толчок к многочисленным исследованиям, которые привели меня к открытию относительно нового и плохо документированного API Apple».
Чтобы упростить работу с этим API (Core Audio Taps, который позволяет разработчикам подключаться к аудиопотокам Mac), Пейн решил создать аудиобиблиотеку с открытым исходным кодом под названием AudioTee.
«В то время я постепенно собирал набор инструментов, но так и не нашел ничего, что могло бы стать самостоятельным продуктом, а не просто крутой технической демонстрацией», — сказал Пейн. «Современные хостируемые модели транскрипции — те же самые, что используют такие приложения, как Granola, — просто невероятны, и это по-настоящему круто — видеть, как твоя речь разворачивается на экране практически в реальном времени. Но меня всегда беспокоило, что в качестве компромисса я должен был предоставлять не просто свои данные, а свои аудиоданные — свой настоящий голос», — добавил он.
Затем он наткнулся на набор программных инструментов под названием FluidAudio — фреймворк на Swift, который обеспечивает полностью локальный ИИ для обработки аудио с низкой задержкой на устройствах Apple. Он позволяет небольшим и быстрым моделям транскрипции работать непосредственно на Neural Engine Mac — специальном аппаратном обеспечении Apple для обработки данных с помощью ИИ.
Именно это помогло Пейну понять, что он может превратить свои исследования в реальный продукт — такой, при котором ваши аудиозаписи никогда не покидают ваш Mac, а транскрипты не хранятся на серверах другой компании.
Talat, созданный совместно с давним другом и бывшим коллегой Пейна Майком Франклином, является результатом интереса Пейна к аудиосфере. В результате получилось приложение размером 20 МБ с одноразовой покупкой, не требующее учетной записи и не передающее аналитические данные разработчикам. Также нет никаких постоянных сборов.
Хотя некоторые приложения для создания заметок с помощью ИИ могут предлагать больше наворотов, Talat предоставляет оптимизированный набор функций. Оно захватывает аудио с микрофона вашего компьютера во время встреч в таких приложениях, как Zoom, Teams, Meet и других, и транскрибирует его в режиме реального времени. Приложение пытается определить говорящих в режиме реального времени, но вы можете переназначить их по мере необходимости. Вы также можете делать заметки, а также редактировать, удалять или разделять фрагменты транскрипта. По окончании встречи локальный LLM генерирует резюме с ключевыми моментами, решениями и задачами.
Заметки, транскрипты и резюме доступны для поиска в Talat.
Помимо аспекта конфиденциальности, Пейн сказал, что цель состоит в том, чтобы предоставить пользователям больше гибкости.
«Мы делаем ставку на настраиваемость и позволяем пользователям контролировать, куда попадают их данные: выбирать собственный LLM, автоматический экспорт в [приложение для ведения заметок] Obsidian, веб-хуки, которые отправляют данные по окончании встречи, сервер MCP», который представляет собой стандартизированный способ подключения инструментов ИИ к внешним источникам данных, «для извлечения данных по запросу», — пояснил он.
«На самом деле ИИ представляет собой смесь — «в основном сшитую и абстрагированную за счет FluidAudio», — отметил Пейн, отметив, что FluidAudio выполняет большую часть тяжелой работы. Что касается функции создания резюме, по умолчанию приложение использует модель ИИ под названием Qwen3-4B-4bit, которая может работать на довольно скромном оборудовании.
Однако пользователи могут переключиться на любого поставщика облачных LLM по своему выбору, выбрать один из двух вариантов Parakeet — моделей распознавания речи, разработанных Nvidia, — или настроить приложение на работу с Ollama (инструментом для локального запуска моделей ИИ), что даст им больше контроля над пользовательским опытом. Со временем Talat добавит поддержку большего количества встроенных вариантов и интегрируется с другими приложениями, такими как Google Calendar и Notion.
На момент запуска пользователи с компьютерами Mac серии M (те, на которых установлены собственные процессоры Apple, начиная с M1) могут скачать приложение и опробовать его бесплатно с 10 часами записи, прежде чем принять решение о покупке.
Talat доступен по цене 49 долларов в этой предрелизной версии, которая все еще находится в стадии активной разработки.
Когда приложение выйдет в версии 1.0, цена увеличится до 99 долларов.
Пейн и Франклин самостоятельно финансируют разработку Talat и планируют и в дальнейшем сохранить модель одноразовой покупки основного продукта.
Связанная статья
BuzzFeed представляет приложения с искусственным интеллектом для создания контента, призванные принести новые доходы
BuzzFeed, американская медиакомпания, известная своими викторинами, списками и небольшим журналистским подразделением, удостоенным Пулитцеровской премии, переориентируется на эпоху искусственного инте
Исследования показывают: приложения на основе искусственного интеллекта приносят доход, но сталкиваются с трудностями при удержании пользователей
С учетом того что магазины приложений переполнены приложениями, основанными на технологиях искусственного интеллекта, многие разработчики считают, что интеграция этой технологии является ключом к получению прибыли. Однако новое исследование, анализир
DeepL, известная своими услугами по переводу текстов, теперь занимается переводом речи
DeepL, компания-переводчик, наиболее известная своими инструментами для перевода текстов, сегодня представила набор решений для перевода «голос-голос», предназначенный для таких сценариев, как встречи
Рекомендации по связанным специальным темам
Комментарии (0)

Granola — приложение для ведения заметок на базе искусственного интеллекта, оцениваемое в 250 миллионов долларов, — завоевало популярность среди основателей технологических компаний и венчурных инвесторов. Однако один из разработчиков увидел спрос на более конфиденциальную, полностью локальную альтернативу, доступную за единовременную плату без подписки. Эта идея привела к созданию нового приложения для Mac под названием Talat.
Ник Пейн, самопровозглашенный компьютерный гик из Йоркшира, Англия, говорит, что идея локального приложения для ведения заметок на базе ИИ возникла в основном благодаря ряду счастливых случайностей.
«Я считаю, что Granola — потрясающее приложение; это яркий пример того, чего можно достичь с помощью приложения Electron, если уделить ему достаточно внимания и заботы», — сказал он TechCrunch. «Когда я впервые попробовал его, я был очарован тем, как ему удалось записывать системный звук на моем Mac без записи видео, что в то время было стандартным обходным решением. Это дало толчок к многочисленным исследованиям, которые привели меня к открытию относительно нового и плохо документированного API Apple».
Чтобы упростить работу с этим API (Core Audio Taps, который позволяет разработчикам подключаться к аудиопотокам Mac), Пейн решил создать аудиобиблиотеку с открытым исходным кодом под названием AudioTee.
«В то время я постепенно собирал набор инструментов, но так и не нашел ничего, что могло бы стать самостоятельным продуктом, а не просто крутой технической демонстрацией», — сказал Пейн. «Современные хостируемые модели транскрипции — те же самые, что используют такие приложения, как Granola, — просто невероятны, и это по-настоящему круто — видеть, как твоя речь разворачивается на экране практически в реальном времени. Но меня всегда беспокоило, что в качестве компромисса я должен был предоставлять не просто свои данные, а свои аудиоданные — свой настоящий голос», — добавил он.
Затем он наткнулся на набор программных инструментов под названием FluidAudio — фреймворк на Swift, который обеспечивает полностью локальный ИИ для обработки аудио с низкой задержкой на устройствах Apple. Он позволяет небольшим и быстрым моделям транскрипции работать непосредственно на Neural Engine Mac — специальном аппаратном обеспечении Apple для обработки данных с помощью ИИ.
Именно это помогло Пейну понять, что он может превратить свои исследования в реальный продукт — такой, при котором ваши аудиозаписи никогда не покидают ваш Mac, а транскрипты не хранятся на серверах другой компании.
Talat, созданный совместно с давним другом и бывшим коллегой Пейна Майком Франклином, является результатом интереса Пейна к аудиосфере. В результате получилось приложение размером 20 МБ с одноразовой покупкой, не требующее учетной записи и не передающее аналитические данные разработчикам. Также нет никаких постоянных сборов.
Хотя некоторые приложения для создания заметок с помощью ИИ могут предлагать больше наворотов, Talat предоставляет оптимизированный набор функций. Оно захватывает аудио с микрофона вашего компьютера во время встреч в таких приложениях, как Zoom, Teams, Meet и других, и транскрибирует его в режиме реального времени. Приложение пытается определить говорящих в режиме реального времени, но вы можете переназначить их по мере необходимости. Вы также можете делать заметки, а также редактировать, удалять или разделять фрагменты транскрипта. По окончании встречи локальный LLM генерирует резюме с ключевыми моментами, решениями и задачами.
Заметки, транскрипты и резюме доступны для поиска в Talat.
Помимо аспекта конфиденциальности, Пейн сказал, что цель состоит в том, чтобы предоставить пользователям больше гибкости.
«Мы делаем ставку на настраиваемость и позволяем пользователям контролировать, куда попадают их данные: выбирать собственный LLM, автоматический экспорт в [приложение для ведения заметок] Obsidian, веб-хуки, которые отправляют данные по окончании встречи, сервер MCP», который представляет собой стандартизированный способ подключения инструментов ИИ к внешним источникам данных, «для извлечения данных по запросу», — пояснил он.
«На самом деле ИИ представляет собой смесь — «в основном сшитую и абстрагированную за счет FluidAudio», — отметил Пейн, отметив, что FluidAudio выполняет большую часть тяжелой работы. Что касается функции создания резюме, по умолчанию приложение использует модель ИИ под названием Qwen3-4B-4bit, которая может работать на довольно скромном оборудовании.
Однако пользователи могут переключиться на любого поставщика облачных LLM по своему выбору, выбрать один из двух вариантов Parakeet — моделей распознавания речи, разработанных Nvidia, — или настроить приложение на работу с Ollama (инструментом для локального запуска моделей ИИ), что даст им больше контроля над пользовательским опытом. Со временем Talat добавит поддержку большего количества встроенных вариантов и интегрируется с другими приложениями, такими как Google Calendar и Notion.
На момент запуска пользователи с компьютерами Mac серии M (те, на которых установлены собственные процессоры Apple, начиная с M1) могут скачать приложение и опробовать его бесплатно с 10 часами записи, прежде чем принять решение о покупке.
Talat доступен по цене 49 долларов в этой предрелизной версии, которая все еще находится в стадии активной разработки.
Когда приложение выйдет в версии 1.0, цена увеличится до 99 долларов.
Пейн и Франклин самостоятельно финансируют разработку Talat и планируют и в дальнейшем сохранить модель одноразовой покупки основного продукта.
BuzzFeed представляет приложения с искусственным интеллектом для создания контента, призванные принести новые доходы
BuzzFeed, американская медиакомпания, известная своими викторинами, списками и небольшим журналистским подразделением, удостоенным Пулитцеровской премии, переориентируется на эпоху искусственного инте
Исследования показывают: приложения на основе искусственного интеллекта приносят доход, но сталкиваются с трудностями при удержании пользователей
С учетом того что магазины приложений переполнены приложениями, основанными на технологиях искусственного интеллекта, многие разработчики считают, что интеграция этой технологии является ключом к получению прибыли. Однако новое исследование, анализир
DeepL, известная своими услугами по переводу текстов, теперь занимается переводом речи
DeepL, компания-переводчик, наиболее известная своими инструментами для перевода текстов, сегодня представила набор решений для перевода «голос-голос», предназначенный для таких сценариев, как встречи











