탈라트의 AI 회의록은 클라우드가 아닌 사용자의 기기에 저장됩니다

2억 5천만 달러의 가치를 인정받은 AI 기반 필기 앱 ‘그라놀라(Granola)’는 기술 창업자들과 벤처 투자자들 사이에서 큰 주목을 받고 있다. 하지만 한 개발자는 구독료 없이 일회성 결제만으로 이용할 수 있는, 더 높은 프라이버시를 보장하는 완전한 로컬형 대안에 대한 수요가 있다고 판단했다. 이러한 비전이 새로운 맥 앱 ‘탈라트(Talat)’의 탄생으로 이어졌다.
영국 요크셔에 거주하며 스스로를 '컴퓨터 괴짜'라고 칭하는 닉 페인(Nick Payne)은 로컬 AI 메모 앱에 대한 아이디어가 주로 일련의 우연한 기회들에서 비롯되었다고 말한다.
그는 테크크런치(TechCrunch)와의 인터뷰에서 “그라놀라는 정말 대단한 앱이라고 생각합니다. 충분한 애정과 정성을 쏟으면 일렉트론(Electron) 앱으로 무엇을 이룰 수 있는지 보여주는 빛나는 사례죠”라고 말했다. “처음 사용해 봤을 때, 당시 일반적인 해결책이었던 영상 녹화 없이도 맥의 시스템 오디오만 녹음할 수 있다는 점에 매료되었습니다. 그 경험은 수많은 연구로 이어졌고, 결국 비교적 새롭고 문서화가 부족한 애플 API를 발견하게 되었습니다.”
해당 API(개발자가 맥의 오디오 스트림에 접근할 수 있게 해주는 ‘코어 오디오 탭스(Core Audio Taps)’)를 더 쉽게 활용할 수 있도록 하기 위해, 페인은 ‘오디오티(AudioTee)’라는 오픈소스 오디오 라이브러리를 만들기로 결정했다.
“그 당시 저는 서서히 툴킷을 구성해 나가고 있었지만, 단순한 멋진 기술 시연이 아니라 그 자체로 하나의 제품으로 자리 잡을 수 있을 것 같은 것은 찾지 못했습니다.”라고 페인은 말했습니다. "최첨단 호스팅 트랜스크립션 모델(Granola와 같은 앱에서 사용하는 것과 동일한 제공업체)은 정말 놀랍고, 자신의 말이 거의 실시간으로 화면에 펼쳐지는 것을 보는 것은 정말 짜릿한 경험입니다. 하지만 그 대가로 제 데이터뿐만 아니라 오디오 데이터, 즉 제 실제 목소리까지 제공해야 한다는 점이 항상 마음에 걸렸습니다.”라고 그는 덧붙였습니다.
그러던 중 그는 FluidAudio라는 소프트웨어 툴킷을 우연히 발견했는데, 이는 애플 기기에서 완전히 로컬 기반의 저지연 오디오 AI를 가능하게 하는 Swift 프레임워크입니다. 이 툴킷을 사용하면 작고 빠른 트랜스크립션 모델을 애플의 AI 처리 전용 하드웨어인 Mac의 Neural Engine에서 직접 실행할 수 있습니다.
바로 이 점이 페인이 자신의 연구를 실제 제품으로 만들 수 있다는 것을 깨닫게 한 계기였습니다. 이 제품에서는 사용자의 오디오가 맥을 벗어나지 않으며, 텍스트 변환 결과물도 타사 서버에 저장되지 않습니다.
페이너의 오랜 친구이자 전 동료인 마이크 프랭클린과 함께 개발한 ‘탈라트(Talat)’는 페이너의 오디오 분야에 대한 관심에서 탄생한 결과물이다. 이 앱은 20MB 크기로, 일회성 구매 방식이며 별도의 계정이 필요 없고, 분석 데이터가 개발자에게 공유되지 않는다. 지속적인 이용료도 없다.
일부 AI 노트 작성 앱이 더 많은 부가 기능을 제공할 수 있지만, 탈랏은 간결한 기능 세트를 제공합니다. 이 앱은 줌(Zoom), 팀즈(Teams), 미트(Meet) 등의 앱에서 회의 중 컴퓨터 마이크를 통해 오디오를 캡처하여 실시간으로 텍스트로 변환합니다. 앱은 실시간으로 화자를 지정하려고 시도하지만, 필요에 따라 사용자가 직접 재지정할 수도 있습니다. 또한 직접 메모를 작성하거나, 텍스트 세그먼트를 편집, 삭제, 분할할 수 있습니다. 회의가 종료되면 로컬 LLM이 핵심 내용, 결정 사항, 실행 항목을 포함한 요약을 생성합니다.
메모, 녹취록, 요약문은 모두 Talat 내에서 검색이 가능합니다.
개인정보 보호 측면 외에도, 페인은 사용자에게 더 많은 유연성을 제공하는 것이 목표라고 말했습니다.
“우리는 구성 가능성을 강화하고 사용자가 데이터의 이동 경로를 제어할 수 있도록 하고 있습니다. 사용자가 직접 LLM을 선택하고, [메모 앱] Obsidian으로 자동 내보내기, 회의가 끝날 때 데이터를 푸시하는 웹훅, AI 도구가 외부 데이터 소스에 연결하는 표준화된 방식인 MCP 서버를 통해 필요에 따라 데이터를 가져올 수 있도록 하는 것”이라고 그는 설명했습니다.
내부적으로 이 AI는 혼합된 형태입니다. “대부분 FluidAudio 뒤에 통합되고 추상화되어 있습니다.”라고 Payne은 언급하며, FluidAudio가 많은 중책을 수행하고 있다고 평가했습니다. 요약 기능의 경우, 이 앱은 비교적 낮은 사양의 하드웨어에서도 실행 가능한 Qwen3-4B-4bit라는 AI 모델을 기본으로 사용합니다.
그러나 사용자는 원하는 클라우드 LLM 제공업체로 전환하거나, Nvidia가 개발한 두 가지 Parakeet 변형(음성 인식 모델) 중 하나를 선택하거나, Ollama(AI 모델을 로컬에서 실행하는 도구)를 지정하여 사용자 경험을 더 세밀하게 제어할 수 있습니다. 향후 탈라트(Talat)는 더 많은 내장 옵션을 지원하고 구글 캘린더(Google Calendar)나 노션(Notion)과 같은 다른 앱과의 연동 기능을 추가할 예정입니다.
출시 시점에 M 시리즈 Mac 컴퓨터(M1부터 시작하는 Apple 자체 프로세서 탑재 모델) 사용자는 앱을 다운로드하여 구매를 결정하기 전 10시간 분량의 녹음 기능을 무료로 체험해 볼 수 있습니다.
Talat은 현재 활발히 개발 중인 이 프리 릴리스 버전에서 49달러에 이용할 수 있습니다.
앱이 1.0 버전으로 출시되면 가격은 99달러로 인상될 예정입니다.
Payne과 Franklin은 Talat을 자체 자금으로 개발하고 있으며, 앞으로도 핵심 제품을 일회성 구매 방식으로 유지할 계획입니다.
관련 기사
버즈피드, 새로운 수익 창출을 위한 AI 콘텐츠 앱 공개
퀴즈와 리스트형 기사, 그리고 잠시나마 퓰리처상을 수상한 저널리즘 부서로 유명한 미국 미디어 기업 버즈피드(BuzzFeed)가 AI 시대에 대비해 새로운 방향을 모색하고 있다. 적어도 공식적인 입장은 그렇다.오스틴에서 열린 SXSW 컨퍼런스에서 버즈피드의 공동 창립자이자 CEO인 조나 페레티는 회사의 최신 미디어 사업인 '브랜치 오피스(Branch Off
AI 앱들이 수익을 창출하지만 사용자 유지에 어려움을 겪고 있으며, 데이터가 이를 보여줍니다.
앱 스토어에는 인공지능 기반의 애플리케이션이 넘쳐나고 있으며, 많은 개발자들은 인공지능을 통합하는 것이 수익성을 확보하는 데 핵심이라고 믿고 있습니다. 하지만 iOS, Android, 웹 전반에 걸친 구독형 앱의 현황을 조사한 새로운 연구는 이러한 일반적인 가정에 도전합니다.75,000명 이상의 앱 개발자들에게 서비스를 제공하는 구독 관리 플랫폼인 RevenueCat은 2026년 구독형 앱 현황 보고서에서 인공지능의 통합이 장기적인 사용자 충성
텍스트 번역으로 유명한 DeepL이 이제 음성 번역 시장에 진출한다
텍스트 기반 도구로 잘 알려진 번역 기업 DeepL이 오늘, 맞춤형 애플리케이션을 통해 현장 근무자들을 위한 회의, 모바일 및 웹 대화, 그룹 토론 등의 상황을 지원하는 음성-음성 번역 제품군을 출시했습니다. 또한 이 회사는 외부 개발자와 기업들이 콜센터와 같은 맞춤형 사용 사례를 위해 DeepL의 기술을 기반으로 서비스를 구축할 수 있도록 지원하는 API
관련 특별 주제 추천
의견 (0)
0/500

2억 5천만 달러의 가치를 인정받은 AI 기반 필기 앱 ‘그라놀라(Granola)’는 기술 창업자들과 벤처 투자자들 사이에서 큰 주목을 받고 있다. 하지만 한 개발자는 구독료 없이 일회성 결제만으로 이용할 수 있는, 더 높은 프라이버시를 보장하는 완전한 로컬형 대안에 대한 수요가 있다고 판단했다. 이러한 비전이 새로운 맥 앱 ‘탈라트(Talat)’의 탄생으로 이어졌다.
영국 요크셔에 거주하며 스스로를 '컴퓨터 괴짜'라고 칭하는 닉 페인(Nick Payne)은 로컬 AI 메모 앱에 대한 아이디어가 주로 일련의 우연한 기회들에서 비롯되었다고 말한다.
그는 테크크런치(TechCrunch)와의 인터뷰에서 “그라놀라는 정말 대단한 앱이라고 생각합니다. 충분한 애정과 정성을 쏟으면 일렉트론(Electron) 앱으로 무엇을 이룰 수 있는지 보여주는 빛나는 사례죠”라고 말했다. “처음 사용해 봤을 때, 당시 일반적인 해결책이었던 영상 녹화 없이도 맥의 시스템 오디오만 녹음할 수 있다는 점에 매료되었습니다. 그 경험은 수많은 연구로 이어졌고, 결국 비교적 새롭고 문서화가 부족한 애플 API를 발견하게 되었습니다.”
해당 API(개발자가 맥의 오디오 스트림에 접근할 수 있게 해주는 ‘코어 오디오 탭스(Core Audio Taps)’)를 더 쉽게 활용할 수 있도록 하기 위해, 페인은 ‘오디오티(AudioTee)’라는 오픈소스 오디오 라이브러리를 만들기로 결정했다.
“그 당시 저는 서서히 툴킷을 구성해 나가고 있었지만, 단순한 멋진 기술 시연이 아니라 그 자체로 하나의 제품으로 자리 잡을 수 있을 것 같은 것은 찾지 못했습니다.”라고 페인은 말했습니다. "최첨단 호스팅 트랜스크립션 모델(Granola와 같은 앱에서 사용하는 것과 동일한 제공업체)은 정말 놀랍고, 자신의 말이 거의 실시간으로 화면에 펼쳐지는 것을 보는 것은 정말 짜릿한 경험입니다. 하지만 그 대가로 제 데이터뿐만 아니라 오디오 데이터, 즉 제 실제 목소리까지 제공해야 한다는 점이 항상 마음에 걸렸습니다.”라고 그는 덧붙였습니다.
그러던 중 그는 FluidAudio라는 소프트웨어 툴킷을 우연히 발견했는데, 이는 애플 기기에서 완전히 로컬 기반의 저지연 오디오 AI를 가능하게 하는 Swift 프레임워크입니다. 이 툴킷을 사용하면 작고 빠른 트랜스크립션 모델을 애플의 AI 처리 전용 하드웨어인 Mac의 Neural Engine에서 직접 실행할 수 있습니다.
바로 이 점이 페인이 자신의 연구를 실제 제품으로 만들 수 있다는 것을 깨닫게 한 계기였습니다. 이 제품에서는 사용자의 오디오가 맥을 벗어나지 않으며, 텍스트 변환 결과물도 타사 서버에 저장되지 않습니다.
페이너의 오랜 친구이자 전 동료인 마이크 프랭클린과 함께 개발한 ‘탈라트(Talat)’는 페이너의 오디오 분야에 대한 관심에서 탄생한 결과물이다. 이 앱은 20MB 크기로, 일회성 구매 방식이며 별도의 계정이 필요 없고, 분석 데이터가 개발자에게 공유되지 않는다. 지속적인 이용료도 없다.
일부 AI 노트 작성 앱이 더 많은 부가 기능을 제공할 수 있지만, 탈랏은 간결한 기능 세트를 제공합니다. 이 앱은 줌(Zoom), 팀즈(Teams), 미트(Meet) 등의 앱에서 회의 중 컴퓨터 마이크를 통해 오디오를 캡처하여 실시간으로 텍스트로 변환합니다. 앱은 실시간으로 화자를 지정하려고 시도하지만, 필요에 따라 사용자가 직접 재지정할 수도 있습니다. 또한 직접 메모를 작성하거나, 텍스트 세그먼트를 편집, 삭제, 분할할 수 있습니다. 회의가 종료되면 로컬 LLM이 핵심 내용, 결정 사항, 실행 항목을 포함한 요약을 생성합니다.
메모, 녹취록, 요약문은 모두 Talat 내에서 검색이 가능합니다.
개인정보 보호 측면 외에도, 페인은 사용자에게 더 많은 유연성을 제공하는 것이 목표라고 말했습니다.
“우리는 구성 가능성을 강화하고 사용자가 데이터의 이동 경로를 제어할 수 있도록 하고 있습니다. 사용자가 직접 LLM을 선택하고, [메모 앱] Obsidian으로 자동 내보내기, 회의가 끝날 때 데이터를 푸시하는 웹훅, AI 도구가 외부 데이터 소스에 연결하는 표준화된 방식인 MCP 서버를 통해 필요에 따라 데이터를 가져올 수 있도록 하는 것”이라고 그는 설명했습니다.
내부적으로 이 AI는 혼합된 형태입니다. “대부분 FluidAudio 뒤에 통합되고 추상화되어 있습니다.”라고 Payne은 언급하며, FluidAudio가 많은 중책을 수행하고 있다고 평가했습니다. 요약 기능의 경우, 이 앱은 비교적 낮은 사양의 하드웨어에서도 실행 가능한 Qwen3-4B-4bit라는 AI 모델을 기본으로 사용합니다.
그러나 사용자는 원하는 클라우드 LLM 제공업체로 전환하거나, Nvidia가 개발한 두 가지 Parakeet 변형(음성 인식 모델) 중 하나를 선택하거나, Ollama(AI 모델을 로컬에서 실행하는 도구)를 지정하여 사용자 경험을 더 세밀하게 제어할 수 있습니다. 향후 탈라트(Talat)는 더 많은 내장 옵션을 지원하고 구글 캘린더(Google Calendar)나 노션(Notion)과 같은 다른 앱과의 연동 기능을 추가할 예정입니다.
출시 시점에 M 시리즈 Mac 컴퓨터(M1부터 시작하는 Apple 자체 프로세서 탑재 모델) 사용자는 앱을 다운로드하여 구매를 결정하기 전 10시간 분량의 녹음 기능을 무료로 체험해 볼 수 있습니다.
Talat은 현재 활발히 개발 중인 이 프리 릴리스 버전에서 49달러에 이용할 수 있습니다.
앱이 1.0 버전으로 출시되면 가격은 99달러로 인상될 예정입니다.
Payne과 Franklin은 Talat을 자체 자금으로 개발하고 있으며, 앞으로도 핵심 제품을 일회성 구매 방식으로 유지할 계획입니다.
버즈피드, 새로운 수익 창출을 위한 AI 콘텐츠 앱 공개
퀴즈와 리스트형 기사, 그리고 잠시나마 퓰리처상을 수상한 저널리즘 부서로 유명한 미국 미디어 기업 버즈피드(BuzzFeed)가 AI 시대에 대비해 새로운 방향을 모색하고 있다. 적어도 공식적인 입장은 그렇다.오스틴에서 열린 SXSW 컨퍼런스에서 버즈피드의 공동 창립자이자 CEO인 조나 페레티는 회사의 최신 미디어 사업인 '브랜치 오피스(Branch Off
AI 앱들이 수익을 창출하지만 사용자 유지에 어려움을 겪고 있으며, 데이터가 이를 보여줍니다.
앱 스토어에는 인공지능 기반의 애플리케이션이 넘쳐나고 있으며, 많은 개발자들은 인공지능을 통합하는 것이 수익성을 확보하는 데 핵심이라고 믿고 있습니다. 하지만 iOS, Android, 웹 전반에 걸친 구독형 앱의 현황을 조사한 새로운 연구는 이러한 일반적인 가정에 도전합니다.75,000명 이상의 앱 개발자들에게 서비스를 제공하는 구독 관리 플랫폼인 RevenueCat은 2026년 구독형 앱 현황 보고서에서 인공지능의 통합이 장기적인 사용자 충성
텍스트 번역으로 유명한 DeepL이 이제 음성 번역 시장에 진출한다
텍스트 기반 도구로 잘 알려진 번역 기업 DeepL이 오늘, 맞춤형 애플리케이션을 통해 현장 근무자들을 위한 회의, 모바일 및 웹 대화, 그룹 토론 등의 상황을 지원하는 음성-음성 번역 제품군을 출시했습니다. 또한 이 회사는 외부 개발자와 기업들이 콜센터와 같은 맞춤형 사용 사례를 위해 DeepL의 기술을 기반으로 서비스를 구축할 수 있도록 지원하는 API





집






