タラットのAI会議メモは、クラウドではなく、お使いのデバイスに保存されます

評価額2億5000万ドルに達するAI搭載ノートアプリ「Granola」は、テック系スタートアップの創業者やベンチャーキャピタリストの間で人気を集めている。しかし、ある開発者は、サブスクリプション制ではなく、一度きりの料金で利用でき、よりプライバシーが守られ、完全にローカルで動作する代替アプリへの需要を見出していた。そのビジョンから生まれたのが、新しいMacアプリ「Talat」だ。
イングランドのヨークシャーを拠点とする、自らを「コンピュータオタク」と称するニック・ペイン氏は、ローカルAIノートアプリというアイデアは、主に一連の幸運な偶然から生まれたと語る。
「Granolaは素晴らしいと思います。十分な愛情と手間をかければ、Electronアプリで何が実現できるかを示す輝かしい好例です」と彼はTechCrunchに語った。 「初めて試した時、当時の標準的な回避策だった動画の録画を伴わずに、Macのシステムオーディオを録音できる仕組みに魅了されました。それがきっかけで多くの調査を行い、比較的新しく、ドキュメントも不十分なAppleのAPIを発見することになりました」
そのAPI(開発者がMacのオーディオストリームにアクセスできる「Core Audio Taps」)の扱いを容易にするため、ペイン氏は「AudioTee」というオープンソースのオーディオライブラリを作成することを決めた。
「その頃、私は少しずつツールキットを組み立てていましたが、単なるクールな技術デモではなく、製品として自立できると感じられるものは見つかりませんでした」とペインは語った。 「最先端のホスト型文字起こしモデル(Granola などのアプリが利用しているものと同じプロバイダ)は素晴らしく、自分の話し言葉がほぼリアルタイムで画面上に展開されるのを見るのは、本能的にクールな体験です。 しかし、その代償として、単なるデータだけでなく、音声データ、つまり自分の実際の声を提供しなければならないという点が、常に気にかかっていました」と彼は付け加えた。
その後、彼は「FluidAudio」というソフトウェアツールキットに出会った。これは、Appleデバイス上で完全にローカルかつ低遅延の音声AI処理を可能にするSwiftフレームワークだ。これにより、小型で高速な文字起こしモデルを、MacのNeural Engine(AppleがAI処理用に搭載した専用ハードウェア)上で直接実行できるようになる。
この発見こそが、ペインに自身の研究を実際の製品へと転換できると確信させたきっかけでした。その製品では、音声データがMacの外に出ることはなく、文字起こし結果も他社のサーバーに保存されることはありません。
ペイン氏の長年の友人であり元同僚のマイク・フランクリン氏と共に開発された「Talat」は、ペイン氏の音声分野への関心から生まれた成果だ。その結果、ダウンロードサイズは20MBで、購入は1回限り、アカウント登録は不要、開発者への分析データの共有もない。継続的な利用料も発生しない。
他のAIノートテイカーにはより多くの機能があるかもしれませんが、Talatは機能を一本化しています。Zoom、Teams、Meetなどのアプリでの会議中に、コンピューターのマイクから音声をキャプチャし、リアルタイムで文字起こしを行います。アプリはリアルタイムで話者を割り当てようとしますが、必要に応じて手動で割り当て直すことも可能です。 手書きメモの追加や、文字起こしセグメントの編集・削除・分割も可能です。会議終了時には、ローカルLLMが要点、決定事項、アクションアイテムを含む要約を生成します。
メモ、文字起こし、要約はすべてTalat内で検索可能です。
プライバシーの観点に加え、ペイン氏は、ユーザーにより多くの柔軟性を提供することが目標であると述べました。
「私たちは設定の自由度を重視しており、ユーザーがデータの行き先を制御できるようにしています。独自のLLMを選択したり、 [メモアプリ] Obsidianへの自動エクスポート、会議終了時にデータを送信するWebhook、MCPサーバー(AIツールが外部データソースに接続するための標準化された方法)への接続など、ユーザーがデータをオンデマンドで取得できるようにしています」と彼は説明しました。
内部の仕組みとしては、AIは複数の要素が混在している。「大部分はFluidAudioの背後で統合・抽象化されている」とペイン氏は指摘し、重労働の多くをFluidAudioが担っていることを評価した。 要約機能については、このアプリはデフォルトでQwen3-4B-4bitというAIモデルを使用しており、比較的低スペックのハードウェアでも動作する。
ただし、ユーザーは任意のクラウドLLMプロバイダーに切り替えたり、Nvidiaが開発した音声認識モデルである2つのParakeetバリエーションから選択したり、Ollama(AIモデルをローカルで実行するためのツール)を指定したりすることができ、これにより体験をより細かく制御できるようになります。 将来的には、Talatはより多くの組み込みオプションのサポートを追加し、GoogleカレンダーやNotionなどの他のアプリとの連携も行う予定です。
リリース当初は、MシリーズMac(M1以降のApple製プロセッサを搭載したモデル)のユーザーがアプリをダウンロードし、購入を決める前に10時間分の録音機能を含む無料トライアルを利用できます。
Talatは現在、まだ活発に開発中のプレリリース版として49ドルで提供されています。
アプリがバージョン1.0にリリースされた際、価格は99ドルに引き上げられます。
Payne氏とFranklin氏はTalatを自己資金で運営しており、今後もコア製品を「一度購入すればそれきり」のモデルとして維持する計画です。
関連記事
BuzzFeed、新たな収益源となるAIコンテンツアプリを発表
クイズやリスト記事、そして短期間ながらピューリッツァー賞を受賞したジャーナリズム部門で知られる米メディア企業BuzzFeedは、AI時代に向けて事業の方向性を転換している。少なくとも、表向きの説明はそうである。オースティンで開催されたSXSWカンファレンスで、BuzzFeedの共同創業者兼CEOであるジョナ・ペレッティ氏は、同社の最新のメディア事業として「Branch Office」というスピン
AIアプリは収益を生み出しているが、ユーザーの維持には課題がある、とデータが示している
アプリストアにはAIを活用したアプリが溢れており、多くの開発者は人工知能の統合こそが収益性を高める鍵だと考えています。しかし、iOS、Android、ウェブ全体でのサブスクリプションアプリの現状を調査した新たな研究により、この一般的な見解に疑問が投げかけられています。75,000人以上のアプリ開発者にサービスを提供するサブスクリプション管理プラットフォームであるRevenueCatが2026年に発表した「サブスクリプションアプリの現状報告」によると、AIの統合だけではユーザーの長期的なロイヤルテ
テキスト翻訳で知られるDeepLが、今度は音声翻訳に注力している
テキスト翻訳ツールで知られる翻訳企業DeepLは本日、カスタムアプリケーションを通じて、会議やモバイル・ウェブ上の会話、現場担当者のグループディスカッションといった場面に対応する音声翻訳スイートをリリースした。 また同社は、外部の開発者や企業がコールセンターなどの特定のユースケースに合わせてDeepLの技術を応用できるようにするAPIも導入した。「長年にわたりテキスト翻訳に注力してきた私たちにとっ
関連特集おすすめ
コメント (0)
0/500

評価額2億5000万ドルに達するAI搭載ノートアプリ「Granola」は、テック系スタートアップの創業者やベンチャーキャピタリストの間で人気を集めている。しかし、ある開発者は、サブスクリプション制ではなく、一度きりの料金で利用でき、よりプライバシーが守られ、完全にローカルで動作する代替アプリへの需要を見出していた。そのビジョンから生まれたのが、新しいMacアプリ「Talat」だ。
イングランドのヨークシャーを拠点とする、自らを「コンピュータオタク」と称するニック・ペイン氏は、ローカルAIノートアプリというアイデアは、主に一連の幸運な偶然から生まれたと語る。
「Granolaは素晴らしいと思います。十分な愛情と手間をかければ、Electronアプリで何が実現できるかを示す輝かしい好例です」と彼はTechCrunchに語った。 「初めて試した時、当時の標準的な回避策だった動画の録画を伴わずに、Macのシステムオーディオを録音できる仕組みに魅了されました。それがきっかけで多くの調査を行い、比較的新しく、ドキュメントも不十分なAppleのAPIを発見することになりました」
そのAPI(開発者がMacのオーディオストリームにアクセスできる「Core Audio Taps」)の扱いを容易にするため、ペイン氏は「AudioTee」というオープンソースのオーディオライブラリを作成することを決めた。
「その頃、私は少しずつツールキットを組み立てていましたが、単なるクールな技術デモではなく、製品として自立できると感じられるものは見つかりませんでした」とペインは語った。 「最先端のホスト型文字起こしモデル(Granola などのアプリが利用しているものと同じプロバイダ)は素晴らしく、自分の話し言葉がほぼリアルタイムで画面上に展開されるのを見るのは、本能的にクールな体験です。 しかし、その代償として、単なるデータだけでなく、音声データ、つまり自分の実際の声を提供しなければならないという点が、常に気にかかっていました」と彼は付け加えた。
その後、彼は「FluidAudio」というソフトウェアツールキットに出会った。これは、Appleデバイス上で完全にローカルかつ低遅延の音声AI処理を可能にするSwiftフレームワークだ。これにより、小型で高速な文字起こしモデルを、MacのNeural Engine(AppleがAI処理用に搭載した専用ハードウェア)上で直接実行できるようになる。
この発見こそが、ペインに自身の研究を実際の製品へと転換できると確信させたきっかけでした。その製品では、音声データがMacの外に出ることはなく、文字起こし結果も他社のサーバーに保存されることはありません。
ペイン氏の長年の友人であり元同僚のマイク・フランクリン氏と共に開発された「Talat」は、ペイン氏の音声分野への関心から生まれた成果だ。その結果、ダウンロードサイズは20MBで、購入は1回限り、アカウント登録は不要、開発者への分析データの共有もない。継続的な利用料も発生しない。
他のAIノートテイカーにはより多くの機能があるかもしれませんが、Talatは機能を一本化しています。Zoom、Teams、Meetなどのアプリでの会議中に、コンピューターのマイクから音声をキャプチャし、リアルタイムで文字起こしを行います。アプリはリアルタイムで話者を割り当てようとしますが、必要に応じて手動で割り当て直すことも可能です。 手書きメモの追加や、文字起こしセグメントの編集・削除・分割も可能です。会議終了時には、ローカルLLMが要点、決定事項、アクションアイテムを含む要約を生成します。
メモ、文字起こし、要約はすべてTalat内で検索可能です。
プライバシーの観点に加え、ペイン氏は、ユーザーにより多くの柔軟性を提供することが目標であると述べました。
「私たちは設定の自由度を重視しており、ユーザーがデータの行き先を制御できるようにしています。独自のLLMを選択したり、 [メモアプリ] Obsidianへの自動エクスポート、会議終了時にデータを送信するWebhook、MCPサーバー(AIツールが外部データソースに接続するための標準化された方法)への接続など、ユーザーがデータをオンデマンドで取得できるようにしています」と彼は説明しました。
内部の仕組みとしては、AIは複数の要素が混在している。「大部分はFluidAudioの背後で統合・抽象化されている」とペイン氏は指摘し、重労働の多くをFluidAudioが担っていることを評価した。 要約機能については、このアプリはデフォルトでQwen3-4B-4bitというAIモデルを使用しており、比較的低スペックのハードウェアでも動作する。
ただし、ユーザーは任意のクラウドLLMプロバイダーに切り替えたり、Nvidiaが開発した音声認識モデルである2つのParakeetバリエーションから選択したり、Ollama(AIモデルをローカルで実行するためのツール)を指定したりすることができ、これにより体験をより細かく制御できるようになります。 将来的には、Talatはより多くの組み込みオプションのサポートを追加し、GoogleカレンダーやNotionなどの他のアプリとの連携も行う予定です。
リリース当初は、MシリーズMac(M1以降のApple製プロセッサを搭載したモデル)のユーザーがアプリをダウンロードし、購入を決める前に10時間分の録音機能を含む無料トライアルを利用できます。
Talatは現在、まだ活発に開発中のプレリリース版として49ドルで提供されています。
アプリがバージョン1.0にリリースされた際、価格は99ドルに引き上げられます。
Payne氏とFranklin氏はTalatを自己資金で運営しており、今後もコア製品を「一度購入すればそれきり」のモデルとして維持する計画です。
BuzzFeed、新たな収益源となるAIコンテンツアプリを発表
クイズやリスト記事、そして短期間ながらピューリッツァー賞を受賞したジャーナリズム部門で知られる米メディア企業BuzzFeedは、AI時代に向けて事業の方向性を転換している。少なくとも、表向きの説明はそうである。オースティンで開催されたSXSWカンファレンスで、BuzzFeedの共同創業者兼CEOであるジョナ・ペレッティ氏は、同社の最新のメディア事業として「Branch Office」というスピン
AIアプリは収益を生み出しているが、ユーザーの維持には課題がある、とデータが示している
アプリストアにはAIを活用したアプリが溢れており、多くの開発者は人工知能の統合こそが収益性を高める鍵だと考えています。しかし、iOS、Android、ウェブ全体でのサブスクリプションアプリの現状を調査した新たな研究により、この一般的な見解に疑問が投げかけられています。75,000人以上のアプリ開発者にサービスを提供するサブスクリプション管理プラットフォームであるRevenueCatが2026年に発表した「サブスクリプションアプリの現状報告」によると、AIの統合だけではユーザーの長期的なロイヤルテ
テキスト翻訳で知られるDeepLが、今度は音声翻訳に注力している
テキスト翻訳ツールで知られる翻訳企業DeepLは本日、カスタムアプリケーションを通じて、会議やモバイル・ウェブ上の会話、現場担当者のグループディスカッションといった場面に対応する音声翻訳スイートをリリースした。 また同社は、外部の開発者や企業がコールセンターなどの特定のユースケースに合わせてDeepLの技術を応用できるようにするAPIも導入した。「長年にわたりテキスト翻訳に注力してきた私たちにとっ





家






