Talat 的人工智慧會議筆記儲存在您的裝置上,而非雲端

估值達 2.5 億美元的人工智慧筆記應用程式 Granola,已在科技創辦人和風險投資人之間引起熱烈迴響。但有位開發者認為,市場需要一款更注重隱私、完全在本地運行的替代方案,且僅需支付一次費用,無需訂閱。這項願景催生了一款名為 Talat 的新 Mac 應用程式。
來自英國約克郡、自稱電腦宅男的尼克·佩恩(Nick Payne)表示,開發這款本地化 AI 筆記應用程式的靈感,很大程度上源自一連串幸運的巧合。
「我認為 Granola 非常出色;它充分展現了當你對 Electron 應用程式傾注足夠的熱忱與用心時,所能達成的成就,」他向 TechCrunch 表示。 「初次試用時,我對它能在不錄製影片的情況下,成功錄製 Mac 系統音訊感到著迷——這在當時是標準的解決方案。這引發了一連串的研究,最終讓我發現了一個相對較新且文檔匱乏的 Apple API。」
為了讓開發者更輕鬆地使用該 API(Core Audio Taps,可讓開發者截取 Mac 的音訊串流),Payne 決定建立一個名為 AudioTee 的開源音訊函式庫。
「那段時間,我雖然慢慢組建了一個工具包,但始終找不到任何能讓我覺得它能獨立成為一款產品,而非僅僅是個酷炫技術展示的東西,」Payne 說道。 「最先進的託管轉錄模型——也就是 Granola 等應用程式所使用的服務供應商——非常出色,看到自己的語音幾乎在即時狀態下呈現在螢幕上,那種感覺真的很酷。 但他補充道:「但一直困擾我的是,這種取捨意味著不僅要提供我的資料,還要提供我的音訊資料;也就是我真實的聲音。」
後來,他偶然發現了一個名為 FluidAudio 的軟體工具包,這是一個 Swift 框架,能在 Apple 裝置上實現完全本地化、低延遲的音訊 AI 處理。它讓小型、快速的轉錄模型能直接在 Mac 的 Neural Engine(Apple 專用於 AI 處理的硬體)上運行。
正是這個關鍵,讓佩恩意識到他能將研究轉化為實際產品——一款讓您的音訊永遠不離開 Mac,且文字記錄不會儲存於其他公司伺服器的產品。
Payne 與其老友兼前同事 Mike Franklin 共同開發的 Talat,正是他對音訊領域興趣的結晶。這款產品僅需下載 20MB 檔案,採一次性購買模式,無需註冊帳號,也不會將分析數據回傳給開發者。此外,亦無任何持續性費用。
雖然某些 AI 筆記工具可能提供更多花俏功能,但 Talat 提供了一套精簡的功能。它能在 Zoom、Teams、Meet 等應用程式進行會議時,透過電腦麥克風擷取音訊並即時轉錄。該應用程式會嘗試即時識別發言者,但您可根據需要重新指派發言者。 您亦可手動記錄筆記,並編輯、刪除或分割文字記錄片段。會議結束後,內建的本地大型語言模型(LLM)會自動生成摘要,涵蓋重點、決議事項及待辦事項。
所有筆記、文字記錄及摘要皆可在 Talat 內進行搜尋。
除了隱私考量外,Payne 表示,目標是賦予使用者更多彈性。
「我們著重於可配置性,讓使用者掌控資料流向:選擇自己的大型語言模型、自動匯出至 [筆記應用程式] Obsidian、會議結束時推送資料的 webhooks,或是 MCP 伺服器(這是一種讓 AI 工具連接外部資料來源的標準化方式),以便按需提取資料,」他解釋道。
在技術層面上,這套 AI 系統是多種技術的混合體——「主要是在 FluidAudio 的後台進行整合與抽象化處理,」Payne 指出,並將許多繁重的工作歸功於 FluidAudio。 在摘要功能方面,該應用程式預設採用名為 Qwen3-4B-4bit 的 AI 模型,該模型可在硬體配置相對低階的裝置上運行。
不過,使用者可選擇切換至任何偏好的雲端大型語言模型(LLM)供應商,或在兩種 Parakeet 變體(由 Nvidia 開發的語音辨識模型)之間進行選擇,亦可指向 Ollama(一款用於本地執行 AI 模型的工具),從而對使用體驗擁有更多掌控權。 未來,Talat 將新增更多內建選項,並與其他應用程式(如 Google 日曆和 Notion)整合。
在推出之初,擁有 M 系列 Mac 電腦(即搭載 Apple 自家處理器,從 M1 開始的機型)的用戶可以下載該應用程式,並在決定購買前免費試用 10 小時的錄音功能。
目前 Talat 處於預發布階段,仍在積極開發中,售價為 49 美元。
待應用程式正式發布 1.0 版本時,價格將調升至 99 美元。
Payne 與 Franklin 正以自籌資金方式開發 Talat,並計畫未來將核心產品維持為一次性購買模式。
相關文章
BuzzFeed 推出 AI 內容應用程式以開拓新收入來源
總部位於美國的媒體公司 BuzzFeed,以測驗、清單式文章以及曾短暫擁有普立茲獎得主的新聞部門而聞名,如今正為迎接人工智慧時代而重新定位。至少,這便是官方的說法。在奧斯汀舉行的SXSW大會上,BuzzFeed共同創辦人兼執行長喬納·佩雷蒂(Jonah Peretti)揭曉了該公司的最新媒體計畫:一個名為「Branch Office」的衍生公司,專注於在旨在促進創意與連結的消費型應用程式中運用人
資料顯示,AI應用程式能夠創造收入,但在使用者留存方面卻面臨挑戰。
隨著應用商店中充斥著各種基於人工智慧的應用程式,許多開發者認為,整合人工智慧是實現盈利的關鍵。然而,一項針對iOS、Android和網頁平臺上的訂閱應用進行的研究卻對這一普遍觀點提出了質疑。作為服務於超過75,000名應用開發者的訂閱管理平臺,RevenueCat在2026年釋出的《訂閱應用現狀報告》中指出,人工智慧的整合並不能確保使用者長期保持忠誠度。事實上,資料表明,這些基於人工智慧的應用在留住訂閱使用者方面面臨著更大的挑戰。這類應用的年平均流失率比非人工智慧應用高出30%。該報告的結論是基
百度健康內部測試 AI 醫生助理「DoctorClaw」,短期內將用於學術資料檢索與辦公室輔助
據報導,百度健康已開始對一款專為醫師設計的專業 AI 智慧助理進行內部測試。這款內部代號為「DoctorClaw」(龍蝦醫生版)的產品,標誌著百度在醫療領域部署大型語言模型方面邁出了重要一步。知情人士透露,該專案目前仍處於封閉開發階段,現已進入內部測試。雖然具體產品形式尚未完全公開,但已接近推出。 就功能而言,DoctorClaw 初期將聚焦於學術文獻檢索與常規診間輔助。然而,其長期戰略旨在深度融
相關專題推薦
評論 (0)
0/500

估值達 2.5 億美元的人工智慧筆記應用程式 Granola,已在科技創辦人和風險投資人之間引起熱烈迴響。但有位開發者認為,市場需要一款更注重隱私、完全在本地運行的替代方案,且僅需支付一次費用,無需訂閱。這項願景催生了一款名為 Talat 的新 Mac 應用程式。
來自英國約克郡、自稱電腦宅男的尼克·佩恩(Nick Payne)表示,開發這款本地化 AI 筆記應用程式的靈感,很大程度上源自一連串幸運的巧合。
「我認為 Granola 非常出色;它充分展現了當你對 Electron 應用程式傾注足夠的熱忱與用心時,所能達成的成就,」他向 TechCrunch 表示。 「初次試用時,我對它能在不錄製影片的情況下,成功錄製 Mac 系統音訊感到著迷——這在當時是標準的解決方案。這引發了一連串的研究,最終讓我發現了一個相對較新且文檔匱乏的 Apple API。」
為了讓開發者更輕鬆地使用該 API(Core Audio Taps,可讓開發者截取 Mac 的音訊串流),Payne 決定建立一個名為 AudioTee 的開源音訊函式庫。
「那段時間,我雖然慢慢組建了一個工具包,但始終找不到任何能讓我覺得它能獨立成為一款產品,而非僅僅是個酷炫技術展示的東西,」Payne 說道。 「最先進的託管轉錄模型——也就是 Granola 等應用程式所使用的服務供應商——非常出色,看到自己的語音幾乎在即時狀態下呈現在螢幕上,那種感覺真的很酷。 但他補充道:「但一直困擾我的是,這種取捨意味著不僅要提供我的資料,還要提供我的音訊資料;也就是我真實的聲音。」
後來,他偶然發現了一個名為 FluidAudio 的軟體工具包,這是一個 Swift 框架,能在 Apple 裝置上實現完全本地化、低延遲的音訊 AI 處理。它讓小型、快速的轉錄模型能直接在 Mac 的 Neural Engine(Apple 專用於 AI 處理的硬體)上運行。
正是這個關鍵,讓佩恩意識到他能將研究轉化為實際產品——一款讓您的音訊永遠不離開 Mac,且文字記錄不會儲存於其他公司伺服器的產品。
Payne 與其老友兼前同事 Mike Franklin 共同開發的 Talat,正是他對音訊領域興趣的結晶。這款產品僅需下載 20MB 檔案,採一次性購買模式,無需註冊帳號,也不會將分析數據回傳給開發者。此外,亦無任何持續性費用。
雖然某些 AI 筆記工具可能提供更多花俏功能,但 Talat 提供了一套精簡的功能。它能在 Zoom、Teams、Meet 等應用程式進行會議時,透過電腦麥克風擷取音訊並即時轉錄。該應用程式會嘗試即時識別發言者,但您可根據需要重新指派發言者。 您亦可手動記錄筆記,並編輯、刪除或分割文字記錄片段。會議結束後,內建的本地大型語言模型(LLM)會自動生成摘要,涵蓋重點、決議事項及待辦事項。
所有筆記、文字記錄及摘要皆可在 Talat 內進行搜尋。
除了隱私考量外,Payne 表示,目標是賦予使用者更多彈性。
「我們著重於可配置性,讓使用者掌控資料流向:選擇自己的大型語言模型、自動匯出至 [筆記應用程式] Obsidian、會議結束時推送資料的 webhooks,或是 MCP 伺服器(這是一種讓 AI 工具連接外部資料來源的標準化方式),以便按需提取資料,」他解釋道。
在技術層面上,這套 AI 系統是多種技術的混合體——「主要是在 FluidAudio 的後台進行整合與抽象化處理,」Payne 指出,並將許多繁重的工作歸功於 FluidAudio。 在摘要功能方面,該應用程式預設採用名為 Qwen3-4B-4bit 的 AI 模型,該模型可在硬體配置相對低階的裝置上運行。
不過,使用者可選擇切換至任何偏好的雲端大型語言模型(LLM)供應商,或在兩種 Parakeet 變體(由 Nvidia 開發的語音辨識模型)之間進行選擇,亦可指向 Ollama(一款用於本地執行 AI 模型的工具),從而對使用體驗擁有更多掌控權。 未來,Talat 將新增更多內建選項,並與其他應用程式(如 Google 日曆和 Notion)整合。
在推出之初,擁有 M 系列 Mac 電腦(即搭載 Apple 自家處理器,從 M1 開始的機型)的用戶可以下載該應用程式,並在決定購買前免費試用 10 小時的錄音功能。
目前 Talat 處於預發布階段,仍在積極開發中,售價為 49 美元。
待應用程式正式發布 1.0 版本時,價格將調升至 99 美元。
Payne 與 Franklin 正以自籌資金方式開發 Talat,並計畫未來將核心產品維持為一次性購買模式。
BuzzFeed 推出 AI 內容應用程式以開拓新收入來源
總部位於美國的媒體公司 BuzzFeed,以測驗、清單式文章以及曾短暫擁有普立茲獎得主的新聞部門而聞名,如今正為迎接人工智慧時代而重新定位。至少,這便是官方的說法。在奧斯汀舉行的SXSW大會上,BuzzFeed共同創辦人兼執行長喬納·佩雷蒂(Jonah Peretti)揭曉了該公司的最新媒體計畫:一個名為「Branch Office」的衍生公司,專注於在旨在促進創意與連結的消費型應用程式中運用人
資料顯示,AI應用程式能夠創造收入,但在使用者留存方面卻面臨挑戰。
隨著應用商店中充斥著各種基於人工智慧的應用程式,許多開發者認為,整合人工智慧是實現盈利的關鍵。然而,一項針對iOS、Android和網頁平臺上的訂閱應用進行的研究卻對這一普遍觀點提出了質疑。作為服務於超過75,000名應用開發者的訂閱管理平臺,RevenueCat在2026年釋出的《訂閱應用現狀報告》中指出,人工智慧的整合並不能確保使用者長期保持忠誠度。事實上,資料表明,這些基於人工智慧的應用在留住訂閱使用者方面面臨著更大的挑戰。這類應用的年平均流失率比非人工智慧應用高出30%。該報告的結論是基
百度健康內部測試 AI 醫生助理「DoctorClaw」,短期內將用於學術資料檢索與辦公室輔助
據報導,百度健康已開始對一款專為醫師設計的專業 AI 智慧助理進行內部測試。這款內部代號為「DoctorClaw」(龍蝦醫生版)的產品,標誌著百度在醫療領域部署大型語言模型方面邁出了重要一步。知情人士透露,該專案目前仍處於封閉開發階段,現已進入內部測試。雖然具體產品形式尚未完全公開,但已接近推出。 就功能而言,DoctorClaw 初期將聚焦於學術文獻檢索與常規診間輔助。然而,其長期戰略旨在深度融





首頁






