你大概也經歷過這個瞬間:看到有人對著電腦講話,乾淨的文字就一行行流進畫面,你心動了,跑去官網找下載按鈕——macOS、Windows、iOS……然後沒了。又一個不支援 Linux 的。
Linux 上的語音輸入一直是這樣:商業大作集體缺席,開源世界其實默默變得很能打,只是你得知道去哪找。這篇就是一份 2026 年「在 Linux 上真正裝得起來、用得下去」的誠實地圖。先把話說在前面:Meander 是我們自己的產品。 但開源替代方案我們照樣公平列出——如果免費離線的工具更適合你,你就該用它。
懶人包
- 不想折騰、還想要 AI 幫你順句子: Meander——原生 Linux app,有免費方案。
- 完全離線、免費、開源: Speech Note(Flathub)——最完整的開源選項。
- 喜歡自己改、自己寫腳本: nerd-dictation——一支你完全掌控的 Python 腳本。
- 想從零自己蓋: whisper.cpp——是引擎不是 app,但離線精準度的天花板。
哪些工具在 Linux 上用不了
先講清單上沒有的:大多數知名 AI 聽寫 app 根本不支援 Linux。
- Wispr Flow——macOS、Windows、iOS、Android。沒有 Linux。(我們的比較)
- superwhisper——macOS、Windows、iOS。沒有 Linux 也沒有 Android。(我們的比較)
- Typeless——macOS、Windows、iOS、Android、網頁。沒有 Linux。(我們的比較)
如果你是從這些工具找過來的,下面就是 Linux 上真正能用的選項。
1. Meander——原生 Linux app,附 AI 修飾
適合: 想要五分鐘就能用、有 AI 修飾、能用自己語言聽寫的人。
Meander 提供原生 Linux 版本(.deb 和 .AppImage),把 Linux 當一等公民。流程是:按住快捷鍵、說話、放開——轉錄、AI 修掉贅字和文法問題、把乾淨的文字貼到游標處。終端機、編輯器、瀏覽器——能打字的地方都行。
- ✅ 按住即說 → 轉錄 → AI 修飾 → 游標處貼上
- ✅ 翻譯模式——說一種語言、輸出另一種;中文、日文、韓文表現特別好
- ✅ 同一帳號支援 Windows,在 Android 上是完整系統鍵盤
- ✅ 有免費方案
- ➖ 雲端架構:需要網路;音訊即時處理、不儲存錄音
取捨: 如果你的硬需求是完全離線,Meander 不是——請看下面的 Speech Note 或 nerd-dictation。
2. Speech Note——最完整的開源選項
適合: 想要免費、離線、開源、又有完整 GUI 的人。
Speech Note 是免費開源(MPL 2.0)的 Linux app,語音轉文字、文字轉語音、翻譯全部離線完成——任何資料都不離開你的電腦。支援多種引擎(whisper.cpp、Faster Whisper、Vosk、Coqui 等),可下載 100 多種語言的模型,還能透過全域快捷鍵把辨識文字輸入到任何聚焦的視窗——所以它是系統級的語音輸入工具,不只是記事本。
- ✅ 免費開源,上架 Flathub(也有 AUR / openSUSE)
- ✅ 完全離線——隱私由架構保證
- ✅ 多引擎多模型,100 多種語言
- ➖ 模型和引擎要自己管理,精準度取決於你的選擇
- ➖ 純轉錄——沒有 AI 修飾贅字或文法
取捨: 比商業 app 多很多旋鈕。這是優點還是缺點,取決於你是誰。
3. nerd-dictation——極簡、可改造
適合: 想要一個讀得懂、能寫腳本、能凹的命令列使用者。
nerd-dictation 是一支 Python 腳本(GPL-3.0),建立在離線的 VOSK 引擎上。沒有常駐程式、沒有 UI:你把「開始」「結束」綁到快捷鍵,它就打出你說的話。文字後處理是一個 Python 設定檔,輸出想怎麼改寫都行。透過輸入模擬工具同時支援 X11 和 Wayland。
- ✅ 免費開源,完全離線
- ✅ 極小、手動觸發——背景沒有任何東西在跑
- ✅ 後處理就是你自己的 Python——客製化沒有上限
- ➖ 需要自己組裝:VOSK 模型、音訊工具、
xdotool/ydotool、快捷鍵 - ➖ VOSK 的精準度落後新一代 Whisper 系模型
4. whisper.cpp——DIY 路線
適合: 想要離線精準度的極限、也不介意自己搭管線的人。
whisper.cpp 不是聽寫 app——它是 OpenAI Whisper 模型的高速 C/C++ 移植版,上面很多工具都建立在它之上。Linux 使用者通常用麥克風擷取腳本加輸入模擬器把它接成聽寫系統。離線精準度就是天花板;其他一切都得自己來。
- ✅ 離線精準度天花板;免費開源
- ➖ 沒有 app、沒有快捷鍵、沒有 UI——全部自己蓋
5. Vocalinux——裝了就能用的離線聽寫
適合: 想在 Ubuntu/Fedora/Arch 上用離線聽寫、又不想寫腳本的人。
Vocalinux 的定位是 Linux 的離線語音輸入:幾分鐘裝好、能在任何 app 裡聽寫,同時支援 X11 和 Wayland。它比較新——如果 Speech Note 對你來說太重、nerd-dictation 又太手動,值得一看。
怎麼選
| 你想要…… | 選 |
|---|---|
| AI 修飾+翻譯,五分鐘能用 | Meander |
| 完全離線+開源,有 GUI | Speech Note |
| 極簡、可腳本化、離線 | nerd-dictation |
| 離線精準度極限、全 DIY | whisper.cpp |
| Ubuntu/Fedora/Arch 上簡單安裝的離線方案 | Vocalinux |
功能與支援情況會變動——請以各專案官網的最新資訊為準。
誠實總結:如果「離線=隱私」是你的硬需求,用 Speech Note——它真的很好,而且免費。如果你想要商業 app 的體驗——AI 修飾、翻譯、一個帳號橫跨 Linux、Windows、Android——那就是 Meander,今天就能用免費方案試。