Voicebox 是一個本地優先的 AI 語音工作室,為 ElevenLabs 和 WisprFlow 提供了一個免費且開源的替代方案。它允許使用者在本地機器上克隆任何聲音、生成高品質語音,並將語音輸入直接分發到任何應用程序中,且所有數據均在本地處理,確保絕對隱私。
🔍 項目特色
Voicebox 整合了 7 種 TTS 引擎(包括 Qwen3-TTS 和 Kokoro),支持 23 種語言。其核心功能包括零樣本聲音克隆、支持 [laugh] 或 [sigh] 等情感標記的表達性語音,以及內建的本地 LLM 用於人格化設定。此外,它還提供了一個 MCP 伺服器,讓 Claude Code 或 Cursor 等 AI Agent 可以直接使用用戶克隆的聲音進行對話。
⭐ 即時人氣
- 32,246 ⭐
📡 來源: GitHub Trending (Daily) | 每週自動追蹤
發佈留言