為開發人員和企業構建

Voxtral TTS 使專業語音合成對所有人都可訪問。使用完全控制在您的基礎設施上部署，或使用我們的 API 進行即時集成。CC BY-NC 許可證下的完全透明開放權重模型。

我們的願景

我們相信 AI 語音技術應該是開放的、可訪問的和企業就緒的。Voxtral TTS 結合了尖端研究和實際部署，使企業能夠大規模構建自然語音體驗。

Voxtral TTS is built on principles that prioritize accessibility, transparency, and enterprise-grade quality for voice AI applications.

開源優先: 開放權重模型發布具有完全透明性。所有 Voxtral TTS 代碼、研究論文和模型權重在 CC BY-NC 許可證下自由提供，用於社區協作。
品質無妥協: Voxtral TTS 以專業級保真度提供自然、情感表達豐富的語音。在原生使用者的人類評估中，以 68.4% 的勝率超越 ElevenLabs Flash v2.5。
全球可訪問性: 9 種語言支持確保全球開發人員可以將 Voxtral TTS 用於他們的應用程序。準確的方言和口音捕捉，實現真正的多語言語音體驗。
企業就緒: 為生產語音代理構建，具有經過驗證的可擴展性。單個 H200 GPU 為 30 多個並發用戶提供服務，具有不間斷的流式傳輸和亞秒級響應時間。
隱私聚焦: 自託管選項意味著您的語音數據保持私密。在您的基礎設施上部署 Voxtral TTS，完全控制數據安全和合規性。
通過研究創新: 由同行評審研究（arXiv 2603.25551）和混合架構支持。Voxtral TTS 結合自回歸生成和流匹配，代表尖端語音合成。

Join developers and enterprises using Voxtral TTS to power natural voice experiences. Open-source, production-ready, and enterprise-grade.