Free AI Prevod textu na reč
33+ open-source modely, 273+ hlasy, 33+ Nie je potrebný žiadny účet.
Všetko, čo potrebujete pre hlasovú umelú inteligenciu
Viac ako 30 nástrojov využívajúcich open-source modely umelej inteligencie
33+ AI hlasové modely
Najkomplexnejšia kolekcia open-source modelov TTS v jednej platforme
Kokoro Voľný
Kokoro je model prevodu textu na reč s 82 miliónmi parametrov, ktorý výrazne prevyšuje svoju hmotnostnú triedu. Napriek svojej malej veľkosti produkuje pozoruhodne prirodzenú a expresívnu reč. Kokoro podporuje viacero jazykov vrátane angličtiny, japončiny, čínštiny a kórejčiny s rôznymi expresívnymi hlasmi. Beží neuveriteľne rýchlo - generuje zvuk takmer 100x rýchlejšie ako v reálnom čase na GPU.
Najlepšie pre: Vysoko kvalitný TTS s minimálnou latenciou, streaming aplikácie
Vyskúšajte zadarmo
Piper Voľný
Piper je ľahký text-to-speech engine vyvinutý spoločnosťou Rhasspy, ktorý využíva VITS a larynx architektúry.Beží výlučne na CPU, takže je ideálny pre hraničné zariadenia, domácu automatizáciu a aplikácie vyžadujúce offline TTS. S viac ako 100 hlasmi v 30+ jazykoch, Piper prináša prirodzene znejúcu reč v reálnom čase aj na Raspberry Pi 4.
Najlepšie pre: Rýchle náhľady, prístupnosť a vložené aplikácie
Vyskúšajte zadarmo
VITS Voľný
VITS (Variational Inference with adversarial learning for end-to-end Text-to-Speech) je paralelná metóda prekladu textu na reč, ktorá generuje prirodzenejšie znejúci zvuk ako súčasné dvojstupňové modely.Prijíma variačnú inferenciu rozšírenú o normalizačné toky a proces konkurenčného tréningu, čím sa dosiahne výrazné zlepšenie prirodzenosti.
Najlepšie pre: Všeobecný prevod textu na reč s prirodzenou prozódiou
Vyskúšajte zadarmo
MeloTTS Voľný
MeloTTS od MyShell.ai je viacjazyčná knižnica TTS podporujúca angličtinu (americká, britská, indická, austrálska), španielčinu, francúzštinu, čínštinu, japončinu a kórejčinu.Je extrémne rýchla, spracúva text rýchlosťou takmer v reálnom čase len na CPU.MeloTTS je navrhnutý pre produkčné použitie a podporuje odvodenie CPU aj GPU.
Najlepšie pre: Produkčné aplikácie vyžadujúce rýchly, viacjazyčný TTS
Vyskúšajte zadarmo
Kani TTS 2 Voľný
Kani-TTS-2 od NineNineSix je ultraľahký model s parametrami 400M postavený na chrbtici Liquid AI LFM2 s NVIDIA NanoCodec.Beží v 3GB VRAM a produkuje ~ 10 sekúnd reči za ~ 2 sekundy na A100 (RTF 0.2). Aktuálne verejné vydanie obsahuje kontrolný bod `kani-tts-2-en` len v angličtine a nevystavuje háčik na vloženie reproduktorov potrebný na klonovanie hlasu - použite Chatterbox / IndexTTS2 / F5-TTS na klonovanie alebo Kokoro / MeloTTS pre neanglický jazyk.
Najlepšie pre: Rýchla generácia angličtiny na hardvéri s nízkou pamäťou VRAM, rýchle náhľady
Vyskúšajte zadarmo
OuteTTS Voľný
OuteTTS rozširuje veľké jazykové modely o schopnosti premeny textu na reč pri zachovaní pôvodnej architektúry. Podporuje viacero backendov vrátane llama.cpp (CPU/GPU), Hugging Face Transformers, ExLlamaV2, VLLM a dokonca aj odvodenie z prehliadača prostredníctvom Transformers.js.
Najlepšie pre: Edge nasadenie, TTS na báze prehliadača, prostredia s nízkymi zdrojmi
Vyskúšajte zadarmo
Pocket TTS Voľný
Pocket TTS od Kyutai (tvorcovia Moshi) je kompaktný model premeny textu na reč s parametrami 100M, ktorý je oveľa ťažší ako jeho hmotnosť. Beží efektívne na CPU, podporuje klonovanie hlasu z jednej zvukovej vzorky a produkuje prirodzene znejúcu reč.
Najlepšie pre: Jednoduché nasadenie, prostredia len s procesorom, rýchle klonovanie hlasu
Vyskúšajte zadarmo
Kitten TTS Voľný
Kitten TTS od KittenML je ultraľahký model premeny textu na reč postavený na ONNX. S variantmi od 15M do 80M parametrov (25-80 MB na disku) poskytuje vysokokvalitnú syntézu hlasu na CPU bez potreby GPU. Obsahuje 8 vstavaných hlasov, nastaviteľnú rýchlosť reči a vstavané predspracovanie textu pre čísla, meny a jednotky. Ideálne pre nasadenie na hranici a aplikácie s nízkou latenciou.
Najlepšie pre: Rýchly ľahký TTS, nasadenie na hraniciach, aplikácie s nízkou latenciou
Vyskúšajte zadarmo
Ming-Omni TTS Voľný
Ming-omni-tts-0.5B od inclusionAI je kompaktný omnimodálny model reči postavený na hustej chrbtici BailingMM s Patch-by-Patch audio dekodérom, ktorý poskytuje výstup 44,1 kHz (blízko CD kvality), podporuje klonovanie hlasu s nulovým výstrelom z 3 + sekundovej referencie a obsahuje zabudované ovládanie emócií / dialektu / BGM prostredníctvom inštrukcií JSON. Vynikajúca stabilita - 0,83% WER na čínskych benchmarkoch.
Najlepšie pre: Vysoko verný dvojjazyčný rozprávač, emočne kontrolované hlasové herectvo, čínsky obsah audioknihy
Vyskúšajte zadarmo
MOSS-TTS Nano Voľný
MOSS-TTS-Nano-100M je OpenMOSS kompaktná 100M-parametrová varianta rodiny MOSS-TTS, ktorá zdieľa architektúru transformátora oneskorenia. Vymieňa špičkovú kvalitu modelu 8B za ~80x menšiu hmotnosť a dramaticky nižšiu VRAM na požiadavku, čo je vhodné pre nasadenie vo voľnej vrstve a vysokej priepustnosti.
Najlepšie pre: Free-tier TTS, vysokoobjemová produkcia, interaktívne použitie s nízkou latenciou
Vyskúšajte zadarmo
Bark Štandardné
Model prevodu textu na zvuk založený na transformátoroch, ktorý generuje realistickú reč, hudbu a zvukové efekty.
Názov vývojára: Suno · Licencia: MIT
Skúste si to
Bark Small Štandardné
Odľahčená verzia Bark s rýchlejším odvodzovaním a nižším využitím pamäte.
Názov vývojára: Suno · Licencia: MIT
Skúste si to
CosyVoice 2 Štandardné
Alibaba škálovateľný streaming TTS s prirodzenosťou ľudskej parity a takmer nulovou latenciou.
Názov vývojára: Alibaba (Tongyi Lab) · Licencia: Apache 2.0
Skúste si to
Dia TTS Štandardné
Model generovania dialógu s viacerými reproduktormi, ktorý vytvára prirodzené konverzácie medzi reproduktormi.
Názov vývojára: Nari Labs · Licencia: Apache 2.0
Skúste si to
Parler TTS Štandardné
Popíšte hlas, ktorý chcete v prirodzenom jazyku a Parler generuje zodpovedajúcu reč.
Názov vývojára: Hugging Face · Licencia: Apache 2.0
Skúste si to
IndexTTS-2 Štandardné
Zero-shot TTS s jemnozrnnou kontrolou emócií a vysokou expresivitou.
Názov vývojára: Index Team · Licencia: Bilibili Model License
Skúste si to
Spark TTS Štandardné
Hlasové klonovanie TTS s kontrolovateľnými emóciami a štýlom hovorenia prostredníctvom výziev.
Názov vývojára: SparkAudio · Licencia: CC BY-NC-SA 4.0
Skúste si to
GPT-SoVITS Štandardné
Niekoľko záberov klonovanie hlasu TTS, ktorý replikuje akýkoľvek hlas z iba 5 sekúnd zvuku.
Názov vývojára: RVC-Boss · Licencia: MIT
Skúste si to
Orpheus Štandardné
Emocionálny model TTS na ľudskej úrovni trénovaný na 100 000 hodinách rečových dát.
Názov vývojára: Canopy Labs · Licencia: Llama 3.2 Community
Skúste si to
Qwen3 TTS Štandardné
Alibaba je viacjazyčný TTS s prednastavenými hlasmi a hlasový dizajn z textu.
Názov vývojára: Alibaba (Qwen) · Licencia: Apache 2.0
Skúste si to
VieNeu-TTS-v2 Štandardné
Vietnamský + anglický kód-prepínanie TTS so 7 prednastavenými hlasmi a klonovanie hlasu zero-shot.CPU-len, nie je potrebný GPU.
Názov vývojára: Phạm Nguyễn Ngọc Bảo · Licencia: Apache 2.0
Skúste si to
Chatterbox Turbo Štandardné
Rýchlejší Chatterbox s latenciou menšou ako 200 ms a paralingvistickými značkami pre smiech, kašeľ a ďalšie.
Názov vývojára: Resemble AI · Licencia: MIT
Skúste si to
VoxCPM Štandardné
Tokenizer-free TTS produkujúce 44.1kHz audio s kontextovou konzistenciou odsekov.
Názov vývojára: OpenBMB · Licencia: Apache 2.0
Skúste si to
VibeVoice Štandardné
Model spoločnosti Microsoft pre dlhý obsah s viacerými reproduktormi, ako sú podcasty a audioknihy.
Názov vývojára: Microsoft · Licencia: MIT
Skúste si to
CosyVoice3 Štandardné
Viacjazyčný TTS novej generácie s dvojitým streamovaním, ovládaním emócií a klonovaním hlasu bez výstrelov.
Názov vývojára: Alibaba (FunAudioLLM) · Licencia: Apache 2.0
Skúste si to
NAMAA Saudi TTS Štandardné
Prvý otvorený Saudskoarabský TTS. Natívny Saudský dialekt s klonovaním hlasu v kvalite Chatterbox.
Názov vývojára: NAMAA Space · Licencia: MIT
Skúste si to
Darwin TTS Štandardné
Cross-modálny Qwen3-TTS variant s FFN váhami zmiešanými z jazykového modelu Qwen3-1.7B pre ostrejšie viacjazyčné klonovanie.
Názov vývojára: FINAL-Bench · Licencia: Apache 2.0
Skúste si to
MOSS-TTSD Štandardné
Model pokračovania dialógu s viacerými reproduktormi – vytvárajte konverzácie v štýle podcastu až s 5 reproduktormi a 60 minútami koherentného zvuku.
Názov vývojára: OpenMOSS · Licencia: Apache 2.0
Skúste si to
CosyVoice 2
Alibaba škálovateľný streaming TTS s prirodzenosťou ľudskej parity a takmer nulovou latenciou.
Jazyky: en, zh, ja, ko, fr, de, it, es
Klon hlasu
IndexTTS-2
Zero-shot TTS s jemnozrnnou kontrolou emócií a vysokou expresivitou.
Jazyky: en, zh
Klon hlasu
Spark TTS
Hlasové klonovanie TTS s kontrolovateľnými emóciami a štýlom hovorenia prostredníctvom výziev.
Jazyky: en, zh
Klon hlasu
GPT-SoVITS
Niekoľko záberov klonovanie hlasu TTS, ktorý replikuje akýkoľvek hlas z iba 5 sekúnd zvuku.
Jazyky: en, zh, ja, ko
Klon hlasu
Chatterbox
Najmodernejšie klonovanie hlasu s nulovým záberom s ovládaním emócií od spoločnosti Resemble AI.
Jazyky: en
Klon hlasu
Tortoise TTS
Multi-hlas text-to-speech zameraný na kvalitu s autoregresívnou architektúrou.
Jazyky: en
Klon hlasu
OpenVoice
Okamžité klonovanie hlasu s granulárnou kontrolou nad štýlom, emóciami a prízvukom.
Jazyky: en, zh, ja, ko, fr, es
Klon hlasu
VieNeu-TTS-v2
Vietnamský + anglický kód-prepínanie TTS so 7 prednastavenými hlasmi a klonovanie hlasu zero-shot.CPU-len, nie je potrebný GPU.
Jazyky: vi, en
Klon hlasu
Chatterbox Turbo
Rýchlejší Chatterbox s latenciou menšou ako 200 ms a paralingvistickými značkami pre smiech, kašeľ a ďalšie.
Jazyky: en
Klon hlasu
VoxCPM
Tokenizer-free TTS produkujúce 44.1kHz audio s kontextovou konzistenciou odsekov.
Jazyky: en, zh
Klon hlasu
OuteTTS
LLM-založené TTS, ktorý beží na CPU, GPU, alebo prehliadač cez llama.cpp a Transformers.js.
Jazyky: en
Klon hlasu
Pocket TTS
Ľahký 100M parametrický model od Kyutai s klonovaním hlasu z jednej vzorky.
Jazyky: en, fr
Klon hlasu
CosyVoice3
Viacjazyčný TTS novej generácie s dvojitým streamovaním, ovládaním emócií a klonovaním hlasu bez výstrelov.
Jazyky: en, zh, ja, ko, de, es, fr, it, ru
Klon hlasu
NAMAA Saudi TTS
Prvý otvorený Saudskoarabský TTS. Natívny Saudský dialekt s klonovaním hlasu v kvalite Chatterbox.
Jazyky: ar
Klon hlasu
Darwin TTS
Cross-modálny Qwen3-TTS variant s FFN váhami zmiešanými z jazykového modelu Qwen3-1.7B pre ostrejšie viacjazyčné klonovanie.
Jazyky: en, ko, ja, zh
Klon hlasu
MOSS-TTSD
Model pokračovania dialógu s viacerými reproduktormi – vytvárajte konverzácie v štýle podcastu až s 5 reproduktormi a 60 minútami koherentného zvuku.
Jazyky: en, zh
Klon hlasu
Ming-Omni TTS
Kompaktný 0.5B omnimodálny model reči od inclusionAI s vysoko verným 44.1kHz výstupom a nulovým klonovaním hlasu.
Jazyky: en, zh
Klon hlasu
MOSS-TTS Nano
Tiny 100M MOSS-TTS variant — rovnaká architektúra, 80x menšia, free-tier latencia.
Jazyky: en, zh, de, es, fr, ja, it, ko, ru, ar, pt
Klon hlasuAPI určené na prvýkrát pre vývojárov
Jeden koncový bod, viac ako 22 modelov. Podpora streamovania pre aplikácie v reálnom čase.
- Formát kompatibilný s OpenAI
- Streamovanie TTS pre aplikácie v reálnom čase
- Dávkové spracovanie veľkých úloh
- Oznámenia o webhookoch
pip install ttsai
npm install @ttsainpm/ttsai
from tts_ai import TTSClient
client = TTSClient(api_key="sk-tts-xxx")
audio = client.generate(
text="Hello from TTS.ai!",
model="kokoro",
voice="af_bella",
)
client.save(audio, "output.mp3")
Jednoduché, transparentné stanovenie cien
Začnite bezplatne. Škálujte podľa svojho rastu.
Zadarmo
15 000 znakov + 5 000/deň
- 7 modelov zdarma vrátane Kokoro
- 5 000 znakov za generáciu
- API prístup zahrnutý
Štart
500 kreditov / mesiac
- Všetky 22+ modely
- 100 000 znakov za generáciu
- Klonovanie hlasu
Pre
2 000 kreditov/mesiac
- Všetko v Starter
- Prístup k API
- Prioritné spracovanie
Podnikanie
10 000 kreditov/mesiac
- Všetko v Pro
- Hromadné API
- Prioritná fronta
Často kladené otázky
Čo by sme mohli zlepšiť? Vaše pripomienky nám pomáhajú riešiť problémy.
Začnite používať AI Voice ešte dnes
Pridajte sa k tvorcom, vývojárom a podnikom, ktoré používajú TTS.ai