Free AI Prevod textu na reč
31+ open-source modely, 231+ hlasy, 34+ Nie je potrebný žiadny účet.
Všetko, čo potrebujete pre hlasovú umelú inteligenciu
Viac ako 30 nástrojov využívajúcich open-source modely umelej inteligencie
31+ AI hlasové modely
Najkomplexnejšia kolekcia open-source modelov TTS v jednej platforme
Kokoro Free
Kokoro je model prevodu textu na reč s 82 miliónmi parametrov, ktorý výrazne prevyšuje svoju hmotnostnú triedu. Napriek svojej malej veľkosti produkuje pozoruhodne prirodzenú a expresívnu reč. Kokoro podporuje viacero jazykov vrátane angličtiny, japončiny, čínštiny a kórejčiny s rôznymi expresívnymi hlasmi. Beží neuveriteľne rýchlo - generuje zvuk takmer 100x rýchlejšie ako v reálnom čase na GPU.
Najlepšie pre: Vysoko kvalitný TTS s minimálnou latenciou, streaming aplikácie
Vyskúšajte zadarmo
Piper Free
Piper je ľahký text-to-speech engine vyvinutý spoločnosťou Rhasspy, ktorý využíva VITS a larynx architektúry.Beží výlučne na CPU, takže je ideálny pre hraničné zariadenia, domácu automatizáciu a aplikácie vyžadujúce offline TTS. S viac ako 100 hlasmi v 30+ jazykoch, Piper prináša prirodzene znejúcu reč v reálnom čase aj na Raspberry Pi 4.
Najlepšie pre: Rýchle náhľady, prístupnosť a vložené aplikácie
Vyskúšajte zadarmo
VITS Free
VITS (Variational Inference with adversarial learning for end-to-end Text-to-Speech) je paralelná metóda prekladu textu na reč, ktorá generuje prirodzenejšie znejúci zvuk ako súčasné dvojstupňové modely.Prijíma variačnú inferenciu rozšírenú o normalizačné toky a proces konkurenčného tréningu, čím sa dosiahne výrazné zlepšenie prirodzenosti.
Najlepšie pre: Všeobecný prevod textu na reč s prirodzenou prozódiou
Vyskúšajte zadarmo
MeloTTS Free
MeloTTS od MyShell.ai je viacjazyčná knižnica TTS podporujúca angličtinu (americká, britská, indická, austrálska), španielčinu, francúzštinu, čínštinu, japončinu a kórejčinu.Je extrémne rýchla, spracúva text rýchlosťou takmer v reálnom čase len na CPU.MeloTTS je navrhnutý pre produkčné použitie a podporuje odvodenie CPU aj GPU.
Najlepšie pre: Produkčné aplikácie vyžadujúce rýchly, viacjazyčný TTS
Vyskúšajte zadarmo
OuteTTS Free
OuteTTS rozširuje veľké jazykové modely o schopnosti premeny textu na reč pri zachovaní pôvodnej architektúry. Podporuje viacero backendov vrátane llama.cpp (CPU/GPU), Hugging Face Transformers, ExLlamaV2, VLLM a dokonca aj odvodenie z prehliadača prostredníctvom Transformers.js.
Najlepšie pre: Edge nasadenie, TTS na báze prehliadača, prostredia s nízkymi zdrojmi
Vyskúšajte zadarmo
Pocket TTS Free
Pocket TTS od Kyutai (tvorcovia Moshi) je kompaktný model premeny textu na reč s parametrami 100M, ktorý je oveľa ťažší ako jeho hmotnosť. Beží efektívne na CPU, podporuje klonovanie hlasu z jednej zvukovej vzorky a produkuje prirodzene znejúcu reč.
Najlepšie pre: Jednoduché nasadenie, prostredia len s procesorom, rýchle klonovanie hlasu
Vyskúšajte zadarmo
Kitten TTS Free
Kitten TTS by KittenML is an ultra-lightweight text-to-speech model built on ONNX. With variants from 15M to 80M parameters (25-80 MB on disk), it delivers high-quality voice synthesis on CPU without requiring a GPU. Features 8 built-in voices, adjustable speech speed, and built-in text preprocessing for numbers, currencies, and units. Ideal for edge deployment and low-latency applications.
Najlepšie pre: Fast lightweight TTS, edge deployment, low-latency applications
Vyskúšajte zadarmo
Bark Standard
Model prevodu textu na zvuk založený na transformátoroch, ktorý generuje realistickú reč, hudbu a zvukové efekty.
Názov vývojára: Suno · Licencia: MIT
Skúste si to
Bark Small Standard
Odľahčená verzia Bark s rýchlejším odvodzovaním a nižším využitím pamäte.
Názov vývojára: Suno · Licencia: MIT
Skúste si to
CosyVoice 2 Standard
Alibaba škálovateľný streaming TTS s prirodzenosťou ľudskej parity a takmer nulovou latenciou.
Názov vývojára: Alibaba (Tongyi Lab) · Licencia: Apache 2.0
Skúste si to
Dia TTS Standard
Model generovania dialógu s viacerými reproduktormi, ktorý vytvára prirodzené konverzácie medzi reproduktormi.
Názov vývojára: Nari Labs · Licencia: Apache 2.0
Skúste si to
Parler TTS Standard
Popíšte hlas, ktorý chcete v prirodzenom jazyku a Parler generuje zodpovedajúcu reč.
Názov vývojára: Hugging Face · Licencia: Apache 2.0
Skúste si to
GLM-TTS Standard
Dosahuje najnižšiu mieru chýb znakov medzi modelmi TTS s otvoreným zdrojovým kódom.
Názov vývojára: Zhipu AI · Licencia: GLM-4 License
Skúste si to
IndexTTS-2 Standard
Zero-shot TTS s jemnozrnnou kontrolou emócií a vysokou expresivitou.
Názov vývojára: Index Team · Licencia: Bilibili Model License
Skúste si to
Spark TTS Standard
Hlasové klonovanie TTS s kontrolovateľnými emóciami a štýlom hovorenia prostredníctvom výziev.
Názov vývojára: SparkAudio · Licencia: CC BY-NC-SA 4.0
Skúste si to
GPT-SoVITS Standard
Niekoľko záberov klonovanie hlasu TTS, ktorý replikuje akýkoľvek hlas z iba 5 sekúnd zvuku.
Názov vývojára: RVC-Boss · Licencia: MIT
Skúste si to
Orpheus Standard
Emocionálny model TTS na ľudskej úrovni trénovaný na 100 000 hodinách rečových dát.
Názov vývojára: Canopy Labs · Licencia: Llama 3.2 Community
Skúste si to
Qwen3 TTS Standard
Alibaba viacjazyčný TTS s klonovaním hlasu, prednastavené hlasy, a hlasový dizajn z textu.
Názov vývojára: Alibaba (Qwen) · Licencia: Apache 2.0
Skúste si to
Chatterbox Turbo Standard
Rýchlejší Chatterbox s latenciou menšou ako 200 ms a paralingvistickými značkami pre smiech, kašeľ a ďalšie.
Názov vývojára: Resemble AI · Licencia: MIT
Skúste si to
Dia 2 Standard
Streamovanie ako prvé konverzačné TTS s dialógom viacerých reproduktorov a paralingvistickými nápovedami.
Názov vývojára: Nari Labs · Licencia: Apache 2.0
Skúste si to
VoxCPM Standard
Tokenizer-free TTS produkujúce 44.1kHz audio s kontextovou konzistenciou odsekov.
Názov vývojára: OpenBMB · Licencia: Apache 2.0
Skúste si to
TADA Standard
Zero-halucinácie TTS s textom-akustické duálne zarovnanie, 5x rýchlejšie ako porovnateľné LLM TTS.
Názov vývojára: Hume AI · Licencia: MIT
Skúste si to
VibeVoice Standard
Model spoločnosti Microsoft pre dlhý obsah s viacerými reproduktormi, ako sú podcasty a audioknihy.
Názov vývojára: Microsoft · Licencia: MIT
Skúste si to
CosyVoice3 Standard
Next-generation multilingual TTS with bi-streaming, emotion control, and zero-shot voice cloning.
Názov vývojára: Alibaba (FunAudioLLM) · Licencia: Apache 2.0
Skúste si to
CosyVoice 2
Alibaba škálovateľný streaming TTS s prirodzenosťou ľudskej parity a takmer nulovou latenciou.
Jazyky: en, zh, ja, ko, fr, de, it, es
Klon hlasu
GLM-TTS
Dosahuje najnižšiu mieru chýb znakov medzi modelmi TTS s otvoreným zdrojovým kódom.
Jazyky: en, zh
Klon hlasu
IndexTTS-2
Zero-shot TTS s jemnozrnnou kontrolou emócií a vysokou expresivitou.
Jazyky: en, zh
Klon hlasu
Spark TTS
Hlasové klonovanie TTS s kontrolovateľnými emóciami a štýlom hovorenia prostredníctvom výziev.
Jazyky: en, zh
Klon hlasu
GPT-SoVITS
Niekoľko záberov klonovanie hlasu TTS, ktorý replikuje akýkoľvek hlas z iba 5 sekúnd zvuku.
Jazyky: en, zh, ja, ko
Klon hlasu
Chatterbox
Najmodernejšie klonovanie hlasu s nulovým záberom s ovládaním emócií od spoločnosti Resemble AI.
Jazyky: en
Klon hlasu
Tortoise TTS
Multi-hlas text-to-speech zameraný na kvalitu s autoregresívnou architektúrou.
Jazyky: en
Klon hlasu
OpenVoice
Okamžité klonovanie hlasu s granulárnou kontrolou nad štýlom, emóciami a prízvukom.
Jazyky: en, zh, ja, ko, fr, de, es, it
Klon hlasu
Qwen3 TTS
Alibaba viacjazyčný TTS s klonovaním hlasu, prednastavené hlasy, a hlasový dizajn z textu.
Jazyky: en, zh, ja, ko, de, fr, ru, pt, es, it
Klon hlasu
Chatterbox Turbo
Rýchlejší Chatterbox s latenciou menšou ako 200 ms a paralingvistickými značkami pre smiech, kašeľ a ďalšie.
Jazyky: en
Klon hlasu
VoxCPM
Tokenizer-free TTS produkujúce 44.1kHz audio s kontextovou konzistenciou odsekov.
Jazyky: en, zh
Klon hlasu
OuteTTS
LLM-založené TTS, ktorý beží na CPU, GPU, alebo prehliadač cez llama.cpp a Transformers.js.
Jazyky: en
Klon hlasu
Pocket TTS
Ľahký 100M parametrický model od Kyutai s klonovaním hlasu z jednej vzorky.
Jazyky: en, fr
Klon hlasu
CosyVoice3
Next-generation multilingual TTS with bi-streaming, emotion control, and zero-shot voice cloning.
Jazyky: en, zh, ja, ko, de, es, fr, it, ru
Klon hlasu
MOSS-TTS
Ultra-long 20-language TTS supporting up to 1 hour of continuous generation with phoneme-level control.
Jazyky: en, zh, de, es, fr, ja, it, hu, ko, ru, fa, ar, pl, pt, cs, da, sv, el, tr
Klon hlasu
MegaTTS3
ByteDance's sparse alignment TTS with adjustable intelligibility vs. speaker similarity.
Jazyky: en, zh
Klon hlasuAPI určené na prvýkrát pre vývojárov
Jeden koncový bod, viac ako 22 modelov. Podpora streamovania pre aplikácie v reálnom čase.
- Formát kompatibilný s OpenAI
- Streamovanie TTS pre aplikácie v reálnom čase
- Dávkové spracovanie veľkých úloh
- Oznámenia o webhookoch
pip install ttsai
npm install @ttsainpm/ttsai
from tts_ai import TTSClient
client = TTSClient(api_key="sk-tts-xxx")
audio = client.generate(
text="Hello from TTS.ai!",
model="kokoro",
voice="af_bella",
)
client.save(audio, "output.mp3")
Jednoduché, transparentné stanovenie cien
Začnite bezplatne. Škálujte podľa svojho rastu.
Zadarmo
15 kreditov
- Kokoro, Piper, VITS, MeloTTS
- Limit 500 znakov
- 3 gen/hod (bez účtu)
Štart
500 kreditov / mesiac
- Všetky 22+ modely
- 100 000 znakov za generáciu
- Klonovanie hlasu
Pre
2 000 kreditov/mesiac
- Všetko v Starter
- Prístup k API
- Prioritné spracovanie
Podnikanie
10 000 kreditov/mesiac
- Všetko v Pro
- Hromadné API
- Prioritná fronta
Často kladené otázky
Čo by sme mohli zlepšiť? Vaše pripomienky nám pomáhajú riešiť problémy.
Začnite používať AI Voice ešte dnes
Pridajte sa k tvorcom, vývojárom a podnikom, ktoré používajú TTS.ai