Free AI Text proslovu
31+ modely open-source, 231+ hlasy, 34+ jazyky, žádný účet není nutný.
Vše, co potřebujete pro hlas AI
30+ nářadí poháněné modely Open-source AI
31+ AI Voice Models
Nejkomplexnější kolekce modelů TTS open-source na jedné platformě
Kokoro Free
Kokoro je 82 milionů parametru text-to-speech model, který punčuje daleko nad jeho hmotnost třídy. Navzdory své malé velikosti, produkuje pozoruhodně přírodní a expresivní řeč. Kokoro podporuje více jazyků včetně angličtiny, japonštiny, čínštiny a korejštiny s řadou expresivních hlasů. To běží neuvěřitelně rychle, generování zvuku téměř 100x rychleji než v reálném čase na GPU.
Nejlepší pro: Vysoce kvalitní TTS s minimální latence, streaming aplikace
Zkuste zdarma
Piper Free
Piper je lehký text-to-speech motor vyvinutý Rhasspy, který používá VITS a hrtan architektury. To běží zcela na CPU, což je ideální pro hrany zařízení, domácí automatizace, a aplikace vyžadující offline TTS. S více než 100 hlasy v 30 + jazyky, Piper poskytuje přírodní-zpívající řeč při rychlostech v reálném čase i na Malina Pi 4.
Nejlepší pro: Rychlé náhledy, dostupnost a vložené aplikace
Zkuste zdarma
VITS Free
VITS (Variational Inference with adversarial learning for end-to-end Text-to-Speech) je paralelní metoda TTS ke konci, která generuje více přirozeného zvuku než současné dvoustupňové modely. Přijímá variační inferenci rozšířenou o normalizační toky a protivní výcvikový proces, který dosahuje významného zlepšení přirozenosti.
Nejlepší pro: Univerzální text-to-speech s přírodní prosodou
Zkuste zdarma
MeloTTS Free
MeloTTS by MyShell.ai je vícejazyčná TTS knihovna podporující angličtinu (American, British, Indian, Australan), španělštinu, francouzštinu, čínštinu, japonštinu a korejštinu. Je to velmi rychlé, zpracování textu při rychlosti téměř v reálném čase na procesoru sám. MeloTTS je určen pro výrobu a podporuje jak CPU a GPU inference.
Nejlepší pro: Výrobní aplikace potřebné rychle, vícejazyčné TTS
Zkuste zdarma
OuteTTS Free
OuteTTS rozšiřuje velké jazykové modely s funkcemi text-to-speech při zachování původní architektury. Podporuje více backendů včetně lama.cpp (CPU/GPU), objímání transformerů obličeje, ExLlamaV2, VLLM, a dokonce i inference prohlížeče přes Transformers.js. Funkce klonování hlasu s nulovým výstřelem přes reproduktorové profily uložené jako JSON.
Nejlepší pro: Zavádění hran, TTS na bázi prohlížeče, prostředí s nízkým zdrojem
Zkuste zdarma
Pocket TTS Free
Kapesní TTS od Kyutai (tvůrci Moshi) je kompaktní 100M parametr text-to-speech modelu, který prorazí vysoko nad svou váhu. To běží efektivně na CPU, podporuje nulovací hlasové klonování z jediného zvukového vzorku, a produkuje přirozený-zvučení řeči. Malá velikost modelu je ideální pro nasazení hran a nízko-zdrojové prostředí.
Nejlepší pro: Lehké nasazení, prostředí pouze CPU, rychlé klonování hlasu
Zkuste zdarma
Kitten TTS Free
Kitten TTS by KittenML je ultralehký text-to-speech model postavený na ONNX. S variantami od 15M do 80M parametry (25-80 MB na disku), poskytuje vysoce kvalitní hlasovou syntézu na procesoru bez nutnosti GPU. Vlastnosti 8 vestavěných hlasů, nastavitelná rychlost řeči a vestavěný text předzpracování pro čísla, měny a jednotky. Ideální pro nasazení hran a nízkonákladové aplikace.
Nejlepší pro: Rychlé lehké TTS, nasazení hran, nízkonákladové aplikace
Zkuste zdarma
Bark Standard
Model na bázi transformeru, který vytváří realistickou řeč, hudbu a zvukové efekty.
Vývojář: Suno · Licence: MIT
Zkus to.
Bark Small Standard
Osvětlená verze Barku s rychlejší inferencí a nižším využitím paměti.
Vývojář: Suno · Licence: MIT
Zkus to.
CosyVoice 2 Standard
Alibaba je škálovatelný streaming TTS s lidskou-parity přirozenost a téměř-nula latence.
Vývojář: Alibaba (Tongyi Lab) · Licence: Apache 2.0
Zkus to.
Dia TTS Standard
Model generování dialogů s více reproduktory, který vytváří přirozené konverzace mezi reproduktory.
Vývojář: Nari Labs · Licence: Apache 2.0
Zkus to.
Parler TTS Standard
Popište hlas, který chcete v přirozeném jazyce a Parler generuje odpovídající řeč.
Vývojář: Hugging Face · Licence: Apache 2.0
Zkus to.
GLM-TTS Standard
Dosáhne nejnižší chybovost znaku mezi modely TTS open-source.
Vývojář: Zhipu AI · Licence: GLM-4 License
Zkus to.
IndexTTS-2 Standard
Nula-shot TTS s jemně zakořeněnou emocionální kontrolou a vysokou expresivitou.
Vývojář: Index Team · Licence: Bilibili Model License
Zkus to.
Spark TTS Standard
Hlasové klonování TTS s ovladatelnými emocemi a stylem mluvení prostřednictvím podnětů.
Vývojář: SparkAudio · Licence: CC BY-NC-SA 4.0
Zkus to.
GPT-SoVITS Standard
Několik-shot hlas klonování TTS, který replikuje jakýkoliv hlas z pouhých 5 sekund zvuku.
Vývojář: RVC-Boss · Licence: MIT
Zkus to.
Orpheus Standard
Lidský emocionální TTS model vycvičený na 100K hodin řečových dat.
Vývojář: Canopy Labs · Licence: Llama 3.2 Community
Zkus to.
Qwen3 TTS Standard
Alibaba je vícejazyčné TTS s klonováním hlasu, přednastavené hlasy, a hlasový design z textu.
Vývojář: Alibaba (Qwen) · Licence: Apache 2.0
Zkus to.
Chatterbox Turbo Standard
Rychlejší Chatterbox s sub-200ms latence a paralinguistické značky pro smích, kašel, a další.
Vývojář: Resemble AI · Licence: MIT
Zkus to.
Dia 2 Standard
Streamování-první konverzační TTS s multi-reproduktor dialog a paralinguistické narážky.
Vývojář: Nari Labs · Licence: Apache 2.0
Zkus to.
VoxCPM Standard
Tokenizer-free TTS produkující 44.1kHz audio s kontextově-uvědomělý odstavec konzistence.
Vývojář: OpenBMB · Licence: Apache 2.0
Zkus to.
TADA Standard
Nula halucinace TTS s text-akustickou dvojitou seřízení, 5x rychlejší než srovnatelné LLM TTS.
Vývojář: Hume AI · Licence: MIT
Zkus to.
VibeVoice Standard
Microsoft model pro dlouhý-formovat multi-reproduktor obsah, jako podcasty a audioknihy.
Vývojář: Microsoft · Licence: MIT
Zkus to.
CosyVoice3 Standard
Next-generation multilingual TTS with bi-streaming, emotion control, and zero-shot voice cloning.
Vývojář: Alibaba (FunAudioLLM) · Licence: Apache 2.0
Zkus to.
CosyVoice 2
Alibaba je škálovatelný streaming TTS s lidskou-parity přirozenost a téměř-nula latence.
Jazyky: en, zh, ja, ko, fr, de, it, es
Klonový hlas
IndexTTS-2
Nula-shot TTS s jemně zakořeněnou emocionální kontrolou a vysokou expresivitou.
Jazyky: en, zh
Klonový hlas
Spark TTS
Hlasové klonování TTS s ovladatelnými emocemi a stylem mluvení prostřednictvím podnětů.
Jazyky: en, zh
Klonový hlas
GPT-SoVITS
Několik-shot hlas klonování TTS, který replikuje jakýkoliv hlas z pouhých 5 sekund zvuku.
Jazyky: en, zh, ja, ko
Klonový hlas
Chatterbox
Nejmodernější klonování nulovacího hlasu s emoční kontrolou z Resse Al.
Jazyky: en
Klonový hlas
Tortoise TTS
Multi-voice text-to-speech zaměřený na kvalitu s autoregresivní architekturou.
Jazyky: en
Klonový hlas
OpenVoice
Okamžité klonování hlasu s granulovanou kontrolou nad stylem, emocemi a přízvukem.
Jazyky: en, zh, ja, ko, fr, de, es, it
Klonový hlas
Qwen3 TTS
Alibaba je vícejazyčné TTS s klonováním hlasu, přednastavené hlasy, a hlasový design z textu.
Jazyky: en, zh, ja, ko, de, fr, ru, pt, es, it
Klonový hlas
Chatterbox Turbo
Rychlejší Chatterbox s sub-200ms latence a paralinguistické značky pro smích, kašel, a další.
Jazyky: en
Klonový hlas
VoxCPM
Tokenizer-free TTS produkující 44.1kHz audio s kontextově-uvědomělý odstavec konzistence.
Jazyky: en, zh
Klonový hlas
OuteTTS
TTS založené na LLM, které běží na procesoru, GPU nebo prohlížeči přes lama.cpp a Transformers.js.
Jazyky: en
Klonový hlas
Pocket TTS
Lehký model parametru 100M od Kyutai s klonováním hlasu z jednoho vzorku.
Jazyky: en, fr
Klonový hlas
CosyVoice3
Next-generation multilingual TTS with bi-streaming, emotion control, and zero-shot voice cloning.
Jazyky: en, zh, ja, ko, de, es, fr, it, ru
Klonový hlas
MOSS-TTS
Ultra-long 20-language TTS supporting up to 1 hour of continuous generation with phoneme-level control.
Jazyky: en, zh, de, es, fr, ja, it, hu, ko, ru, fa, ar, pl, pt, cs, da, sv, el, tr
Klonový hlas
MegaTTS3
ByteDance's sparse alignment TTS with adjustable intelligibility vs. speaker similarity.
Jazyky: en, zh
Klonový hlasVývojář-První API
OpenAI kompatibilní REST API. Jeden cíl, 22+ modely. Streamování podpory pro aplikace v reálném čase.
- Formát kompatibilní s OpenAI
- Streamování TTS pro aplikace v reálném čase
- Zpracovávání šarží pro velká pracovní místa
- Oznámení o webhooku
pip install ttsai
npm install @ttsainpm/ttsai
from tts_ai import TTSClient
client = TTSClient(api_key="sk-tts-xxx")
audio = client.generate(
text="Hello from TTS.ai!",
model="kokoro",
voice="af_bella",
)
client.save(audio, "output.mp3")
Jednoduché, Průhledné ceny
Začněte zdarma, jak rostete.
Volné
15 kreditů
- Kokoro, Piper, VITS, MeloTTS
- Limit 500 znaků
- 3 gen/hod (bez účtu)
Starter
500 kreditů/měsíc
- Všechny 22+ modely
- 100 000 znaků na generaci
- Klonování hlasu
Pro
2 000 kreditů/měsíc
- Všechno v Starteru
- Přístup API
- Prioritní zpracování
Často kladené otázky
Co bychom mohli zlepšit? Vaše zpětná vazba nám pomáhá řešit problémy.
Začněte používat AI hlas dnes
Připojte se k tvůrcům, developerům a podnikům využívajícím TTS.ai