Free AI Text proslovu

33+ modely open-source, 273+ hlasy, 33+ jazyky, žádný účet není nutný.

17K+
tvůrci
70K+
generace
33+
Modely AI
273+
hlasy
Miluju TTS.ai? Řekni to svým přátelům!

Vše, co potřebujete pro hlas AI

30+ nářadí poháněné modely Open-source AI

33+ AI Voice Models

Nejkomplexnější kolekce modelů TTS open-source na jedné platformě

KokoroKokoro Volné

Kokoro je 82 milionů parametru text-to-speech model, který punčuje daleko nad jeho hmotnost třídy. Navzdory své malé velikosti, produkuje pozoruhodně přírodní a expresivní řeč. Kokoro podporuje více jazyků včetně angličtiny, japonštiny, čínštiny a korejštiny s řadou expresivních hlasů. To běží neuvěřitelně rychle, generování zvuku téměř 100x rychleji než v reálném čase na GPU.

Nejlepší pro: Vysoce kvalitní TTS s minimální latence, streaming aplikace

Zkuste zdarma

PiperPiper Volné

Piper je lehký text-to-speech motor vyvinutý Rhasspy, který používá VITS a hrtan architektury. To běží zcela na CPU, což je ideální pro hrany zařízení, domácí automatizace, a aplikace vyžadující offline TTS. S více než 100 hlasy v 30 + jazyky, Piper poskytuje přírodní-zpívající řeč při rychlostech v reálném čase i na Malina Pi 4.

Nejlepší pro: Rychlé náhledy, dostupnost a vložené aplikace

Zkuste zdarma

VITSVITS Volné

VITS (Variational Inference with adversarial learning for end-to-end Text-to-Speech) je paralelní metoda TTS ke konci, která generuje více přirozeného zvuku než současné dvoustupňové modely. Přijímá variační inferenci rozšířenou o normalizační toky a protivní výcvikový proces, který dosahuje významného zlepšení přirozenosti.

Nejlepší pro: Univerzální text-to-speech s přírodní prosodou

Zkuste zdarma

MeloTTSMeloTTS Volné

MeloTTS by MyShell.ai je vícejazyčná TTS knihovna podporující angličtinu (American, British, Indian, Australan), španělštinu, francouzštinu, čínštinu, japonštinu a korejštinu. Je to velmi rychlé, zpracování textu při rychlosti téměř v reálném čase na procesoru sám. MeloTTS je určen pro výrobu a podporuje jak CPU a GPU inference.

Nejlepší pro: Výrobní aplikace potřebné rychle, vícejazyčné TTS

Zkuste zdarma

Kani TTS 2Kani TTS 2 Volné

Kani-TTS-2 od NineNineSix je ultra-lehký 400M parametr model postavený na Liquid AI LFM2 páteře s NVIDIA NanoCodec. To běží v pouhých 3GB VRAM a produkuje ~10 sekund řeči za ~2 sekundy na A100 (RTF 0.2). Současné veřejné vydání lodí pouze angličtina-kani-tts-2-en[2] checkpoint a nevystavuje reproduktor-embedding háček potřebný pro klonování hlasu ~2 používá Chatterbox / IndexTTS2 / F5-TTS pro klonování, nebo Kokoro / MeloTTS pro non-angličtina.

Nejlepší pro: Rychlá anglická generace na nízkoVRAM hardware, rychlé náhledy

Zkuste zdarma

OuteTTSOuteTTS Volné

OuteTTS rozšiřuje velké jazykové modely s funkcemi text-to-speech při zachování původní architektury. Podporuje více backendů včetně lama.cpp (CPU/GPU), objímání transformerů obličeje, ExLlamaV2, VLLM, a dokonce i inference prohlížeče přes Transformers.js. Funkce klonování hlasu s nulovým výstřelem přes reproduktorové profily uložené jako JSON.

Nejlepší pro: Zavádění hran, TTS na bázi prohlížeče, prostředí s nízkým zdrojem

Zkuste zdarma

Pocket TTSPocket TTS Volné

Kapesní TTS od Kyutai (tvůrci Moshi) je kompaktní 100M parametr text-to-speech modelu, který prorazí vysoko nad svou váhu. To běží efektivně na CPU, podporuje nulovací hlasové klonování z jediného zvukového vzorku, a produkuje přirozený-zvučení řeči. Malá velikost modelu je ideální pro nasazení hran a nízko-zdrojové prostředí.

Nejlepší pro: Lehké nasazení, prostředí pouze CPU, rychlé klonování hlasu

Zkuste zdarma

Kitten TTSKitten TTS Volné

Kitten TTS by KittenML je ultralehký text-to-speech model postavený na ONNX. S variantami od 15M do 80M parametry (25-80 MB na disku), poskytuje vysoce kvalitní hlasovou syntézu na procesoru bez nutnosti GPU. Vlastnosti 8 vestavěných hlasů, nastavitelná rychlost řeči a vestavěný text předzpracování pro čísla, měny a jednotky. Ideální pro nasazení hran a nízkonákladové aplikace.

Nejlepší pro: Rychlé lehké TTS, nasazení hran, nízkonákladové aplikace

Zkuste zdarma

Ming-Omni TTSMing-Omni TTS Volné

Ming-omni-tts-0.5B podle inkluzeAI je kompaktní omni-modální model řeči postavený na BailingMM husté páteři s Patch-by-Patch flow-match-match audio dekodér. Dodává 44.1kHz výstup (blízká kvalita CD), podporuje nulovací hlas klonování z 3+ druhé reference, a zahrnuje vestavěný emoční / dialekt / BGM ovládání přes JSON pokyny. Vynikající stabilita 0,8% WER na čínské referenční hodnoty.

Nejlepší pro: Vysoce věrnostní dvojjazyčné vyprávění, emocionálně řízené hlasové hraní, čínský audioknihový obsah

Zkuste zdarma

MOSS-TTS NanoMOSS-TTS Nano Volné

MOSS-TTS-Nano-100M je kompaktní varianta 100M-parametrů OpenMOSS rodiny MOSS-TTS, která sdílí architekturu zpožděných transformátorů. Vyměňuje maximální kvalitu 8B modelu pro ~80x menší váhy a dramaticky nižší na žádost VRAM, takže je vhodná pro nasazení free-tier a high-throughput. Stejný 20-jazyčný dosah.

Nejlepší pro: Free-tier TTS, velkoobjemová výroba, nízkonákladové interaktivní použití

Zkuste zdarma

BarkBark Standardní

Model na bázi transformeru, který vytváří realistickou řeč, hudbu a zvukové efekty.

Vývojář: Suno · Licence: MIT

Zkus to.

Bark SmallBark Small Standardní

Osvětlená verze Barku s rychlejší inferencí a nižším využitím paměti.

Vývojář: Suno · Licence: MIT

Zkus to.

CosyVoice 2CosyVoice 2 Standardní

Alibaba je škálovatelný streaming TTS s lidskou-parity přirozenost a téměř-nula latence.

Vývojář: Alibaba (Tongyi Lab) · Licence: Apache 2.0

Zkus to.

Dia TTSDia TTS Standardní

Model generování dialogů s více reproduktory, který vytváří přirozené konverzace mezi reproduktory.

Vývojář: Nari Labs · Licence: Apache 2.0

Zkus to.

Parler TTSParler TTS Standardní

Popište hlas, který chcete v přirozeném jazyce a Parler generuje odpovídající řeč.

Vývojář: Hugging Face · Licence: Apache 2.0

Zkus to.

IndexTTS-2IndexTTS-2 Standardní

Nula-shot TTS s jemně zakořeněnou emocionální kontrolou a vysokou expresivitou.

Vývojář: Index Team · Licence: Bilibili Model License

Zkus to.

Spark TTSSpark TTS Standardní

Hlasové klonování TTS s ovladatelnými emocemi a stylem mluvení prostřednictvím podnětů.

Vývojář: SparkAudio · Licence: CC BY-NC-SA 4.0

Zkus to.

GPT-SoVITSGPT-SoVITS Standardní

Několik-shot hlas klonování TTS, který replikuje jakýkoliv hlas z pouhých 5 sekund zvuku.

Vývojář: RVC-Boss · Licence: MIT

Zkus to.

OrpheusOrpheus Standardní

Lidský emocionální TTS model vycvičený na 100K hodin řečových dat.

Vývojář: Canopy Labs · Licence: Llama 3.2 Community

Zkus to.

Qwen3 TTSQwen3 TTS Standardní

Alibaba je vícejazyčné TTS s předem nastavenými hlasy a hlasový design z textu.

Vývojář: Alibaba (Qwen) · Licence: Apache 2.0

Zkus to.

VieNeu-TTS-v2VieNeu-TTS-v2 Standardní

Vietnamec + anglický kód-přepínač TTS se 7 přednastavené hlasy a nulovací hlas klonování. CPU-pouze, není potřeba GPU.

Vývojář: Phạm Nguyễn Ngọc Bảo · Licence: Apache 2.0

Zkus to.

Chatterbox TurboChatterbox Turbo Standardní

Rychlejší Chatterbox s sub-200ms latence a paralinguistické značky pro smích, kašel, a další.

Vývojář: Resemble AI · Licence: MIT

Zkus to.

VoxCPMVoxCPM Standardní

Tokenizer-free TTS produkující 44.1kHz audio s kontextově-uvědomělý odstavec konzistence.

Vývojář: OpenBMB · Licence: Apache 2.0

Zkus to.

VibeVoiceVibeVoice Standardní

Microsoft model pro dlouhý-formovat multi-reproduktor obsah, jako podcasty a audioknihy.

Vývojář: Microsoft · Licence: MIT

Zkus to.

CosyVoice3CosyVoice3 Standardní

Další generace vícejazyčných TTS s bi-streamováním, ovládáním emocí a bezvýstřelovým klonováním hlasu.

Vývojář: Alibaba (FunAudioLLM) · Licence: Apache 2.0

Zkus to.

NAMAA Saudi TTSNAMAA Saudi TTS Standardní

První otevřený saúdsko-arabský TTS, rodilý saúdský dialekt s klonováním hlasu v Chatterboxu.

Vývojář: NAMAA Space · Licence: MIT

Zkus to.

Darwin TTSDarwin TTS Standardní

Cross-modal Qwen3-TTS varianta se závažími FFN smíchanými z jazykového modelu Qwen3-1.7B pro ostřejší vícejazyčné klonování.

Vývojář: FINAL-Bench · Licence: Apache 2.0

Zkus to.

MOSS-TTSDMOSS-TTSD Standardní

Multi-speaker dialog pokračování modelu?, generovat podcast-styl konverzace s až 5 reproduktory a 60 minut soudržného zvuku.

Vývojář: OpenMOSS · Licence: Apache 2.0

Zkus to.

ChatterboxChatterbox Prémie

Nejmodernější klonování nulovacího hlasu s emoční kontrolou z Resse Al.

Kvalita:

Zkus to.

Tortoise TTSTortoise TTS Prémie

Multi-voice text-to-speech zaměřený na kvalitu s autoregresivní architekturou.

Kvalita:

Zkus to.

StyleTTS 2StyleTTS 2 Prémie

Lidská úroveň textu-k-mluvě prostřednictvím stylu difuze a protivní školení.

Kvalita:

Zkus to.

OpenVoiceOpenVoice Prémie

Okamžité klonování hlasu s granulovanou kontrolou nad stylem, emocemi a přízvukem.

Kvalita:

Zkus to.

Sesame CSMSesame CSM Prémie

Model konverzační řeči vytváří přirozený dialog s vhodným načasováním a emocemi.

Kvalita:

Zkus to.

CosyVoice 2CosyVoice 2

Alibaba je škálovatelný streaming TTS s lidskou-parity přirozenost a téměř-nula latence.

Jazyky: en, zh, ja, ko, fr, de, it, es

Klonový hlas

IndexTTS-2IndexTTS-2

Nula-shot TTS s jemně zakořeněnou emocionální kontrolou a vysokou expresivitou.

Jazyky: en, zh

Klonový hlas

Spark TTSSpark TTS

Hlasové klonování TTS s ovladatelnými emocemi a stylem mluvení prostřednictvím podnětů.

Jazyky: en, zh

Klonový hlas

GPT-SoVITSGPT-SoVITS

Několik-shot hlas klonování TTS, který replikuje jakýkoliv hlas z pouhých 5 sekund zvuku.

Jazyky: en, zh, ja, ko

Klonový hlas

ChatterboxChatterbox

Nejmodernější klonování nulovacího hlasu s emoční kontrolou z Resse Al.

Jazyky: en

Klonový hlas

Tortoise TTSTortoise TTS

Multi-voice text-to-speech zaměřený na kvalitu s autoregresivní architekturou.

Jazyky: en

Klonový hlas

OpenVoiceOpenVoice

Okamžité klonování hlasu s granulovanou kontrolou nad stylem, emocemi a přízvukem.

Jazyky: en, zh, ja, ko, fr, es

Klonový hlas

VieNeu-TTS-v2VieNeu-TTS-v2

Vietnamec + anglický kód-přepínač TTS se 7 přednastavené hlasy a nulovací hlas klonování. CPU-pouze, není potřeba GPU.

Jazyky: vi, en

Klonový hlas

Chatterbox TurboChatterbox Turbo

Rychlejší Chatterbox s sub-200ms latence a paralinguistické značky pro smích, kašel, a další.

Jazyky: en

Klonový hlas

VoxCPMVoxCPM

Tokenizer-free TTS produkující 44.1kHz audio s kontextově-uvědomělý odstavec konzistence.

Jazyky: en, zh

Klonový hlas

OuteTTSOuteTTS

TTS založené na LLM, které běží na procesoru, GPU nebo prohlížeči přes lama.cpp a Transformers.js.

Jazyky: en

Klonový hlas

Pocket TTSPocket TTS

Lehký model parametru 100M od Kyutai s klonováním hlasu z jednoho vzorku.

Jazyky: en, fr

Klonový hlas

CosyVoice3CosyVoice3

Další generace vícejazyčných TTS s bi-streamováním, ovládáním emocí a bezvýstřelovým klonováním hlasu.

Jazyky: en, zh, ja, ko, de, es, fr, it, ru

Klonový hlas

NAMAA Saudi TTSNAMAA Saudi TTS

První otevřený saúdsko-arabský TTS, rodilý saúdský dialekt s klonováním hlasu v Chatterboxu.

Jazyky: ar

Klonový hlas

Darwin TTSDarwin TTS

Cross-modal Qwen3-TTS varianta se závažími FFN smíchanými z jazykového modelu Qwen3-1.7B pro ostřejší vícejazyčné klonování.

Jazyky: en, ko, ja, zh

Klonový hlas

MOSS-TTSDMOSS-TTSD

Multi-speaker dialog pokračování modelu?, generovat podcast-styl konverzace s až 5 reproduktory a 60 minut soudržného zvuku.

Jazyky: en, zh

Klonový hlas

Ming-Omni TTSMing-Omni TTS

Kompaktní model 0.5B omni-modální řeči z inkluzeAI s vysokou věrností 44.1kHz výstupem a bezvýstřelovým klonováním hlasu.

Jazyky: en, zh

Klonový hlas

MOSS-TTS NanoMOSS-TTS Nano

Drobná varianta 100M MOSS-TTS, stejná architektura, 80x menší, free-tier latency.

Jazyky: en, zh, de, es, fr, ja, it, ko, ru, ar, pt

Klonový hlas

Vývojář-První API

OpenAI kompatibilní REST API. Jeden cíl, 22+ modely. Streamování podpory pro aplikace v reálném čase.

  • Formát kompatibilní s OpenAI
  • Streamování TTS pro aplikace v reálném čase
  • Zpracovávání šarží pro velká pracovní místa
  • Oznámení o webhooku
Zobrazit API Docs
pip install ttsai npm install @ttsainpm/ttsai
Python
from tts_ai import TTSClient

client = TTSClient(api_key="sk-tts-xxx")
audio = client.generate(
    text="Hello from TTS.ai!",
    model="kokoro",
    voice="af_bella",
)
client.save(audio, "output.mp3")

Jednoduché, Průhledné ceny

Začněte zdarma, jak rostete.

Volné

$0

15 000 znaků + 5 000/den

  • 7 volných modelů včetně Kokoro
  • 5,000 znaků na generaci
  • Součástí je přístup API
Zaregistrovat se zdarma

Starter

$9/ne

500 kreditů/měsíc

  • Všechny 22+ modely
  • 100 000 znaků na generaci
  • Klonování hlasu
Začněte
Nejoblíbenější

Pro

$29/ne

2 000 kreditů/měsíc

  • Všechno v Starteru
  • Přístup API
  • Prioritní zpracování
Get Pro

Obchod

$99/ne

10 000 kreditů/měsíc

  • Everything in Pro
  • Bulk API
  • Prioritní fronta
Get business

Zobrazit všechny plány včetně znakových balíčků →

Často kladené otázky

TTS.ai je nejkomplexnější hlasová platforma AI, která nabízí 22+ text-to-speech modely, hlasové klonování, řeč-to-text, a audio nástroje. Všechny modely jsou otevřené zdroje bez uzamykatelné prodejce.

Ano! TTS.ai nabízí zdarma text-to-speech s Kokoro, Piper, VITS, a Melotts modely. Není nutné žádný účet. Zaregistrujte se získat 15,000 volných znaků a přístup ke všem modelům. Placené plány začínají na $9/měsíc.

Pro rychlost použijte Kokoro nebo Piper. Pro kvalitu zkuste CosyVoice 2 nebo StyletTS 2. Pro klonování hlasu použijte Chatterbox nebo GPT-SoviTS. Pro dialog použijte Dia TTS. Zkuste více modelů na stejném textu.

Ano. OpenAI-kompatibilní REST API pro TTS, STT, hlasové klonování, a audio nástroje. Zahrnuto na každém plánu včetně zdarma, s omezeními sazeb, které škálují podle úrovně (Zdarma: 10 req/min, Lite: 20, Starter: 30, Pro: 60, Business: 300). Zobrazit dokumentaci na tts.ai/api/.

Kvalita hlasu se liší podle modelu. Premium modely jako CosyVoice 2, StyleTTS 2, a Chatterbox produkují téměř lidské kvality řeči s přírodní intonací a emocí. Volné modely jako Kokoro nabízejí vynikající kvalitu pro většinu případů použití.

TTS.ai podporuje 30+ jazyků napříč svou modelovou knihovnou. Angličtina má nejširší modelovou podporu, ale modely jako CosyVoice 2 pokrývají čínštinu, japonštinu a korejštinu; GPT-Sovits zpracovává čínské, japonské, korejské a anglické; a MeloTTS podporuje angličtinu, španělštinu, francouzštinu, čínštinu, japonštinu a korejštinu.

Ano. Veškeré zpracování probíhá na našich dedikovaných GPU serverech. Vaše textové vstupy nebo generované audio neukládáme po doručení. Nahrané hlasové vzorky pro klonování se používají pouze pro aktuální relaci a nejsou uchovávány. Vaše údaje nikdy nesdílíme se třetími stranami ani je nepoužíváme k tréninku modelů.

Ano. Všechny audio generované na TTS.ai je vaše používat komerčně, včetně pro YouTube videa, podcasty, audioknihy, aplikace, reklamy, a produkty. Naše modely jsou open source pod povolenými licencemi (MIT, Apache 2.0). Žádné poplatky nebo přiřazení vyžadují.

TTS.ai generuje zvuk ve formátu WAV ve výchozím nastavení pro maximální kvalitu. Můžete převést do MP3, FLAC, OGG, nebo M4A pomocí našeho bezplatného nástroje Audio Converter. API podporuje upřesnění vašeho preferovaného výstupního formátu přímo v žádosti.

Odeslání krátkého zvukového vzorku (méně než 5 sekund) hlasu, který chcete klonovat, pak zadejte jakýkoliv text pro generování řeči v tomto hlase. Modely jako Chatterbox, GPT-Sovits, a CosyVoice 2 podporují klonování hlasu. Naklonovaný hlas zachycuje tón, akcent, a mluvící styl.

Zdarma modely (Kokoro, Piper, VITS, Melotts) nevyžadují žádný účet a stojí nula znaků. Standardní modely (2 000 znaků/1K vstup) zahrnují Bark, CosyVoice 2, F5-TTS, a Dia. Premium modely (4 000 znaků/1K vstup) zahrnují OpenVoice, Chatterbox, Styletts 2, a Tortoise. Placené modely obecně nabízejí vyšší kvalitu, více hlasů, a další funkce jako hlasové klonování.

Ano. API podporuje dávkové zpracování pro převod velkých objemů textu do řeči. Předložte více žádostí a získat výsledky asynchronně pomocí práce UUIDS. Obchodní plán ($99/mo) a vyšší patří prioritní fronta přístup pro rychlejší zpracování šarží. Ideální pro audioknihu výrobu, obsah kurzu, a velkoplošné projekty hlasového přehrávání.
4.1/5 (42)

Co bychom mohli zlepšit? Vaše zpětná vazba nám pomáhá řešit problémy.

Začněte používat AI hlas dnes

Připojte se k tvůrcům, developerům a podnikům využívajícím TTS.ai