Free AI Text proslovu

31+ modely open-source, 231+ hlasy, 34+ jazyky, žádný účet není nutný.

8K+
tvůrci
30K+
generace
31+
Modely AI
231+
hlasy
0/500 znaky · Sign up for 5,000 per generation → Volné
Miluju TTS.ai? Řekni to svým přátelům!

Vše, co potřebujete pro hlas AI

30+ nářadí poháněné modely Open-source AI

31+ AI Voice Models

Nejkomplexnější kolekce modelů TTS open-source na jedné platformě

KokoroKokoro Free

Kokoro je 82 milionů parametru text-to-speech model, který punčuje daleko nad jeho hmotnost třídy. Navzdory své malé velikosti, produkuje pozoruhodně přírodní a expresivní řeč. Kokoro podporuje více jazyků včetně angličtiny, japonštiny, čínštiny a korejštiny s řadou expresivních hlasů. To běží neuvěřitelně rychle, generování zvuku téměř 100x rychleji než v reálném čase na GPU.

Nejlepší pro: Vysoce kvalitní TTS s minimální latence, streaming aplikace

Zkuste zdarma

PiperPiper Free

Piper je lehký text-to-speech motor vyvinutý Rhasspy, který používá VITS a hrtan architektury. To běží zcela na CPU, což je ideální pro hrany zařízení, domácí automatizace, a aplikace vyžadující offline TTS. S více než 100 hlasy v 30 + jazyky, Piper poskytuje přírodní-zpívající řeč při rychlostech v reálném čase i na Malina Pi 4.

Nejlepší pro: Rychlé náhledy, dostupnost a vložené aplikace

Zkuste zdarma

VITSVITS Free

VITS (Variational Inference with adversarial learning for end-to-end Text-to-Speech) je paralelní metoda TTS ke konci, která generuje více přirozeného zvuku než současné dvoustupňové modely. Přijímá variační inferenci rozšířenou o normalizační toky a protivní výcvikový proces, který dosahuje významného zlepšení přirozenosti.

Nejlepší pro: Univerzální text-to-speech s přírodní prosodou

Zkuste zdarma

MeloTTSMeloTTS Free

MeloTTS by MyShell.ai je vícejazyčná TTS knihovna podporující angličtinu (American, British, Indian, Australan), španělštinu, francouzštinu, čínštinu, japonštinu a korejštinu. Je to velmi rychlé, zpracování textu při rychlosti téměř v reálném čase na procesoru sám. MeloTTS je určen pro výrobu a podporuje jak CPU a GPU inference.

Nejlepší pro: Výrobní aplikace potřebné rychle, vícejazyčné TTS

Zkuste zdarma

OuteTTSOuteTTS Free

OuteTTS rozšiřuje velké jazykové modely s funkcemi text-to-speech při zachování původní architektury. Podporuje více backendů včetně lama.cpp (CPU/GPU), objímání transformerů obličeje, ExLlamaV2, VLLM, a dokonce i inference prohlížeče přes Transformers.js. Funkce klonování hlasu s nulovým výstřelem přes reproduktorové profily uložené jako JSON.

Nejlepší pro: Zavádění hran, TTS na bázi prohlížeče, prostředí s nízkým zdrojem

Zkuste zdarma

Pocket TTSPocket TTS Free

Kapesní TTS od Kyutai (tvůrci Moshi) je kompaktní 100M parametr text-to-speech modelu, který prorazí vysoko nad svou váhu. To běží efektivně na CPU, podporuje nulovací hlasové klonování z jediného zvukového vzorku, a produkuje přirozený-zvučení řeči. Malá velikost modelu je ideální pro nasazení hran a nízko-zdrojové prostředí.

Nejlepší pro: Lehké nasazení, prostředí pouze CPU, rychlé klonování hlasu

Zkuste zdarma

Kitten TTSKitten TTS Free

Kitten TTS by KittenML je ultralehký text-to-speech model postavený na ONNX. S variantami od 15M do 80M parametry (25-80 MB na disku), poskytuje vysoce kvalitní hlasovou syntézu na procesoru bez nutnosti GPU. Vlastnosti 8 vestavěných hlasů, nastavitelná rychlost řeči a vestavěný text předzpracování pro čísla, měny a jednotky. Ideální pro nasazení hran a nízkonákladové aplikace.

Nejlepší pro: Rychlé lehké TTS, nasazení hran, nízkonákladové aplikace

Zkuste zdarma

BarkBark Standard

Model na bázi transformeru, který vytváří realistickou řeč, hudbu a zvukové efekty.

Vývojář: Suno · Licence: MIT

Zkus to.

Bark SmallBark Small Standard

Osvětlená verze Barku s rychlejší inferencí a nižším využitím paměti.

Vývojář: Suno · Licence: MIT

Zkus to.

CosyVoice 2CosyVoice 2 Standard

Alibaba je škálovatelný streaming TTS s lidskou-parity přirozenost a téměř-nula latence.

Vývojář: Alibaba (Tongyi Lab) · Licence: Apache 2.0

Zkus to.

Dia TTSDia TTS Standard

Model generování dialogů s více reproduktory, který vytváří přirozené konverzace mezi reproduktory.

Vývojář: Nari Labs · Licence: Apache 2.0

Zkus to.

Parler TTSParler TTS Standard

Popište hlas, který chcete v přirozeném jazyce a Parler generuje odpovídající řeč.

Vývojář: Hugging Face · Licence: Apache 2.0

Zkus to.

GLM-TTSGLM-TTS Standard

Dosáhne nejnižší chybovost znaku mezi modely TTS open-source.

Vývojář: Zhipu AI · Licence: GLM-4 License

Zkus to.

IndexTTS-2IndexTTS-2 Standard

Nula-shot TTS s jemně zakořeněnou emocionální kontrolou a vysokou expresivitou.

Vývojář: Index Team · Licence: Bilibili Model License

Zkus to.

Spark TTSSpark TTS Standard

Hlasové klonování TTS s ovladatelnými emocemi a stylem mluvení prostřednictvím podnětů.

Vývojář: SparkAudio · Licence: CC BY-NC-SA 4.0

Zkus to.

GPT-SoVITSGPT-SoVITS Standard

Několik-shot hlas klonování TTS, který replikuje jakýkoliv hlas z pouhých 5 sekund zvuku.

Vývojář: RVC-Boss · Licence: MIT

Zkus to.

OrpheusOrpheus Standard

Lidský emocionální TTS model vycvičený na 100K hodin řečových dat.

Vývojář: Canopy Labs · Licence: Llama 3.2 Community

Zkus to.

Qwen3 TTSQwen3 TTS Standard

Alibaba je vícejazyčné TTS s klonováním hlasu, přednastavené hlasy, a hlasový design z textu.

Vývojář: Alibaba (Qwen) · Licence: Apache 2.0

Zkus to.

Chatterbox TurboChatterbox Turbo Standard

Rychlejší Chatterbox s sub-200ms latence a paralinguistické značky pro smích, kašel, a další.

Vývojář: Resemble AI · Licence: MIT

Zkus to.

Dia 2Dia 2 Standard

Streamování-první konverzační TTS s multi-reproduktor dialog a paralinguistické narážky.

Vývojář: Nari Labs · Licence: Apache 2.0

Zkus to.

VoxCPMVoxCPM Standard

Tokenizer-free TTS produkující 44.1kHz audio s kontextově-uvědomělý odstavec konzistence.

Vývojář: OpenBMB · Licence: Apache 2.0

Zkus to.

TADATADA Standard

Nula halucinace TTS s text-akustickou dvojitou seřízení, 5x rychlejší než srovnatelné LLM TTS.

Vývojář: Hume AI · Licence: MIT

Zkus to.

VibeVoiceVibeVoice Standard

Microsoft model pro dlouhý-formovat multi-reproduktor obsah, jako podcasty a audioknihy.

Vývojář: Microsoft · Licence: MIT

Zkus to.

CosyVoice3CosyVoice3 Standard

Next-generation multilingual TTS with bi-streaming, emotion control, and zero-shot voice cloning.

Vývojář: Alibaba (FunAudioLLM) · Licence: Apache 2.0

Zkus to.

ChatterboxChatterbox Premium

Nejmodernější klonování nulovacího hlasu s emoční kontrolou z Resse Al.

Kvalita:

Zkus to.

Tortoise TTSTortoise TTS Premium

Multi-voice text-to-speech zaměřený na kvalitu s autoregresivní architekturou.

Kvalita:

Zkus to.

StyleTTS 2StyleTTS 2 Premium

Lidská úroveň textu-k-mluvě prostřednictvím stylu difuze a protivní školení.

Kvalita:

Zkus to.

OpenVoiceOpenVoice Premium

Okamžité klonování hlasu s granulovanou kontrolou nad stylem, emocemi a přízvukem.

Kvalita:

Zkus to.

Sesame CSMSesame CSM Premium

Model konverzační řeči vytváří přirozený dialog s vhodným načasováním a emocemi.

Kvalita:

Zkus to.

MOSS-TTSMOSS-TTS Premium

Ultra-long 20-language TTS supporting up to 1 hour of continuous generation with phoneme-level control.

Kvalita:

Zkus to.

MegaTTS3MegaTTS3 Premium

ByteDance's sparse alignment TTS with adjustable intelligibility vs. speaker similarity.

Kvalita:

Zkus to.

CosyVoice 2CosyVoice 2

Alibaba je škálovatelný streaming TTS s lidskou-parity přirozenost a téměř-nula latence.

Jazyky: en, zh, ja, ko, fr, de, it, es

Klonový hlas

GLM-TTSGLM-TTS

Dosáhne nejnižší chybovost znaku mezi modely TTS open-source.

Jazyky: en, zh

Klonový hlas

IndexTTS-2IndexTTS-2

Nula-shot TTS s jemně zakořeněnou emocionální kontrolou a vysokou expresivitou.

Jazyky: en, zh

Klonový hlas

Spark TTSSpark TTS

Hlasové klonování TTS s ovladatelnými emocemi a stylem mluvení prostřednictvím podnětů.

Jazyky: en, zh

Klonový hlas

GPT-SoVITSGPT-SoVITS

Několik-shot hlas klonování TTS, který replikuje jakýkoliv hlas z pouhých 5 sekund zvuku.

Jazyky: en, zh, ja, ko

Klonový hlas

ChatterboxChatterbox

Nejmodernější klonování nulovacího hlasu s emoční kontrolou z Resse Al.

Jazyky: en

Klonový hlas

Tortoise TTSTortoise TTS

Multi-voice text-to-speech zaměřený na kvalitu s autoregresivní architekturou.

Jazyky: en

Klonový hlas

OpenVoiceOpenVoice

Okamžité klonování hlasu s granulovanou kontrolou nad stylem, emocemi a přízvukem.

Jazyky: en, zh, ja, ko, fr, de, es, it

Klonový hlas

Qwen3 TTSQwen3 TTS

Alibaba je vícejazyčné TTS s klonováním hlasu, přednastavené hlasy, a hlasový design z textu.

Jazyky: en, zh, ja, ko, de, fr, ru, pt, es, it

Klonový hlas

Chatterbox TurboChatterbox Turbo

Rychlejší Chatterbox s sub-200ms latence a paralinguistické značky pro smích, kašel, a další.

Jazyky: en

Klonový hlas

VoxCPMVoxCPM

Tokenizer-free TTS produkující 44.1kHz audio s kontextově-uvědomělý odstavec konzistence.

Jazyky: en, zh

Klonový hlas

OuteTTSOuteTTS

TTS založené na LLM, které běží na procesoru, GPU nebo prohlížeči přes lama.cpp a Transformers.js.

Jazyky: en

Klonový hlas

Pocket TTSPocket TTS

Lehký model parametru 100M od Kyutai s klonováním hlasu z jednoho vzorku.

Jazyky: en, fr

Klonový hlas

CosyVoice3CosyVoice3

Next-generation multilingual TTS with bi-streaming, emotion control, and zero-shot voice cloning.

Jazyky: en, zh, ja, ko, de, es, fr, it, ru

Klonový hlas

MOSS-TTSMOSS-TTS

Ultra-long 20-language TTS supporting up to 1 hour of continuous generation with phoneme-level control.

Jazyky: en, zh, de, es, fr, ja, it, hu, ko, ru, fa, ar, pl, pt, cs, da, sv, el, tr

Klonový hlas

MegaTTS3MegaTTS3

ByteDance's sparse alignment TTS with adjustable intelligibility vs. speaker similarity.

Jazyky: en, zh

Klonový hlas

Vývojář-První API

OpenAI kompatibilní REST API. Jeden cíl, 22+ modely. Streamování podpory pro aplikace v reálném čase.

  • Formát kompatibilní s OpenAI
  • Streamování TTS pro aplikace v reálném čase
  • Zpracovávání šarží pro velká pracovní místa
  • Oznámení o webhooku
Zobrazit API Docs
pip install ttsai npm install @ttsainpm/ttsai
Python
from tts_ai import TTSClient

client = TTSClient(api_key="sk-tts-xxx")
audio = client.generate(
    text="Hello from TTS.ai!",
    model="kokoro",
    voice="af_bella",
)
client.save(audio, "output.mp3")

Jednoduché, Průhledné ceny

Začněte zdarma, jak rostete.

Volné

$0

15 kreditů

  • Kokoro, Piper, VITS, MeloTTS
  • Limit 500 znaků
  • 3 gen/hod (bez účtu)
Zaregistrovat se zdarma

Starter

$9/ne

500 kreditů/měsíc

  • Všechny 22+ modely
  • 100 000 znaků na generaci
  • Klonování hlasu
Začněte
Nejoblíbenější

Pro

$29/ne

2 000 kreditů/měsíc

  • Všechno v Starteru
  • Přístup API
  • Prioritní zpracování
Get Pro

Obchod

$99/ne

10 000 kreditů/měsíc

  • Everything in Pro
  • Bulk API
  • Prioritní fronta
Get business

Zobrazit všechny plány včetně znakových balíčků →

Často kladené otázky

TTS.ai je nejkomplexnější hlasová platforma AI, která nabízí 22+ text-to-speech modely, hlasové klonování, řeč-to-text, a audio nástroje. Všechny modely jsou otevřené zdroje bez uzamykatelné prodejce.

Ano! TTS.ai nabízí zdarma text-to-speech s Kokoro, Piper, VITS, a Melotts modely. Není nutné žádný účet. Zaregistrujte se získat 15,000 volných znaků a přístup ke všem modelům. Placené plány začínají na $9/měsíc.

Pro rychlost použijte Kokoro nebo Piper. Pro kvalitu zkuste CosyVoice 2 nebo StyletTS 2. Pro klonování hlasu použijte Chatterbox nebo GPT-SoviTS. Pro dialog použijte Dia TTS. Zkuste více modelů na stejném textu.

Ano. OpenAI kompatibilní REST API pro TTS, STT, hlasové klonování a audio nástroje. K dispozici na Pro ($29/mo) a Enterprise ($99/mo) plány. Zobrazit dokumentaci na tts.ai/api/.

Kvalita hlasu se liší podle modelu. Premium modely jako CosyVoice 2, StyleTTS 2, a Chatterbox produkují téměř lidské kvality řeči s přírodní intonací a emocí. Volné modely jako Kokoro nabízejí vynikající kvalitu pro většinu případů použití.

TTS.ai podporuje 30+ jazyků napříč svou modelovou knihovnou. Angličtina má nejširší modelovou podporu, ale modely jako CosyVoice 2 pokrývají čínštinu, japonštinu a korejštinu; GPT-Sovits zpracovává čínské, japonské, korejské a anglické; a MeloTTS podporuje angličtinu, španělštinu, francouzštinu, čínštinu, japonštinu a korejštinu.

Ano. Veškeré zpracování probíhá na našich dedikovaných GPU serverech. Vaše textové vstupy nebo generované audio neukládáme po doručení. Nahrané hlasové vzorky pro klonování se používají pouze pro aktuální relaci a nejsou uchovávány. Vaše údaje nikdy nesdílíme se třetími stranami ani je nepoužíváme k tréninku modelů.

Ano. Všechny audio generované na TTS.ai je vaše používat komerčně, včetně pro YouTube videa, podcasty, audioknihy, aplikace, reklamy, a produkty. Naše modely jsou open source pod povolenými licencemi (MIT, Apache 2.0). Žádné poplatky nebo přiřazení vyžadují.

TTS.ai generuje zvuk ve formátu WAV ve výchozím nastavení pro maximální kvalitu. Můžete převést do MP3, FLAC, OGG, nebo M4A pomocí našeho bezplatného nástroje Audio Converter. API podporuje upřesnění vašeho preferovaného výstupního formátu přímo v žádosti.

Odeslání krátkého zvukového vzorku (méně než 5 sekund) hlasu, který chcete klonovat, pak zadejte jakýkoliv text pro generování řeči v tomto hlase. Modely jako Chatterbox, GPT-Sovits, a CosyVoice 2 podporují klonování hlasu. Naklonovaný hlas zachycuje tón, akcent, a mluvící styl.

Zdarma modely (Kokoro, Piper, VITS, Melotts) nevyžadují žádný účet a stojí nula znaků. Standardní modely (2 000 znaků/1K vstup) zahrnují Bark, CosyVoice 2, F5-TTS, a Dia. Premium modely (4 000 znaků/1K vstup) zahrnují OpenVoice, Chatterbox, Styletts 2, a Tortoise. Placené modely obecně nabízejí vyšší kvalitu, více hlasů, a další funkce jako hlasové klonování.

Ano. API podporuje dávkové zpracování pro převod velkých objemů textu do řeči. Odevzdejte více žádostí a získat výsledky asynchronně pomocí práce UUIDS. Enterprise plány ($99/mo) zahrnují přednostní fronta přístup pro rychlejší zpracování šarží. Ideální pro audioknihu výrobu, obsah kurzu, a velkoplošné projekty hlasového přehrávání.
4.1/5 (21)

Co bychom mohli zlepšit? Vaše zpětná vazba nám pomáhá řešit problémy.

Začněte používat AI hlas dnes

Připojte se k tvůrcům, developerům a podnikům využívajícím TTS.ai