Free AI Prevod textu na reč

31+ open-source modely, 231+ hlasy, 34+ Nie je potrebný žiadny účet.

8K+
tvorcovia
30K+
generácie
31+
Modely umelej inteligencie
231+
hlasy
0/500 znaky · Sign up for 5,000 per generation → Zadarmo
Láska TTS.ai? Povedzte svojim priateľom!

Všetko, čo potrebujete pre hlasovú umelú inteligenciu

Viac ako 30 nástrojov využívajúcich open-source modely umelej inteligencie

31+ AI hlasové modely

Najkomplexnejšia kolekcia open-source modelov TTS v jednej platforme

KokoroKokoro Free

Kokoro je model prevodu textu na reč s 82 miliónmi parametrov, ktorý výrazne prevyšuje svoju hmotnostnú triedu. Napriek svojej malej veľkosti produkuje pozoruhodne prirodzenú a expresívnu reč. Kokoro podporuje viacero jazykov vrátane angličtiny, japončiny, čínštiny a kórejčiny s rôznymi expresívnymi hlasmi. Beží neuveriteľne rýchlo - generuje zvuk takmer 100x rýchlejšie ako v reálnom čase na GPU.

Najlepšie pre: Vysoko kvalitný TTS s minimálnou latenciou, streaming aplikácie

Vyskúšajte zadarmo

PiperPiper Free

Piper je ľahký text-to-speech engine vyvinutý spoločnosťou Rhasspy, ktorý využíva VITS a larynx architektúry.Beží výlučne na CPU, takže je ideálny pre hraničné zariadenia, domácu automatizáciu a aplikácie vyžadujúce offline TTS. S viac ako 100 hlasmi v 30+ jazykoch, Piper prináša prirodzene znejúcu reč v reálnom čase aj na Raspberry Pi 4.

Najlepšie pre: Rýchle náhľady, prístupnosť a vložené aplikácie

Vyskúšajte zadarmo

VITSVITS Free

VITS (Variational Inference with adversarial learning for end-to-end Text-to-Speech) je paralelná metóda prekladu textu na reč, ktorá generuje prirodzenejšie znejúci zvuk ako súčasné dvojstupňové modely.Prijíma variačnú inferenciu rozšírenú o normalizačné toky a proces konkurenčného tréningu, čím sa dosiahne výrazné zlepšenie prirodzenosti.

Najlepšie pre: Všeobecný prevod textu na reč s prirodzenou prozódiou

Vyskúšajte zadarmo

MeloTTSMeloTTS Free

MeloTTS od MyShell.ai je viacjazyčná knižnica TTS podporujúca angličtinu (americká, britská, indická, austrálska), španielčinu, francúzštinu, čínštinu, japončinu a kórejčinu.Je extrémne rýchla, spracúva text rýchlosťou takmer v reálnom čase len na CPU.MeloTTS je navrhnutý pre produkčné použitie a podporuje odvodenie CPU aj GPU.

Najlepšie pre: Produkčné aplikácie vyžadujúce rýchly, viacjazyčný TTS

Vyskúšajte zadarmo

OuteTTSOuteTTS Free

OuteTTS rozširuje veľké jazykové modely o schopnosti premeny textu na reč pri zachovaní pôvodnej architektúry. Podporuje viacero backendov vrátane llama.cpp (CPU/GPU), Hugging Face Transformers, ExLlamaV2, VLLM a dokonca aj odvodenie z prehliadača prostredníctvom Transformers.js.

Najlepšie pre: Edge nasadenie, TTS na báze prehliadača, prostredia s nízkymi zdrojmi

Vyskúšajte zadarmo

Pocket TTSPocket TTS Free

Pocket TTS od Kyutai (tvorcovia Moshi) je kompaktný model premeny textu na reč s parametrami 100M, ktorý je oveľa ťažší ako jeho hmotnosť. Beží efektívne na CPU, podporuje klonovanie hlasu z jednej zvukovej vzorky a produkuje prirodzene znejúcu reč.

Najlepšie pre: Jednoduché nasadenie, prostredia len s procesorom, rýchle klonovanie hlasu

Vyskúšajte zadarmo

Kitten TTSKitten TTS Free

Kitten TTS by KittenML is an ultra-lightweight text-to-speech model built on ONNX. With variants from 15M to 80M parameters (25-80 MB on disk), it delivers high-quality voice synthesis on CPU without requiring a GPU. Features 8 built-in voices, adjustable speech speed, and built-in text preprocessing for numbers, currencies, and units. Ideal for edge deployment and low-latency applications.

Najlepšie pre: Fast lightweight TTS, edge deployment, low-latency applications

Vyskúšajte zadarmo

BarkBark Standard

Model prevodu textu na zvuk založený na transformátoroch, ktorý generuje realistickú reč, hudbu a zvukové efekty.

Názov vývojára: Suno · Licencia: MIT

Skúste si to

Bark SmallBark Small Standard

Odľahčená verzia Bark s rýchlejším odvodzovaním a nižším využitím pamäte.

Názov vývojára: Suno · Licencia: MIT

Skúste si to

CosyVoice 2CosyVoice 2 Standard

Alibaba škálovateľný streaming TTS s prirodzenosťou ľudskej parity a takmer nulovou latenciou.

Názov vývojára: Alibaba (Tongyi Lab) · Licencia: Apache 2.0

Skúste si to

Dia TTSDia TTS Standard

Model generovania dialógu s viacerými reproduktormi, ktorý vytvára prirodzené konverzácie medzi reproduktormi.

Názov vývojára: Nari Labs · Licencia: Apache 2.0

Skúste si to

Parler TTSParler TTS Standard

Popíšte hlas, ktorý chcete v prirodzenom jazyku a Parler generuje zodpovedajúcu reč.

Názov vývojára: Hugging Face · Licencia: Apache 2.0

Skúste si to

GLM-TTSGLM-TTS Standard

Dosahuje najnižšiu mieru chýb znakov medzi modelmi TTS s otvoreným zdrojovým kódom.

Názov vývojára: Zhipu AI · Licencia: GLM-4 License

Skúste si to

IndexTTS-2IndexTTS-2 Standard

Zero-shot TTS s jemnozrnnou kontrolou emócií a vysokou expresivitou.

Názov vývojára: Index Team · Licencia: Bilibili Model License

Skúste si to

Spark TTSSpark TTS Standard

Hlasové klonovanie TTS s kontrolovateľnými emóciami a štýlom hovorenia prostredníctvom výziev.

Názov vývojára: SparkAudio · Licencia: CC BY-NC-SA 4.0

Skúste si to

GPT-SoVITSGPT-SoVITS Standard

Niekoľko záberov klonovanie hlasu TTS, ktorý replikuje akýkoľvek hlas z iba 5 sekúnd zvuku.

Názov vývojára: RVC-Boss · Licencia: MIT

Skúste si to

OrpheusOrpheus Standard

Emocionálny model TTS na ľudskej úrovni trénovaný na 100 000 hodinách rečových dát.

Názov vývojára: Canopy Labs · Licencia: Llama 3.2 Community

Skúste si to

Qwen3 TTSQwen3 TTS Standard

Alibaba viacjazyčný TTS s klonovaním hlasu, prednastavené hlasy, a hlasový dizajn z textu.

Názov vývojára: Alibaba (Qwen) · Licencia: Apache 2.0

Skúste si to

Chatterbox TurboChatterbox Turbo Standard

Rýchlejší Chatterbox s latenciou menšou ako 200 ms a paralingvistickými značkami pre smiech, kašeľ a ďalšie.

Názov vývojára: Resemble AI · Licencia: MIT

Skúste si to

Dia 2Dia 2 Standard

Streamovanie ako prvé konverzačné TTS s dialógom viacerých reproduktorov a paralingvistickými nápovedami.

Názov vývojára: Nari Labs · Licencia: Apache 2.0

Skúste si to

VoxCPMVoxCPM Standard

Tokenizer-free TTS produkujúce 44.1kHz audio s kontextovou konzistenciou odsekov.

Názov vývojára: OpenBMB · Licencia: Apache 2.0

Skúste si to

TADATADA Standard

Zero-halucinácie TTS s textom-akustické duálne zarovnanie, 5x rýchlejšie ako porovnateľné LLM TTS.

Názov vývojára: Hume AI · Licencia: MIT

Skúste si to

VibeVoiceVibeVoice Standard

Model spoločnosti Microsoft pre dlhý obsah s viacerými reproduktormi, ako sú podcasty a audioknihy.

Názov vývojára: Microsoft · Licencia: MIT

Skúste si to

CosyVoice3CosyVoice3 Standard

Next-generation multilingual TTS with bi-streaming, emotion control, and zero-shot voice cloning.

Názov vývojára: Alibaba (FunAudioLLM) · Licencia: Apache 2.0

Skúste si to

ChatterboxChatterbox Premium

Najmodernejšie klonovanie hlasu s nulovým záberom s ovládaním emócií od spoločnosti Resemble AI.

Kvalita:

Skúste si to

Tortoise TTSTortoise TTS Premium

Multi-hlas text-to-speech zameraný na kvalitu s autoregresívnou architektúrou.

Kvalita:

Skúste si to

StyleTTS 2StyleTTS 2 Premium

Prevod textu na reč na ľudskej úrovni prostredníctvom difúzie štýlu a súboja.

Kvalita:

Skúste si to

OpenVoiceOpenVoice Premium

Okamžité klonovanie hlasu s granulárnou kontrolou nad štýlom, emóciami a prízvukom.

Kvalita:

Skúste si to

Sesame CSMSesame CSM Premium

Model konverzačnej reči generujúci prirodzený dialóg s vhodným načasovaním a emóciami.

Kvalita:

Skúste si to

MOSS-TTSMOSS-TTS Premium

Ultra-long 20-language TTS supporting up to 1 hour of continuous generation with phoneme-level control.

Kvalita:

Skúste si to

MegaTTS3MegaTTS3 Premium

ByteDance's sparse alignment TTS with adjustable intelligibility vs. speaker similarity.

Kvalita:

Skúste si to

CosyVoice 2CosyVoice 2

Alibaba škálovateľný streaming TTS s prirodzenosťou ľudskej parity a takmer nulovou latenciou.

Jazyky: en, zh, ja, ko, fr, de, it, es

Klon hlasu

GLM-TTSGLM-TTS

Dosahuje najnižšiu mieru chýb znakov medzi modelmi TTS s otvoreným zdrojovým kódom.

Jazyky: en, zh

Klon hlasu

IndexTTS-2IndexTTS-2

Zero-shot TTS s jemnozrnnou kontrolou emócií a vysokou expresivitou.

Jazyky: en, zh

Klon hlasu

Spark TTSSpark TTS

Hlasové klonovanie TTS s kontrolovateľnými emóciami a štýlom hovorenia prostredníctvom výziev.

Jazyky: en, zh

Klon hlasu

GPT-SoVITSGPT-SoVITS

Niekoľko záberov klonovanie hlasu TTS, ktorý replikuje akýkoľvek hlas z iba 5 sekúnd zvuku.

Jazyky: en, zh, ja, ko

Klon hlasu

ChatterboxChatterbox

Najmodernejšie klonovanie hlasu s nulovým záberom s ovládaním emócií od spoločnosti Resemble AI.

Jazyky: en

Klon hlasu

Tortoise TTSTortoise TTS

Multi-hlas text-to-speech zameraný na kvalitu s autoregresívnou architektúrou.

Jazyky: en

Klon hlasu

OpenVoiceOpenVoice

Okamžité klonovanie hlasu s granulárnou kontrolou nad štýlom, emóciami a prízvukom.

Jazyky: en, zh, ja, ko, fr, de, es, it

Klon hlasu

Qwen3 TTSQwen3 TTS

Alibaba viacjazyčný TTS s klonovaním hlasu, prednastavené hlasy, a hlasový dizajn z textu.

Jazyky: en, zh, ja, ko, de, fr, ru, pt, es, it

Klon hlasu

Chatterbox TurboChatterbox Turbo

Rýchlejší Chatterbox s latenciou menšou ako 200 ms a paralingvistickými značkami pre smiech, kašeľ a ďalšie.

Jazyky: en

Klon hlasu

VoxCPMVoxCPM

Tokenizer-free TTS produkujúce 44.1kHz audio s kontextovou konzistenciou odsekov.

Jazyky: en, zh

Klon hlasu

OuteTTSOuteTTS

LLM-založené TTS, ktorý beží na CPU, GPU, alebo prehliadač cez llama.cpp a Transformers.js.

Jazyky: en

Klon hlasu

Pocket TTSPocket TTS

Ľahký 100M parametrický model od Kyutai s klonovaním hlasu z jednej vzorky.

Jazyky: en, fr

Klon hlasu

CosyVoice3CosyVoice3

Next-generation multilingual TTS with bi-streaming, emotion control, and zero-shot voice cloning.

Jazyky: en, zh, ja, ko, de, es, fr, it, ru

Klon hlasu

MOSS-TTSMOSS-TTS

Ultra-long 20-language TTS supporting up to 1 hour of continuous generation with phoneme-level control.

Jazyky: en, zh, de, es, fr, ja, it, hu, ko, ru, fa, ar, pl, pt, cs, da, sv, el, tr

Klon hlasu

MegaTTS3MegaTTS3

ByteDance's sparse alignment TTS with adjustable intelligibility vs. speaker similarity.

Jazyky: en, zh

Klon hlasu

API určené na prvýkrát pre vývojárov

Jeden koncový bod, viac ako 22 modelov. Podpora streamovania pre aplikácie v reálnom čase.

  • Formát kompatibilný s OpenAI
  • Streamovanie TTS pre aplikácie v reálnom čase
  • Dávkové spracovanie veľkých úloh
  • Oznámenia o webhookoch
Zobraziť API dokumenty
pip install ttsai npm install @ttsainpm/ttsai
Python
from tts_ai import TTSClient

client = TTSClient(api_key="sk-tts-xxx")
audio = client.generate(
    text="Hello from TTS.ai!",
    model="kokoro",
    voice="af_bella",
)
client.save(audio, "output.mp3")

Jednoduché, transparentné stanovenie cien

Začnite bezplatne. Škálujte podľa svojho rastu.

Zadarmo

$0

15 kreditov

  • Kokoro, Piper, VITS, MeloTTS
  • Limit 500 znakov
  • 3 gen/hod (bez účtu)
Zaregistrujte sa zdarma

Štart

$9/mesiacov

500 kreditov / mesiac

  • Všetky 22+ modely
  • 100 000 znakov za generáciu
  • Klonovanie hlasu
Ako začať
Lesbičky Najobľúbenejší

Pre

$29/mesiacov

2 000 kreditov/mesiac

  • Všetko v Starter
  • Prístup k API
  • Prioritné spracovanie
Získať Pro verziu

Podnikanie

$99/mesiacov

10 000 kreditov/mesiac

  • Všetko v Pro
  • Hromadné API
  • Prioritná fronta
Získať podnikanie

Zobraziť všetky plány vrátane balíčkov postáv →

Často kladené otázky

TTS.ai je najkomplexnejšia AI hlasová platforma, ktorá ponúka viac ako 22 modelov premeny textu na reč, klonovanie hlasu, premenu reči na text a audio nástroje.Všetky modely sú open source bez viazania na dodávateľa.

Áno! TTS.ai ponúka bezplatný prevod textu na reč s modelmi Kokoro, Piper, VITS a MeloTTS. Nevyžaduje sa žiadny účet. Zaregistrujte sa a získajte 15 000 znakov zadarmo a prístup ku všetkým modelom. Platené plány začínajú na 9 USD / mesiac.

Pre rýchlosť použite Kokoro alebo Piper. Pre kvalitu vyskúšajte CosyVoice 2 alebo StyleTTS 2. Pre klonovanie hlasu použite Chatterbox alebo GPT-SoVITS. Pre dialógy použite Dia TTS. Vyskúšajte viacero modelov na rovnakom texte na porovnanie.

Áno. Rozhranie REST API kompatibilné s technológiou OpenAI pre nástroje na preklad textu na reč, preklad textu na reč, klonovanie hlasu a zvukové nástroje. K dispozícii v plánoch Pro (29 USD mesačne) a Enterprise (99 USD mesačne).

Kvalita hlasu sa líši v závislosti od modelu. Prémiové modely ako CosyVoice 2, StyleTTS 2 a Chatterbox produkujú reč v takmer ľudskej kvalite s prirodzenou intonáciou a emóciami.Bezplatné modely ako Kokoro ponúkajú vynikajúcu kvalitu pre väčšinu prípadov použitia.

TTS.ai podporuje viac ako 30 jazykov v rámci svojej knižnice modelov. Angličtina má najširšiu podporu modelov, ale modely ako CosyVoice 2 pokrývajú čínštinu, japončinu a kórejčinu. GPT-SoVITS zvláda čínštinu, japončinu, kórejčinu a angličtinu a MeloTTS podporuje angličtinu, španielčinu, francúzštinu, čínštinu, japončinu a kórejčinu.

Áno. Všetky spracovania prebiehajú na našich vyhradených GPU serveroch. Po doručení neukladáme váš textový vstup ani generovaný zvuk. Nahraté hlasové vzorky na klonovanie sa používajú iba na aktuálnu reláciu a neuchováva sa. Nikdy nezdieľame vaše údaje s tretími stranami ani ich nepoužívame na trénovanie modelov.

Áno. Všetok zvuk generovaný na TTS.ai je váš na komerčné použitie, vrátane videí YouTube, podcastov, audiokníh, aplikácií, reklám a produktov.Naše modely sú open source pod permisívne licencie (MIT, Apache 2.0).Žiadne licenčné poplatky alebo pripisovanie.

TTS.ai generuje zvuk vo formáte WAV, ktorý je štandardne nastavený na maximálnu kvalitu. Môžete ho konvertovať do MP3, FLAC, OGG alebo M4A pomocou nášho bezplatného nástroja Audio Converter. API podporuje špecifikáciu preferovaného výstupného formátu priamo v požiadavke.

Nahrajte krátku zvukovú vzorku (len 5 sekúnd) hlasu, ktorý chcete klonovať, a potom zadajte ľubovoľný text na generovanie reči v tomto hlase. Modely ako Chatterbox, GPT-SoVITS a CosyVoice 2 podporujú klonovanie hlasu. klonovaný hlas zachytáva tón, prízvuk a štýl hovorenia.

Bezplatné modely (Kokoro, Piper, VITS, MeloTTS) nevyžadujú žiadny účet a nestoja nič. Štandardné modely (2 000 znakov/1 000 vstupov) zahŕňajú Bark, CosyVoice 2, F5-TTS a Dia. Prémiové modely (4 000 znakov/1 000 vstupov) zahŕňajú OpenVoice, Chatterbox, StyleTTS 2 a Tortoise. Platené modely všeobecne ponúkajú vyššiu kvalitu, viac hlasov a ďalšie funkcie, ako je klonovanie hlasu.

Áno. Rozhranie API podporuje dávkové spracovanie na konverziu veľkého množstva textu na reč. Odoslať viacero požiadaviek a načítať výsledky asynchrónne pomocou UUID úloh. Podnikové plány (99 USD/mesiac) zahŕňajú prioritný prístup do frontu na rýchlejšie dávkové spracovanie. Ideálne na produkciu audiokníh, obsah kurzov a rozsiahle projekty s dabingom.
4.1/5 (21)

Čo by sme mohli zlepšiť? Vaše pripomienky nám pomáhajú riešiť problémy.

Začnite používať AI Voice ešte dnes

Pridajte sa k tvorcom, vývojárom a podnikom, ktoré používajú TTS.ai