Free AI Prevod textu na reč

33+ open-source modely, 273+ hlasy, 33+ Nie je potrebný žiadny účet.

17K+
tvorcovia
70K+
generácie
33+
Modely umelej inteligencie
273+
hlasy
Láska TTS.ai? Povedzte svojim priateľom!

Všetko, čo potrebujete pre hlasovú umelú inteligenciu

Viac ako 30 nástrojov využívajúcich open-source modely umelej inteligencie

33+ AI hlasové modely

Najkomplexnejšia kolekcia open-source modelov TTS v jednej platforme

KokoroKokoro Voľný

Kokoro je model prevodu textu na reč s 82 miliónmi parametrov, ktorý výrazne prevyšuje svoju hmotnostnú triedu. Napriek svojej malej veľkosti produkuje pozoruhodne prirodzenú a expresívnu reč. Kokoro podporuje viacero jazykov vrátane angličtiny, japončiny, čínštiny a kórejčiny s rôznymi expresívnymi hlasmi. Beží neuveriteľne rýchlo - generuje zvuk takmer 100x rýchlejšie ako v reálnom čase na GPU.

Najlepšie pre: Vysoko kvalitný TTS s minimálnou latenciou, streaming aplikácie

Vyskúšajte zadarmo

PiperPiper Voľný

Piper je ľahký text-to-speech engine vyvinutý spoločnosťou Rhasspy, ktorý využíva VITS a larynx architektúry.Beží výlučne na CPU, takže je ideálny pre hraničné zariadenia, domácu automatizáciu a aplikácie vyžadujúce offline TTS. S viac ako 100 hlasmi v 30+ jazykoch, Piper prináša prirodzene znejúcu reč v reálnom čase aj na Raspberry Pi 4.

Najlepšie pre: Rýchle náhľady, prístupnosť a vložené aplikácie

Vyskúšajte zadarmo

VITSVITS Voľný

VITS (Variational Inference with adversarial learning for end-to-end Text-to-Speech) je paralelná metóda prekladu textu na reč, ktorá generuje prirodzenejšie znejúci zvuk ako súčasné dvojstupňové modely.Prijíma variačnú inferenciu rozšírenú o normalizačné toky a proces konkurenčného tréningu, čím sa dosiahne výrazné zlepšenie prirodzenosti.

Najlepšie pre: Všeobecný prevod textu na reč s prirodzenou prozódiou

Vyskúšajte zadarmo

MeloTTSMeloTTS Voľný

MeloTTS od MyShell.ai je viacjazyčná knižnica TTS podporujúca angličtinu (americká, britská, indická, austrálska), španielčinu, francúzštinu, čínštinu, japončinu a kórejčinu.Je extrémne rýchla, spracúva text rýchlosťou takmer v reálnom čase len na CPU.MeloTTS je navrhnutý pre produkčné použitie a podporuje odvodenie CPU aj GPU.

Najlepšie pre: Produkčné aplikácie vyžadujúce rýchly, viacjazyčný TTS

Vyskúšajte zadarmo

Kani TTS 2Kani TTS 2 Voľný

Kani-TTS-2 od NineNineSix je ultraľahký model s parametrami 400M postavený na chrbtici Liquid AI LFM2 s NVIDIA NanoCodec.Beží v 3GB VRAM a produkuje ~ 10 sekúnd reči za ~ 2 sekundy na A100 (RTF 0.2). Aktuálne verejné vydanie obsahuje kontrolný bod `kani-tts-2-en` len v angličtine a nevystavuje háčik na vloženie reproduktorov potrebný na klonovanie hlasu - použite Chatterbox / IndexTTS2 / F5-TTS na klonovanie alebo Kokoro / MeloTTS pre neanglický jazyk.

Najlepšie pre: Rýchla generácia angličtiny na hardvéri s nízkou pamäťou VRAM, rýchle náhľady

Vyskúšajte zadarmo

OuteTTSOuteTTS Voľný

OuteTTS rozširuje veľké jazykové modely o schopnosti premeny textu na reč pri zachovaní pôvodnej architektúry. Podporuje viacero backendov vrátane llama.cpp (CPU/GPU), Hugging Face Transformers, ExLlamaV2, VLLM a dokonca aj odvodenie z prehliadača prostredníctvom Transformers.js.

Najlepšie pre: Edge nasadenie, TTS na báze prehliadača, prostredia s nízkymi zdrojmi

Vyskúšajte zadarmo

Pocket TTSPocket TTS Voľný

Pocket TTS od Kyutai (tvorcovia Moshi) je kompaktný model premeny textu na reč s parametrami 100M, ktorý je oveľa ťažší ako jeho hmotnosť. Beží efektívne na CPU, podporuje klonovanie hlasu z jednej zvukovej vzorky a produkuje prirodzene znejúcu reč.

Najlepšie pre: Jednoduché nasadenie, prostredia len s procesorom, rýchle klonovanie hlasu

Vyskúšajte zadarmo

Kitten TTSKitten TTS Voľný

Kitten TTS od KittenML je ultraľahký model premeny textu na reč postavený na ONNX. S variantmi od 15M do 80M parametrov (25-80 MB na disku) poskytuje vysokokvalitnú syntézu hlasu na CPU bez potreby GPU. Obsahuje 8 vstavaných hlasov, nastaviteľnú rýchlosť reči a vstavané predspracovanie textu pre čísla, meny a jednotky. Ideálne pre nasadenie na hranici a aplikácie s nízkou latenciou.

Najlepšie pre: Rýchly ľahký TTS, nasadenie na hraniciach, aplikácie s nízkou latenciou

Vyskúšajte zadarmo

Ming-Omni TTSMing-Omni TTS Voľný

Ming-omni-tts-0.5B od inclusionAI je kompaktný omnimodálny model reči postavený na hustej chrbtici BailingMM s Patch-by-Patch audio dekodérom, ktorý poskytuje výstup 44,1 kHz (blízko CD kvality), podporuje klonovanie hlasu s nulovým výstrelom z 3 + sekundovej referencie a obsahuje zabudované ovládanie emócií / dialektu / BGM prostredníctvom inštrukcií JSON. Vynikajúca stabilita - 0,83% WER na čínskych benchmarkoch.

Najlepšie pre: Vysoko verný dvojjazyčný rozprávač, emočne kontrolované hlasové herectvo, čínsky obsah audioknihy

Vyskúšajte zadarmo

MOSS-TTS NanoMOSS-TTS Nano Voľný

MOSS-TTS-Nano-100M je OpenMOSS kompaktná 100M-parametrová varianta rodiny MOSS-TTS, ktorá zdieľa architektúru transformátora oneskorenia. Vymieňa špičkovú kvalitu modelu 8B za ~80x menšiu hmotnosť a dramaticky nižšiu VRAM na požiadavku, čo je vhodné pre nasadenie vo voľnej vrstve a vysokej priepustnosti.

Najlepšie pre: Free-tier TTS, vysokoobjemová produkcia, interaktívne použitie s nízkou latenciou

Vyskúšajte zadarmo

BarkBark Štandardné

Model prevodu textu na zvuk založený na transformátoroch, ktorý generuje realistickú reč, hudbu a zvukové efekty.

Názov vývojára: Suno · Licencia: MIT

Skúste si to

Bark SmallBark Small Štandardné

Odľahčená verzia Bark s rýchlejším odvodzovaním a nižším využitím pamäte.

Názov vývojára: Suno · Licencia: MIT

Skúste si to

CosyVoice 2CosyVoice 2 Štandardné

Alibaba škálovateľný streaming TTS s prirodzenosťou ľudskej parity a takmer nulovou latenciou.

Názov vývojára: Alibaba (Tongyi Lab) · Licencia: Apache 2.0

Skúste si to

Dia TTSDia TTS Štandardné

Model generovania dialógu s viacerými reproduktormi, ktorý vytvára prirodzené konverzácie medzi reproduktormi.

Názov vývojára: Nari Labs · Licencia: Apache 2.0

Skúste si to

Parler TTSParler TTS Štandardné

Popíšte hlas, ktorý chcete v prirodzenom jazyku a Parler generuje zodpovedajúcu reč.

Názov vývojára: Hugging Face · Licencia: Apache 2.0

Skúste si to

IndexTTS-2IndexTTS-2 Štandardné

Zero-shot TTS s jemnozrnnou kontrolou emócií a vysokou expresivitou.

Názov vývojára: Index Team · Licencia: Bilibili Model License

Skúste si to

Spark TTSSpark TTS Štandardné

Hlasové klonovanie TTS s kontrolovateľnými emóciami a štýlom hovorenia prostredníctvom výziev.

Názov vývojára: SparkAudio · Licencia: CC BY-NC-SA 4.0

Skúste si to

GPT-SoVITSGPT-SoVITS Štandardné

Niekoľko záberov klonovanie hlasu TTS, ktorý replikuje akýkoľvek hlas z iba 5 sekúnd zvuku.

Názov vývojára: RVC-Boss · Licencia: MIT

Skúste si to

OrpheusOrpheus Štandardné

Emocionálny model TTS na ľudskej úrovni trénovaný na 100 000 hodinách rečových dát.

Názov vývojára: Canopy Labs · Licencia: Llama 3.2 Community

Skúste si to

Qwen3 TTSQwen3 TTS Štandardné

Alibaba je viacjazyčný TTS s prednastavenými hlasmi a hlasový dizajn z textu.

Názov vývojára: Alibaba (Qwen) · Licencia: Apache 2.0

Skúste si to

VieNeu-TTS-v2VieNeu-TTS-v2 Štandardné

Vietnamský + anglický kód-prepínanie TTS so 7 prednastavenými hlasmi a klonovanie hlasu zero-shot.CPU-len, nie je potrebný GPU.

Názov vývojára: Phạm Nguyễn Ngọc Bảo · Licencia: Apache 2.0

Skúste si to

Chatterbox TurboChatterbox Turbo Štandardné

Rýchlejší Chatterbox s latenciou menšou ako 200 ms a paralingvistickými značkami pre smiech, kašeľ a ďalšie.

Názov vývojára: Resemble AI · Licencia: MIT

Skúste si to

VoxCPMVoxCPM Štandardné

Tokenizer-free TTS produkujúce 44.1kHz audio s kontextovou konzistenciou odsekov.

Názov vývojára: OpenBMB · Licencia: Apache 2.0

Skúste si to

VibeVoiceVibeVoice Štandardné

Model spoločnosti Microsoft pre dlhý obsah s viacerými reproduktormi, ako sú podcasty a audioknihy.

Názov vývojára: Microsoft · Licencia: MIT

Skúste si to

CosyVoice3CosyVoice3 Štandardné

Viacjazyčný TTS novej generácie s dvojitým streamovaním, ovládaním emócií a klonovaním hlasu bez výstrelov.

Názov vývojára: Alibaba (FunAudioLLM) · Licencia: Apache 2.0

Skúste si to

NAMAA Saudi TTSNAMAA Saudi TTS Štandardné

Prvý otvorený Saudskoarabský TTS. Natívny Saudský dialekt s klonovaním hlasu v kvalite Chatterbox.

Názov vývojára: NAMAA Space · Licencia: MIT

Skúste si to

Darwin TTSDarwin TTS Štandardné

Cross-modálny Qwen3-TTS variant s FFN váhami zmiešanými z jazykového modelu Qwen3-1.7B pre ostrejšie viacjazyčné klonovanie.

Názov vývojára: FINAL-Bench · Licencia: Apache 2.0

Skúste si to

MOSS-TTSDMOSS-TTSD Štandardné

Model pokračovania dialógu s viacerými reproduktormi – vytvárajte konverzácie v štýle podcastu až s 5 reproduktormi a 60 minútami koherentného zvuku.

Názov vývojára: OpenMOSS · Licencia: Apache 2.0

Skúste si to

ChatterboxChatterbox Prémia

Najmodernejšie klonovanie hlasu s nulovým záberom s ovládaním emócií od spoločnosti Resemble AI.

Kvalita:

Skúste si to

Tortoise TTSTortoise TTS Prémia

Multi-hlas text-to-speech zameraný na kvalitu s autoregresívnou architektúrou.

Kvalita:

Skúste si to

StyleTTS 2StyleTTS 2 Prémia

Prevod textu na reč na ľudskej úrovni prostredníctvom difúzie štýlu a súboja.

Kvalita:

Skúste si to

OpenVoiceOpenVoice Prémia

Okamžité klonovanie hlasu s granulárnou kontrolou nad štýlom, emóciami a prízvukom.

Kvalita:

Skúste si to

Sesame CSMSesame CSM Prémia

Model konverzačnej reči generujúci prirodzený dialóg s vhodným načasovaním a emóciami.

Kvalita:

Skúste si to

CosyVoice 2CosyVoice 2

Alibaba škálovateľný streaming TTS s prirodzenosťou ľudskej parity a takmer nulovou latenciou.

Jazyky: en, zh, ja, ko, fr, de, it, es

Klon hlasu

IndexTTS-2IndexTTS-2

Zero-shot TTS s jemnozrnnou kontrolou emócií a vysokou expresivitou.

Jazyky: en, zh

Klon hlasu

Spark TTSSpark TTS

Hlasové klonovanie TTS s kontrolovateľnými emóciami a štýlom hovorenia prostredníctvom výziev.

Jazyky: en, zh

Klon hlasu

GPT-SoVITSGPT-SoVITS

Niekoľko záberov klonovanie hlasu TTS, ktorý replikuje akýkoľvek hlas z iba 5 sekúnd zvuku.

Jazyky: en, zh, ja, ko

Klon hlasu

ChatterboxChatterbox

Najmodernejšie klonovanie hlasu s nulovým záberom s ovládaním emócií od spoločnosti Resemble AI.

Jazyky: en

Klon hlasu

Tortoise TTSTortoise TTS

Multi-hlas text-to-speech zameraný na kvalitu s autoregresívnou architektúrou.

Jazyky: en

Klon hlasu

OpenVoiceOpenVoice

Okamžité klonovanie hlasu s granulárnou kontrolou nad štýlom, emóciami a prízvukom.

Jazyky: en, zh, ja, ko, fr, es

Klon hlasu

VieNeu-TTS-v2VieNeu-TTS-v2

Vietnamský + anglický kód-prepínanie TTS so 7 prednastavenými hlasmi a klonovanie hlasu zero-shot.CPU-len, nie je potrebný GPU.

Jazyky: vi, en

Klon hlasu

Chatterbox TurboChatterbox Turbo

Rýchlejší Chatterbox s latenciou menšou ako 200 ms a paralingvistickými značkami pre smiech, kašeľ a ďalšie.

Jazyky: en

Klon hlasu

VoxCPMVoxCPM

Tokenizer-free TTS produkujúce 44.1kHz audio s kontextovou konzistenciou odsekov.

Jazyky: en, zh

Klon hlasu

OuteTTSOuteTTS

LLM-založené TTS, ktorý beží na CPU, GPU, alebo prehliadač cez llama.cpp a Transformers.js.

Jazyky: en

Klon hlasu

Pocket TTSPocket TTS

Ľahký 100M parametrický model od Kyutai s klonovaním hlasu z jednej vzorky.

Jazyky: en, fr

Klon hlasu

CosyVoice3CosyVoice3

Viacjazyčný TTS novej generácie s dvojitým streamovaním, ovládaním emócií a klonovaním hlasu bez výstrelov.

Jazyky: en, zh, ja, ko, de, es, fr, it, ru

Klon hlasu

NAMAA Saudi TTSNAMAA Saudi TTS

Prvý otvorený Saudskoarabský TTS. Natívny Saudský dialekt s klonovaním hlasu v kvalite Chatterbox.

Jazyky: ar

Klon hlasu

Darwin TTSDarwin TTS

Cross-modálny Qwen3-TTS variant s FFN váhami zmiešanými z jazykového modelu Qwen3-1.7B pre ostrejšie viacjazyčné klonovanie.

Jazyky: en, ko, ja, zh

Klon hlasu

MOSS-TTSDMOSS-TTSD

Model pokračovania dialógu s viacerými reproduktormi – vytvárajte konverzácie v štýle podcastu až s 5 reproduktormi a 60 minútami koherentného zvuku.

Jazyky: en, zh

Klon hlasu

Ming-Omni TTSMing-Omni TTS

Kompaktný 0.5B omnimodálny model reči od inclusionAI s vysoko verným 44.1kHz výstupom a nulovým klonovaním hlasu.

Jazyky: en, zh

Klon hlasu

MOSS-TTS NanoMOSS-TTS Nano

Tiny 100M MOSS-TTS variant — rovnaká architektúra, 80x menšia, free-tier latencia.

Jazyky: en, zh, de, es, fr, ja, it, ko, ru, ar, pt

Klon hlasu

API určené na prvýkrát pre vývojárov

Jeden koncový bod, viac ako 22 modelov. Podpora streamovania pre aplikácie v reálnom čase.

  • Formát kompatibilný s OpenAI
  • Streamovanie TTS pre aplikácie v reálnom čase
  • Dávkové spracovanie veľkých úloh
  • Oznámenia o webhookoch
Zobraziť API dokumenty
pip install ttsai npm install @ttsainpm/ttsai
Python
from tts_ai import TTSClient

client = TTSClient(api_key="sk-tts-xxx")
audio = client.generate(
    text="Hello from TTS.ai!",
    model="kokoro",
    voice="af_bella",
)
client.save(audio, "output.mp3")

Jednoduché, transparentné stanovenie cien

Začnite bezplatne. Škálujte podľa svojho rastu.

Zadarmo

$0

15 000 znakov + 5 000/deň

  • 7 modelov zdarma vrátane Kokoro
  • 5 000 znakov za generáciu
  • API prístup zahrnutý
Zaregistrujte sa zdarma

Štart

$9/mesiacov

500 kreditov / mesiac

  • Všetky 22+ modely
  • 100 000 znakov za generáciu
  • Klonovanie hlasu
Ako začať
Lesbičky Najobľúbenejší

Pre

$29/mesiacov

2 000 kreditov/mesiac

  • Všetko v Starter
  • Prístup k API
  • Prioritné spracovanie
Získať Pro verziu

Podnikanie

$99/mesiacov

10 000 kreditov/mesiac

  • Všetko v Pro
  • Hromadné API
  • Prioritná fronta
Získať podnikanie

Zobraziť všetky plány vrátane balíčkov postáv →

Často kladené otázky

TTS.ai je najkomplexnejšia AI hlasová platforma, ktorá ponúka viac ako 22 modelov premeny textu na reč, klonovanie hlasu, premenu reči na text a audio nástroje.Všetky modely sú open source bez viazania na dodávateľa.

Áno! TTS.ai ponúka bezplatný prevod textu na reč s modelmi Kokoro, Piper, VITS a MeloTTS. Nevyžaduje sa žiadny účet. Zaregistrujte sa a získajte 15 000 znakov zadarmo a prístup ku všetkým modelom. Platené plány začínajú na 9 USD / mesiac.

Pre rýchlosť použite Kokoro alebo Piper. Pre kvalitu vyskúšajte CosyVoice 2 alebo StyleTTS 2. Pre klonovanie hlasu použite Chatterbox alebo GPT-SoVITS. Pre dialógy použite Dia TTS. Vyskúšajte viacero modelov na rovnakom texte na porovnanie.

Áno. Rozhranie API REST kompatibilné s technológiou OpenAI pre nástroje na preklad textu na reč, textu na reč, klonovanie hlasu a zvuk. Zahrnuté v každom pláne vrátane bezplatného plánu s limitmi rýchlosti, ktoré sa menia podľa úrovne (bezplatný plán: 10 požiadaviek za minútu, Lite: 20, Starter: 30, Pro: 60, Business: 300).

Kvalita hlasu sa líši v závislosti od modelu. Prémiové modely ako CosyVoice 2, StyleTTS 2 a Chatterbox produkujú reč v takmer ľudskej kvalite s prirodzenou intonáciou a emóciami.Bezplatné modely ako Kokoro ponúkajú vynikajúcu kvalitu pre väčšinu prípadov použitia.

TTS.ai podporuje viac ako 30 jazykov v rámci svojej knižnice modelov. Angličtina má najširšiu podporu modelov, ale modely ako CosyVoice 2 pokrývajú čínštinu, japončinu a kórejčinu. GPT-SoVITS zvláda čínštinu, japončinu, kórejčinu a angličtinu a MeloTTS podporuje angličtinu, španielčinu, francúzštinu, čínštinu, japončinu a kórejčinu.

Áno. Všetky spracovania prebiehajú na našich vyhradených GPU serveroch. Po doručení neukladáme váš textový vstup ani generovaný zvuk. Nahraté hlasové vzorky na klonovanie sa používajú iba na aktuálnu reláciu a neuchováva sa. Nikdy nezdieľame vaše údaje s tretími stranami ani ich nepoužívame na trénovanie modelov.

Áno. Všetok zvuk generovaný na TTS.ai je váš na komerčné použitie, vrátane videí YouTube, podcastov, audiokníh, aplikácií, reklám a produktov.Naše modely sú open source pod permisívne licencie (MIT, Apache 2.0).Žiadne licenčné poplatky alebo pripisovanie.

TTS.ai generuje zvuk vo formáte WAV, ktorý je štandardne nastavený na maximálnu kvalitu. Môžete ho konvertovať do MP3, FLAC, OGG alebo M4A pomocou nášho bezplatného nástroja Audio Converter. API podporuje špecifikáciu preferovaného výstupného formátu priamo v požiadavke.

Nahrajte krátku zvukovú vzorku (len 5 sekúnd) hlasu, ktorý chcete klonovať, a potom zadajte ľubovoľný text na generovanie reči v tomto hlase. Modely ako Chatterbox, GPT-SoVITS a CosyVoice 2 podporujú klonovanie hlasu. klonovaný hlas zachytáva tón, prízvuk a štýl hovorenia.

Bezplatné modely (Kokoro, Piper, VITS, MeloTTS) nevyžadujú žiadny účet a nestoja nič. Štandardné modely (2 000 znakov/1 000 vstupov) zahŕňajú Bark, CosyVoice 2, F5-TTS a Dia. Prémiové modely (4 000 znakov/1 000 vstupov) zahŕňajú OpenVoice, Chatterbox, StyleTTS 2 a Tortoise. Platené modely všeobecne ponúkajú vyššiu kvalitu, viac hlasov a ďalšie funkcie, ako je klonovanie hlasu.

Áno. Rozhranie API podporuje dávkové spracovanie na konverziu veľkého množstva textu na reč. Odoslať viacero žiadostí a načítať výsledky asynchrónne pomocou identifikátorov UUID úloh. Plán Business (99 USD/mesiac) a vyššie verzie zahŕňajú prioritný prístup do frontu na rýchlejšie dávkové spracovanie. Ideálne na produkciu audiokníh, obsah kurzov a rozsiahle projekty s dabingom.
4.1/5 (42)

Čo by sme mohli zlepšiť? Vaše pripomienky nám pomáhajú riešiť problémy.

Začnite používať AI Voice ešte dnes

Pridajte sa k tvorcom, vývojárom a podnikom, ktoré používajú TTS.ai