Voľná umelá inteligencia Prevod textu na reč

20+ open-source modely, 107+ hlasy, 32+ Nevyžaduje sa žiadny účet.

1K+
tvorcovia
2K+
generácie
20+
Modely umelej inteligencie
107+
hlasy
0/500 znaky Zadarmo
Páči sa vám TTS.ai? Povedzte svojim priateľom!

Všetko, čo potrebujete pre hlasovú umelú inteligenciu

Viac ako 30 nástrojov využívajúcich open-source modely umelej inteligencie

20+ AI hlasové modely

Najkomplexnejšia kolekcia open-source modelov TTS v jednej platforme

KokoroKokoro Free

Kokoro je model prevodu textu na reč s 82 miliónmi parametrov, ktorý výrazne prevyšuje svoju hmotnostnú triedu. Napriek svojej malej veľkosti produkuje pozoruhodne prirodzenú a expresívnu reč. Kokoro podporuje viacero jazykov vrátane angličtiny, japončiny, čínštiny a kórejčiny s rôznymi expresívnymi hlasmi. Beží neuveriteľne rýchlo - generuje zvuk takmer 100x rýchlejšie ako v reálnom čase na GPU.

Najlepšie pre: Vysoko kvalitný TTS s minimálnou latenciou, streaming aplikácie

Vyskúšajte zadarmo

PiperPiper Free

Piper je ľahký text-to-speech engine vyvinutý spoločnosťou Rhasspy, ktorý využíva VITS a larynx architektúry.Beží výlučne na CPU, takže je ideálny pre hraničné zariadenia, domácu automatizáciu a aplikácie vyžadujúce offline TTS. S viac ako 100 hlasmi v 30+ jazykoch, Piper prináša prirodzene znejúcu reč v reálnom čase aj na Raspberry Pi 4.

Najlepšie pre: Rýchle náhľady, prístupnosť a vložené aplikácie

Vyskúšajte zadarmo

VITSVITS Free

VITS (Variational Inference with adversarial learning for end-to-end Text-to-Speech) je paralelná end-to-end metóda prevodu textu na reč, ktorá generuje prirodzenejšie znejúci zvuk ako súčasné dvojstupňové modely.Prijíma variačnú inferenciu rozšírenú o normalizačné toky a konkurenčný tréningový proces, čím dosahuje výrazné zlepšenie prirodzenosti.

Najlepšie pre: Univerzálny prevod textu na reč s prirodzenou prozódiou

Vyskúšajte zadarmo

MeloTTSMeloTTS Free

MeloTTS od MyShell.ai je viacjazyčná knižnica TTS podporujúca angličtinu (americká, britská, indická, austrálska), španielčinu, francúzštinu, čínštinu, japončinu a kórejčinu.Je extrémne rýchla, spracúva text rýchlosťou takmer v reálnom čase len na CPU.MeloTTS je navrhnutý pre produkčné použitie a podporuje dedukciu CPU aj GPU.

Najlepšie pre: Produkčné aplikácie vyžadujúce rýchly, viacjazyčný TTS

Vyskúšajte zadarmo

BarkBark Standard

Model prevodu textu na zvuk založený na transformátoroch, ktorý generuje realistickú reč, hudbu a zvukové efekty.

Názov vývojára: Suno · Licencia: MIT

Skúste si to

Bark SmallBark Small Standard

Odľahčená verzia Bark s rýchlejším odvodzovaním a nižším využitím pamäte.

Názov vývojára: Suno · Licencia: MIT

Skúste si to

CosyVoice 2CosyVoice 2 Standard

Alibaba škálovateľný streaming TTS s prirodzenosťou ľudskej parity a takmer nulovou latenciou.

Názov vývojára: Alibaba (Tongyi Lab) · Licencia: Apache 2.0

Skúste si to

Dia TTSDia TTS Standard

Model generovania dialógu s viacerými reproduktormi, ktorý vytvára prirodzené konverzácie medzi reproduktormi.

Názov vývojára: Nari Labs · Licencia: Apache 2.0

Skúste si to

Parler TTSParler TTS Standard

Popíšte hlas, ktorý chcete v prirodzenom jazyku a Parler generuje zodpovedajúcu reč.

Názov vývojára: Hugging Face · Licencia: Apache 2.0

Skúste si to

GLM-TTSGLM-TTS Standard

Dosahuje najnižšiu mieru chýb znakov medzi modelmi TTS s otvoreným zdrojovým kódom.

Názov vývojára: Zhipu AI · Licencia: GLM-4 License

Skúste si to

IndexTTS-2IndexTTS-2 Standard

Zero-shot TTS s jemnozrnnou kontrolou emócií a vysokou expresivitou.

Názov vývojára: Index Team · Licencia: Bilibili Model License

Skúste si to

Spark TTSSpark TTS Standard

Hlasové klonovanie TTS s kontrolovateľnými emóciami a štýlom hovorenia prostredníctvom výziev.

Názov vývojára: SparkAudio · Licencia: CC BY-NC-SA 4.0

Skúste si to

GPT-SoVITSGPT-SoVITS Standard

Niekoľko záberov klonovanie hlasu TTS, ktorý replikuje akýkoľvek hlas z iba 5 sekúnd zvuku.

Názov vývojára: RVC-Boss · Licencia: MIT

Skúste si to

OrpheusOrpheus Standard

Emocionálny model TTS na ľudskej úrovni trénovaný na 100 000 hodinách rečových dát.

Názov vývojára: Canopy Labs · Licencia: Llama 3.2 Community

Skúste si to

Qwen3 TTSQwen3 TTS Standard

Alibaba viacjazyčný TTS s klonovaním hlasu, prednastavené hlasy, a hlasový dizajn z textu.

Názov vývojára: Alibaba (Qwen) · Licencia: Apache 2.0

Skúste si to

ChatterboxChatterbox Premium

Najmodernejšie klonovanie hlasu s nulovým záberom s ovládaním emócií od spoločnosti Resemble AI.

Kvalita:

Skúste si to

Tortoise TTSTortoise TTS Premium

Multi-hlas text-to-speech zameraný na kvalitu s autoregresívnou architektúrou.

Kvalita:

Skúste si to

StyleTTS 2StyleTTS 2 Premium

Prevod textu na reč na ľudskej úrovni prostredníctvom difúzie štýlu a súboja.

Kvalita:

Skúste si to

OpenVoiceOpenVoice Premium

Okamžité klonovanie hlasu s granulárnou kontrolou nad štýlom, emóciami a prízvukom.

Kvalita:

Skúste si to

Sesame CSMSesame CSM Premium

Model konverzačnej reči generujúci prirodzený dialóg s vhodným načasovaním a emóciami.

Kvalita:

Skúste si to

CosyVoice 2CosyVoice 2

Alibaba škálovateľný streaming TTS s prirodzenosťou ľudskej parity a takmer nulovou latenciou.

Jazyky: en, zh, ja, ko, fr, de, it, es

Klon hlasu

GLM-TTSGLM-TTS

Dosahuje najnižšiu mieru chýb znakov medzi modelmi TTS s otvoreným zdrojovým kódom.

Jazyky: en, zh

Klon hlasu

IndexTTS-2IndexTTS-2

Zero-shot TTS s jemnozrnnou kontrolou emócií a vysokou expresivitou.

Jazyky: en, zh

Klon hlasu

Spark TTSSpark TTS

Hlasové klonovanie TTS s kontrolovateľnými emóciami a štýlom hovorenia prostredníctvom výziev.

Jazyky: en, zh

Klon hlasu

GPT-SoVITSGPT-SoVITS

Niekoľko záberov klonovanie hlasu TTS, ktorý replikuje akýkoľvek hlas z iba 5 sekúnd zvuku.

Jazyky: en, zh, ja, ko

Klon hlasu

ChatterboxChatterbox

Najmodernejšie klonovanie hlasu s nulovým záberom s ovládaním emócií od spoločnosti Resemble AI.

Jazyky: en

Klon hlasu

Tortoise TTSTortoise TTS

Multi-hlas text-to-speech zameraný na kvalitu s autoregresívnou architektúrou.

Jazyky: en

Klon hlasu

OpenVoiceOpenVoice

Okamžité klonovanie hlasu s granulárnou kontrolou nad štýlom, emóciami a prízvukom.

Jazyky: en, zh, ja, ko, fr, de, es, it

Klon hlasu

Qwen3 TTSQwen3 TTS

Alibaba viacjazyčný TTS s klonovaním hlasu, prednastavené hlasy, a hlasový dizajn z textu.

Jazyky: en, zh, ja, ko, de, fr, ru, pt, es, it

Klon hlasu

API na prvom mieste pre vývojárov

Jeden koncový bod, viac ako 22 modelov. Podpora streamovania pre aplikácie v reálnom čase.

  • Formát kompatibilný s OpenAI
  • Streamovanie TTS pre aplikácie v reálnom čase
  • Dávkové spracovanie veľkých úloh
  • Oznámenia o webhookoch
Zobraziť API dokumenty
pip install ttsai npm install @ttsainpm/ttsai
Python
from tts_ai import TTSClient

client = TTSClient(api_key="sk-tts-xxx")
audio = client.generate(
    text="Hello from TTS.ai!",
    model="kokoro",
    voice="af_bella",
)
client.save(audio, "output.mp3")

Jednoduché, transparentné stanovenie cien

Začnite bezplatne. Škálujte podľa svojho rastu.

Zadarmo

$0

15 kreditov

  • Kokoro, Piper, VITS, MeloTTS
  • Limit 500 znakov
  • 3 gen/hod (bez účtu)
Zaregistrujte sa zdarma

Štart

$9/mesiacov

500 kreditov / mesiac

  • Všetky 22+ modely
  • 100,000 chars per generation
  • Klonovanie hlasu
Ako začať
Striptease Najobľúbenejší

Pre

$29/mesiacov

2 000 kreditov/mesiac

  • Všetko v Starter
  • Prístup k API
  • Prioritné spracovanie
Získať Pro verziu

Podnikanie

$99/mesiacov

10 000 kreditov/mesiac

  • Všetko v Pro
  • Hromadné API
  • Prioritná fronta
Získať podnikanie

Zobraziť všetky plány vrátane balíčkov postáv →

Často kladené otázky

TTS.ai je najkomplexnejšia AI hlasová platforma, ktorá ponúka viac ako 22 modelov premeny textu na reč, klonovanie hlasu, premenu reči na text a audio nástroje.Všetky modely sú open source a nie sú viazané na konkrétneho dodávateľa.

Áno! TTS.ai ponúka bezplatný prevod textu na reč s modelmi Kokoro, Piper, VITS a MeloTTS. Nevyžaduje sa žiadny účet. Zaregistrujte sa a získajte 15 000 znakov zadarmo a prístup ku všetkým modelom. Platené plány začínajú na 9 USD / mesiac.

Pre rýchlosť použite Kokoro alebo Piper. Pre kvalitu vyskúšajte CosyVoice 2 alebo StyleTTS 2. Pre klonovanie hlasu použite Chatterbox alebo GPT-SoVITS. Pre dialógy použite Dia TTS. Vyskúšajte viacero modelov na rovnakom texte na porovnanie.

Áno. Rozhranie REST API kompatibilné s technológiou OpenAI pre TTS, STT, klonovanie hlasu a zvukové nástroje. K dispozícii v plánoch Pro (29 USD/mesiac) a Enterprise (99 USD/mesiac).

Kvalita hlasu sa líši v závislosti od modelu. Prémiové modely ako CosyVoice 2, StyleTTS 2 a Chatterbox produkujú reč v takmer ľudskej kvalite s prirodzenou intonáciou a emóciami.Bezplatné modely ako Kokoro ponúkajú vynikajúcu kvalitu pre väčšinu prípadov použitia.

TTS.ai podporuje viac ako 30 jazykov vo svojej knižnici modelov.Angličtina má najširšiu podporu modelov, ale modely ako CosyVoice 2 pokrývajú čínštinu, japončinu a kórejčinu; GPT-SoVITS zvláda čínštinu, japončinu, kórejčinu a angličtinu; a MeloTTS podporuje angličtinu, španielčinu, francúzštinu, čínštinu, japončinu a kórejčinu.

Áno. Všetky spracovania prebiehajú na našich vyhradených GPU serveroch. Po doručení neukladáme váš textový vstup ani generovaný zvuk. Nahraté hlasové vzorky na klonovanie sa používajú iba na aktuálnu reláciu a neuchováva sa. Nikdy nezdieľame vaše údaje s tretími stranami ani ich nepoužívame na trénovanie modelov.

Áno. Všetok zvuk generovaný na TTS.ai je váš na komerčné použitie, vrátane videí YouTube, podcastov, audiokníh, aplikácií, reklám a produktov.Naše modely sú open source pod permisívne licencie (MIT, Apache 2.0).Žiadne licenčné poplatky alebo pripisovanie.

TTS.ai predvolene generuje zvuk vo formáte WAV pre maximálnu kvalitu. Môžete konvertovať do MP3, FLAC, OGG alebo M4A pomocou nášho bezplatného nástroja Audio Converter. API podporuje špecifikáciu preferovaného výstupného formátu priamo v požiadavke.

Nahrajte krátku zvukovú vzorku (len 5 sekúnd) hlasu, ktorý chcete klonovať, a potom zadajte ľubovoľný text na generovanie reči v tomto hlase. Modely ako Chatterbox, GPT-SoVITS a CosyVoice 2 podporujú klonovanie hlasu. klonovaný hlas zachytáva tón, prízvuk a štýl hovorenia.

Bezplatné modely (Kokoro, Piper, VITS, MeloTTS) nevyžadujú žiadny účet a nestoja nič. Štandardné modely (2 000 znakov/1 000 vstupov) zahŕňajú Bark, CosyVoice 2, F5-TTS a Dia. Prémiové modely (4 000 znakov/1 000 vstupov) zahŕňajú OpenVoice, Chatterbox, StyleTTS 2 a Tortoise. Platené modely všeobecne ponúkajú vyššiu kvalitu, viac hlasov a ďalšie funkcie, ako je klonovanie hlasu.

Áno. Rozhranie API podporuje dávkové spracovanie na konverziu veľkého množstva textu na reč. Odoslať viacero požiadaviek a načítať výsledky asynchrónne pomocou UUID úloh. Podnikové plány (99 USD/mesiac) zahŕňajú prioritný prístup do frontu na rýchlejšie dávkové spracovanie. Ideálne na produkciu audiokníh, obsah kurzov a rozsiahle projekty s dabingom.
4.0/5 (8)

Začnite používať AI Voice ešte dnes

Pridajte sa k tvorcom, vývojárom a podnikom, ktoré používajú TTS.ai