Ingyenes MI Szöveg a beszédhez
20+ nyílt forráskódú modellek, 107+ hangok, 32+ nyelveket. Számla nem szükséges.
Minden, amire szükséged van a hangjelzőhöz
30+ szerszámok nyílt forráskódú MI modellekkel
20+ AI hangmodellek
A nyílt forráskódú TTS modellek legátfogóbb gyűjteménye egy platformon
Kokoro Free
Kokoro egy 82 millió paraméteres szövegtől-beszédig modell, amely jóval a súlyosztály felett üt. Kis mérete ellenére rendkívül természetes és kifejező beszédet ad. Kokoro több nyelvet támogat, köztük angolt, japánt, kínait és koreait különböző expresszív hangokkal. Hihetetlenül gyorsan fut, közel 100x-kal gyorsabban generál hangokat, mint valós időben egy GPU-n.
Legjobb: Kiváló minőségű TTS minimális késéssel, streaming alkalmazásokkal
Próbálja ki a szabad
Piper Free
Piper egy könnyű SMS-to-speech motor által kifejlesztett Rhasspy, amely használja VITS és gége architektúrák. Ez teljesen a CPU, így ideális az él eszközök, otthon automatizálás, és alkalmazások igényel offline TTS. Több mint 100 hangok 30+ nyelvek, Piper szállít természetes hangzású beszéd valós idejű sebesség még egy málna Pi 4.
Legjobb: Gyors előnézetek, akadálymentesítés és beágyazott alkalmazások
Próbálja ki a szabad
VITS Free
A VITS (Variational Inference with adversarial learning for end-to-end Text-to-Speech) egy párhuzamos vég-vég-vég TTS módszer, amely több természetes hangzást generál, mint a jelenlegi kétlépcsős modellek. A standardizáló áramlásokkal és egy ellenzős képzési folyamattal kiegészített variációs következtetéseket fogad el, amelyek jelentős javulást eredményeznek a természetességben.
Legjobb: Általános célú szöveg-szólás természetes proszódiával
Próbálja ki a szabad
MeloTTS Free
MelotTS by MyShell.ai egy többnyelvű TTS könyvtár támogató angol (amerikai, brit, indiai, ausztrál), spanyol, francia, kínai, japán, és koreai. Ez rendkívül gyors, feldolgozás szöveg közel valós idejű sebesség CPU egyedül. MelotTS célja a termelés használata, és támogatja a CPU és a GPU következtetések.
Legjobb: Gyors, többnyelvű TTS gyártási alkalmazásokra van szükség
Próbálja ki a szabad
Bark Standard
Transformer-alapú szöveg-audio modell, amely realisztikus beszéd, zene, és hanghatások.
Fejlesztő: Suno · Jogosítvány: MIT
Próbáld ki.
Bark Small Standard
Könnyebb változata Bark gyorsabb következtetés és kisebb memória használat.
Fejlesztő: Suno · Jogosítvány: MIT
Próbáld ki.
CosyVoice 2 Standard
Alibaba skálázható TTS-e emberi-paritatív természetességgel és majdnem nulla késéssel.
Fejlesztő: Alibaba (Tongyi Lab) · Jogosítvány: Apache 2.0
Próbáld ki.
Dia TTS Standard
Multi-speaker dialógus generációs modell, amely létrehoz természetes beszélgetések hangszórók között.
Fejlesztő: Nari Labs · Jogosítvány: Apache 2.0
Próbáld ki.
Parler TTS Standard
Írja le a kívánt hangot természetes nyelven, és Parler generál megfelelő beszédet.
Fejlesztő: Hugging Face · Jogosítvány: Apache 2.0
Próbáld ki.
GLM-TTS Standard
A nyílt forráskódú TTS-modellek közül a legalacsonyabb karakterhibát éri el.
Fejlesztő: Zhipu AI · Jogosítvány: GLM-4 License
Próbáld ki.
IndexTTS-2 Standard
Zéró lövés TTS finoman kifinomult érzelmi kontroll és magas kifejezőképesség.
Fejlesztő: Index Team · Jogosítvány: Bilibili Model License
Próbáld ki.
Spark TTS Standard
Hang klónozása TTS irányítható érzelemmel és beszédstílus segítségével prompts.
Fejlesztő: SparkAudio · Jogosítvány: CC BY-NC-SA 4.0
Próbáld ki.
GPT-SoVITS Standard
Kevés hang klónozza a TTS-t, ami lemásolja a hangot mindössze 5 másodpercnyi hangból.
Fejlesztő: RVC-Boss · Jogosítvány: MIT
Próbáld ki.
Orpheus Standard
Emberi szintű TTS modell, 100 ezer órányi beszédadattal.
Fejlesztő: Canopy Labs · Jogosítvány: Llama 3.2 Community
Próbáld ki.
Qwen3 TTS Standard
Alibaba többnyelvű TTS hang klónozás, előre beállított hangok, és hangtervezés szövegből.
Fejlesztő: Alibaba (Qwen) · Jogosítvány: Apache 2.0
Próbáld ki.
CosyVoice 2
Alibaba skálázható TTS-e emberi-paritatív természetességgel és majdnem nulla késéssel.
Nyelvek: en, zh, ja, ko, fr, de, it, es
Klónhang
GLM-TTS
A nyílt forráskódú TTS-modellek közül a legalacsonyabb karakterhibát éri el.
Nyelvek: en, zh
Klónhang
IndexTTS-2
Zéró lövés TTS finoman kifinomult érzelmi kontroll és magas kifejezőképesség.
Nyelvek: en, zh
Klónhang
Spark TTS
Hang klónozása TTS irányítható érzelemmel és beszédstílus segítségével prompts.
Nyelvek: en, zh
Klónhang
GPT-SoVITS
Kevés hang klónozza a TTS-t, ami lemásolja a hangot mindössze 5 másodpercnyi hangból.
Nyelvek: en, zh, ja, ko
Klónhang
Chatterbox
A legmodernebb zéró hangú klónozás érzelmi irányítással Resemble AI-tól.
Nyelvek: en
Klónhang
Tortoise TTS
A többhangú szövegtől a beszédig a minőségre koncentrált, autoregresszív architektúrával.
Nyelvek: en
Klónhang
OpenVoice
Azonnali hang klónozás szemcsés kontroll felett stílus, érzelem, és akcentus.
Nyelvek: en, zh, ja, ko, fr, de, es, it
Klónhang
Qwen3 TTS
Alibaba többnyelvű TTS hang klónozás, előre beállított hangok, és hangtervezés szövegből.
Nyelvek: en, zh, ja, ko, de, fr, ru, pt, es, it
KlónhangFejlesztő-első API
OpenAI-kompatibilis REST API. Egy végpont, 22+ modellek. Streaming támogatás valós idejű alkalmazások.
- OpenAI-kompatibilis formátum
- TTS közvetítés valós idejű alkalmazásokhoz
- Batch processing for large jobs
- Webhook értesítések
pip install ttsai
npm install @ttsainpm/ttsai
from tts_ai import TTSClient
client = TTSClient(api_key="sk-tts-xxx")
audio = client.generate(
text="Hello from TTS.ai!",
model="kokoro",
voice="af_bella",
)
client.save(audio, "output.mp3")
Egyszerű, átlátható árképzés
Kezdd el, ahogy nősz.
Ingyenes
15 kredit
- Kokoro, Piper, VITS, MeloTTS
- 500 karakterhatár
- 3 ge/óra (nincs számla)
Indító
500 kredit/hó
- Mind a 22+ modell
- 100 000 chars generációnként
- Hang klónozása
Pro
2000 kredit/hó
- Minden kezdőben
- API-hozzáférés
- Prioritású feldolgozás
Üzleti tevékenység
10 000 kredit/hó
- Minden a Pro-ban
- Ömlesztett API
- Prioritási sor
Az összes terv megtekintése, beleértve a karaktercsomagokat →
Gyakran ismételt kérdések
Kezdd el használni az AI Voice-t ma
Csatlakozz az alkotókhoz, a fejlesztőkhöz és a TTS.ai-et használó vállalkozásokhoz