Laisva AI Tekstas į kalbą
20+ atvirojo kodo modeliai, 107+ balsai, 32+ kalbos. Sąskaitos nereikia.
Viskas, ko jums reikia balso AI
30+ įrankių, varomų atvirojo šaltinio AI modeliais
20+ AI balso modeliai
Išsamiausias atvirojo kodo TTS modelių rinkinys vienoje platformoje
Kokoro Free
Kokoro yra 82 milijonų parametrų teksto-į-speech modelis, kuris perforuoja gerokai virš savo svorio klasės. Nepaisant jo mažyčių dydis, jis gamina nepaprastai natūralus ir išraiškingas kalba. Kokoro palaiko kelias kalbas, įskaitant anglų, japonų, kinų ir korėjiečių išraiškingų balsų įvairovė. Jis veikia neįtikėtinai greitai – generuoti garso beveik 100x greičiau nei realiu laiku GPU.
Geriausias už: Aukštos kokybės TTS su minimalia latentine, srautinės programos
Bandyti nemokamai
Piper Free
Piper yra lengvas tekstas-į-speech variklis, sukurtas Rhasspy, kuris naudoja VITS ir gerklx architektūrų. Jis veikia visiškai CPU, todėl idealiai tinka kraštutinių įrenginių, namų automatizavimo, ir taikomosios programos reikalauja belaidis TTS. Su daugiau nei 100 balsų 30+ kalbomis, Piper pristato natūralų garsą kalba realiu laiku net Aviečių Pi 4.
Geriausias už: Greita peržiūra, prieinamumas ir įterptosios programos
Bandyti nemokamai
VITS Free
VITS (Variational Inclusion with conversarial learning for end-to-end Text-to-Speech) yra lygiagretus „nuo galo iki galo“ TTS metodas, kuris generuoja daugiau natūralių garso skambesių nei dabartiniai dviejų pakopų modeliai. Jis priima įvairų interferenciją, sustiprintą normalizuojant srautus ir atliekant priešpriešinio mokymo procesą, užtikrinantį reikšmingą natūralios aplinkos pagerėjimą.
Geriausias už: Bendrosios paskirties tekstas-į-speech su natūralia prozodija
Bandyti nemokamai
MeloTTS Free
MeloTTS by MyShell.ai yra daugiakalbė TTS biblioteka, remianti anglų (American, British, Indian, Australia), ispanų, prancūzų, kinų, japonų, ir korėjiečių. Tai yra labai greitai, apdoroti tekstą beveik realiu laiku vien procesoriaus. MeloTTS yra skirtas gamybos naudojimui ir palaiko tiek procesoriaus ir GPU inferencija.
Geriausias už: Gamybos programos, kurioms reikia greitų, daugiakalbių TTS
Bandyti nemokamai
Bark Standard
Transformatorių paremtas tekstų-audio modelis, kuris sukuria realų kalbos, muzikos ir garso efektai.
Programuotojas: Suno · Licencija: MIT
Pabandyk
Bark Small Standard
Lengvesnė versija bark su greičiau indo ir mažesnio atminties naudojimo.
Programuotojas: Suno · Licencija: MIT
Pabandyk
CosyVoice 2 Standard
Alibaba masyviai transliuojama TTS su žmogaus pariteto natūralumo ir beveik nulinės latentiškumo.
Programuotojas: Alibaba (Tongyi Lab) · Licencija: Apache 2.0
Pabandyk
Dia TTS Standard
Kelių garsiakalbių dialogo generavimo modelis, kuris sukuria natūralius pokalbius tarp garsiakalbių.
Programuotojas: Nari Labs · Licencija: Apache 2.0
Pabandyk
Parler TTS Standard
Apibūdinkite norimą balsą natūralia kalba, o Parler generuoja atitinkamą kalbą.
Programuotojas: Hugging Face · Licencija: Apache 2.0
Pabandyk
GLM-TTS Standard
Pasiekti mažiausią simbolių klaidų lygį tarp atvirojo šaltinio TTS modelių.
Programuotojas: Zhipu AI · Licencija: GLM-4 License
Pabandyk
IndexTTS-2 Standard
Zero-shot TTS su plono grūdo emocijų kontrolė ir didelis išraiškingumas.
Programuotojas: Index Team · Licencija: Bilibili Model License
Pabandyk
Spark TTS Standard
Balso klonavimas TTS su reguliuojamas emocijų ir kalbėjimo stilius per paspaudimus.
Programuotojas: SparkAudio · Licencija: CC BY-NC-SA 4.0
Pabandyk
GPT-SoVITS Standard
Nedaug fotografinio balso klonavimo TTS, kuris kartoja bet kokį balsą vos iš 5 sekundžių garso.
Programuotojas: RVC-Boss · Licencija: MIT
Pabandyk
Orpheus Standard
Žmogaus lygio emocinių TTS modelis apmokytas 100K kalbos valandų duomenimis.
Programuotojas: Canopy Labs · Licencija: Llama 3.2 Community
Pabandyk
Qwen3 TTS Standard
Alibaba daugiakalbė TTS su balso klonavimu, iš anksto nustatytais balsais ir balso dizainu iš teksto.
Programuotojas: Alibaba (Qwen) · Licencija: Apache 2.0
Pabandyk
CosyVoice 2
Alibaba masyviai transliuojama TTS su žmogaus pariteto natūralumo ir beveik nulinės latentiškumo.
Kalbos: en, zh, ja, ko, fr, de, it, es
Klonuoti balsą
GLM-TTS
Pasiekti mažiausią simbolių klaidų lygį tarp atvirojo šaltinio TTS modelių.
Kalbos: en, zh
Klonuoti balsą
IndexTTS-2
Zero-shot TTS su plono grūdo emocijų kontrolė ir didelis išraiškingumas.
Kalbos: en, zh
Klonuoti balsą
Spark TTS
Balso klonavimas TTS su reguliuojamas emocijų ir kalbėjimo stilius per paspaudimus.
Kalbos: en, zh
Klonuoti balsą
GPT-SoVITS
Nedaug fotografinio balso klonavimo TTS, kuris kartoja bet kokį balsą vos iš 5 sekundžių garso.
Kalbos: en, zh, ja, ko
Klonuoti balsą
Chatterbox
Šiuolaikinės nulinės fotografijos balso klonavimas su emocijų reguliavimu iš Reemble AI.
Kalbos: en
Klonuoti balsą
Tortoise TTS
Daugiabalsis tekstas-to-speech sutelktas į kokybę su autoregesyvios architektūros.
Kalbos: en
Klonuoti balsą
OpenVoice
Momentinis balso klonavimas su granuliuotu reguliavimu per stilių, emocijas, ir akcentą.
Kalbos: en, zh, ja, ko, fr, de, es, it
Klonuoti balsą
Qwen3 TTS
Alibaba daugiakalbė TTS su balso klonavimu, iš anksto nustatytais balsais ir balso dizainu iš teksto.
Kalbos: en, zh, ja, ko, de, fr, ru, pt, es, it
Klonuoti balsąProgramuotojas- pirmasis API
Suderinamas REST API. Vienas rezultatas, 22+ modeliai. Srauto palaikymas realiu laiku taikomosios programos.
- Su atvirais raštais suderinamas formatas
- Realaus laiko programėlių transliavimas TTS
- Partijos tvarkymas dideliems darbams
- Pranešimai apie žiniatinklio kabiną
pip install ttsai
npm install @ttsainpm/ttsai
from tts_ai import TTSClient
client = TTSClient(api_key="sk-tts-xxx")
audio = client.generate(
text="Hello from TTS.ai!",
model="kokoro",
voice="af_bella",
)
client.save(audio, "output.mp3")
Paprastas, skaidrus kainų nustatymas
Pradėti nemokamai. Mastelis, kai jūs augate.
Neapmuitinama
15 kreditų
- Kokoro, Piper, VITS, MeloTTS
- 500 ženklų riba
- 3 gen/val. (sąskaitos nėra)
Pradžia
500 kreditų per mėnesį
- Visi 22+ modeliai
- 100,000 chars per generation
- Balso klonavimas
Pro
2 000 kreditų per mėnesį
- Viskas pradžioje
- API prieiga
- Prioritetinis tvarkymas
Dažnai užduodami klausimai
Pradėti AIS balso naudojimą šiandien
Prisijunkite kūrėjai, kūrėjai, ir verslo naudojant TTS.ai