Bezmaksas AI Teksts uz runu
20+ atklātā pirmkoda modeļus, 107+ balsis, 32+ valodas. Konts nav nepieciešams.
Viss, kas jums nepieciešams balss AI
30+ rīki ar atvērta pirmkoda AI modeļiem
20+ AI balss modeļi
Visplašākā atvērtā avota TTS modeļu kolekcija vienā platformā
Kokoro Free
Kokoro ir 82 miljoni parametru tekstu-to-speech modelis, kas perforē krietni virs tā svara klases. Neskatoties uz tā sīko izmēru, tas rada ārkārtīgi dabas un izteiksmīgu runu. Kokoro atbalsta vairākas valodas, tostarp angļu, japāņu, ķīniešu un korejiešu ar dažādu izteiksmīgu balsi. Tas darbojas neticami ātri — radot audio gandrīz 100x ātrāk nekā reālā laikā GPU.
Labākais par: Augstas kvalitātes TTS ar minimālu latentumu, straumēšanas lietojumprogrammas
Mēģināt atbrīvot
Piper Free
Piper ir viegla teksta-to-speech motors, kas izstrādāts Rhasspy kas izmanto VITS un balsenes arhitektūras. Tas darbojas pilnīgi uz CPU, padarot to ideāli piemērots malas ierīcēm, mājas automatizācijas, un lietojumprogrammas, kas prasa bezsaistes TTS. Ar vairāk nekā 100 balsis 30+ valodās, Piper piedāvā dabas skaņas runu reāllaikā pat uz Aveņu Pi 4.
Labākais par: Ātri priekšskatījumi, pieejamība un iegultās lietojumprogrammas
Mēģināt atbrīvot
VITS Free
VITS (Variational Induction with conversarial learning for end-to-end Text-to-Speech) ir paralēla visdažādākā TTS metode, kas rada vairāk dabas skaņas nekā pašreizējie divpakāpju modeļi. Tā pieņem dažādus secinājumus, kas papildināti ar normalizēšanu plūsmas un sacīkstes apmācību procesu, panākot ievērojamu dabas uzlabojumu.
Labākais par: Vispārējs teksts-to-speech ar dabisku prozodi
Mēģināt atbrīvot
MeloTTS Free
MeloTTS by MyShell.ai ir daudzvalodu TTS bibliotēka, kas atbalsta angļu (Amerikāņu, Britu, Indijas, Austrālijas), spāņu, franču, ķīniešu, japāņu, un korejiešu. Tas ir ļoti ātri, apstrādājot tekstu gandrīz reālā laikā ātrumu CPU vien. MeloTTS ir paredzēta ražošanas izmantošanu un atbalsta gan CPU un GPU inference.
Labākais par: Ražošanas lietojumprogrammas, kurām nepieciešama ātra, daudzvalodu TTS
Mēģināt atbrīvot
Bark Standard
Transformatoru balstīta teksta-audio modelis, kas rada reālistisku runu, mūziku un skaņas efektus.
Izstrādātājs: Suno · Licence: MIT
Pamēģini to
Bark Small Standard
Vieglāka versija bark ar ātrāku inclusion un zemāku atmiņas izmantošanu.
Izstrādātājs: Suno · Licence: MIT
Pamēģini to
CosyVoice 2 Standard
Alibaba straumējamais TTS ar cilvēka paritāti naturalitāti un gandrīz nulles latenci.
Izstrādātājs: Alibaba (Tongyi Lab) · Licence: Apache 2.0
Pamēģini to
Dia TTS Standard
Vairāku runātāju dialoga paaudzes modelis, kas rada dabiskas sarunas starp runātājiem.
Izstrādātājs: Nari Labs · Licence: Apache 2.0
Pamēģini to
Parler TTS Standard
Aprakstiet, kāda balss vēlaties dabas valodā, un Parler rada atbilstošu runu.
Izstrādātājs: Hugging Face · Licence: Apache 2.0
Pamēģini to
GLM-TTS Standard
Sasniedz zemāko rakstzīmju kļūdu līmeni starp atvērtā avota TTS modeļiem.
Izstrādātājs: Zhipu AI · Licence: GLM-4 License
Pamēģini to
IndexTTS-2 Standard
Nulle-shot TTS ar smalki graudainu emociju kontroli un augstu izteiksmi.
Izstrādātājs: Index Team · Licence: Bilibili Model License
Pamēģini to
Spark TTS Standard
Balss klonēšana TTS ar kontrolējamu emociju un runāšanas stilu, izmantojot pamudinājumus.
Izstrādātājs: SparkAudio · Licence: CC BY-NC-SA 4.0
Pamēģini to
GPT-SoVITS Standard
Mazshot balss klonēšanas TTS, kas atkārto jebkuru balsi no tikai 5 sekundes audio.
Izstrādātājs: RVC-Boss · Licence: MIT
Pamēģini to
Orpheus Standard
Cilvēka līmeņa emocionālo TTS modelis apguvis 100K runas stundas.
Izstrādātājs: Canopy Labs · Licence: Llama 3.2 Community
Pamēģini to
Qwen3 TTS Standard
Alibaba daudzvalodu TTS ar balss klonēšanu, iepriekš iestatītām balsīm un balss dizainu no teksta.
Izstrādātājs: Alibaba (Qwen) · Licence: Apache 2.0
Pamēģini to
CosyVoice 2
Alibaba straumējamais TTS ar cilvēka paritāti naturalitāti un gandrīz nulles latenci.
Valodas: en, zh, ja, ko, fr, de, it, es
Clone Balss
GLM-TTS
Sasniedz zemāko rakstzīmju kļūdu līmeni starp atvērtā avota TTS modeļiem.
Valodas: en, zh
Clone Balss
IndexTTS-2
Nulle-shot TTS ar smalki graudainu emociju kontroli un augstu izteiksmi.
Valodas: en, zh
Clone Balss
Spark TTS
Balss klonēšana TTS ar kontrolējamu emociju un runāšanas stilu, izmantojot pamudinājumus.
Valodas: en, zh
Clone Balss
GPT-SoVITS
Mazshot balss klonēšanas TTS, kas atkārto jebkuru balsi no tikai 5 sekundes audio.
Valodas: en, zh, ja, ko
Clone Balss
Chatterbox
Mūsdienu nulles-shot balss klonēšana ar emociju kontroli no Reemble AI.
Valodas: en
Clone Balss
Tortoise TTS
Daudzbalsu teksts-to-speech koncentrējas uz kvalitāti ar autoregesīvu arhitektūru.
Valodas: en
Clone Balss
OpenVoice
Instant balss klonēšana ar granulu kontroli pār stilu, emocijām un akcentu.
Valodas: en, zh, ja, ko, fr, de, es, it
Clone Balss
Qwen3 TTS
Alibaba daudzvalodu TTS ar balss klonēšanu, iepriekš iestatītām balsīm un balss dizainu no teksta.
Valodas: en, zh, ja, ko, de, fr, ru, pt, es, it
Clone BalssIzstrādātājs- pirmais API
Ar OpenAI saderīgu REST API. Viens mērķa kritērijs, 22+ modeļi. Streaming atbalsts reālā laika lietojumprogrammām.
- Ar OpenAI savietojams formāts
- TTS plūsmas reāllaika lietojumprogrammām
- Partijas apstrāde lielām darbavietām
- Webhook paziņojumi
pip install ttsai
npm install @ttsainpm/ttsai
from tts_ai import TTSClient
client = TTSClient(api_key="sk-tts-xxx")
audio = client.generate(
text="Hello from TTS.ai!",
model="kokoro",
voice="af_bella",
)
client.save(audio, "output.mp3")
Vienkārša, pārredzama cenu noteikšana
Sākt bez maksas. Scale kā jūs augt.
Bezmaksas
15 kredīti
- Kokoro, Piper, VITS, MeloTTS
- 500 rakstzīmju limits
- 3 g/stundā (nav konta)
Palaist
500 kredīti/mēnesis
- Visi 22+ modeļi
- 100,000 chars per generation
- Balss klonēšana
Pro
2 000 kredīti/mēnesis
- Viss iesākumā
- API piekļuve
- Prioritārā apstrāde
Bieži uzdoti jautājumi
Sākt izmantojot AI balsi šodien
Pievienojies radītājiem, izstrādātājiem, un uzņēmumiem, izmantojot TTS.ai