Free AI Матндан сўзга
20+ очиқ манба моделлари, 107+ овозлар, 32+ Тиллар. Ҳисоб талаб қилинмайди.
Сўзли AI учун керак бўлган барча нарса
30+ очиқ манбали AI моделлари билан таъминланган асбоблар
20+ AI овоз моделлари
Бир платформада очиқ манбали TTS моделларининг энг кенг қамровли тўплами
Kokoro Free
Kokoro 82 миллион параметрли матн-нутқ модели бўлиб, у ўз вазн тоифасидан анча юқори даражада ишлайди. Унинг кичик ўлчамига қарамай, у диққатга сазовор табиий ва ифодали сўзлашувни ишлаб чиқаради. Kokoro инглиз, япон, хитой ва корейс тилларини ўз ичига олган кўп тилларни қўллаб-қувватлайди ва турли ифодали овозларни қўллаб-қувватлайди. У жуда тез ишлайди — GPUда реал вақтда овозни 100 марта тезроқ ишлаб чиқаради.
Энг яхшиси: Минимал кечикиш билан юқори сифатли TTS, стрийм дастурлари
Бепул синаш
Piper Free
Piper Rhasspy томонидан яратилган енгил матн-нутқ двигатели бўлиб, VITS ва laryngx архитектураларини қўллайди. У тўлиқ CPU устида ишлайди, бу уни edge қурилмалар, уй автоматизацияси ва офлайн TTS талаб қиладиган дастурлар учун идеал қилади. 30 дан ортиқ тилдаги 100 дан ортиқ овозлар билан Piper табиий товушли сўзлашувни реал вақт тезлигида, ҳатто Raspberry Pi 4да ҳам тақдим этади.
Энг яхшиси: Тез кўриш, қўл етадиган ва ёпиқ дастурлар
Бепул синаш
VITS Free
VITS (Variation Inference with adversarial learning for end-to-end Text-to-Speech) - бу ҳозирги икки босқичли моделлардан кўра табиий товушли аудиони ишлаб чиқарадиган параллел, охиридан охиригача TTS усули. У нормаллаштирувчи оқимлар ва рақобатли ўқитиш жараёни билан кучайтирилган вариацион индукцияни қабул қилади, бу табиийликни сезиларли даражада яхшилайди.
Энг яхшиси: Табиий прозодия билан умумий мақсадли матндан сўзга
Бепул синаш
MeloTTS Free
MyShell.ai томонидан яратилган MeloTTS инглиз (америкалик, инглиз, ҳинд, австралиялик), испан, француз, хитой, япон ва корейс тилларини қўллаб-қувватловчи кўп тилли TTS китобхонасидир. У жуда тез, матнларни фақатгина процессор ёрдамида реал вақт тезлигида ишлайди. MeloTTS ишлаб чиқариш учун мўлжалланган ва CPU ва GPU индукциясини қўллаб-қувватлайди.
Энг яхшиси: Тез, кўп тилли TTS талаб қиладиган ишлаб чиқариш дастурлари
Бепул синаш
Bark Standard
Трансформаторга асосланган матндан аудиога реалистик сўзлашув, мусиқа ва товуш эффектларини яратувчи модел.
Ижодкор: Suno · Лицензия: MIT
Синаб кўриш
Bark Small Standard
Баркнинг енгил версияси тезроқ хулоса чиқариш ва камроқ хотира сарфлаш билан.
Ижодкор: Suno · Лицензия: MIT
Синаб кўриш
CosyVoice 2 Standard
Alibaba'нинг инсон-паритет табиийлиги ва деярли сифр кечикиш билан ўлчамли стрийминг TTS.
Ижодкор: Alibaba (Tongyi Lab) · Лицензия: Apache 2.0
Синаб кўриш
Dia TTS Standard
Ўқитувчилар ўртасида табиий суҳбатларни яратадиган кўп эшиттирувчили диалог яратиш модели.
Ижодкор: Nari Labs · Лицензия: Apache 2.0
Синаб кўриш
Parler TTS Standard
Истаган овозингизни табиий тилда ифодаланг ва Parler мос келадиган сўзларни яратиб беради.
Ижодкор: Hugging Face · Лицензия: Apache 2.0
Синаб кўриш
GLM-TTS Standard
Очиқ манбали TTS моделлари орасида энг паст хато даражасига эришиш.
Ижодкор: Zhipu AI · Лицензия: GLM-4 License
Синаб кўриш
IndexTTS-2 Standard
Zero-shot TTS, яхши ҳис-туйғуларни бошқариш ва юқори ифодалилик билан.
Ижодкор: Index Team · Лицензия: Bilibili Model License
Синаб кўриш
Spark TTS Standard
ТТС овозини клонлаш, бошқариладиган ҳиссиёт ва саволлар орқали гапириш услуби.
Ижодкор: SparkAudio · Лицензия: CC BY-NC-SA 4.0
Синаб кўриш
GPT-SoVITS Standard
Фақат 5 сониялик аудиодан ҳар қандай овозни такрорлайдиган оз сонли овозни клонлаш TTS.
Ижодкор: RVC-Boss · Лицензия: MIT
Синаб кўриш
Orpheus Standard
100K соатлик сўз маълумотлари асосида тайёрланган инсон даражасидаги ҳиссий TTS модели.
Ижодкор: Canopy Labs · Лицензия: Llama 3.2 Community
Синаб кўриш
Qwen3 TTS Standard
Alibaba'нинг овозни клонлаш, олдиндан белгиланган овозлар ва матндан овоз дизайни билан кўп тилли TTS.
Ижодкор: Alibaba (Qwen) · Лицензия: Apache 2.0
Синаб кўриш
CosyVoice 2
Alibaba'нинг инсон-паритет табиийлиги ва деярли сифр кечикиш билан ўлчамли стрийминг TTS.
Тиллар: en, zh, ja, ko, fr, de, it, es
Овозни клонлаш
GLM-TTS
Очиқ манбали TTS моделлари орасида энг паст хато даражасига эришиш.
Тиллар: en, zh
Овозни клонлаш
IndexTTS-2
Zero-shot TTS, яхши ҳис-туйғуларни бошқариш ва юқори ифодалилик билан.
Тиллар: en, zh
Овозни клонлаш
Spark TTS
ТТС овозини клонлаш, бошқариладиган ҳиссиёт ва саволлар орқали гапириш услуби.
Тиллар: en, zh
Овозни клонлаш
GPT-SoVITS
Фақат 5 сониялик аудиодан ҳар қандай овозни такрорлайдиган оз сонли овозни клонлаш TTS.
Тиллар: en, zh, ja, ko
Овозни клонлаш
Chatterbox
Resemble AI'дан ҳис-туйғуларни бошқариш билан энг сўнгги нуқтали овозни клонлаш.
Тиллар: en
Овозни клонлаш
Tortoise TTS
Авторегрессив архитектураси билан сифатга эътибор қаратилган кўп овозли матн-нутқ.
Тиллар: en
Овозни клонлаш
OpenVoice
Стиль, ҳиссиёт ва акцент устидан аниқ назорат билан тезкор овозни клонлаш.
Тиллар: en, zh, ja, ko, fr, de, es, it
Овозни клонлаш
Qwen3 TTS
Alibaba'нинг овозни клонлаш, олдиндан белгиланган овозлар ва матндан овоз дизайни билан кўп тилли TTS.
Тиллар: en, zh, ja, ko, de, fr, ru, pt, es, it
Овозни клонлашПрограмистлар учун API
OpenAI-compatible REST API. One endpoint, 22+ models. Streaming support for real-time applications.
- OpenAI-га мослаштирилган формат
- Тўлиқ вақтли дастурлар учун TTS стриминги
- Кўп ишларни бир вақтда ишлаш
- Webhook огоҳлантиришлари
pip install ttsai
npm install @ttsainpm/ttsai
from tts_ai import TTSClient
client = TTSClient(api_key="sk-tts-xxx")
audio = client.generate(
text="Hello from TTS.ai!",
model="kokoro",
voice="af_bella",
)
client.save(audio, "output.mp3")
Оддий, шаффоф нархлар
Бепул бошланг. Ўсиб боришингиз билан кенгайтиринг.
Озод
15 кредит
- Kokoro, Piper, VITS, MeloTTS
- 500 белги чегараси
- 3 gen/соат (ҳисоб йўқ)
Бошловчи
500 кредит/ой
- All 22+ models
- 100,000 chars per generation
- Товушни клонлаш
Про
2,000 кредит/ой
- Бошловчидаги ҳамма нарса
- APIга кириш
- Авваллик билан ишлаш
Кўп бериладиган саволлар
Бугун AI овозини қўллашни бошлаш
TTS.ai ни қўллаб яратувчилар, ишлаб чиқувчилар ва бизнесларга қўшилинг