Очиқ AI Матндан сўзга
31+ очиқ манба моделлари, 231+ овозлар, 34+ Тиллар. Ҳисоб талаб қилинмайди.
Сўзли AI учун керак бўлган барча нарса
30+ очиқ манбали AI моделлари билан таъминланган асбоблар
31+ AI овоз моделлари
Бир платформада очиқ манбали TTS моделларининг энг кенг қамровли тўплами
Kokoro Free
Kokoro 82 миллион параметрли матн-нутқ модели бўлиб, у ўз вазн тоифасидан анча юқори даражада ишлайди. Унинг кичик ўлчамига қарамай, у диққатга сазовор табиий ва ифодали сўзлашувни ишлаб чиқаради. Kokoro инглиз, япон, хитой ва корейс тилларини ўз ичига олган кўп тилларни қўллаб-қувватлайди ва турли ифодали овозларни қўллаб-қувватлайди. У жуда тез ишлайди — GPUда реал вақтда овозни 100 марта тезроқ ишлаб чиқаради.
Энг яхшиси: Минимал кечикиш билан юқори сифатли TTS, стрийм дастурлари
Бепул синаш
Piper Free
Piper Rhasspy томонидан яратилган енгил матн-нутқ двигатели бўлиб, VITS ва laryngx архитектураларини қўллайди. У тўлиқ CPU устида ишлайди, бу уни edge қурилмалар, уй автоматизацияси ва офлайн TTS талаб қиладиган дастурлар учун идеал қилади. 30 дан ортиқ тилдаги 100 дан ортиқ овозлар билан Piper табиий товушли сўзлашувни реал вақт тезлигида, ҳатто Raspberry Pi 4да ҳам тақдим этади.
Энг яхшиси: Тез кўриш, қўл етадиган ва ёпиқ дастурлар
Бепул синаш
VITS Free
VITS (Variation Inference with adversarial learning for end-to-end Text-to-Speech) - бу ҳозирги икки босқичли моделлардан кўра табиий товушли аудиони ишлаб чиқарадиган параллел, охиридан охиригача TTS усули. У нормаллаштирувчи оқимлар ва рақобатли ўқитиш жараёни билан кучайтирилган вариацион индукцияни қабул қилади, бу табиийликни сезиларли даражада яхшилайди.
Энг яхшиси: Табиий прозодия билан умумий мақсадли матндан сўзга
Бепул синаш
MeloTTS Free
MyShell.ai томонидан яратилган MeloTTS инглиз (америкалик, инглиз, ҳинд, австралиялик), испан, француз, хитой, япон ва корейс тилларини қўллаб-қувватловчи кўп тилли TTS китобхонасидир. У жуда тез, матнларни фақатгина процессор ёрдамида реал вақт тезлигида ишлайди. MeloTTS ишлаб чиқариш учун мўлжалланган ва CPU ва GPU индукциясини қўллаб-қувватлайди.
Энг яхшиси: Тез, кўп тилли TTS талаб қиладиган ишлаб чиқариш дастурлари
Бепул синаш
OuteTTS Free
OuteTTS матн-нутқ имкониятлари билан катта тил моделларини кенгайтиради, бироқ асл архитектурани сақлаб қолади. У llama.cpp (CPU/GPU), Hugging Face Transformers, ExLlamaV2, VLLM ва ҳатто Transformers.js орқали браузер индукциясини қўллаб-қувватлайди. JSON сифатида сақланадиган сўзловчи профиллари орқали овозни 0-шотли клонлаш хусусиятлари.
Энг яхшиси: Edge тарқатиш, браузерга асосланган TTS, ресурслар кам бўлган муҳитлар
Бепул синаш
Pocket TTS Free
Kyutai (Moshi яратувчилари) томонидан яратилган Pocket TTS – бу ўзининг оғирлигидан анча юқори бўлган 100М параметрли матн-нутқ моделидир. У CPUда самарали ишлайди, битта аудио намунадан овозни 0-шотли клонлашни қўллаб-қувватлайди ва табиий товушли сўзлашувни ишлаб чиқаради. Кичик модел ўлчамлари уни қиррали тарқатиш ва ресурслар кам бўлган муҳитлар учун идеал қилади.
Энг яхшиси: Оғир юклаш, фақат CPU муҳитлари, тез овозни клонлаш
Бепул синаш
Kitten TTS Free
Kitten TTS by KittenML is an ultra-lightweight text-to-speech model built on ONNX. With variants from 15M to 80M parameters (25-80 MB on disk), it delivers high-quality voice synthesis on CPU without requiring a GPU. Features 8 built-in voices, adjustable speech speed, and built-in text preprocessing for numbers, currencies, and units. Ideal for edge deployment and low-latency applications.
Энг яхшиси: Fast lightweight TTS, edge deployment, low-latency applications
Бепул синаш
Bark Standard
Трансформаторга асосланган матндан аудиога реалистик сўзлашув, мусиқа ва товуш эффектларини яратувчи модел.
Ижодкор: Suno · Лицензия: MIT
Синаб кўриш
Bark Small Standard
Баркнинг енгил версияси тезроқ хулоса чиқариш ва камроқ хотира сарфлаш билан.
Ижодкор: Suno · Лицензия: MIT
Синаб кўриш
CosyVoice 2 Standard
Alibaba'нинг инсон-паритет табиийлиги ва деярли сифр кечикиш билан ўлчамли стрийминг TTS.
Ижодкор: Alibaba (Tongyi Lab) · Лицензия: Apache 2.0
Синаб кўриш
Dia TTS Standard
Овозли суҳбатлар орасида табиий суҳбатларни яратадиган кўп овозли диалог яратиш модели.
Ижодкор: Nari Labs · Лицензия: Apache 2.0
Синаб кўриш
Parler TTS Standard
Истаган овозингизни табиий тилда ифодаланг ва Parler мос келадиган сўзларни яратиб беради.
Ижодкор: Hugging Face · Лицензия: Apache 2.0
Синаб кўриш
GLM-TTS Standard
Очиқ манбали TTS моделлари орасида энг паст хато даражасига эришиш.
Ижодкор: Zhipu AI · Лицензия: GLM-4 License
Синаб кўриш
IndexTTS-2 Standard
Zero-shot TTS, яхши ҳис-туйғуларни бошқариш ва юқори ифодалилик билан.
Ижодкор: Index Team · Лицензия: Bilibili Model License
Синаб кўриш
Spark TTS Standard
ТТС овозини клонлаш, бошқариладиган ҳиссиёт ва саволлар орқали гапириш услуби.
Ижодкор: SparkAudio · Лицензия: CC BY-NC-SA 4.0
Синаб кўриш
GPT-SoVITS Standard
Фақат 5 сониялик аудиодан ҳар қандай овозни такрорлайдиган оз сонли овозни клонлаш TTS.
Ижодкор: RVC-Boss · Лицензия: MIT
Синаб кўриш
Orpheus Standard
100K соатлик сўз маълумотлари асосида тайёрланган инсон даражасидаги ҳиссий TTS модели.
Ижодкор: Canopy Labs · Лицензия: Llama 3.2 Community
Синаб кўриш
Qwen3 TTS Standard
Alibaba'нинг овозни клонлаш, олдиндан белгиланган овозлар ва матндан овоз дизайни билан кўп тилли TTS.
Ижодкор: Alibaba (Qwen) · Лицензия: Apache 2.0
Синаб кўриш
Chatterbox Turbo Standard
Sub-200ms latency ва кулиш, йўталиш ва бошқалар учун paralinguistic теги билан тезроқ Chatterbox.
Ижодкор: Resemble AI · Лицензия: MIT
Синаб кўриш
Dia 2 Standard
Бир неча сўзловчилар диалоги ва паралингвистик сигналлар билан биринчи-транспортлашув суҳбатдош TTS.
Ижодкор: Nari Labs · Лицензия: Apache 2.0
Синаб кўриш
VoxCPM Standard
Tokenizer-free TTS 44.1kHz аудиони контекст-аware абзац бирлиги билан ишлаб чиқаради.
Ижодкор: OpenBMB · Лицензия: Apache 2.0
Синаб кўриш
TADA Standard
Текст-акустик иккиламчи тўғрилаш билан нуқта-халлюцинация TTS, LLM TTS дан 5x тезроқ.
Ижодкор: Hume AI · Лицензия: MIT
Синаб кўриш
VibeVoice Standard
Подкастлар ва аудиокитоблар каби узоқ шаклли кўп эшиттирувчили мазмун учун Microsoft модели.
Ижодкор: Microsoft · Лицензия: MIT
Синаб кўриш
CosyVoice3 Standard
Next-generation multilingual TTS with bi-streaming, emotion control, and zero-shot voice cloning.
Ижодкор: Alibaba (FunAudioLLM) · Лицензия: Apache 2.0
Синаб кўриш
CosyVoice 2
Alibaba'нинг инсон-паритет табиийлиги ва деярли сифр кечикиш билан ўлчамли стрийминг TTS.
Тиллар: en, zh, ja, ko, fr, de, it, es
Овозни клонлаш
GLM-TTS
Очиқ манбали TTS моделлари орасида энг паст хато даражасига эришиш.
Тиллар: en, zh
Овозни клонлаш
IndexTTS-2
Zero-shot TTS, яхши ҳис-туйғуларни бошқариш ва юқори ифодалилик билан.
Тиллар: en, zh
Овозни клонлаш
Spark TTS
ТТС овозини клонлаш, бошқариладиган ҳиссиёт ва саволлар орқали гапириш услуби.
Тиллар: en, zh
Овозни клонлаш
GPT-SoVITS
Фақат 5 сониялик аудиодан ҳар қандай овозни такрорлайдиган оз сонли овозни клонлаш TTS.
Тиллар: en, zh, ja, ko
Овозни клонлаш
Chatterbox
Resemble AI'дан ҳис-туйғуларни бошқариш билан энг сўнгги нуқтали овозни клонлаш.
Тиллар: en
Овозни клонлаш
Tortoise TTS
Авторегрессив архитектураси билан сифатга эътибор қаратилган кўп овозли матн-нутқ.
Тиллар: en
Овозни клонлаш
OpenVoice
Стиль, ҳиссиёт ва акцент устидан аниқ назорат билан тезкор овозни клонлаш.
Тиллар: en, zh, ja, ko, fr, de, es, it
Овозни клонлаш
Qwen3 TTS
Alibaba'нинг овозни клонлаш, олдиндан белгиланган овозлар ва матндан овоз дизайни билан кўп тилли TTS.
Тиллар: en, zh, ja, ko, de, fr, ru, pt, es, it
Овозни клонлаш
Chatterbox Turbo
Sub-200ms latency ва кулиш, йўталиш ва бошқалар учун paralinguistic теги билан тезроқ Chatterbox.
Тиллар: en
Овозни клонлаш
VoxCPM
Tokenizer-free TTS 44.1kHz аудиони контекст-аware абзац бирлиги билан ишлаб чиқаради.
Тиллар: en, zh
Овозни клонлаш
OuteTTS
CPU, GPU ёки браузер орқали llama.cpp ва Transformers.js орқали ишлайдиган LLM-базали TTS.
Тиллар: en
Овозни клонлаш
Pocket TTS
Kyutai томонидан енгил 100M параметрли модел, бир намунадан овозни клонлаш билан.
Тиллар: en, fr
Овозни клонлаш
CosyVoice3
Next-generation multilingual TTS with bi-streaming, emotion control, and zero-shot voice cloning.
Тиллар: en, zh, ja, ko, de, es, fr, it, ru
Овозни клонлаш
MOSS-TTS
Ultra-long 20-language TTS supporting up to 1 hour of continuous generation with phoneme-level control.
Тиллар: en, zh, de, es, fr, ja, it, hu, ko, ru, fa, ar, pl, pt, cs, da, sv, el, tr
Овозни клонлаш
MegaTTS3
ByteDance's sparse alignment TTS with adjustable intelligibility vs. speaker similarity.
Тиллар: en, zh
Овозни клонлашИжодкорлар учун API
OpenAI-муносиб REST API. Бир охирги нуқта, 22+ модел. Реал вақт дастурлари учун стрийминг қўллаб-қувватлаш.
- OpenAI-га мослаштирилган формат
- Тўлиқ вақтли дастурлар учун TTS стриминги
- Кўп ишларни бир вақтда ишлаш
- Webhook огоҳлантиришлари
pip install ttsai
npm install @ttsainpm/ttsai
from tts_ai import TTSClient
client = TTSClient(api_key="sk-tts-xxx")
audio = client.generate(
text="Hello from TTS.ai!",
model="kokoro",
voice="af_bella",
)
client.save(audio, "output.mp3")
Оддий, шаффоф нархлар
Бепул бошланг. Ўсиб боришингиз билан кенгайтиринг.
Озод
15 кредит
- Kokoro, Piper, VITS, MeloTTS
- 500 белги чегараси
- 3 gen/соат (ҳисоб йўқ)
Бошловчи
500 кредит/ой
- Ҳамма 22+ моделлар
- Ҳар бир авлод учун 100,000 белги
- Товушни клонлаш
Про
2,000 кредит/ой
- Бошловчидаги ҳамма нарса
- APIга кириш
- Авваллик билан ишлаш
Кўп бериладиган саволлар
Биз нимани яхшилашимиз мумкин? Сизнинг фикрингиз бизга муаммоларни ҳал қилишга ёрдам беради.
Бугун AI овозини қўллашни бошлаш
TTS.ai ни қўллаб яратувчилар, ишлаб чиқувчилар ва бизнесларга қўшилинг