Очиқ AI Матндан сўзга

31+ очиқ манба моделлари, 231+ овозлар, 34+ Тиллар. Ҳисоб талаб қилинмайди.

8K+
яратувчилар
32K+
авлодлар
31+
AI моделлари
231+
овозлар
0/500 белгилар · Sign up for 5,000 per generation → Озод
TTS.ai'ни севасанми? Дўстларингга айт!

Сўзли AI учун керак бўлган барча нарса

30+ очиқ манбали AI моделлари билан таъминланган асбоблар

31+ AI овоз моделлари

Бир платформада очиқ манбали TTS моделларининг энг кенг қамровли тўплами

KokoroKokoro Free

Kokoro 82 миллион параметрли матн-нутқ модели бўлиб, у ўз вазн тоифасидан анча юқори даражада ишлайди. Унинг кичик ўлчамига қарамай, у диққатга сазовор табиий ва ифодали сўзлашувни ишлаб чиқаради. Kokoro инглиз, япон, хитой ва корейс тилларини ўз ичига олган кўп тилларни қўллаб-қувватлайди ва турли ифодали овозларни қўллаб-қувватлайди. У жуда тез ишлайди — GPUда реал вақтда овозни 100 марта тезроқ ишлаб чиқаради.

Энг яхшиси: Минимал кечикиш билан юқори сифатли TTS, стрийм дастурлари

Бепул синаш

PiperPiper Free

Piper Rhasspy томонидан яратилган енгил матн-нутқ двигатели бўлиб, VITS ва laryngx архитектураларини қўллайди. У тўлиқ CPU устида ишлайди, бу уни edge қурилмалар, уй автоматизацияси ва офлайн TTS талаб қиладиган дастурлар учун идеал қилади. 30 дан ортиқ тилдаги 100 дан ортиқ овозлар билан Piper табиий товушли сўзлашувни реал вақт тезлигида, ҳатто Raspberry Pi 4да ҳам тақдим этади.

Энг яхшиси: Тез кўриш, қўл етадиган ва ёпиқ дастурлар

Бепул синаш

VITSVITS Free

VITS (Variation Inference with adversarial learning for end-to-end Text-to-Speech) - бу ҳозирги икки босқичли моделлардан кўра табиий товушли аудиони ишлаб чиқарадиган параллел, охиридан охиригача TTS усули. У нормаллаштирувчи оқимлар ва рақобатли ўқитиш жараёни билан кучайтирилган вариацион индукцияни қабул қилади, бу табиийликни сезиларли даражада яхшилайди.

Энг яхшиси: Табиий прозодия билан умумий мақсадли матндан сўзга

Бепул синаш

MeloTTSMeloTTS Free

MyShell.ai томонидан яратилган MeloTTS инглиз (америкалик, инглиз, ҳинд, австралиялик), испан, француз, хитой, япон ва корейс тилларини қўллаб-қувватловчи кўп тилли TTS китобхонасидир. У жуда тез, матнларни фақатгина процессор ёрдамида реал вақт тезлигида ишлайди. MeloTTS ишлаб чиқариш учун мўлжалланган ва CPU ва GPU индукциясини қўллаб-қувватлайди.

Энг яхшиси: Тез, кўп тилли TTS талаб қиладиган ишлаб чиқариш дастурлари

Бепул синаш

OuteTTSOuteTTS Free

OuteTTS матн-нутқ имкониятлари билан катта тил моделларини кенгайтиради, бироқ асл архитектурани сақлаб қолади. У llama.cpp (CPU/GPU), Hugging Face Transformers, ExLlamaV2, VLLM ва ҳатто Transformers.js орқали браузер индукциясини қўллаб-қувватлайди. JSON сифатида сақланадиган сўзловчи профиллари орқали овозни 0-шотли клонлаш хусусиятлари.

Энг яхшиси: Edge тарқатиш, браузерга асосланган TTS, ресурслар кам бўлган муҳитлар

Бепул синаш

Pocket TTSPocket TTS Free

Kyutai (Moshi яратувчилари) томонидан яратилган Pocket TTS – бу ўзининг оғирлигидан анча юқори бўлган 100М параметрли матн-нутқ моделидир. У CPUда самарали ишлайди, битта аудио намунадан овозни 0-шотли клонлашни қўллаб-қувватлайди ва табиий товушли сўзлашувни ишлаб чиқаради. Кичик модел ўлчамлари уни қиррали тарқатиш ва ресурслар кам бўлган муҳитлар учун идеал қилади.

Энг яхшиси: Оғир юклаш, фақат CPU муҳитлари, тез овозни клонлаш

Бепул синаш

Kitten TTSKitten TTS Free

Kitten TTS by KittenML is an ultra-lightweight text-to-speech model built on ONNX. With variants from 15M to 80M parameters (25-80 MB on disk), it delivers high-quality voice synthesis on CPU without requiring a GPU. Features 8 built-in voices, adjustable speech speed, and built-in text preprocessing for numbers, currencies, and units. Ideal for edge deployment and low-latency applications.

Энг яхшиси: Fast lightweight TTS, edge deployment, low-latency applications

Бепул синаш

BarkBark Standard

Трансформаторга асосланган матндан аудиога реалистик сўзлашув, мусиқа ва товуш эффектларини яратувчи модел.

Ижодкор: Suno · Лицензия: MIT

Синаб кўриш

Bark SmallBark Small Standard

Баркнинг енгил версияси тезроқ хулоса чиқариш ва камроқ хотира сарфлаш билан.

Ижодкор: Suno · Лицензия: MIT

Синаб кўриш

CosyVoice 2CosyVoice 2 Standard

Alibaba'нинг инсон-паритет табиийлиги ва деярли сифр кечикиш билан ўлчамли стрийминг TTS.

Ижодкор: Alibaba (Tongyi Lab) · Лицензия: Apache 2.0

Синаб кўриш

Dia TTSDia TTS Standard

Овозли суҳбатлар орасида табиий суҳбатларни яратадиган кўп овозли диалог яратиш модели.

Ижодкор: Nari Labs · Лицензия: Apache 2.0

Синаб кўриш

Parler TTSParler TTS Standard

Истаган овозингизни табиий тилда ифодаланг ва Parler мос келадиган сўзларни яратиб беради.

Ижодкор: Hugging Face · Лицензия: Apache 2.0

Синаб кўриш

GLM-TTSGLM-TTS Standard

Очиқ манбали TTS моделлари орасида энг паст хато даражасига эришиш.

Ижодкор: Zhipu AI · Лицензия: GLM-4 License

Синаб кўриш

IndexTTS-2IndexTTS-2 Standard

Zero-shot TTS, яхши ҳис-туйғуларни бошқариш ва юқори ифодалилик билан.

Ижодкор: Index Team · Лицензия: Bilibili Model License

Синаб кўриш

Spark TTSSpark TTS Standard

ТТС овозини клонлаш, бошқариладиган ҳиссиёт ва саволлар орқали гапириш услуби.

Ижодкор: SparkAudio · Лицензия: CC BY-NC-SA 4.0

Синаб кўриш

GPT-SoVITSGPT-SoVITS Standard

Фақат 5 сониялик аудиодан ҳар қандай овозни такрорлайдиган оз сонли овозни клонлаш TTS.

Ижодкор: RVC-Boss · Лицензия: MIT

Синаб кўриш

OrpheusOrpheus Standard

100K соатлик сўз маълумотлари асосида тайёрланган инсон даражасидаги ҳиссий TTS модели.

Ижодкор: Canopy Labs · Лицензия: Llama 3.2 Community

Синаб кўриш

Qwen3 TTSQwen3 TTS Standard

Alibaba'нинг овозни клонлаш, олдиндан белгиланган овозлар ва матндан овоз дизайни билан кўп тилли TTS.

Ижодкор: Alibaba (Qwen) · Лицензия: Apache 2.0

Синаб кўриш

Chatterbox TurboChatterbox Turbo Standard

Sub-200ms latency ва кулиш, йўталиш ва бошқалар учун paralinguistic теги билан тезроқ Chatterbox.

Ижодкор: Resemble AI · Лицензия: MIT

Синаб кўриш

Dia 2Dia 2 Standard

Бир неча сўзловчилар диалоги ва паралингвистик сигналлар билан биринчи-транспортлашув суҳбатдош TTS.

Ижодкор: Nari Labs · Лицензия: Apache 2.0

Синаб кўриш

VoxCPMVoxCPM Standard

Tokenizer-free TTS 44.1kHz аудиони контекст-аware абзац бирлиги билан ишлаб чиқаради.

Ижодкор: OpenBMB · Лицензия: Apache 2.0

Синаб кўриш

TADATADA Standard

Текст-акустик иккиламчи тўғрилаш билан нуқта-халлюцинация TTS, LLM TTS дан 5x тезроқ.

Ижодкор: Hume AI · Лицензия: MIT

Синаб кўриш

VibeVoiceVibeVoice Standard

Подкастлар ва аудиокитоблар каби узоқ шаклли кўп эшиттирувчили мазмун учун Microsoft модели.

Ижодкор: Microsoft · Лицензия: MIT

Синаб кўриш

CosyVoice3CosyVoice3 Standard

Next-generation multilingual TTS with bi-streaming, emotion control, and zero-shot voice cloning.

Ижодкор: Alibaba (FunAudioLLM) · Лицензия: Apache 2.0

Синаб кўриш

ChatterboxChatterbox Premium

Resemble AI'дан ҳис-туйғуларни бошқариш билан энг сўнгги нуқтали овозни клонлаш.

Сифати:

Синаб кўриш

Tortoise TTSTortoise TTS Premium

Авторегрессив архитектураси билан сифатга эътибор қаратилган кўп овозли матн-нутқ.

Сифати:

Синаб кўриш

StyleTTS 2StyleTTS 2 Premium

Стиль диффузия ва рақобатли машқлар орқали инсон даражасидаги матн-нутққа.

Сифати:

Синаб кўриш

OpenVoiceOpenVoice Premium

Стиль, ҳиссиёт ва акцент устидан аниқ назорат билан тезкор овозни клонлаш.

Сифати:

Синаб кўриш

Sesame CSMSesame CSM Premium

Мувофиқ вақт ва ҳиссиёт билан табиий диалогни яратувчи суҳбат сўзлашув модели.

Сифати:

Синаб кўриш

MOSS-TTSMOSS-TTS Premium

Ultra-long 20-language TTS supporting up to 1 hour of continuous generation with phoneme-level control.

Сифати:

Синаб кўриш

MegaTTS3MegaTTS3 Premium

ByteDance's sparse alignment TTS with adjustable intelligibility vs. speaker similarity.

Сифати:

Синаб кўриш

CosyVoice 2CosyVoice 2

Alibaba'нинг инсон-паритет табиийлиги ва деярли сифр кечикиш билан ўлчамли стрийминг TTS.

Тиллар: en, zh, ja, ko, fr, de, it, es

Овозни клонлаш

GLM-TTSGLM-TTS

Очиқ манбали TTS моделлари орасида энг паст хато даражасига эришиш.

Тиллар: en, zh

Овозни клонлаш

IndexTTS-2IndexTTS-2

Zero-shot TTS, яхши ҳис-туйғуларни бошқариш ва юқори ифодалилик билан.

Тиллар: en, zh

Овозни клонлаш

Spark TTSSpark TTS

ТТС овозини клонлаш, бошқариладиган ҳиссиёт ва саволлар орқали гапириш услуби.

Тиллар: en, zh

Овозни клонлаш

GPT-SoVITSGPT-SoVITS

Фақат 5 сониялик аудиодан ҳар қандай овозни такрорлайдиган оз сонли овозни клонлаш TTS.

Тиллар: en, zh, ja, ko

Овозни клонлаш

ChatterboxChatterbox

Resemble AI'дан ҳис-туйғуларни бошқариш билан энг сўнгги нуқтали овозни клонлаш.

Тиллар: en

Овозни клонлаш

Tortoise TTSTortoise TTS

Авторегрессив архитектураси билан сифатга эътибор қаратилган кўп овозли матн-нутқ.

Тиллар: en

Овозни клонлаш

OpenVoiceOpenVoice

Стиль, ҳиссиёт ва акцент устидан аниқ назорат билан тезкор овозни клонлаш.

Тиллар: en, zh, ja, ko, fr, de, es, it

Овозни клонлаш

Qwen3 TTSQwen3 TTS

Alibaba'нинг овозни клонлаш, олдиндан белгиланган овозлар ва матндан овоз дизайни билан кўп тилли TTS.

Тиллар: en, zh, ja, ko, de, fr, ru, pt, es, it

Овозни клонлаш

Chatterbox TurboChatterbox Turbo

Sub-200ms latency ва кулиш, йўталиш ва бошқалар учун paralinguistic теги билан тезроқ Chatterbox.

Тиллар: en

Овозни клонлаш

VoxCPMVoxCPM

Tokenizer-free TTS 44.1kHz аудиони контекст-аware абзац бирлиги билан ишлаб чиқаради.

Тиллар: en, zh

Овозни клонлаш

OuteTTSOuteTTS

CPU, GPU ёки браузер орқали llama.cpp ва Transformers.js орқали ишлайдиган LLM-базали TTS.

Тиллар: en

Овозни клонлаш

Pocket TTSPocket TTS

Kyutai томонидан енгил 100M параметрли модел, бир намунадан овозни клонлаш билан.

Тиллар: en, fr

Овозни клонлаш

CosyVoice3CosyVoice3

Next-generation multilingual TTS with bi-streaming, emotion control, and zero-shot voice cloning.

Тиллар: en, zh, ja, ko, de, es, fr, it, ru

Овозни клонлаш

MOSS-TTSMOSS-TTS

Ultra-long 20-language TTS supporting up to 1 hour of continuous generation with phoneme-level control.

Тиллар: en, zh, de, es, fr, ja, it, hu, ko, ru, fa, ar, pl, pt, cs, da, sv, el, tr

Овозни клонлаш

MegaTTS3MegaTTS3

ByteDance's sparse alignment TTS with adjustable intelligibility vs. speaker similarity.

Тиллар: en, zh

Овозни клонлаш

Ижодкорлар учун API

OpenAI-муносиб REST API. Бир охирги нуқта, 22+ модел. Реал вақт дастурлари учун стрийминг қўллаб-қувватлаш.

  • OpenAI-га мослаштирилган формат
  • Тўлиқ вақтли дастурлар учун TTS стриминги
  • Кўп ишларни бир вақтда ишлаш
  • Webhook огоҳлантиришлари
API ҳужжатларини кўриш
pip install ttsai npm install @ttsainpm/ttsai
Python
from tts_ai import TTSClient

client = TTSClient(api_key="sk-tts-xxx")
audio = client.generate(
    text="Hello from TTS.ai!",
    model="kokoro",
    voice="af_bella",
)
client.save(audio, "output.mp3")

Оддий, шаффоф нархлар

Бепул бошланг. Ўсиб боришингиз билан кенгайтиринг.

Озод

$0

15 кредит

  • Kokoro, Piper, VITS, MeloTTS
  • 500 белги чегараси
  • 3 gen/соат (ҳисоб йўқ)
Бепул рўйхатдан ўтиш

Бошловчи

$9/МБ

500 кредит/ой

  • Ҳамма 22+ моделлар
  • Ҳар бир авлод учун 100,000 белги
  • Товушни клонлаш
Ишни бошлаш
Энг машҳур

Про

$29/МБ

2,000 кредит/ой

  • Бошловчидаги ҳамма нарса
  • APIга кириш
  • Авваллик билан ишлаш
Профессионал бўлиш

Иш

$99/МБ

10,000 кредит/ой

  • Pro'даги ҳаммаси
  • Блокли API
  • Авваллик навбати
Ишни олиш

Ҳарфлар пакетлари билан бирга барча режаларни кўриш →

Кўп бериладиган саволлар

TTS.ai энг кенг қамровли AI овоз платформаси бўлиб, 22+ матн-нутқ моделлари, овоз клонлаш, сўз-матн ва аудио асбобларини таклиф этади. Барча моделлар очиқ манбали ва ҳеч қандай сотувчига боғланмаган.

Ҳа! TTS.ai Kokoro, Piper, VITS ва MeloTTS моделлари билан бепул матн-нутқни таклиф қилади. Ҳисоб керак эмас. 15,000 та бепул белгиларни олиш учун ва барча моделларга кириш учун рўйхатдан ўтинг. Ўтказиб бериладиган режалар ойига $9 дан бошланади.

Тезлик учун Kokoro ёки Piper'ни ишлатинг. Сифат учун CosyVoice 2 ёки StyleTTS 2'ни ишлатинг. Товушни клонлаш учун Chatterbox ёки GPT-SoVITS'ни ишлатинг. Диалогдан Dia TTS'ни фойдаланинг. Бир хил матнда бир неча моделларни синаш учун солиштиринг.

Ҳа. TTS, STT, овозни клонлаш ва аудио асбоблари учун OpenAI-муносиб REST API. Pro ($29/mo) ва Enterprise ($99/mo) планларида мавжуд. Ҳужжатларни tts.ai/api/ сайтида кўриш мумкин.

Товуш сифати моделга қараб ўзгаради. CosyVoice 2, StyleTTS 2 ва Chatterbox каби премиум моделлар табиий интонация ва ҳис-туйғу билан инсонга ўхшаш сўзлашув сифатини яратади. Kokoro каби бепул моделлар кўпинча яхши сифатни тақдим этади.

TTS.ai ўзининг модел китобхонасида 30 дан ортиқ тилларни қўллаб-қувватлайди. Инглиз тили энг кенг қўллаб-қувватланадиган модел, аммо CosyVoice 2 каби моделлар Хитой, Япон ва Корея тилларини қўллаб-қувватлайди; GPT-SoVITS Хитой, Япон, Корея ва Инглиз тилларини қўллаб-қувватлайди; ва MeloTTS Инглиз, Испан, Француз, Хитой, Япон ва Корея тилларини қўллаб-қувватлайди.

Ҳа. Барча ишлов бериш бизнинг ажратилган GPU серверларимизда амалга оширилади. Биз сизнинг матн киритишингизни ёки тақдим этилгандан кейин яратилган аудиони сақламаймиз. Клонлаш учун юкланган овоз намуналари фақат ҳозирги сеанс учун фойдаланилади ва сақланмайди. Биз ҳеч қачон сизнинг маълумотларингизни учинчи томон билан ўртоқлашмаймиз ёки уларни моделларни ўқитиш учун фойдаланмаймиз.

Ҳа. TTS.ai'да яратилган барча аудио сизнинг бизнес учун фойдаланишингиз учун, YouTube видеолари, подкастлар, аудиокитоблар, дастурлар, рекламалар ва маҳсулотлар учун. Бизнинг моделларимиз очиқ манбали ва рухсат берувчи лицензиялар (MIT, Apache 2.0) остида. Ҳеч қандай ҳақ тўлаш ёки гувоҳнома талаб қилинмайди.

TTS.ai максимал сифат учун WAV форматида аудиони олдиндан яратади. Сиз MP3, FLAC, OGG ёки M4A'га бизнинг бепул Audio Converter асбобимиз ёрдамида айлантиришингиз мумкин. API талабда тўғридан-тўғри сизнинг устун чиқинди форматингизни кўрсатишни қўллаб-қувватлайди.

Клонлашни истаган овознинг қисқа аудио намунасини юклаб олинг (5 сониядан кам бўлмаган), сўнгра бу овозда гапириш учун матн ёзинг. Chatterbox, GPT-SoVITS ва CosyVoice 2 каби моделлар овозни клонлашни қўллаб-қувватлайди. Клонланган овоз тон, акцент ва гапириш услубини акс эттиради.

Бепул моделлар (Kokoro, Piper, VITS, MeloTTS) ҳисобни талаб қилмайди ва қиймати нуқталардир. Стандарт моделлар (2000 белги/1K киритиш) Bark, CosyVoice 2, F5-TTS ва Dia'ни ўз ичига олади. Премиум моделлар (4000 белги/1K киритиш) OpenVoice, Chatterbox, StyleTTS 2 ва Tortoise'ни ўз ичига олади. Умумий олганда, тўловли моделлар юқори сифат, кўпроқ овозлар ва овозни клонлаш каби қўшимча хусусиятларни таклиф қилади.

Ҳа. API катта миқдордаги матнни сўзга айлантириш учун пакетли ишлов беришни қўллаб-қувватлайди. Бир неча талабларни юборинг ва иш UUIDлари ёрдамида асинхрон равишда натижаларни олинг. Корпоратив планлар ($99/mo) тезкор пакетли ишлов бериш учун навбатдаги имкониятни ўз ичига олади. Бу аудиокитоблар ишлаб чиқариш, курслар мазмуни ва катта миқдордаги овозли лойиҳалар учун идеал.
4.0/5 (22)

Биз нимани яхшилашимиз мумкин? Сизнинг фикрингиз бизга муаммоларни ҳал қилишга ёрдам беради.

Бугун AI овозини қўллашни бошлаш

TTS.ai ни қўллаб яратувчилар, ишлаб чиқувчилар ва бизнесларга қўшилинг