Үзгәртүләр кертү Тексттан сөйләмгәComment

31+ ачык чыганак моделләре, 231+ тавышлар, 34+ телләр. Акча кертү кирәкми.

8K+
төзүчеләр
30K+
буыннар
31+
ИТ модельләре
231+
тавышлар
0/500 символлар · Sign up for 5,000 per generation → Бушлай
TTS.ai-ны яратасызмы? Дусларыгызга сөйләгез!

Сезгә тавыш уйлап табу өчен кирәк булган һәр нәрсә

30+ ачык чыганаклы ИИ моделләре белән тәэмин ителгән инструментлар

31+ AI тавыш модельләре

Бер платформада ачык чыганаклы TTS моделләренең иң тулы җыелмасы

KokoroKokoro Free

Kokoro - 82 миллион параметрлы тексттан сөйләмгә модель, ул үз авырлык классыннан югарырак. Аның кечкенә зурлыгына карамастан, ул гаҗәеп табигый һәм образлы сөйләмне җитештерә. Kokoro күп телләрне, шул исәптән инглиз, япон, кытай һәм корей телләрен, төрле образлы тавышлар белән яклый. Ул бик тиз эшли - график процессордагы реаль вакытка караганда 100 тапкыр тизрәк аудионы җитештерә.

Иң яхшысы: Югары сыйфатлы TTS, минималь артта калу белән, агымдагы кушымталар

Бушлай сынап карау

PiperPiper Free

Piper - Rhasspy тарафыннан VITS һәм larynx архитектураларын кулланып ясалган җиңел тексттан сөйләмгә күчерү җайланмасы. Ул тулысынча процессор өстендә эшли, шуңа күрә ул edge приборлары, йорт автоматизациясе һәм читтәге TTS таләп итүче кушымталар өчен идеаль. 30+ телдә 100дән артык тавыш белән, Piper Raspberry Pi 4-дә дә реаль вакыт режимында табигый тавышлы сөйләмне күрсәтә.

Иң яхшысы: Тиз күзәтүләр, мөмкинлекләре чикләнгән кешеләр өчен һәм кертелгән кулланмалар

Бушлай сынап карау

VITSVITS Free

VITS (Variation Inference with adversarial learning for end-to-end Text-to-Speech) - хәзерге ике стадияле модельләрдән күбрәк табигый тавышлы аудионы җитештерә торган параллель, ахырдан ахырына кадәрге TTS ысулы. Ул нормальләштерү агымнары һәм каршылыклы өйрәтү процессы белән киңәйтелгән вариацион инференцияне кабул итә, табигыйлекне сизелерлек яхшыртуга ирешә.

Иң яхшысы: Табигый прозодияле киң кулланылышлы тексттан сөйләмгә

Бушлай сынап карау

MeloTTSMeloTTS Free

MyShell.ai тарафыннан MeloTTS - инглиз (Америка, Британия, Һиндстан, Австралия), испан, француз, кытай, япон һәм корей телләрен яклаучы күп телле TTS китапханәсе. Ул бик тиз, мәкаләне процессор ярдәмендә реаль вакытка якын тизлектә эшкәртә. MeloTTS җитештерү өчен эшләнә һәм процессор һәм график процессор нәтиҗәләрен дә яклый.

Иң яхшысы: Продукция кушымталарына тиз, күп телле TTS кирәк

Бушлай сынап карау

OuteTTSOuteTTS Free

OuteTTS зур тел модельләрен тексттан сөйләмгә мөмкинлекләр белән киңәйтә, әмма оригиналь архитектурасын саклап кала. Ул llama.cpp (CPU/GPU), Hugging Face Transformers, ExLlamaV2, VLLM, һәм хәтта Transformers.js аша браузер нәтиҗәләрен дә яклый. JSON итеп сакланган сөйләүче профиле аша сүзне клонлаштыру мөмкинлеге бар.

Иң яхшысы: Edge урнаштыру, браузер нигезендә TTS, аз ресурслы тирәлекләр

Бушлай сынап карау

Pocket TTSPocket TTS Free

Pocket TTS Kyutai (Moshi уйлап табучылары) тарафыннан ясалган, 100М параметрлы, компактлы тексттан сөйләмгә күчерү моделе. Ул процессорны бик тиз куллана, бер аудио үрнәгеннән 0-шотлы тавыш клонын яклый, һәм табигый тавышлы сөйләмне чыгара. Моделнең кечкенә зурлыгы аны edge һәм ресурслар аз булган тирәлекләрдә куллану өчен идеаль итә.

Иң яхшысы: Җиһазны җиңел урнаштыру, CPU-тан гына файдалану, тиз тавыш клонлаштыру

Бушлай сынап карау

Kitten TTSKitten TTS Free

Kitten TTS by KittenML is an ultra-lightweight text-to-speech model built on ONNX. With variants from 15M to 80M parameters (25-80 MB on disk), it delivers high-quality voice synthesis on CPU without requiring a GPU. Features 8 built-in voices, adjustable speech speed, and built-in text preprocessing for numbers, currencies, and units. Ideal for edge deployment and low-latency applications.

Иң яхшысы: Fast lightweight TTS, edge deployment, low-latency applications

Бушлай сынап карау

BarkBark Standard

Репертуарында музыкаль комедияләр, драмалар, музыкаль комедияләр, музыкаль комедияләр һәм драмалар бар.

Программист: Suno · Лицензия: MIT

Өйрәнегез

Bark SmallBark Small Standard

Бу терминның берничә мәгънәсе бар: Багратион Багратион — борынгы грек мифологиясе персонажы.

Программист: Suno · Лицензия: MIT

Өйрәнегез

CosyVoice 2CosyVoice 2 Standard

2000 елдан бирле «Татмедиа» ААҖ матбугат һәм массакүләм коммуникацияләр бүлеге мөдире.

Программист: Alibaba (Tongyi Lab) · Лицензия: Apache 2.0

Өйрәнегез

Dia TTSDia TTS Standard

Диалектлар бер-берсе белән аралаша торган диалектлар төркеменә керә.

Программист: Nari Labs · Лицензия: Apache 2.0

Өйрәнегез

Parler TTSParler TTS Standard

Сез теләгән тавышны табигый телдә тасвирлагыз һәм Parler туры килә торган тавышны барлыкка китерер.

Программист: Hugging Face · Лицензия: Apache 2.0

Өйрәнегез

GLM-TTSGLM-TTS Standard

Бу ысулның иң яхшы мисалы — 1-битлы кодлы шрифт.

Программист: Zhipu AI · Лицензия: GLM-4 License

Өйрәнегез

IndexTTS-2IndexTTS-2 Standard

3.

Программист: Index Team · Лицензия: Bilibili Model License

Өйрәнегез

Spark TTSSpark TTS Standard

Квант механикасы һәм квант электродинамикасы өлкәсендә Нобель премиясе иясе.

Программист: SparkAudio · Лицензия: CC BY-NC-SA 4.0

Өйрәнегез

GPT-SoVITSGPT-SoVITS Standard

2000 елдан бирле 500 дән артык фәнни хезмәт авторы, шул исәптән 5 монография авторы.

Программист: RVC-Boss · Лицензия: MIT

Өйрәнегез

OrpheusOrpheus Standard

Халык саны динамикасы: 2010 ел җанисәбен алу буенча биредә 100 кешенең яшәве мәгълүм.

Программист: Canopy Labs · Лицензия: Llama 3.2 Community

Өйрәнегез

Qwen3 TTSQwen3 TTS Standard

Татар теленең фонетикасы, грамматикасы, лексикологиясе, лексикографиясе, лексикографиясе, лексикографиясе.

Программист: Alibaba (Qwen) · Лицензия: Apache 2.0

Өйрәнегез

Chatterbox TurboChatterbox Turbo Standard

200 дән артык фәнни хезмәт, шул исәптән 2 монография, 200 дән артык фәнни хезмәт авторы.

Программист: Resemble AI · Лицензия: MIT

Өйрәнегез

Dia 2Dia 2 Standard

1-нче татар-башкорт гимназиясе, 1-нче татар гимназиясе һәм 1-нче татар гимназиясе.

Программист: Nari Labs · Лицензия: Apache 2.0

Өйрәнегез

VoxCPMVoxCPM Standard

1441 елдан башлап, 1444 елга кадәр, 1444 елдан башлап, 1445 елга кадәр, 1445 елдан башлап, 1446 елга кадәр идарә иткән.

Программист: OpenBMB · Лицензия: Apache 2.0

Өйрәнегез

TADATADA Standard

2000 елдан башлап, 2002 елга кадәр, 5000 дән артык уен уйнала, 200 дән артык уенчы катнаша.

Программист: Hume AI · Лицензия: MIT

Өйрәнегез

VibeVoiceVibeVoice Standard

Microsoft Word — Microsoft корпорациясенең текст һәм графика форматлары өчен кулланыла торган программа.

Программист: Microsoft · Лицензия: MIT

Өйрәнегез

CosyVoice3CosyVoice3 Standard

Next-generation multilingual TTS with bi-streaming, emotion control, and zero-shot voice cloning.

Программист: Alibaba (FunAudioLLM) · Лицензия: Apache 2.0

Өйрәнегез

ChatterboxChatterbox Premium

Квант механикасы теориясендә квант механикасы — квант механикасы өлкәсенең бер өлеше.

Сыйфат:

Өйрәнегез

Tortoise TTSTortoise TTS Premium

Архитектураның күпчелек төрләре, аерым алганда архитектура архитектурасы, архитектура архитектурасы дип атала.

Сыйфат:

Өйрәнегез

StyleTTS 2StyleTTS 2 Premium

Социаль-икътисади үсеш динамикасы һәм социаль-икътисади үсеш тенденцияләре.

Сыйфат:

Өйрәнегез

OpenVoiceOpenVoice Premium

Контроль-изоляция системасы — механик, термик һәм электромагнит тәэсирләргә каршы тору системасы.

Сыйфат:

Өйрәнегез

Sesame CSMSesame CSM Premium

Диалектның диалектологик үзенчәлекләре аның диалектологик һәм диалектологик-лингвистик үзенчәлекләре белән туры килә.

Сыйфат:

Өйрәнегез

MOSS-TTSMOSS-TTS Premium

Ultra-long 20-language TTS supporting up to 1 hour of continuous generation with phoneme-level control.

Сыйфат:

Өйрәнегез

MegaTTS3MegaTTS3 Premium

ByteDance's sparse alignment TTS with adjustable intelligibility vs. speaker similarity.

Сыйфат:

Өйрәнегез

CosyVoice 2CosyVoice 2

2000 елдан бирле «Татмедиа» ААҖ матбугат һәм массакүләм коммуникацияләр бүлеге мөдире.

Телләр: en, zh, ja, ko, fr, de, it, es

Клонлау тавышы

GLM-TTSGLM-TTS

Бу ысулның иң яхшы мисалы — 1-битлы кодлы шрифт.

Телләр: en, zh

Клонлау тавышы

IndexTTS-2IndexTTS-2

3.

Телләр: en, zh

Клонлау тавышы

Spark TTSSpark TTS

Квант механикасы һәм квант электродинамикасы өлкәсендә Нобель премиясе иясе.

Телләр: en, zh

Клонлау тавышы

GPT-SoVITSGPT-SoVITS

2000 елдан бирле 500 дән артык фәнни хезмәт авторы, шул исәптән 5 монография авторы.

Телләр: en, zh, ja, ko

Клонлау тавышы

ChatterboxChatterbox

Квант механикасы теориясендә квант механикасы — квант механикасы өлкәсенең бер өлеше.

Телләр: en

Клонлау тавышы

Tortoise TTSTortoise TTS

Архитектураның күпчелек төрләре, аерым алганда архитектура архитектурасы, архитектура архитектурасы дип атала.

Телләр: en

Клонлау тавышы

OpenVoiceOpenVoice

Контроль-изоляция системасы — механик, термик һәм электромагнит тәэсирләргә каршы тору системасы.

Телләр: en, zh, ja, ko, fr, de, es, it

Клонлау тавышы

Qwen3 TTSQwen3 TTS

Татар теленең фонетикасы, грамматикасы, лексикологиясе, лексикографиясе, лексикографиясе, лексикографиясе.

Телләр: en, zh, ja, ko, de, fr, ru, pt, es, it

Клонлау тавышы

Chatterbox TurboChatterbox Turbo

200 дән артык фәнни хезмәт, шул исәптән 2 монография, 200 дән артык фәнни хезмәт авторы.

Телләр: en

Клонлау тавышы

VoxCPMVoxCPM

1441 елдан башлап, 1444 елга кадәр, 1444 елдан башлап, 1445 елга кадәр, 1445 елдан башлап, 1446 елга кадәр идарә иткән.

Телләр: en, zh

Клонлау тавышы

OuteTTSOuteTTS

1999 елдан башлап,.cn домены,.cn.cn һәм.cn.cn дип үзгәртелә.

Телләр: en

Клонлау тавышы

Pocket TTSPocket TTS

100 дән артык фәнни хезмәт авторы, шул исәптән 1 монография авторы.

Телләр: en, fr

Клонлау тавышы

CosyVoice3CosyVoice3

Next-generation multilingual TTS with bi-streaming, emotion control, and zero-shot voice cloning.

Телләр: en, zh, ja, ko, de, es, fr, it, ru

Клонлау тавышы

MOSS-TTSMOSS-TTS

Ultra-long 20-language TTS supporting up to 1 hour of continuous generation with phoneme-level control.

Телләр: en, zh, de, es, fr, ja, it, hu, ko, ru, fa, ar, pl, pt, cs, da, sv, el, tr

Клонлау тавышы

MegaTTS3MegaTTS3

ByteDance's sparse alignment TTS with adjustable intelligibility vs. speaker similarity.

Телләр: en, zh

Клонлау тавышы

Программистлар өчен API

OpenAI-га туры килгән REST API. Бер чикләү, 22+ модель. Реаль вакытлы кулланмалар өчен агымлы ярдәм.

  • OpenAI-га туры килә торган формат
  • Реаль вакыт программалары өчен TTS трансляциясе
  • Бөек эшләр өчен пакетлы эшкәртү
  • Webhook хәбәрләре
API документациясен карау
pip install ttsai npm install @ttsainpm/ttsai
Python
from tts_ai import TTSClient

client = TTSClient(api_key="sk-tts-xxx")
audio = client.generate(
    text="Hello from TTS.ai!",
    model="kokoro",
    voice="af_bella",
)
client.save(audio, "output.mp3")

Гадәти, ачык бәяләү

Сез үскән саен киңәйтегез.

Бушлай

$0

50 нче бит

  • Kokoro, Piper, VITS, MeloTTS
  • 500 символ чикләү
  • 3 гыйнвар/сәгать (хисап юк)
Бушлай теркәлү

Башлатучы

$9/мс

500 кредит/аена

  • 22 — сан.
  • 100 000 гә якын төре билгеле.
  • Сүзләрне клонлау
Башларга
Иң популяр

Профиль

$29/мс

2000 елда нигезләнгән.

  • Башлатучыдагы бар нәрсә
  • APIга керү
  • Иң элек эшкәртү
Профессионал булыгыз

Эш

$99/мс

10 000 кредит/аена

  • Профессиональ
  • Күпчелек API
  • Иң беренче чиратта
Эшне алырга

Барлык планнарны, шул исәптән кредит пакетларын да карау →

Кайвакыт бирелә торган сораулар

TTS.ai иң тулы AI тавыш платформасы, 22+ текст-телгә модельләр, тавыш клонлаштыру, сүз-текст һәм аудио инструментлар тәкъдим итә. Барлык модельләр дә сатучыга бәйле булмаган ачык чыганаклы.

Әйе! TTS.ai Kokoro, Piper, VITS һәм MeloTTS моделләре белән тексттан сүзгә бушлай хезмәт күрсәтә. Акча кертү таләп ителми. 15 000 тән артык символны бушлай алу өчен һәм барлык модельләргә керү өчен теркәлегез. Аерым түләү планнары айга 9 доллардан башлана.

Югары тизлек өчен Kokoro яки Piper кулланыгыз. Югары сыйфат өчен CosyVoice 2 яки StyleTTS 2 кулланыгыз. Сүзләрне клонлау өчен Chatterbox яки GPT-SoVITS кулланыгыз. Диалоглар өчен Dia TTS кулланыгыз. Бер үк текстны чагыштыру өчен берничә модельне кулланыгыз.

Әйе. OpenAI-га туры килүче REST API TTS, STT, тавыш клонлаштыру һәм аудио инструментлары өчен. Про ($29/аена) һәм Энтерпрайз ($99/аена) планнарында бар. Документацияне tts.ai/api/ сайтында карагыз.

Сүзнең сыйфаты модельдән модельгә үзгәрә. CosyVoice 2, StyleTTS 2 һәм Chatterbox кебек премиум модельләр табигый интонация һәм хисләр белән кеше тавышы сыйфатына якын тавыш бирә. Kokoro кебек бушлай модельләр күбрәк куллану очраклары өчен яхшы сыйфатны тәкъдим итә.

TTS.ai үзенең модель китапханәсендә 30+ телне яклый. Инглиз теле иң киң модельне яклый, ләкин CosyVoice 2 кебек модельләр кытай, япон һәм корей телләрен яклый; GPT-SoVITS кытай, япон, корей һәм инглиз телләрен яклый; һәм MeloTTS инглиз, испан, француз, кытай, япон һәм корей телләрен яклый.

Әйе. Барлык эшкәртү безнең аерым GPU серверларында бара. Без сезнең текст кертемнәрегезне яки генерацияләнгән аудионы тапшырганнан соң сакламыйбыз. Клонлау өчен йөкләнгән тавыш үрнәкләре бары тик хәзерге сеанс өчен генә кулланыла һәм сакланмый. Без сезнең мәгълүматларыгызны беркайчан да өченче яклар белән уртаклашмыйбыз яки модельләрне өйрәтү өчен кулланмыйбыз.

Әйе. TTS.ai-да барлык иҗат ителгән тавышлар сезнең коммерцияле куллану өчен, шул исәптән YouTube видеолары, подкастлар, аудиокитаплар, кушымталар, рекламалар һәм продуктлар өчен. Безнең модельләр ачык чыганаклы һәм рөхсәт ителгән лицензияләр (MIT, Apache 2.0) астында. Авторлык хокуклары яки исем бирү таләп ителми.

TTS.ai иң югары сыйфат өчен WAV форматында аудио ясый. Сез аны MP3, FLAC, OGG, яки M4A форматларына әйләндерә аласыз безнең бушлай Аудио конвертер ярдәмендә. API сезнең сайлаган форматны сорауда турыдан-туры күрсәтүне хуплый.

Клонлаштырырга теләгән тавышның кыска аудио үрнәкләрен (5 секундтан да азрак) йөкләгез, аннан соң бу тавышта сөйләмне генерацияләү өчен теләсә нинди текстны кертегез. Chatterbox, GPT-SoVITS, һәм CosyVoice 2 кебек модельләр тавыш клонлаштыруны яклый. Клонлаштырылган тавыш тонны, акцентны һәм сөйләшү стилен тота.

Бушлай модельләр (Kokoro, Piper, VITS, MeloTTS) исәп-хисап таләп итми һәм кредитлар да кирәкми. Стандарт модельләр (2 кредит/1К символ) арасында Bark, CosyVoice 2, F5-TTS, һәм Dia бар. Премиум модельләр (4 кредит/1К символ) арасында OpenVoice, Chatterbox, StyleTTS 2, һәм Tortoise бар. Платалы модельләр, гадәттә, югарырак сыйфат, күбрәк тавышлар һәм тавыш клонлаштыру кебек өстәмә мөмкинлекләр тәкъдим итә.

Әйе. API зур күләмдәге текстны сөйләмгә әйләндерү өчен пакетлы эшкәртүне яклый. Берничә сорау җибәрегез һәм нәтиҗәләрне UUIDлар ярдәмендә асинхрон рәвештә кайтарыгыз. Enterprise планнары ($99/аена) тизрәк пакетлы эшкәртү өчен приоритетлы чиратларга керү мөмкинлеге бирә. Аудиокитаплар, курс эчтәлеге һәм зур масштаблы тавыш проектлары өчен идеаль.
4.1/5 (21)

What could we improve? Your feedback helps us fix issues.

Бүген үк AI тавышын кулланырга керешегез

TTS.ai кулланып иҗат итүчеләр, үстерүчеләр һәм эшмәкәрләргә кушылыгыз