Үзгәртүләр кертү Тексттан сөйләмгәComment
31+ ачык чыганак моделләре, 231+ тавышлар, 34+ телләр. Акча кертү кирәкми.
Сезгә тавыш уйлап табу өчен кирәк булган һәр нәрсә
30+ ачык чыганаклы ИИ моделләре белән тәэмин ителгән инструментлар
31+ AI тавыш модельләре
Бер платформада ачык чыганаклы TTS моделләренең иң тулы җыелмасы
Kokoro Free
Kokoro - 82 миллион параметрлы тексттан сөйләмгә модель, ул үз авырлык классыннан югарырак. Аның кечкенә зурлыгына карамастан, ул гаҗәеп табигый һәм образлы сөйләмне җитештерә. Kokoro күп телләрне, шул исәптән инглиз, япон, кытай һәм корей телләрен, төрле образлы тавышлар белән яклый. Ул бик тиз эшли - график процессордагы реаль вакытка караганда 100 тапкыр тизрәк аудионы җитештерә.
Иң яхшысы: Югары сыйфатлы TTS, минималь артта калу белән, агымдагы кушымталар
Бушлай сынап карау
Piper Free
Piper - Rhasspy тарафыннан VITS һәм larynx архитектураларын кулланып ясалган җиңел тексттан сөйләмгә күчерү җайланмасы. Ул тулысынча процессор өстендә эшли, шуңа күрә ул edge приборлары, йорт автоматизациясе һәм читтәге TTS таләп итүче кушымталар өчен идеаль. 30+ телдә 100дән артык тавыш белән, Piper Raspberry Pi 4-дә дә реаль вакыт режимында табигый тавышлы сөйләмне күрсәтә.
Иң яхшысы: Тиз күзәтүләр, мөмкинлекләре чикләнгән кешеләр өчен һәм кертелгән кулланмалар
Бушлай сынап карау
VITS Free
VITS (Variation Inference with adversarial learning for end-to-end Text-to-Speech) - хәзерге ике стадияле модельләрдән күбрәк табигый тавышлы аудионы җитештерә торган параллель, ахырдан ахырына кадәрге TTS ысулы. Ул нормальләштерү агымнары һәм каршылыклы өйрәтү процессы белән киңәйтелгән вариацион инференцияне кабул итә, табигыйлекне сизелерлек яхшыртуга ирешә.
Иң яхшысы: Табигый прозодияле киң кулланылышлы тексттан сөйләмгә
Бушлай сынап карау
MeloTTS Free
MyShell.ai тарафыннан MeloTTS - инглиз (Америка, Британия, Һиндстан, Австралия), испан, француз, кытай, япон һәм корей телләрен яклаучы күп телле TTS китапханәсе. Ул бик тиз, мәкаләне процессор ярдәмендә реаль вакытка якын тизлектә эшкәртә. MeloTTS җитештерү өчен эшләнә һәм процессор һәм график процессор нәтиҗәләрен дә яклый.
Иң яхшысы: Продукция кушымталарына тиз, күп телле TTS кирәк
Бушлай сынап карау
OuteTTS Free
OuteTTS зур тел модельләрен тексттан сөйләмгә мөмкинлекләр белән киңәйтә, әмма оригиналь архитектурасын саклап кала. Ул llama.cpp (CPU/GPU), Hugging Face Transformers, ExLlamaV2, VLLM, һәм хәтта Transformers.js аша браузер нәтиҗәләрен дә яклый. JSON итеп сакланган сөйләүче профиле аша сүзне клонлаштыру мөмкинлеге бар.
Иң яхшысы: Edge урнаштыру, браузер нигезендә TTS, аз ресурслы тирәлекләр
Бушлай сынап карау
Pocket TTS Free
Pocket TTS Kyutai (Moshi уйлап табучылары) тарафыннан ясалган, 100М параметрлы, компактлы тексттан сөйләмгә күчерү моделе. Ул процессорны бик тиз куллана, бер аудио үрнәгеннән 0-шотлы тавыш клонын яклый, һәм табигый тавышлы сөйләмне чыгара. Моделнең кечкенә зурлыгы аны edge һәм ресурслар аз булган тирәлекләрдә куллану өчен идеаль итә.
Иң яхшысы: Җиһазны җиңел урнаштыру, CPU-тан гына файдалану, тиз тавыш клонлаштыру
Бушлай сынап карау
Kitten TTS Free
Kitten TTS by KittenML is an ultra-lightweight text-to-speech model built on ONNX. With variants from 15M to 80M parameters (25-80 MB on disk), it delivers high-quality voice synthesis on CPU without requiring a GPU. Features 8 built-in voices, adjustable speech speed, and built-in text preprocessing for numbers, currencies, and units. Ideal for edge deployment and low-latency applications.
Иң яхшысы: Fast lightweight TTS, edge deployment, low-latency applications
Бушлай сынап карау
Bark Standard
Репертуарында музыкаль комедияләр, драмалар, музыкаль комедияләр, музыкаль комедияләр һәм драмалар бар.
Программист: Suno · Лицензия: MIT
Өйрәнегез
Bark Small Standard
Бу терминның берничә мәгънәсе бар: Багратион Багратион — борынгы грек мифологиясе персонажы.
Программист: Suno · Лицензия: MIT
Өйрәнегез
CosyVoice 2 Standard
2000 елдан бирле «Татмедиа» ААҖ матбугат һәм массакүләм коммуникацияләр бүлеге мөдире.
Программист: Alibaba (Tongyi Lab) · Лицензия: Apache 2.0
Өйрәнегез
Dia TTS Standard
Диалектлар бер-берсе белән аралаша торган диалектлар төркеменә керә.
Программист: Nari Labs · Лицензия: Apache 2.0
Өйрәнегез
Parler TTS Standard
Сез теләгән тавышны табигый телдә тасвирлагыз һәм Parler туры килә торган тавышны барлыкка китерер.
Программист: Hugging Face · Лицензия: Apache 2.0
Өйрәнегез
GLM-TTS Standard
Бу ысулның иң яхшы мисалы — 1-битлы кодлы шрифт.
Программист: Zhipu AI · Лицензия: GLM-4 License
Өйрәнегез
Spark TTS Standard
Квант механикасы һәм квант электродинамикасы өлкәсендә Нобель премиясе иясе.
Программист: SparkAudio · Лицензия: CC BY-NC-SA 4.0
Өйрәнегез
GPT-SoVITS Standard
2000 елдан бирле 500 дән артык фәнни хезмәт авторы, шул исәптән 5 монография авторы.
Программист: RVC-Boss · Лицензия: MIT
Өйрәнегез
Orpheus Standard
Халык саны динамикасы: 2010 ел җанисәбен алу буенча биредә 100 кешенең яшәве мәгълүм.
Программист: Canopy Labs · Лицензия: Llama 3.2 Community
Өйрәнегез
Qwen3 TTS Standard
Татар теленең фонетикасы, грамматикасы, лексикологиясе, лексикографиясе, лексикографиясе, лексикографиясе.
Программист: Alibaba (Qwen) · Лицензия: Apache 2.0
Өйрәнегез
Chatterbox Turbo Standard
200 дән артык фәнни хезмәт, шул исәптән 2 монография, 200 дән артык фәнни хезмәт авторы.
Программист: Resemble AI · Лицензия: MIT
Өйрәнегез
Dia 2 Standard
1-нче татар-башкорт гимназиясе, 1-нче татар гимназиясе һәм 1-нче татар гимназиясе.
Программист: Nari Labs · Лицензия: Apache 2.0
Өйрәнегез
VoxCPM Standard
1441 елдан башлап, 1444 елга кадәр, 1444 елдан башлап, 1445 елга кадәр, 1445 елдан башлап, 1446 елга кадәр идарә иткән.
Программист: OpenBMB · Лицензия: Apache 2.0
Өйрәнегез
TADA Standard
2000 елдан башлап, 2002 елга кадәр, 5000 дән артык уен уйнала, 200 дән артык уенчы катнаша.
Программист: Hume AI · Лицензия: MIT
Өйрәнегез
VibeVoice Standard
Microsoft Word — Microsoft корпорациясенең текст һәм графика форматлары өчен кулланыла торган программа.
Программист: Microsoft · Лицензия: MIT
Өйрәнегез
CosyVoice3 Standard
Next-generation multilingual TTS with bi-streaming, emotion control, and zero-shot voice cloning.
Программист: Alibaba (FunAudioLLM) · Лицензия: Apache 2.0
Өйрәнегез
CosyVoice 2
2000 елдан бирле «Татмедиа» ААҖ матбугат һәм массакүләм коммуникацияләр бүлеге мөдире.
Телләр: en, zh, ja, ko, fr, de, it, es
Клонлау тавышы
Spark TTS
Квант механикасы һәм квант электродинамикасы өлкәсендә Нобель премиясе иясе.
Телләр: en, zh
Клонлау тавышы
GPT-SoVITS
2000 елдан бирле 500 дән артык фәнни хезмәт авторы, шул исәптән 5 монография авторы.
Телләр: en, zh, ja, ko
Клонлау тавышы
Chatterbox
Квант механикасы теориясендә квант механикасы — квант механикасы өлкәсенең бер өлеше.
Телләр: en
Клонлау тавышы
Tortoise TTS
Архитектураның күпчелек төрләре, аерым алганда архитектура архитектурасы, архитектура архитектурасы дип атала.
Телләр: en
Клонлау тавышы
OpenVoice
Контроль-изоляция системасы — механик, термик һәм электромагнит тәэсирләргә каршы тору системасы.
Телләр: en, zh, ja, ko, fr, de, es, it
Клонлау тавышы
Qwen3 TTS
Татар теленең фонетикасы, грамматикасы, лексикологиясе, лексикографиясе, лексикографиясе, лексикографиясе.
Телләр: en, zh, ja, ko, de, fr, ru, pt, es, it
Клонлау тавышы
Chatterbox Turbo
200 дән артык фәнни хезмәт, шул исәптән 2 монография, 200 дән артык фәнни хезмәт авторы.
Телләр: en
Клонлау тавышы
VoxCPM
1441 елдан башлап, 1444 елга кадәр, 1444 елдан башлап, 1445 елга кадәр, 1445 елдан башлап, 1446 елга кадәр идарә иткән.
Телләр: en, zh
Клонлау тавышы
Pocket TTS
100 дән артык фәнни хезмәт авторы, шул исәптән 1 монография авторы.
Телләр: en, fr
Клонлау тавышы
CosyVoice3
Next-generation multilingual TTS with bi-streaming, emotion control, and zero-shot voice cloning.
Телләр: en, zh, ja, ko, de, es, fr, it, ru
Клонлау тавышы
MOSS-TTS
Ultra-long 20-language TTS supporting up to 1 hour of continuous generation with phoneme-level control.
Телләр: en, zh, de, es, fr, ja, it, hu, ko, ru, fa, ar, pl, pt, cs, da, sv, el, tr
Клонлау тавышы
MegaTTS3
ByteDance's sparse alignment TTS with adjustable intelligibility vs. speaker similarity.
Телләр: en, zh
Клонлау тавышыПрограммистлар өчен API
OpenAI-га туры килгән REST API. Бер чикләү, 22+ модель. Реаль вакытлы кулланмалар өчен агымлы ярдәм.
- OpenAI-га туры килә торган формат
- Реаль вакыт программалары өчен TTS трансляциясе
- Бөек эшләр өчен пакетлы эшкәртү
- Webhook хәбәрләре
pip install ttsai
npm install @ttsainpm/ttsai
from tts_ai import TTSClient
client = TTSClient(api_key="sk-tts-xxx")
audio = client.generate(
text="Hello from TTS.ai!",
model="kokoro",
voice="af_bella",
)
client.save(audio, "output.mp3")
Гадәти, ачык бәяләү
Сез үскән саен киңәйтегез.
Бушлай
50 нче бит
- Kokoro, Piper, VITS, MeloTTS
- 500 символ чикләү
- 3 гыйнвар/сәгать (хисап юк)
Профиль
2000 елда нигезләнгән.
- Башлатучыдагы бар нәрсә
- APIга керү
- Иң элек эшкәртү
Кайвакыт бирелә торган сораулар
What could we improve? Your feedback helps us fix issues.
Бүген үк AI тавышын кулланырга керешегез
TTS.ai кулланып иҗат итүчеләр, үстерүчеләр һәм эшмәкәрләргә кушылыгыз