Үзгәртүләр кертү Тексттан сөйләмгәComment
33+ ачык чыганак моделләре, 273+ тавышлар, 33+ телләр. Акча кертү кирәкми.
Сезгә тавыш уйлап табу өчен кирәк булган һәр нәрсә
30+ ачык чыганаклы ИИ моделләре белән тәэмин ителгән инструментлар
33+ AI тавыш модельләре
Бер платформада ачык чыганаклы TTS моделләренең иң тулы җыелмасы
Kokoro Бушлай
Kokoro - 82 миллион параметрлы тексттан сөйләмгә модель, ул үз авырлык классыннан югарырак. Аның кечкенә зурлыгына карамастан, ул гаҗәеп табигый һәм образлы сөйләмне җитештерә. Kokoro күп телләрне, шул исәптән инглиз, япон, кытай һәм корей телләрен, төрле образлы тавышлар белән яклый. Ул бик тиз эшли - график процессордагы реаль вакытка караганда 100 тапкыр тизрәк аудионы җитештерә.
Иң яхшысы: Югары сыйфатлы TTS, минималь артта калу белән, агымдагы кушымталар
Бушлай сынап карау
Piper Бушлай
Piper - Rhasspy тарафыннан VITS һәм larynx архитектураларын кулланып ясалган җиңел тексттан сөйләмгә күчерү җайланмасы. Ул тулысынча процессор өстендә эшли, шуңа күрә ул edge приборлары, йорт автоматизациясе һәм читтәге TTS таләп итүче кушымталар өчен идеаль. 30+ телдә 100дән артык тавыш белән, Piper Raspberry Pi 4-дә дә реаль вакыт режимында табигый тавышлы сөйләмне күрсәтә.
Иң яхшысы: Тиз күзәтүләр, мөмкинлекләре чикләнгән кешеләр өчен һәм кертелгән кулланмалар
Бушлай сынап карау
VITS Бушлай
VITS (Variation Inference with adversarial learning for end-to-end Text-to-Speech) - хәзерге ике стадияле модельләрдән күбрәк табигый тавышлы аудионы җитештерә торган параллель, ахырдан ахырына кадәрге TTS ысулы. Ул нормальләштерү агымнары һәм каршылыклы өйрәтү процессы белән киңәйтелгән вариацион инференцияне кабул итә, табигыйлекне сизелерлек яхшыртуга ирешә.
Иң яхшысы: Табигый прозодияле киң кулланылышлы тексттан сөйләмгә
Бушлай сынап карау
MeloTTS Бушлай
MyShell.ai тарафыннан MeloTTS - инглиз (Америка, Британия, Һиндстан, Австралия), испан, француз, кытай, япон һәм корей телләрен яклаучы күп телле TTS китапханәсе. Ул бик тиз, мәкаләне процессор ярдәмендә реаль вакытка якын тизлектә эшкәртә. MeloTTS җитештерү өчен эшләнә һәм процессор һәм график процессор нәтиҗәләрен дә яклый.
Иң яхшысы: Продукция кушымталарына тиз, күп телле TTS кирәк
Бушлай сынап карау
Kani TTS 2 Бушлай
Kani-TTS-2 NineNineSix тарафыннан LiquidAI LFM2 backbone белән Nvidia NanoCodec белән төзелгән бик җиңел 400M параметрлы модель. Ул бары тик 3GB VRAM белән эшли һәм ~2 секундта 10 секунд сөйләшү (RTF 0.2) ясый.
Иң яхшысы: Тиз генерация, аз ресурслар кулланучы тирәлекләр, тиз күзәтүләр
Бушлай сынап карау
OuteTTS Бушлай
OuteTTS зур тел модельләрен тексттан сөйләмгә мөмкинлекләр белән киңәйтә, әмма оригиналь архитектурасын саклап кала. Ул llama.cpp (CPU/GPU), Hugging Face Transformers, ExLlamaV2, VLLM, һәм хәтта Transformers.js аша браузер нәтиҗәләрен дә яклый. JSON итеп сакланган сөйләүче профиле аша сүзне клонлаштыру мөмкинлеге бар.
Иң яхшысы: Edge урнаштыру, браузер нигезендә TTS, аз ресурслы тирәлекләр
Бушлай сынап карау
Pocket TTS Бушлай
Pocket TTS Kyutai (Moshi уйлап табучылары) тарафыннан ясалган, 100М параметрлы, компактлы тексттан сөйләмгә күчерү моделе. Ул процессорны бик тиз куллана, бер аудио үрнәгеннән 0-шотлы тавыш клонын яклый, һәм табигый тавышлы сөйләмне чыгара. Моделнең кечкенә зурлыгы аны edge һәм ресурслар аз булган тирәлекләрдә куллану өчен идеаль итә.
Иң яхшысы: Җиһазны җиңел урнаштыру, CPU-тан гына файдалану, тиз тавыш клонлаштыру
Бушлай сынап карау
Kitten TTS Бушлай
Kitten TTS by KittenML - ONNX нигезендә төзелгән бик җиңел тексттан сөйләмгә модель. 15М дан 80М га кадәр параметрлар белән (дисктагы 25-80 МБ), ул график процессор кирәкмичә, процессорда югары сыйфатлы сүз синтезын бирә. 8 эчке тавыш, көйләнерлек сөйләм тизлеге, һәм сан, акча һәм берәмлекләр өчен эчке текст эшкәртү. Иң яхшысы edge-компьютерлар һәм түбән-задержка кулланмалары өчен.
Иң яхшысы: Җиңел һәм тиз TTS, edge-компьютерлар өчен, аз вакытлы кулланмалар
Бушлай сынап карау
Ming-Omni TTS Бушлай
InclusionAI тарафыннан ясалган Ming-omni-tts-0.5B — BailingMM ныгытылган нигезендә төзелгән, Patch-by-Patch агымына туры килгән аудио декодер белән компактлы омни-модаль сөйләм модели. 44.1 кГц чыганакны (CD сыйфатына якын) бирә, 3+ секундлы сылтамадан 0-шот тавыш клонын яклый, һәм JSON күрсәтмәләре аша эчке хис / диалект / BGM контролен кертә.
Иң яхшысы: 2001 елдан — «Татарстан» телерадиокомпаниясе, «Татарстан» радиосы, «Татарстан» телерадиокомпаниясе баш мөхәррире.
Бушлай сынап карау
MOSS-TTS Nano Бушлай
MOSS-TTS-Nano-100M is OpenMOSS's compact 100M-parameter variant of the MOSS-TTS family, sharing the delay-transformer architecture. Trades the 8B model's peak quality for ~80x smaller weights and dramatically lower per-request VRAM, making it suitable for free-tier and high-throughput deployments. Same 20-language reach.
Иң яхшысы: Free-tier TTS, high-volume production, low-latency interactive use
Бушлай сынап карау
Bark Стандарт
Репертуарында музыкаль комедияләр, драмалар, музыкаль комедияләр, музыкаль комедияләр һәм драмалар бар.
Программист: Suno · Лицензия: MIT
Өйрәнегез
Bark Small Стандарт
Бу терминның берничә мәгънәсе бар: Багратион Багратион — борынгы грек мифологиясе персонажы.
Программист: Suno · Лицензия: MIT
Өйрәнегез
CosyVoice 2 Стандарт
2000 елдан бирле «Татмедиа» ААҖ матбугат һәм массакүләм коммуникацияләр бүлеге мөдире.
Программист: Alibaba (Tongyi Lab) · Лицензия: Apache 2.0
Өйрәнегез
Dia TTS Стандарт
Диалектлар бер-берсе белән аралаша торган диалектлар төркеменә керә.
Программист: Nari Labs · Лицензия: Apache 2.0
Өйрәнегез
Parler TTS Стандарт
Сез теләгән тавышны табигый телдә тасвирлагыз һәм Parler туры килә торган тавышны барлыкка китерер.
Программист: Hugging Face · Лицензия: Apache 2.0
Өйрәнегез
Spark TTS Стандарт
Квант механикасы һәм квант электродинамикасы өлкәсендә Нобель премиясе иясе.
Программист: SparkAudio · Лицензия: CC BY-NC-SA 4.0
Өйрәнегез
GPT-SoVITS Стандарт
2000 елдан бирле 500 дән артык фәнни хезмәт авторы, шул исәптән 5 монография авторы.
Программист: RVC-Boss · Лицензия: MIT
Өйрәнегез
Orpheus Стандарт
Халык саны динамикасы: 2010 ел җанисәбен алу буенча биредә 100 кешенең яшәве мәгълүм.
Программист: Canopy Labs · Лицензия: Llama 3.2 Community
Өйрәнегез
Qwen3 TTS Стандарт
Татар теленең фонетикасы, грамматикасы, лексикологиясе, лексикографиясе, лексикографиясе, лексикографиясе.
Программист: Alibaba (Qwen) · Лицензия: Apache 2.0
Өйрәнегез
VieNeu-TTS-v2 Стандарт
Vietnamese + English code-switching TTS with 7 preset voices and zero-shot voice cloning. CPU-only, no GPU required.
Программист: Phạm Nguyễn Ngọc Bảo · Лицензия: Apache 2.0
Өйрәнегез
Chatterbox Turbo Стандарт
200 дән артык фәнни хезмәт, шул исәптән 2 монография, 200 дән артык фәнни хезмәт авторы.
Программист: Resemble AI · Лицензия: MIT
Өйрәнегез
VoxCPM Стандарт
1441 елдан башлап, 1444 елга кадәр, 1444 елдан башлап, 1445 елга кадәр, 1445 елдан башлап, 1446 елга кадәр идарә иткән.
Программист: OpenBMB · Лицензия: Apache 2.0
Өйрәнегез
VibeVoice Стандарт
Microsoft Word — Microsoft корпорациясенең текст һәм графика форматлары өчен кулланыла торган программа.
Программист: Microsoft · Лицензия: MIT
Өйрәнегез
CosyVoice3 Стандарт
1990 елдан башлап, ССРБда, КПССның Үзәк Комитеты, КПССның Үзәк Комитеты һәм КПССның Үзәк Комитеты рәисләре.
Программист: Alibaba (FunAudioLLM) · Лицензия: Apache 2.0
Өйрәнегез
NAMAA Saudi TTS Стандарт
Сауд-араб телен сөйләмгә күчерү өчен беренче ачык программа. Сауд диалекты, Chatterbox сыйфатлы тавыш клонлаштыру белән.
Программист: NAMAA Space · Лицензия: MIT
Өйрәнегез
Darwin TTS Стандарт
NGC 3373 — Кече Магелланов бозлыгы урнашкан очырак төстәге спектраль класслы спектраль классификацияле йолдыз.
Программист: FINAL-Bench · Лицензия: Apache 2.0
Өйрәнегез
MOSS-TTSD Стандарт
2009 елдан бирле «Татарстан» радиосы 500дән артык тапшыру һәм 60тан артык радиотапшырулар алып бара, 100дән артык радиотапшыруны алып бара.
Программист: OpenMOSS · Лицензия: Apache 2.0
Өйрәнегез
CosyVoice 2
2000 елдан бирле «Татмедиа» ААҖ матбугат һәм массакүләм коммуникацияләр бүлеге мөдире.
Телләр: en, zh, ja, ko, fr, de, it, es
Клонлау тавышы
Spark TTS
Квант механикасы һәм квант электродинамикасы өлкәсендә Нобель премиясе иясе.
Телләр: en, zh
Клонлау тавышы
GPT-SoVITS
2000 елдан бирле 500 дән артык фәнни хезмәт авторы, шул исәптән 5 монография авторы.
Телләр: en, zh, ja, ko
Клонлау тавышы
Chatterbox
Квант механикасы теориясендә квант механикасы — квант механикасы өлкәсенең бер өлеше.
Телләр: en
Клонлау тавышы
Tortoise TTS
Архитектураның күпчелек төрләре, аерым алганда архитектура архитектурасы, архитектура архитектурасы дип атала.
Телләр: en
Клонлау тавышы
OpenVoice
Контроль-изоляция системасы — механик, термик һәм электромагнит тәэсирләргә каршы тору системасы.
Телләр: en, zh, ja, ko, fr, es
Клонлау тавышы
VieNeu-TTS-v2
Vietnamese + English code-switching TTS with 7 preset voices and zero-shot voice cloning. CPU-only, no GPU required.
Телләр: vi, en
Клонлау тавышы
Chatterbox Turbo
200 дән артык фәнни хезмәт, шул исәптән 2 монография, 200 дән артык фәнни хезмәт авторы.
Телләр: en
Клонлау тавышы
VoxCPM
1441 елдан башлап, 1444 елга кадәр, 1444 елдан башлап, 1445 елга кадәр, 1445 елдан башлап, 1446 елга кадәр идарә иткән.
Телләр: en, zh
Клонлау тавышы
Pocket TTS
100 дән артык фәнни хезмәт авторы, шул исәптән 1 монография авторы.
Телләр: en, fr
Клонлау тавышы
CosyVoice3
1990 елдан башлап, ССРБда, КПССның Үзәк Комитеты, КПССның Үзәк Комитеты һәм КПССның Үзәк Комитеты рәисләре.
Телләр: en, zh, ja, ko, de, es, fr, it, ru
Клонлау тавышы
NAMAA Saudi TTS
Сауд-араб телен сөйләмгә күчерү өчен беренче ачык программа. Сауд диалекты, Chatterbox сыйфатлы тавыш клонлаштыру белән.
Телләр: ar
Клонлау тавышы
Darwin TTS
NGC 3373 — Кече Магелланов бозлыгы урнашкан очырак төстәге спектраль класслы спектраль классификацияле йолдыз.
Телләр: en, ko, ja, zh
Клонлау тавышы
MOSS-TTSD
2009 елдан бирле «Татарстан» радиосы 500дән артык тапшыру һәм 60тан артык радиотапшырулар алып бара, 100дән артык радиотапшыруны алып бара.
Телләр: en, zh
Клонлау тавышы
Ming-Omni TTS
1941 елның 15 маенда ССРБ Югары Шурасы Президиумы Указы белән 41-нче укчы дивизия оештырыла.
Телләр: en, zh
Клонлау тавышы
MOSS-TTS Nano
Tiny 100M MOSS-TTS variant — same architecture, 80x smaller, free-tier latency.
Телләр: en, zh, de, es, fr, ja, it, ko, ru, ar, pt
Клонлау тавышыПрограммистлар өчен API
OpenAI-га туры килгән REST API. Бер чикләү, 22+ модель. Реаль вакытлы кулланмалар өчен агымлы ярдәм.
- OpenAI-га туры килә торган формат
- Реаль вакыт программалары өчен TTS трансляциясе
- Бөек эшләр өчен пакетлы эшкәртү
- Webhook хәбәрләре
pip install ttsai
npm install @ttsainpm/ttsai
from tts_ai import TTSClient
client = TTSClient(api_key="sk-tts-xxx")
audio = client.generate(
text="Hello from TTS.ai!",
model="kokoro",
voice="af_bella",
)
client.save(audio, "output.mp3")
Гадәти, ачык бәяләү
Сез үскән саен киңәйтегез.
Бушлай
15,000 символ + 5,000/көн
- 7 ирекле модель, шул исәптән Кокоро
- 5000 дән артык төре билгеле.
- APIга керү кертелгән
Профиль
2000 елда нигезләнгән.
- Башлатучыдагы бар нәрсә
- APIга керү
- Иң элек эшкәртү
Кайвакыт бирелә торган сораулар
Без нәрсәне яхшыртырга мөмкин? Сезнең фикерләрегез безгә проблемаларны чишәргә ярдәм итә.
Бүген үк AI тавышын кулланырга керешегез
TTS.ai кулланып иҗат итүчеләр, үстерүчеләр һәм эшмәкәрләргә кушылыгыз