Үзгәртүләр кертү Тексттан сөйләмгәComment

33+ ачык чыганак моделләре, 273+ тавышлар, 33+ телләр. Акча кертү кирәкми.

17K+
төзүчеләр
70K+
буыннар
33+
ИТ модельләре
273+
тавышлар
0/500 символлар · 5000 елда нигезләнгән. → Бушлай
TTS.ai-ны яратасызмы? Дусларыгызга сөйләгез!

Сезгә тавыш уйлап табу өчен кирәк булган һәр нәрсә

30+ ачык чыганаклы ИИ моделләре белән тәэмин ителгән инструментлар

33+ AI тавыш модельләре

Бер платформада ачык чыганаклы TTS моделләренең иң тулы җыелмасы

KokoroKokoro Бушлай

Kokoro - 82 миллион параметрлы тексттан сөйләмгә модель, ул үз авырлык классыннан югарырак. Аның кечкенә зурлыгына карамастан, ул гаҗәеп табигый һәм образлы сөйләмне җитештерә. Kokoro күп телләрне, шул исәптән инглиз, япон, кытай һәм корей телләрен, төрле образлы тавышлар белән яклый. Ул бик тиз эшли - график процессордагы реаль вакытка караганда 100 тапкыр тизрәк аудионы җитештерә.

Иң яхшысы: Югары сыйфатлы TTS, минималь артта калу белән, агымдагы кушымталар

Бушлай сынап карау

PiperPiper Бушлай

Piper - Rhasspy тарафыннан VITS һәм larynx архитектураларын кулланып ясалган җиңел тексттан сөйләмгә күчерү җайланмасы. Ул тулысынча процессор өстендә эшли, шуңа күрә ул edge приборлары, йорт автоматизациясе һәм читтәге TTS таләп итүче кушымталар өчен идеаль. 30+ телдә 100дән артык тавыш белән, Piper Raspberry Pi 4-дә дә реаль вакыт режимында табигый тавышлы сөйләмне күрсәтә.

Иң яхшысы: Тиз күзәтүләр, мөмкинлекләре чикләнгән кешеләр өчен һәм кертелгән кулланмалар

Бушлай сынап карау

VITSVITS Бушлай

VITS (Variation Inference with adversarial learning for end-to-end Text-to-Speech) - хәзерге ике стадияле модельләрдән күбрәк табигый тавышлы аудионы җитештерә торган параллель, ахырдан ахырына кадәрге TTS ысулы. Ул нормальләштерү агымнары һәм каршылыклы өйрәтү процессы белән киңәйтелгән вариацион инференцияне кабул итә, табигыйлекне сизелерлек яхшыртуга ирешә.

Иң яхшысы: Табигый прозодияле киң кулланылышлы тексттан сөйләмгә

Бушлай сынап карау

MeloTTSMeloTTS Бушлай

MyShell.ai тарафыннан MeloTTS - инглиз (Америка, Британия, Һиндстан, Австралия), испан, француз, кытай, япон һәм корей телләрен яклаучы күп телле TTS китапханәсе. Ул бик тиз, мәкаләне процессор ярдәмендә реаль вакытка якын тизлектә эшкәртә. MeloTTS җитештерү өчен эшләнә һәм процессор һәм график процессор нәтиҗәләрен дә яклый.

Иң яхшысы: Продукция кушымталарына тиз, күп телле TTS кирәк

Бушлай сынап карау

Kani TTS 2Kani TTS 2 Бушлай

Kani-TTS-2 NineNineSix тарафыннан LiquidAI LFM2 backbone белән Nvidia NanoCodec белән төзелгән бик җиңел 400M параметрлы модель. Ул бары тик 3GB VRAM белән эшли һәм ~2 секундта 10 секунд сөйләшү (RTF 0.2) ясый.

Иң яхшысы: Тиз генерация, аз ресурслар кулланучы тирәлекләр, тиз күзәтүләр

Бушлай сынап карау

OuteTTSOuteTTS Бушлай

OuteTTS зур тел модельләрен тексттан сөйләмгә мөмкинлекләр белән киңәйтә, әмма оригиналь архитектурасын саклап кала. Ул llama.cpp (CPU/GPU), Hugging Face Transformers, ExLlamaV2, VLLM, һәм хәтта Transformers.js аша браузер нәтиҗәләрен дә яклый. JSON итеп сакланган сөйләүче профиле аша сүзне клонлаштыру мөмкинлеге бар.

Иң яхшысы: Edge урнаштыру, браузер нигезендә TTS, аз ресурслы тирәлекләр

Бушлай сынап карау

Pocket TTSPocket TTS Бушлай

Pocket TTS Kyutai (Moshi уйлап табучылары) тарафыннан ясалган, 100М параметрлы, компактлы тексттан сөйләмгә күчерү моделе. Ул процессорны бик тиз куллана, бер аудио үрнәгеннән 0-шотлы тавыш клонын яклый, һәм табигый тавышлы сөйләмне чыгара. Моделнең кечкенә зурлыгы аны edge һәм ресурслар аз булган тирәлекләрдә куллану өчен идеаль итә.

Иң яхшысы: Җиһазны җиңел урнаштыру, CPU-тан гына файдалану, тиз тавыш клонлаштыру

Бушлай сынап карау

Kitten TTSKitten TTS Бушлай

Kitten TTS by KittenML - ONNX нигезендә төзелгән бик җиңел тексттан сөйләмгә модель. 15М дан 80М га кадәр параметрлар белән (дисктагы 25-80 МБ), ул график процессор кирәкмичә, процессорда югары сыйфатлы сүз синтезын бирә. 8 эчке тавыш, көйләнерлек сөйләм тизлеге, һәм сан, акча һәм берәмлекләр өчен эчке текст эшкәртү. Иң яхшысы edge-компьютерлар һәм түбән-задержка кулланмалары өчен.

Иң яхшысы: Җиңел һәм тиз TTS, edge-компьютерлар өчен, аз вакытлы кулланмалар

Бушлай сынап карау

Ming-Omni TTSMing-Omni TTS Бушлай

InclusionAI тарафыннан ясалган Ming-omni-tts-0.5B — BailingMM ныгытылган нигезендә төзелгән, Patch-by-Patch агымына туры килгән аудио декодер белән компактлы омни-модаль сөйләм модели. 44.1 кГц чыганакны (CD сыйфатына якын) бирә, 3+ секундлы сылтамадан 0-шот тавыш клонын яклый, һәм JSON күрсәтмәләре аша эчке хис / диалект / BGM контролен кертә.

Иң яхшысы: 2001 елдан — «Татарстан» телерадиокомпаниясе, «Татарстан» радиосы, «Татарстан» телерадиокомпаниясе баш мөхәррире.

Бушлай сынап карау

MOSS-TTS NanoMOSS-TTS Nano Бушлай

MOSS-TTS-Nano-100M is OpenMOSS's compact 100M-parameter variant of the MOSS-TTS family, sharing the delay-transformer architecture. Trades the 8B model's peak quality for ~80x smaller weights and dramatically lower per-request VRAM, making it suitable for free-tier and high-throughput deployments. Same 20-language reach.

Иң яхшысы: Free-tier TTS, high-volume production, low-latency interactive use

Бушлай сынап карау

BarkBark Стандарт

Репертуарында музыкаль комедияләр, драмалар, музыкаль комедияләр, музыкаль комедияләр һәм драмалар бар.

Программист: Suno · Лицензия: MIT

Өйрәнегез

Bark SmallBark Small Стандарт

Бу терминның берничә мәгънәсе бар: Багратион Багратион — борынгы грек мифологиясе персонажы.

Программист: Suno · Лицензия: MIT

Өйрәнегез

CosyVoice 2CosyVoice 2 Стандарт

2000 елдан бирле «Татмедиа» ААҖ матбугат һәм массакүләм коммуникацияләр бүлеге мөдире.

Программист: Alibaba (Tongyi Lab) · Лицензия: Apache 2.0

Өйрәнегез

Dia TTSDia TTS Стандарт

Диалектлар бер-берсе белән аралаша торган диалектлар төркеменә керә.

Программист: Nari Labs · Лицензия: Apache 2.0

Өйрәнегез

Parler TTSParler TTS Стандарт

Сез теләгән тавышны табигый телдә тасвирлагыз һәм Parler туры килә торган тавышны барлыкка китерер.

Программист: Hugging Face · Лицензия: Apache 2.0

Өйрәнегез

IndexTTS-2IndexTTS-2 Стандарт

3.

Программист: Index Team · Лицензия: Bilibili Model License

Өйрәнегез

Spark TTSSpark TTS Стандарт

Квант механикасы һәм квант электродинамикасы өлкәсендә Нобель премиясе иясе.

Программист: SparkAudio · Лицензия: CC BY-NC-SA 4.0

Өйрәнегез

GPT-SoVITSGPT-SoVITS Стандарт

2000 елдан бирле 500 дән артык фәнни хезмәт авторы, шул исәптән 5 монография авторы.

Программист: RVC-Boss · Лицензия: MIT

Өйрәнегез

OrpheusOrpheus Стандарт

Халык саны динамикасы: 2010 ел җанисәбен алу буенча биредә 100 кешенең яшәве мәгълүм.

Программист: Canopy Labs · Лицензия: Llama 3.2 Community

Өйрәнегез

Qwen3 TTSQwen3 TTS Стандарт

Татар теленең фонетикасы, грамматикасы, лексикологиясе, лексикографиясе, лексикографиясе, лексикографиясе.

Программист: Alibaba (Qwen) · Лицензия: Apache 2.0

Өйрәнегез

VieNeu-TTS-v2VieNeu-TTS-v2 Стандарт

Vietnamese + English code-switching TTS with 7 preset voices and zero-shot voice cloning. CPU-only, no GPU required.

Программист: Phạm Nguyễn Ngọc Bảo · Лицензия: Apache 2.0

Өйрәнегез

Chatterbox TurboChatterbox Turbo Стандарт

200 дән артык фәнни хезмәт, шул исәптән 2 монография, 200 дән артык фәнни хезмәт авторы.

Программист: Resemble AI · Лицензия: MIT

Өйрәнегез

VoxCPMVoxCPM Стандарт

1441 елдан башлап, 1444 елга кадәр, 1444 елдан башлап, 1445 елга кадәр, 1445 елдан башлап, 1446 елга кадәр идарә иткән.

Программист: OpenBMB · Лицензия: Apache 2.0

Өйрәнегез

VibeVoiceVibeVoice Стандарт

Microsoft Word — Microsoft корпорациясенең текст һәм графика форматлары өчен кулланыла торган программа.

Программист: Microsoft · Лицензия: MIT

Өйрәнегез

CosyVoice3CosyVoice3 Стандарт

1990 елдан башлап, ССРБда, КПССның Үзәк Комитеты, КПССның Үзәк Комитеты һәм КПССның Үзәк Комитеты рәисләре.

Программист: Alibaba (FunAudioLLM) · Лицензия: Apache 2.0

Өйрәнегез

NAMAA Saudi TTSNAMAA Saudi TTS Стандарт

Сауд-араб телен сөйләмгә күчерү өчен беренче ачык программа. Сауд диалекты, Chatterbox сыйфатлы тавыш клонлаштыру белән.

Программист: NAMAA Space · Лицензия: MIT

Өйрәнегез

Darwin TTSDarwin TTS Стандарт

NGC 3373 — Кече Магелланов бозлыгы урнашкан очырак төстәге спектраль класслы спектраль классификацияле йолдыз.

Программист: FINAL-Bench · Лицензия: Apache 2.0

Өйрәнегез

MOSS-TTSDMOSS-TTSD Стандарт

2009 елдан бирле «Татарстан» радиосы 500дән артык тапшыру һәм 60тан артык радиотапшырулар алып бара, 100дән артык радиотапшыруны алып бара.

Программист: OpenMOSS · Лицензия: Apache 2.0

Өйрәнегез

ChatterboxChatterbox Премиум

Квант механикасы теориясендә квант механикасы — квант механикасы өлкәсенең бер өлеше.

Сыйфат:

Өйрәнегез

Tortoise TTSTortoise TTS Премиум

Архитектураның күпчелек төрләре, аерым алганда архитектура архитектурасы, архитектура архитектурасы дип атала.

Сыйфат:

Өйрәнегез

StyleTTS 2StyleTTS 2 Премиум

Социаль-икътисади үсеш динамикасы һәм социаль-икътисади үсеш тенденцияләре.

Сыйфат:

Өйрәнегез

OpenVoiceOpenVoice Премиум

Контроль-изоляция системасы — механик, термик һәм электромагнит тәэсирләргә каршы тору системасы.

Сыйфат:

Өйрәнегез

Sesame CSMSesame CSM Премиум

Диалектның диалектологик үзенчәлекләре аның диалектологик һәм диалектологик-лингвистик үзенчәлекләре белән туры килә.

Сыйфат:

Өйрәнегез

CosyVoice 2CosyVoice 2

2000 елдан бирле «Татмедиа» ААҖ матбугат һәм массакүләм коммуникацияләр бүлеге мөдире.

Телләр: en, zh, ja, ko, fr, de, it, es

Клонлау тавышы

IndexTTS-2IndexTTS-2

3.

Телләр: en, zh

Клонлау тавышы

Spark TTSSpark TTS

Квант механикасы һәм квант электродинамикасы өлкәсендә Нобель премиясе иясе.

Телләр: en, zh

Клонлау тавышы

GPT-SoVITSGPT-SoVITS

2000 елдан бирле 500 дән артык фәнни хезмәт авторы, шул исәптән 5 монография авторы.

Телләр: en, zh, ja, ko

Клонлау тавышы

ChatterboxChatterbox

Квант механикасы теориясендә квант механикасы — квант механикасы өлкәсенең бер өлеше.

Телләр: en

Клонлау тавышы

Tortoise TTSTortoise TTS

Архитектураның күпчелек төрләре, аерым алганда архитектура архитектурасы, архитектура архитектурасы дип атала.

Телләр: en

Клонлау тавышы

OpenVoiceOpenVoice

Контроль-изоляция системасы — механик, термик һәм электромагнит тәэсирләргә каршы тору системасы.

Телләр: en, zh, ja, ko, fr, es

Клонлау тавышы

VieNeu-TTS-v2VieNeu-TTS-v2

Vietnamese + English code-switching TTS with 7 preset voices and zero-shot voice cloning. CPU-only, no GPU required.

Телләр: vi, en

Клонлау тавышы

Chatterbox TurboChatterbox Turbo

200 дән артык фәнни хезмәт, шул исәптән 2 монография, 200 дән артык фәнни хезмәт авторы.

Телләр: en

Клонлау тавышы

VoxCPMVoxCPM

1441 елдан башлап, 1444 елга кадәр, 1444 елдан башлап, 1445 елга кадәр, 1445 елдан башлап, 1446 елга кадәр идарә иткән.

Телләр: en, zh

Клонлау тавышы

OuteTTSOuteTTS

1999 елдан башлап,.cn домены,.cn.cn һәм.cn.cn дип үзгәртелә.

Телләр: en

Клонлау тавышы

Pocket TTSPocket TTS

100 дән артык фәнни хезмәт авторы, шул исәптән 1 монография авторы.

Телләр: en, fr

Клонлау тавышы

CosyVoice3CosyVoice3

1990 елдан башлап, ССРБда, КПССның Үзәк Комитеты, КПССның Үзәк Комитеты һәм КПССның Үзәк Комитеты рәисләре.

Телләр: en, zh, ja, ko, de, es, fr, it, ru

Клонлау тавышы

NAMAA Saudi TTSNAMAA Saudi TTS

Сауд-араб телен сөйләмгә күчерү өчен беренче ачык программа. Сауд диалекты, Chatterbox сыйфатлы тавыш клонлаштыру белән.

Телләр: ar

Клонлау тавышы

Darwin TTSDarwin TTS

NGC 3373 — Кече Магелланов бозлыгы урнашкан очырак төстәге спектраль класслы спектраль классификацияле йолдыз.

Телләр: en, ko, ja, zh

Клонлау тавышы

MOSS-TTSDMOSS-TTSD

2009 елдан бирле «Татарстан» радиосы 500дән артык тапшыру һәм 60тан артык радиотапшырулар алып бара, 100дән артык радиотапшыруны алып бара.

Телләр: en, zh

Клонлау тавышы

Ming-Omni TTSMing-Omni TTS

1941 елның 15 маенда ССРБ Югары Шурасы Президиумы Указы белән 41-нче укчы дивизия оештырыла.

Телләр: en, zh

Клонлау тавышы

MOSS-TTS NanoMOSS-TTS Nano

Tiny 100M MOSS-TTS variant — same architecture, 80x smaller, free-tier latency.

Телләр: en, zh, de, es, fr, ja, it, ko, ru, ar, pt

Клонлау тавышы

Программистлар өчен API

OpenAI-га туры килгән REST API. Бер чикләү, 22+ модель. Реаль вакытлы кулланмалар өчен агымлы ярдәм.

  • OpenAI-га туры килә торган формат
  • Реаль вакыт программалары өчен TTS трансляциясе
  • Бөек эшләр өчен пакетлы эшкәртү
  • Webhook хәбәрләре
API документациясен карау
pip install ttsai npm install @ttsainpm/ttsai
Python
from tts_ai import TTSClient

client = TTSClient(api_key="sk-tts-xxx")
audio = client.generate(
    text="Hello from TTS.ai!",
    model="kokoro",
    voice="af_bella",
)
client.save(audio, "output.mp3")

Гадәти, ачык бәяләү

Сез үскән саен киңәйтегез.

Бушлай

$0

15,000 символ + 5,000/көн

  • 7 ирекле модель, шул исәптән Кокоро
  • 5000 дән артык төре билгеле.
  • APIга керү кертелгән
Бушлай теркәлү

Башлатучы

$9/мс

500 кредит/аена

  • 22 — сан.
  • 100 000 гә якын төре билгеле.
  • Сүзләрне клонлау
Башларга
Иң популяр

Профиль

$29/мс

2000 елда нигезләнгән.

  • Башлатучыдагы бар нәрсә
  • APIга керү
  • Иң элек эшкәртү
Профессионал булыгыз

Эш

$99/мс

10 000 кредит/аена

  • Профессиональ
  • Күпчелек API
  • Иң беренче чиратта
Эшне алырга

Барлык планнарны, шул исәптән кредит пакетларын да карау →

Кайвакыт бирелә торган сораулар

TTS.ai иң тулы AI тавыш платформасы, 22+ текст-телгә модельләр, тавыш клонлаштыру, сүз-текст һәм аудио инструментлар тәкъдим итә. Барлык модельләр дә сатучыга бәйле булмаган ачык чыганаклы.

Әйе! TTS.ai Kokoro, Piper, VITS һәм MeloTTS моделләре белән тексттан сүзгә бушлай хезмәт күрсәтә. Акча кертү таләп ителми. 15 000 тән артык символны бушлай алу өчен һәм барлык модельләргә керү өчен теркәлегез. Аерым түләү планнары айга 9 доллардан башлана.

Югары тизлек өчен Kokoro яки Piper кулланыгыз. Югары сыйфат өчен CosyVoice 2 яки StyleTTS 2 кулланыгыз. Сүзләрне клонлау өчен Chatterbox яки GPT-SoVITS кулланыгыз. Диалоглар өчен Dia TTS кулланыгыз. Бер үк текстны чагыштыру өчен берничә модельне кулланыгыз.

Әйе. OpenAI-га туры килгән REST API TTS, STT, тавыш клонлаштыру һәм аудио инструментлары өчен. Һәр планга кертелә, шул исәптән бушлай да, тизлек чикләүләре дәрәҗә буенча үзгәрә (бушлай: 10 сорау/минут, җиңел: 20, башлангыч: 30, профессиональ: 60, бизнес: 300). Документацияне tts.ai/api/ сайтында карагыз.

Сүзнең сыйфаты модельдән модельгә үзгәрә. CosyVoice 2, StyleTTS 2 һәм Chatterbox кебек премиум модельләр табигый интонация һәм хисләр белән кеше тавышы сыйфатына якын тавыш бирә. Kokoro кебек бушлай модельләр күбрәк куллану очраклары өчен яхшы сыйфатны тәкъдим итә.

TTS.ai үзенең модель китапханәсендә 30+ телне яклый. Инглиз теле иң киң модельне яклый, ләкин CosyVoice 2 кебек модельләр кытай, япон һәм корей телләрен яклый; GPT-SoVITS кытай, япон, корей һәм инглиз телләрен яклый; һәм MeloTTS инглиз, испан, француз, кытай, япон һәм корей телләрен яклый.

Әйе. Барлык эшкәртү безнең аерым GPU серверларында бара. Без сезнең текст кертемнәрегезне яки генерацияләнгән аудионы тапшырганнан соң сакламыйбыз. Клонлау өчен йөкләнгән тавыш үрнәкләре бары тик хәзерге сеанс өчен генә кулланыла һәм сакланмый. Без сезнең мәгълүматларыгызны беркайчан да өченче яклар белән уртаклашмыйбыз яки модельләрне өйрәтү өчен кулланмыйбыз.

Әйе. TTS.ai-да барлык иҗат ителгән тавышлар сезнең коммерцияле куллану өчен, шул исәптән YouTube видеолары, подкастлар, аудиокитаплар, кушымталар, рекламалар һәм продуктлар өчен. Безнең модельләр ачык чыганаклы һәм рөхсәт ителгән лицензияләр (MIT, Apache 2.0) астында. Авторлык хокуклары яки исем бирү таләп ителми.

TTS.ai иң югары сыйфат өчен WAV форматында аудио ясый. Сез аны MP3, FLAC, OGG, яки M4A форматларына әйләндерә аласыз безнең бушлай Аудио конвертер ярдәмендә. API сезнең сайлаган форматны сорауда турыдан-туры күрсәтүне хуплый.

Клонлаштырырга теләгән тавышның кыска аудио үрнәкләрен (5 секундтан да азрак) йөкләгез, аннан соң бу тавышта сөйләмне генерацияләү өчен теләсә нинди текстны кертегез. Chatterbox, GPT-SoVITS, һәм CosyVoice 2 кебек модельләр тавыш клонлаштыруны яклый. Клонлаштырылган тавыш тонны, акцентны һәм сөйләшү стилен тота.

Бушлай модельләр (Kokoro, Piper, VITS, MeloTTS) исәп-хисап таләп итми һәм кредитлар да кирәкми. Стандарт модельләр (2 кредит/1К символ) арасында Bark, CosyVoice 2, F5-TTS, һәм Dia бар. Премиум модельләр (4 кредит/1К символ) арасында OpenVoice, Chatterbox, StyleTTS 2, һәм Tortoise бар. Платалы модельләр, гадәттә, югарырак сыйфат, күбрәк тавышлар һәм тавыш клонлаштыру кебек өстәмә мөмкинлекләр тәкъдим итә.

Әйе. API зур күләмдә текстны сөйләмгә әйләндерү өчен пакетлы эшкәртүне яклый. Берничә сорау җибәрегез һәм нәтиҗәләрне асинхрон рәвештә UUIDлар ярдәмендә җыйыгыз. Бизнес план ($99/аена) һәм югарырак планнар тизрәк пакетлы эшкәртү өчен приоритетлы чиратларга керү мөмкинлеген бирә. Аудиокитаплар, курс эчтәлеге һәм зур масштаблы тавыш проектлары өчен идеаль.
4.1/5 (42)

Без нәрсәне яхшыртырга мөмкин? Сезнең фикерләрегез безгә проблемаларны чишәргә ярдәм итә.

Бүген үк AI тавышын кулланырга керешегез

TTS.ai кулланып иҗат итүчеләр, үстерүчеләр һәм эшмәкәрләргә кушылыгыз