Free AIGenericName Мәтінді сөйлеугеName

33+ ашық кодты модельдер, 273+ дауыстар, 33+ Тілдерді қолдау. Тіркелгі қажет емес.

17K+
жасаушылары
70K+
генерациялар
33+
AI үлгілері
273+
дауыс
0/500 таңбалар · Бір буынға 5000 жазылу → Бос
TTS.ai ұнады ма? Достарыңызға хабарлаңыз!

Дыбыс көмегімен басқару үшін қажет барлық нәрсеName

30+ құрал ашық-көздерінде жасанды интеллект моделдеріне негізделген

33+ AI дауыс үлгілері

Бір платформадағы ашық кодты TTS модельдерінің ең толық жинағыName

KokoroKokoro Бос

Kokoro - 82 миллион параметрлі мәтіннен сөйлеуге көшіру моделі, ол өз салмағының класынан әлдеқайда жоғары. Шағын өлшеміне қарамастан, ол өте табиғи және өрнекті сөйлеуді шығарады. Kokoro ағылшын, жапон, қытай және корей сияқты бірнеше тілдерді қолдайды, әртүрлі өрнекті дауыстарды шығарады. Ол өте жылдам жұмыс істейді - графикалық процессордағы шын уақыттағыдан 100 есе жылдам.

Келесіге ең қолайлы: Жоғары сапалы, минималды кешіктірумен TTS, ағындық қолданбаларName

Тегін сынау

PiperPiper Бос

Piper - Rhasspy жасаған, VITS және larynx архитектураларын қолданатын жеңіл мәтін- дыбыс аудару тетігі. Ол тек процессорда жұмыс істейді, сондықтан Edge құрылғылары, үй автоматтандыруы және офлайн TTS қажет қолданбалар үшін өте қолайлы. 30- дан астам тілдегі 100- ден астам дауысымен Piper Raspberry Pi 4- те де шынайы дыбыстарды шын уақыт режимінде жеткізеді.

Келесіге ең қолайлы: Жедел нобайлау, қолжетімділік және ендірілген қолданбаларName

Тегін сынау

VITSVITS Бос

VITS (Variation Inference with adversarial learning for end- to- end Text- to- Speech) - бұл қазіргі екі сатылы үлгілерге қарағанда табиғи дауысты шығаратын параллельді, аясынан аяғына дейінгі TTS әдісі. Ол табиғилықты едәуір жақсарту үшін, нормаластыру ағымдары мен қарсыласу оқыту процесімен толықтырылған вариациялық инференцияны қолданады.

Келесіге ең қолайлы: Табиғи интонациямен жалпы мақсаттағы мәтін- дыбыс үндестігіName

Тегін сынау

MeloTTSMeloTTS Бос

MyShell. ai- ның MeloTTS - ағылшын (американдық, британдық, үнді, австралиялық), испан, француз, қытай, жапон және корей тілдерін қолдайтын көп тілді TTS жиыны. Бұл өте жылдам, тек процессормен мәтіндерді шын уақытпен өңдей алады. MeloTTS өндірістік мақсатта қолданылады және процессор мен графикалық процессордың да мәліметтерін пайдаланады.

Келесіге ең қолайлы: Жедел, көп тілді TTS қажет ететін өндірістік қолданбаларName

Тегін сынау

Kani TTS 2Kani TTS 2 Бос

NineNineSix- тің Kani- TTS- 2 - NVIDIA NanoCodec- тің Liquid AI LFM2 негізінде жасалған өте жеңіл 400М параметрлі модель. Ол тек 3 ГБ VRAM- да жұмыс істейді және A100 (RTF 0. 2) құрылғысында ~2 секундта ~10 секунд сөйлем шығарады. Қазіргі ашық нұсқасы тек ағылшын тіліндегі `kani- tts- 2- en` тексеру нүктесін ұсынады және дыбыс клондау үшін қажет дыбыс ендіру тоқпағы жоқ - клондау үшін Chatterbox / IndexTTS2 / F5- TTS, ал ағылшын тілінде емес болса Kokoro / MeloTTS қолданыңыз.

Келесіге ең қолайлы: VRAM аз құрылғыларда ағылшын тілін тез құру, жылдам алдын- ала қарау

Тегін сынау

OuteTTSOuteTTS Бос

OuteTTS мәтінді сөйлеуге айналдыру мүмкіндіктерімен ірі тіл модельдерін кеңейтеді, бірақ бастапқы архитектурасын сақтайды. Ол llama. cpp (CPU/GPU), Hugging Face Transformers, ExLlamaV2, VLLM және тіпті Transformers. js арқылы браузердің тұжырымдарын қолдайды. JSON түрінде сақталған дыбыс шығарушы профилі арқылы дауысты клондау мүмкіндігі бар.

Келесіге ең қолайлы: Edge-ті іске қосу, браузерге негізделген TTS, ресурстары аз орталар

Тегін сынау

Pocket TTSPocket TTS Бос

Pocket TTS Kyutai (Moshi- ның жасаушылары) жасаған, салмағы 100М параметрлік, компактті мәтіннен сөйлеуге көшіру үлгісі. Процессордың қуатын тиімді пайдаланады, бір аудио үлгісінен дыбыстарды клондауды қолдайды, табиғи дыбыстарды шығарады. Үлгінің кішігірім өлшемі оны ресурстары аз орталарда қолдануға өте қолайлы етеді.

Келесіге ең қолайлы: Жеңіл орналастыру, тек процессорды пайдаланатын орталар, тез дауысты клондауName

Тегін сынау

Kitten TTSKitten TTS Бос

Kitten TTS by KittenML - бұл ONNX негізінде жасалған өте жеңіл мәтін- дыбыс синтезі моделі. 15М- ден 80М- ге дейінгі параметрлерімен (дискіде 25- 80 МБ), ол графикалық процессорды қажет етпей, жоғары сапалы дыбыс синтезін CPU- дан орындайды. 8 ішкі дыбысы, дыбыс жылдамдығын баптау, сан, валюта және бірліктер үшін ішкі мәтін өңдеуі бар. Ең жақын орналасу және төменгі артта қалу қолданбаларына өте ыңғайлы.

Келесіге ең қолайлы: Жедел, жеңіл, шеттік орналастыру, төменгі артта қалу қолданбаларыName

Тегін сынау

Ming-Omni TTSMing-Omni TTS Бос

InclusionAI- ның Ming- omni- tts- 0. 5B дегені BailingMM тығыз арнасына негізделген, Patch- by- Patch ауа- қатынасы сәйкесті аудио декодері бар компактті омни- модалды сөйлеу моделі. 44. 1 кГц шығыс (CD сапасына жақын), 3+ секундтық сілтемеден нульдік- клондау дыбысын қолдайды, JSON инструкциялары арқылы эмоционалды / диалект / BGM басқаруын қамтиды. Қытайлық ережелер бойынша мықты тұрақтылығы — 0. 83% WER.

Келесіге ең қолайлы: High-fidelity екі тілде баяндау, эмоция-контрольді дауыс әрекеті, қытайлық аудиокітап мазмұны

Тегін сынау

MOSS-TTS NanoMOSS-TTS Nano Бос

MOSS- TTS- Nano- 100M - MOSS- TTS отбасының OpenMOSS- тің компактті 100М- параметрлі нұсқасы, кешіктіру- трансформатор архитектурасын қолданады. 8B үлгісінің сапасын ~80x қысқартылған салмағы мен сұраныс бойынша VRAM- ның күрт төмендеуі үшін айырбастайды, бұл оны тегін деңгейлі және жоғары өткізгіштікті орналастыруға жарамсыз етеді. 20 тілге бірдей жету мүмкіндігі.

Келесіге ең қолайлы: Тегін деңгейлі TTS, көп көлемді шығару, аз кешіктіруі бар интерактивті қолдану

Тегін сынау

BarkBark Әдетті

Трансформаторға негізделген мәтіннен дыбыс шығару моделі, реалистік сөйлеу, музыка және дыбыс эффекттерін шығарады.

Жасаушы: Suno · Лицензия: MIT

Сынап көру

Bark SmallBark Small Әдетті

Bark- тің жеңіл нұсқасы, тезірек есептеу және аз жады жұмсау. Name

Жасаушы: Suno · Лицензия: MIT

Сынап көру

CosyVoice 2CosyVoice 2 Әдетті

Алғашқы нұсқасында атомның массасы мен электронның саны бірдей болатын.

Жасаушы: Alibaba (Tongyi Lab) · Лицензия: Apache 2.0

Сынап көру

Dia TTSDia TTS Әдетті

Диалогтық жүйелер - диалогтық диалогты құру үшін қолданылатын бағдарламалық жасақтама.

Жасаушы: Nari Labs · Лицензия: Apache 2.0

Сынап көру

Parler TTSParler TTS Әдетті

Сіз тілегіңізді табиғи тілде сипаттап, Parler сәйкесті дыбыстарды құрастырады.

Жасаушы: Hugging Face · Лицензия: Apache 2.0

Сынап көру

IndexTTS-2IndexTTS-2 Әдетті

Ұзындығы 100 шақырымнан асатын ірі өзендер мен өзендер жүйесі бар.

Жасаушы: Index Team · Лицензия: Bilibili Model License

Сынап көру

Spark TTSSpark TTS Әдетті

Аудио клондау TTS контролирленетін эмоциялармен және сұраулар арқылы сөйлеу стилімен.

Жасаушы: SparkAudio · Лицензия: CC BY-NC-SA 4.0

Сынап көру

GPT-SoVITSGPT-SoVITS Әдетті

Аудио файлдың 5 секундынан кез келген дыбысты клондау үшін бірнеше реттік дауысты клондау.

Жасаушы: RVC-Boss · Лицензия: MIT

Сынап көру

OrpheusOrpheus Әдетті

100-ден астам ғылыми еңбектің, оның ішінде 10 монографияның авторы.

Жасаушы: Canopy Labs · Лицензия: Llama 3.2 Community

Сынап көру

Qwen3 TTSQwen3 TTS Әдетті

Alibaba-ның көп тілді TTS-і алдын-ала орнатылған дауыспен және мәтіннен дыбыс дизайнымен.

Жасаушы: Alibaba (Qwen) · Лицензия: Apache 2.0

Сынап көру

VieNeu-TTS-v2VieNeu-TTS-v2 Әдетті

Вьетнам және ағылшын тілдерін кодты ауыстырып, 7 алдын- ала орнатылған дыбыспен және дыбыстарды клондаусыз. Тек процессор қажет, графикалық процессор қажет емес. Name

Жасаушы: Phạm Nguyễn Ngọc Bảo · Лицензия: Apache 2.0

Сынап көру

Chatterbox TurboChatterbox Turbo Әдетті

200 м-ден төменгі кешіктіруімен және күлкі, жөтел және басқа да паралингвистикалық тегтермен жылдам Chatterbox.

Жасаушы: Resemble AI · Лицензия: MIT

Сынап көру

VoxCPMVoxCPM Әдетті

Токенизаторсыз TTS 44.1kHz аудионы контекст-сенімді абзац біркелкілігімен шығарады.

Жасаушы: OpenBMB · Лицензия: Apache 2.0

Сынап көру

VibeVoiceVibeVoice Әдетті

Подкасттар мен аудиокітаптар сияқты ұзақ форматтағы мульти-сөйлеуші мазмұны үшін Microsoft моделі.

Жасаушы: Microsoft · Лицензия: MIT

Сынап көру

CosyVoice3CosyVoice3 Әдетті

Би-стриминг, эмоцияларды басқару және дауысты клондау арқылы келесі буын көп тілді TTS.

Жасаушы: Alibaba (FunAudioLLM) · Лицензия: Apache 2.0

Сынап көру

NAMAA Saudi TTSNAMAA Saudi TTS Әдетті

Бірінші ашық Сауд Арабиясының дыбыс аудару жүйесі. Сауд Арабиясының өз диалектісі, Chatterbox- сапалы дыбыстарды клондау. Name

Жасаушы: NAMAA Space · Лицензия: MIT

Сынап көру

Darwin TTSDarwin TTS Әдетті

Qwen3-1.7B тіл моделінен алынған FFN салмағы бар Qwen3-TTS-тің кросс-модалды нұсқасы көп тілдік клондауды жеңілдету үшін қолданылады.

Жасаушы: FINAL-Bench · Лицензия: Apache 2.0

Сынап көру

MOSS-TTSDMOSS-TTSD Әдетті

Multi-speaker dialogue continuation model — 5-ке дейінгі спикерлермен және 60 минуттық біртұтас аудиомен подкаст-стиліндегі әңгімелерді құру.

Жасаушы: OpenMOSS · Лицензия: Apache 2.0

Сынап көру

ChatterboxChatterbox Premium

Рефлекторлық клондау — клондау әдісі арқылы гендік кодты клондау.

Сапа:

Сынап көру

Tortoise TTSTortoise TTS Premium

Компьютерлік графика — компьютерлік графиканың бір саласы болып табылады.

Сапа:

Сынап көру

StyleTTS 2StyleTTS 2 Premium

Қазақ тілі грамматикасы, грамматикалық стильдер, грамматикалық стильдер.

Сапа:

Сынап көру

OpenVoiceOpenVoice Premium

Стиль, эмоция және акцентті егжей-тегжейлі басқарумен дауысты дереу клондау.

Сапа:

Сынап көру

Sesame CSMSesame CSM Premium

Диалогтық оқытуда диалогтық сөйлеудің негізгі мақсаты - сөйлеудің табиғи, эмоционалды және коммуникативтік қасиеттерін дамыту.

Сапа:

Сынап көру

CosyVoice 2CosyVoice 2

Алғашқы нұсқасында атомның массасы мен электронның саны бірдей болатын.

Тілдер: en, zh, ja, ko, fr, de, it, es

Дыбысты көшіру

IndexTTS-2IndexTTS-2

Ұзындығы 100 шақырымнан асатын ірі өзендер мен өзендер жүйесі бар.

Тілдер: en, zh

Дыбысты көшіру

Spark TTSSpark TTS

Аудио клондау TTS контролирленетін эмоциялармен және сұраулар арқылы сөйлеу стилімен.

Тілдер: en, zh

Дыбысты көшіру

GPT-SoVITSGPT-SoVITS

Аудио файлдың 5 секундынан кез келген дыбысты клондау үшін бірнеше реттік дауысты клондау.

Тілдер: en, zh, ja, ko

Дыбысты көшіру

ChatterboxChatterbox

Рефлекторлық клондау — клондау әдісі арқылы гендік кодты клондау.

Тілдер: en

Дыбысты көшіру

Tortoise TTSTortoise TTS

Компьютерлік графика — компьютерлік графиканың бір саласы болып табылады.

Тілдер: en

Дыбысты көшіру

OpenVoiceOpenVoice

Стиль, эмоция және акцентті егжей-тегжейлі басқарумен дауысты дереу клондау.

Тілдер: en, zh, ja, ko, fr, es

Дыбысты көшіру

VieNeu-TTS-v2VieNeu-TTS-v2

Вьетнам және ағылшын тілдерін кодты ауыстырып, 7 алдын- ала орнатылған дыбыспен және дыбыстарды клондаусыз. Тек процессор қажет, графикалық процессор қажет емес. Name

Тілдер: vi, en

Дыбысты көшіру

Chatterbox TurboChatterbox Turbo

200 м-ден төменгі кешіктіруімен және күлкі, жөтел және басқа да паралингвистикалық тегтермен жылдам Chatterbox.

Тілдер: en

Дыбысты көшіру

VoxCPMVoxCPM

Токенизаторсыз TTS 44.1kHz аудионы контекст-сенімді абзац біркелкілігімен шығарады.

Тілдер: en, zh

Дыбысты көшіру

OuteTTSOuteTTS

LLM-ге негізделген, CPU, GPU немесе браузер арқылы llama.cpp және Transformers.js арқылы жұмыс істейтін TTS.

Тілдер: en

Дыбысты көшіру

Pocket TTSPocket TTS

Kyutai- ның жеңіл 100М параметрлік моделі, бір үлгіден дауысты клондау.

Тілдер: en, fr

Дыбысты көшіру

CosyVoice3CosyVoice3

Би-стриминг, эмоцияларды басқару және дауысты клондау арқылы келесі буын көп тілді TTS.

Тілдер: en, zh, ja, ko, de, es, fr, it, ru

Дыбысты көшіру

NAMAA Saudi TTSNAMAA Saudi TTS

Бірінші ашық Сауд Арабиясының дыбыс аудару жүйесі. Сауд Арабиясының өз диалектісі, Chatterbox- сапалы дыбыстарды клондау. Name

Тілдер: ar

Дыбысты көшіру

Darwin TTSDarwin TTS

Qwen3-1.7B тіл моделінен алынған FFN салмағы бар Qwen3-TTS-тің кросс-модалды нұсқасы көп тілдік клондауды жеңілдету үшін қолданылады.

Тілдер: en, ko, ja, zh

Дыбысты көшіру

MOSS-TTSDMOSS-TTSD

Multi-speaker dialogue continuation model — 5-ке дейінгі спикерлермен және 60 минуттық біртұтас аудиомен подкаст-стиліндегі әңгімелерді құру.

Тілдер: en, zh

Дыбысты көшіру

Ming-Omni TTSMing-Omni TTS

1950 жылы 14 қаңтарда Алматы қаласында туған.1994 жылы 14 қаңтарда Алматы қаласында қайтыс болды.

Тілдер: en, zh

Дыбысты көшіру

MOSS-TTS NanoMOSS-TTS Nano

100-ден астам ғылыми еңбектің, оның ішінде 8 монографияның, 100-ден астам оқу құралының авторы.

Тілдер: en, zh, de, es, fr, ja, it, ko, ru, ar, pt

Дыбысты көшіру

Жасаушылар үшін API

OpenAI-ге үйлесімді REST API. Бір консоль, 22+ үлгісі. Реал уақыт қолданбаларын тасымалдауды қолдау.

  • OpenAI үйлесімді пішімі
  • TTS-ті тікелей қолданбалар үшін тасымалдау
  • Үлкен тапсырмаларды дестелеу
  • Webhook құлақтандырулары
API құжаттамасын қарау
pip install ttsai npm install @ttsainpm/ttsai
Python
from tts_ai import TTSClient

client = TTSClient(api_key="sk-tts-xxx")
audio = client.generate(
    text="Hello from TTS.ai!",
    model="kokoro",
    voice="af_bella",
)
client.save(audio, "output.mp3")

Қарапайым, түсінікті бағалау

Еркін бастаңыз. Өсе келе масштабтаңыз.

Бос

$0

15, 000 таңба + 5, 000/ күн

  • 7 еркін үлгі, оның ішінде Kokoro
  • Бір буында 5000 таңба
  • API қатынасы қосылған
Тегін тіркелу

Бастауыш

$9/ай

500 кредит/ ай

  • Барлық 22+ үлгілері
  • Бір буындағы 100, 000 таңба
  • Дыбысты көшіру
Бастау
Ең танымал

Про

$29/ай

2000 кредит/ ай

  • Бастауыштағы барлығы
  • API қатынау
  • Артықшылықты өңдеу
Профессионал болу

Бизнес

$99/ай

10 000 кредит/ ай

  • Pro- дағы барлығы
  • Жалпы API
  • Артықшылық кезек
Іс- әрекетті алу

Барлық жоспарларды, соның ішінде таңба жиындарын көрсету →

Жиі қойылатын сұрақтар

TTS.ai - ең толық AI дауыс платформасы, 22+ мәтін-сөз моделін, дауыс клондауын, сөз-мәтін және аудио құралдарын ұсынады. Барлық модельдер ашық кодты және өндірушіге тәуелді емес.

Иә! TTS.ai Kokoro, Piper, VITS және MeloTTS үлгілерімен мәтіннен сөйлеуге тегін қызмет көрсетеді. Тіркелгі қажет емес. 15 000 тегін таңбаны алуға және барлық үлгілерге қол жеткізуге тіркеліңіз. Ақылы жоспарлар айына $9-дан басталады.

Жылдамдық үшін Kokoro не Piper қолданыңыз. Сапа үшін CosyVoice 2 не StyleTTS 2 қолданыңыз. Дыбысты клондау үшін Chatterbox не GPT- SoVITS қолданыңыз. Диалог үшін Dia TTS қолданыңыз. Бір мәтіннің бірнеше үлгісін салыстыру үшін қолданыңыз.

Иә. OpenAI-ге сәйкес келетін TTS, STT, дауыс клондау және аудио құралдары үшін REST API. Әрбір жоспарға кіреді, тегін де бар, жылдамдық шектеулері деңгейге қарай өзгереді (Free: 10 req/min, Lite: 20, Starter: 30, Pro: 60, Business: 300). Құжаттаманы tts.ai/api/ сайтында қараңыз.

Дауыс сапасы модельге байланысты өзгереді. CosyVoice 2, StyleTTS 2, Chatterbox сияқты премиум модельдер табиғи интонация мен эмоциямен адамға ұқсас дыбыс шығарады. Kokoro сияқты тегін модельдер көп жағдайда өте жақсы дыбыс шығарады.

TTS.ai 30- дан астам тілдерді қолдайды. Англия тілінің қолдауы ең кең, бірақ CosyVoice 2 қытай, жапон және корей тілдерін қолдайды; GPT- SoVITS қытай, жапон, корей және ағылшын тілдерін қолдайды; ал MeloTTS ағылшын, испан, француз, қытай, жапон және корей тілдерін қолдайды.

Иә. Барлық өңдеу біздің арнайы графикалық процессор серверлерінде жүргізіледі. Біз енгізген мәтін не жасалған аудионы сақтамаймыз. Клондау үшін жүктеген дыбыс үлгілері тек ағымдағы сеанста ғана қолданылады, сақталмайды. Біз деректеріңізді үшінші тараппен бөліспейміз, модельдерді оқыту үшін де қолданбаймыз.

Иә. TTS.ai-де жасалған барлық аудио файлдар сіздің коммерциялық мақсатта, YouTube видеолары, подкасттар, аудиокітаптар, қолданбалар, жарнама және өнімдер үшін қолданылуы мүмкін. Біздің модельдеріміз ашық коды бар, рұқсат етілген лицензиялармен (MIT, Apache 2.0) шығарылады. Авторлық ақы немесе авторлық құқық талап етілмейді.

TTS.ai әдетті түрде WAV пішімінде дыбыс шығарады, бұл ең жоғары сапалы. Аудио файлды MP3, FLAC, OGG, немесе M4A пішіміне ашық Аудио конвертері арқылы аударуға болады. API сұрауында қалаған шығыс пішіміңізді тікелей келтіруге мүмкіндік береді.

Клондайтын дауыстың қысқа (5 секундқа дейін) аудио үлгісін жүктеп беріңіз, содан кейін осы дауысты шығару үшін мәтін енгізіңіз. Chatterbox, GPT- SoVITS және CosyVoice 2 сияқты үлгілер дауысты клондауды қолдайды. Клондалған дауыс тонын, акцентін және сөйлеу стилін сақтайды.

Тегін үлгілер (Kokoro, Piper, VITS, MeloTTS) тіркелгі қажет етпейді және нөл таңбаға бағаланады. Стандартты үлгілер (2000 таңба/1K кірістіру) Bark, CosyVoice 2, F5-TTS, және Dia. Премиум үлгілер (4000 таңба/1K кірістіру) OpenVoice, Chatterbox, StyleTTS 2, және Tortoise. Ақылы үлгілер көбіне жоғары сапалы, көбірек дауыстарды және дауыстарды клондау сияқты қосымша мүмкіндіктерді ұсынады.

Иә. API көп көлемдегі мәтіндерді сөйлеуге айналдыру үшін пакеттік өңдеуді қолдайды. Бірнеше сұраныстарды жіберіп, тапсырма UUID- терін пайдаланып нәтижелерді асинхронды түрде алу. Бизнес жоспары ($99/ ай) және жоғарырақ жоспарлар пакеттік өңдеуді жеделдету үшін кезекке артықшылықты қатынауды қамтиды. Аудиокітаптарды шығару, курс мазмұнын жасау және үлкен масштабтағы дыбыс жобалары үшін өте қолайлы.
4.1/5 (42)

Нені жақсартуға болады? Сіздің пікіріңіз бізге қателерді түзетуге көмектеседі.

AI Voice-ті бүгін қолдана бастаңыз

TTS.ai-ді қолданатын құрушылар, әзірлеуші және бизнес өкілдерімен бірлесіп жұмыс істеу