Free AIGenericName Мәтінді сөйлеугеName

31+ ашық кодты модельдер, 231+ дауыстар, 34+ Тілдерді қолдау. Тіркелгі қажет емес.

8K+
жасаушылары
30K+
генерациялар
31+
AI үлгілері
231+
дауыс
0/500 таңбалар · Sign up for 5,000 per generation → Бос
TTS.ai ұнады ма? Достарыңызға хабарлаңыз!

Дыбыс көмегімен басқару үшін қажет барлық нәрсеName

30+ құрал ашық-көздерінде жасанды интеллект моделдеріне негізделген

31+ AI дауыс үлгілері

Бір платформадағы ашық кодты TTS модельдерінің ең толық жинағыName

KokoroKokoro Free

Kokoro - 82 миллион параметрлі мәтіннен сөйлеуге көшіру моделі, ол өз салмағының класынан әлдеқайда жоғары. Шағын өлшеміне қарамастан, ол өте табиғи және өрнекті сөйлеуді шығарады. Kokoro ағылшын, жапон, қытай және корей сияқты бірнеше тілдерді қолдайды, әртүрлі өрнекті дауыстарды шығарады. Ол өте жылдам жұмыс істейді - графикалық процессордағы шын уақыттағыдан 100 есе жылдам.

Келесіге ең қолайлы: Жоғары сапалы, минималды кешіктірумен TTS, ағындық қолданбаларName

Тегін сынау

PiperPiper Free

Piper - Rhasspy жасаған, VITS және larynx архитектураларын қолданатын жеңіл мәтін- дыбыс аудару тетігі. Ол тек процессорда жұмыс істейді, сондықтан Edge құрылғылары, үй автоматтандыруы және офлайн TTS қажет қолданбалар үшін өте қолайлы. 30- дан астам тілдегі 100- ден астам дауысымен Piper Raspberry Pi 4- те де шынайы дыбыстарды шын уақыт режимінде жеткізеді.

Келесіге ең қолайлы: Жедел нобайлау, қолжетімділік және ендірілген қолданбаларName

Тегін сынау

VITSVITS Free

VITS (Variation Inference with adversarial learning for end- to- end Text- to- Speech) - бұл қазіргі екі сатылы үлгілерге қарағанда табиғи дауысты шығаратын параллельді, аясынан аяғына дейінгі TTS әдісі. Ол табиғилықты едәуір жақсарту үшін, нормаластыру ағымдары мен қарсыласу оқыту процесімен толықтырылған вариациялық инференцияны қолданады.

Келесіге ең қолайлы: Табиғи интонациямен жалпы мақсаттағы мәтін- дыбыс үндестігіName

Тегін сынау

MeloTTSMeloTTS Free

MyShell. ai- ның MeloTTS - ағылшын (американдық, британдық, үнді, австралиялық), испан, француз, қытай, жапон және корей тілдерін қолдайтын көп тілді TTS жиыны. Бұл өте жылдам, тек процессормен мәтіндерді шын уақытпен өңдей алады. MeloTTS өндірістік мақсатта қолданылады және процессор мен графикалық процессордың да мәліметтерін пайдаланады.

Келесіге ең қолайлы: Жедел, көп тілді TTS қажет ететін өндірістік қолданбаларName

Тегін сынау

OuteTTSOuteTTS Free

OuteTTS мәтінді сөйлеуге айналдыру мүмкіндіктерімен ірі тіл модельдерін кеңейтеді, бірақ бастапқы архитектурасын сақтайды. Ол llama. cpp (CPU/GPU), Hugging Face Transformers, ExLlamaV2, VLLM және тіпті Transformers. js арқылы браузердің тұжырымдарын қолдайды. JSON түрінде сақталған дыбыс шығарушы профилі арқылы дауысты клондау мүмкіндігі бар.

Келесіге ең қолайлы: Edge-ті іске қосу, браузерге негізделген TTS, ресурстары аз орталар

Тегін сынау

Pocket TTSPocket TTS Free

Pocket TTS Kyutai (Moshi- ның жасаушылары) жасаған, салмағы 100М параметрлік, компактті мәтіннен сөйлеуге көшіру үлгісі. Процессордың қуатын тиімді пайдаланады, бір аудио үлгісінен дыбыстарды клондауды қолдайды, табиғи дыбыстарды шығарады. Үлгінің кішігірім өлшемі оны ресурстары аз орталарда қолдануға өте қолайлы етеді.

Келесіге ең қолайлы: Жеңіл орналастыру, тек процессорды пайдаланатын орталар, тез дауысты клондауName

Тегін сынау

Kitten TTSKitten TTS Free

Kitten TTS by KittenML is an ultra-lightweight text-to-speech model built on ONNX. With variants from 15M to 80M parameters (25-80 MB on disk), it delivers high-quality voice synthesis on CPU without requiring a GPU. Features 8 built-in voices, adjustable speech speed, and built-in text preprocessing for numbers, currencies, and units. Ideal for edge deployment and low-latency applications.

Келесіге ең қолайлы: Fast lightweight TTS, edge deployment, low-latency applications

Тегін сынау

BarkBark Standard

Трансформаторға негізделген мәтіннен дыбыс шығару моделі, реалистік сөйлеу, музыка және дыбыс эффекттерін шығарады.

Жасаушы: Suno · Лицензия: MIT

Сынап көру

Bark SmallBark Small Standard

Bark- тің жеңіл нұсқасы, тезірек есептеу және аз жады жұмсау. Name

Жасаушы: Suno · Лицензия: MIT

Сынап көру

CosyVoice 2CosyVoice 2 Standard

Алғашқы нұсқасында атомның массасы мен электронның саны бірдей болатын.

Жасаушы: Alibaba (Tongyi Lab) · Лицензия: Apache 2.0

Сынап көру

Dia TTSDia TTS Standard

Диалогтық жүйелер - диалогтық диалогты құру үшін қолданылатын бағдарламалық жасақтама.

Жасаушы: Nari Labs · Лицензия: Apache 2.0

Сынап көру

Parler TTSParler TTS Standard

Сіз тілегіңізді табиғи тілде сипаттап, Parler сәйкесті дыбыстарды құрастырады.

Жасаушы: Hugging Face · Лицензия: Apache 2.0

Сынап көру

GLM-TTSGLM-TTS Standard

Ашық кодты ТДС үлгілерінің ішіндегі ең төменгі таңба қателігіне қол жеткізеді.

Жасаушы: Zhipu AI · Лицензия: GLM-4 License

Сынап көру

IndexTTS-2IndexTTS-2 Standard

Ұзындығы 100 шақырымнан асатын ірі өзендер мен өзендер жүйесі бар.

Жасаушы: Index Team · Лицензия: Bilibili Model License

Сынап көру

Spark TTSSpark TTS Standard

Аудио клондау TTS контролирленетін эмоциялармен және сұраулар арқылы сөйлеу стилімен.

Жасаушы: SparkAudio · Лицензия: CC BY-NC-SA 4.0

Сынап көру

GPT-SoVITSGPT-SoVITS Standard

Аудио файлдың 5 секундынан кез келген дыбысты клондау үшін бірнеше реттік дауысты клондау.

Жасаушы: RVC-Boss · Лицензия: MIT

Сынап көру

OrpheusOrpheus Standard

100-ден астам ғылыми еңбектің, оның ішінде 10 монографияның авторы.

Жасаушы: Canopy Labs · Лицензия: Llama 3.2 Community

Сынап көру

Qwen3 TTSQwen3 TTS Standard

Alibaba-ның көп тілдік TTS дыбыс клондауымен, алдын-ала орнатылған дауыстармен, мәтіннен дыбыс дизайнымен.

Жасаушы: Alibaba (Qwen) · Лицензия: Apache 2.0

Сынап көру

Chatterbox TurboChatterbox Turbo Standard

200 м-ден төменгі кешіктіруімен және күлкі, жөтел және басқа да паралингвистикалық тегтермен жылдам Chatterbox.

Жасаушы: Resemble AI · Лицензия: MIT

Сынап көру

Dia 2Dia 2 Standard

1-ші сыныпта оқып жүргенде-ақ, ақындық, публицистикалық, публицистикалық-публицистикалық шығармалар жазды.

Жасаушы: Nari Labs · Лицензия: Apache 2.0

Сынап көру

VoxCPMVoxCPM Standard

Токенизаторсыз TTS 44.1kHz аудионы контекст-сенімді абзац біркелкілігімен шығарады.

Жасаушы: OpenBMB · Лицензия: Apache 2.0

Сынап көру

TADATADA Standard

2000 жылы 25 қыркүйекте 500-ден астам нұсқасы шығарылған, оның ішінде 200-ден астам нұсқасы 2000 жылы 12 қыркүйекте шығарылды.

Жасаушы: Hume AI · Лицензия: MIT

Сынап көру

VibeVoiceVibeVoice Standard

Подкасттар мен аудиокітаптар сияқты ұзақ форматтағы мульти-сөйлеуші мазмұны үшін Microsoft моделі.

Жасаушы: Microsoft · Лицензия: MIT

Сынап көру

CosyVoice3CosyVoice3 Standard

Next-generation multilingual TTS with bi-streaming, emotion control, and zero-shot voice cloning.

Жасаушы: Alibaba (FunAudioLLM) · Лицензия: Apache 2.0

Сынап көру

ChatterboxChatterbox Premium

Рефлекторлық клондау — клондау әдісі арқылы гендік кодты клондау.

Сапа:

Сынап көру

Tortoise TTSTortoise TTS Premium

Компьютерлік графика — компьютерлік графиканың бір саласы болып табылады.

Сапа:

Сынап көру

StyleTTS 2StyleTTS 2 Premium

Қазақ тілі грамматикасы, грамматикалық стильдер, грамматикалық стильдер.

Сапа:

Сынап көру

OpenVoiceOpenVoice Premium

Стиль, эмоция және акцентті егжей-тегжейлі басқарумен дауысты дереу клондау.

Сапа:

Сынап көру

Sesame CSMSesame CSM Premium

Диалогтық оқытуда диалогтық сөйлеудің негізгі мақсаты - сөйлеудің табиғи, эмоционалды және коммуникативтік қасиеттерін дамыту.

Сапа:

Сынап көру

MOSS-TTSMOSS-TTS Premium

Ultra-long 20-language TTS supporting up to 1 hour of continuous generation with phoneme-level control.

Сапа:

Сынап көру

MegaTTS3MegaTTS3 Premium

ByteDance's sparse alignment TTS with adjustable intelligibility vs. speaker similarity.

Сапа:

Сынап көру

CosyVoice 2CosyVoice 2

Алғашқы нұсқасында атомның массасы мен электронның саны бірдей болатын.

Тілдер: en, zh, ja, ko, fr, de, it, es

Дыбысты көшіру

GLM-TTSGLM-TTS

Ашық кодты ТДС үлгілерінің ішіндегі ең төменгі таңба қателігіне қол жеткізеді.

Тілдер: en, zh

Дыбысты көшіру

IndexTTS-2IndexTTS-2

Ұзындығы 100 шақырымнан асатын ірі өзендер мен өзендер жүйесі бар.

Тілдер: en, zh

Дыбысты көшіру

Spark TTSSpark TTS

Аудио клондау TTS контролирленетін эмоциялармен және сұраулар арқылы сөйлеу стилімен.

Тілдер: en, zh

Дыбысты көшіру

GPT-SoVITSGPT-SoVITS

Аудио файлдың 5 секундынан кез келген дыбысты клондау үшін бірнеше реттік дауысты клондау.

Тілдер: en, zh, ja, ko

Дыбысты көшіру

ChatterboxChatterbox

Рефлекторлық клондау — клондау әдісі арқылы гендік кодты клондау.

Тілдер: en

Дыбысты көшіру

Tortoise TTSTortoise TTS

Компьютерлік графика — компьютерлік графиканың бір саласы болып табылады.

Тілдер: en

Дыбысты көшіру

OpenVoiceOpenVoice

Стиль, эмоция және акцентті егжей-тегжейлі басқарумен дауысты дереу клондау.

Тілдер: en, zh, ja, ko, fr, de, es, it

Дыбысты көшіру

Qwen3 TTSQwen3 TTS

Alibaba-ның көп тілдік TTS дыбыс клондауымен, алдын-ала орнатылған дауыстармен, мәтіннен дыбыс дизайнымен.

Тілдер: en, zh, ja, ko, de, fr, ru, pt, es, it

Дыбысты көшіру

Chatterbox TurboChatterbox Turbo

200 м-ден төменгі кешіктіруімен және күлкі, жөтел және басқа да паралингвистикалық тегтермен жылдам Chatterbox.

Тілдер: en

Дыбысты көшіру

VoxCPMVoxCPM

Токенизаторсыз TTS 44.1kHz аудионы контекст-сенімді абзац біркелкілігімен шығарады.

Тілдер: en, zh

Дыбысты көшіру

OuteTTSOuteTTS

LLM-ге негізделген, CPU, GPU немесе браузер арқылы llama.cpp және Transformers.js арқылы жұмыс істейтін TTS.

Тілдер: en

Дыбысты көшіру

Pocket TTSPocket TTS

Kyutai- ның жеңіл 100М параметрлік моделі, бір үлгіден дауысты клондау.

Тілдер: en, fr

Дыбысты көшіру

CosyVoice3CosyVoice3

Next-generation multilingual TTS with bi-streaming, emotion control, and zero-shot voice cloning.

Тілдер: en, zh, ja, ko, de, es, fr, it, ru

Дыбысты көшіру

MOSS-TTSMOSS-TTS

Ultra-long 20-language TTS supporting up to 1 hour of continuous generation with phoneme-level control.

Тілдер: en, zh, de, es, fr, ja, it, hu, ko, ru, fa, ar, pl, pt, cs, da, sv, el, tr

Дыбысты көшіру

MegaTTS3MegaTTS3

ByteDance's sparse alignment TTS with adjustable intelligibility vs. speaker similarity.

Тілдер: en, zh

Дыбысты көшіру

Жасаушылар үшін API

OpenAI-ге үйлесімді REST API. Бір консоль, 22+ үлгісі. Реал уақыт қолданбаларын тасымалдауды қолдау.

  • OpenAI үйлесімді пішімі
  • TTS-ті тікелей қолданбалар үшін тасымалдау
  • Үлкен тапсырмаларды дестелеу
  • Webhook құлақтандырулары
API құжаттамасын қарау
pip install ttsai npm install @ttsainpm/ttsai
Python
from tts_ai import TTSClient

client = TTSClient(api_key="sk-tts-xxx")
audio = client.generate(
    text="Hello from TTS.ai!",
    model="kokoro",
    voice="af_bella",
)
client.save(audio, "output.mp3")

Қарапайым, түсінікті бағалау

Еркін бастаңыз. Өсе келе масштабтаңыз.

Бос

$0

15 кредит

  • Kokoro, Piper, VITS, MeloTTS
  • 500 таңба шегі
  • 3 күн/ сағат (тізімсіз)
Тегін тіркелу

Бастауыш

$9/ай

500 кредит/ ай

  • Барлық 22+ үлгілері
  • Бір буындағы 100, 000 таңба
  • Дыбысты көшіру
Бастау
Ең танымал

Про

$29/ай

2000 кредит/ ай

  • Бастауыштағы барлығы
  • API қатынау
  • Артықшылықты өңдеу
Профессионал болу

Бизнес

$99/ай

10 000 кредит/ ай

  • Pro- дағы барлығы
  • Жалпы API
  • Артықшылық кезек
Іс- әрекетті алу

Барлық жоспарларды, соның ішінде таңба жиындарын көрсету →

Жиі қойылатын сұрақтар

TTS.ai - ең толық AI дауыс платформасы, 22+ мәтін-сөз моделін, дауыс клондауын, сөз-мәтін және аудио құралдарын ұсынады. Барлық модельдер ашық кодты және өндірушіге тәуелді емес.

Иә! TTS.ai Kokoro, Piper, VITS және MeloTTS үлгілерімен мәтіннен сөйлеуге тегін қызмет көрсетеді. Тіркелгі қажет емес. 15 000 тегін таңбаны алуға және барлық үлгілерге қол жеткізуге тіркеліңіз. Ақылы жоспарлар айына $9-дан басталады.

Жылдамдық үшін Kokoro не Piper қолданыңыз. Сапа үшін CosyVoice 2 не StyleTTS 2 қолданыңыз. Дыбысты клондау үшін Chatterbox не GPT- SoVITS қолданыңыз. Диалог үшін Dia TTS қолданыңыз. Бір мәтіннің бірнеше үлгісін салыстыру үшін қолданыңыз.

Иә. OpenAI-ге сәйкес келетін TTS, STT, дауыс клондау және аудио құралдары үшін REST API. Pro ($29/mo) және Enterprise ($99/mo) жоспарларында қол жетімді. Құжаттаманы tts.ai/api/ сайтында қараңыз.

Дауыс сапасы модельге байланысты өзгереді. CosyVoice 2, StyleTTS 2, Chatterbox сияқты премиум модельдер табиғи интонация мен эмоциямен адамға ұқсас дыбыс шығарады. Kokoro сияқты тегін модельдер көп жағдайда өте жақсы дыбыс шығарады.

TTS.ai 30- дан астам тілдерді қолдайды. Англия тілінің қолдауы ең кең, бірақ CosyVoice 2 қытай, жапон және корей тілдерін қолдайды; GPT- SoVITS қытай, жапон, корей және ағылшын тілдерін қолдайды; ал MeloTTS ағылшын, испан, француз, қытай, жапон және корей тілдерін қолдайды.

Иә. Барлық өңдеу біздің арнайы графикалық процессор серверлерінде жүргізіледі. Біз енгізген мәтін не жасалған аудионы сақтамаймыз. Клондау үшін жүктеген дыбыс үлгілері тек ағымдағы сеанста ғана қолданылады, сақталмайды. Біз деректеріңізді үшінші тараппен бөліспейміз, модельдерді оқыту үшін де қолданбаймыз.

Иә. TTS.ai-де жасалған барлық аудио файлдар сіздің коммерциялық мақсатта, YouTube видеолары, подкасттар, аудиокітаптар, қолданбалар, жарнама және өнімдер үшін қолданылуы мүмкін. Біздің модельдеріміз ашық коды бар, рұқсат етілген лицензиялармен (MIT, Apache 2.0) шығарылады. Авторлық ақы немесе авторлық құқық талап етілмейді.

TTS.ai әдетті түрде WAV пішімінде дыбыс шығарады, бұл ең жоғары сапалы. Аудио файлды MP3, FLAC, OGG, немесе M4A пішіміне ашық Аудио конвертері арқылы аударуға болады. API сұрауында қалаған шығыс пішіміңізді тікелей келтіруге мүмкіндік береді.

Клондайтын дауыстың қысқа (5 секундқа дейін) аудио үлгісін жүктеп беріңіз, содан кейін осы дауысты шығару үшін мәтін енгізіңіз. Chatterbox, GPT- SoVITS және CosyVoice 2 сияқты үлгілер дауысты клондауды қолдайды. Клондалған дауыс тонын, акцентін және сөйлеу стилін сақтайды.

Тегін үлгілер (Kokoro, Piper, VITS, MeloTTS) тіркелгі қажет етпейді және нөл таңбаға бағаланады. Стандартты үлгілер (2000 таңба/1K кірістіру) Bark, CosyVoice 2, F5-TTS, және Dia. Премиум үлгілер (4000 таңба/1K кірістіру) OpenVoice, Chatterbox, StyleTTS 2, және Tortoise. Ақылы үлгілер көбіне жоғары сапалы, көбірек дауыстарды және дауыстарды клондау сияқты қосымша мүмкіндіктерді ұсынады.

Иә. API үлкен көлемдегі мәтіндерді сөйлеуге айналдыру үшін пакеттік өңдеуді қолдайды. Бірнеше сұраныстарды жіберіп, тапсырма UUID- терін пайдаланып нәтижелерді асинхронды түрде алу. Enterprise жоспары ($99/ ай) пакеттік өңдеуді жеделдету үшін кезекке артықшылықты қатынауды қамтиды. Аудиокітаптарды шығару, курс мазмұнын жасау және кең көлемді дыбыс жобалары үшін өте қолайлы.
4.1/5 (21)

Нені жақсартуға болады? Сіздің пікіріңіз бізге қателерді түзетуге көмектеседі.

AI Voice-ті бүгін қолдана бастаңыз

TTS.ai-ді қолданатын құрушылар, әзірлеуші және бизнес өкілдерімен бірлесіп жұмыс істеу