Free AI Тексттен сүйлөөгө

31+ ачык булактуу моделдер, 231+ үн, 34+ Тилди тандоо. Тизме-фактура керек эмес.

8K+
түзүүчүлөр
32K+
генерациялар
31+
AI моделдери
231+
үн
0/500 символ · Sign up for 5,000 per generation → Акысыз
TTS.ai сизге жактыбы? Досторуңузга айтып коюңуз!

Сөздүк үчүн керектүү бардык нерсе

30+ ачык булактуу AI моделдери менен иштелип чыккан аспаптар

31+ AI үн моделдери

Бир платформадагы эң кеңири ачык булактуу TTS моделдеринин жыйнагы

KokoroKokoro Free

Kokoro - бул 82 миллион параметрлүү текст-сөз моделинин өзүнүн салмак классынан ашып түшкөн модели. Анын кичинекей өлчөмүне карабастан, ал абдан табигый жана эмоциялык сүйлөмдү жаратат. Kokoro бир нече тилдердин, анын ичинде англис, япон, кытай жана корей тилдерин колдойт, ар кандай эмоциялык үн менен. Ал өтө тез иштейт - аудиону GPU аркылуу реалдык убакытта генерациялоого караганда 100 эсе тез.

Эң жакшысы: Минималдуу кечиктирүү менен жогорку сапаттагы TTS, потоктук колдонмолор

Акысыз сынап көрүү

PiperPiper Free

Piper - Rhasspy тарабынан иштелип чыккан тексттен сүйлөмгө өтүү үчүн жеңил движок, VITS жана larynx архитектураларын колдонот. Ал толугу менен процессор менен иштейт, андыктан ал edge-устройствалар, үй автоматизациясы жана оффлайн TTS талап кылган тиркемелерге идеалдуу. 100дөн ашык үн менен 30дан ашык тилде, Piper Raspberry Pi 4де да табигый үн менен сөздү реалдык убакытта жеткирет.

Эң жакшысы: Жылдам алдын-ала көрүү, жеткиликтүүлүктү жакшыртуу жана орнотулган колдонмолор

Акысыз сынап көрүү

VITSVITS Free

VITS (Variation Inference with adversarial learning for end-to-end Text-to-Speech) - бул параллельдүү, эки баскычтуу моделдерге караганда табигый үн чыгаруучу, бүткүл текстти сүйлөмгө айландыруу методу. Ал вариациялык инференцияны, нормалдаштыруу агымдарын жана атаандаштыкты үйрөтүү процессин колдонот, бул табигый үн чыгаруу сапатын кыйла жогорулатат.

Эң жакшысы: Жалпы максаттагы текст-сөз алмашуу программасы

Акысыз сынап көрүү

MeloTTSMeloTTS Free

MeloTTS by MyShell.ai - бул англис (америкалык, британдык, индиялык, австралиялык), испан, француз, кытай, япон жана корей тилдерин колдогон көп тилдеги текстти которуу библиотекасы. Бул программа өтө тез, текстти процессор менен бир эле учурда иштетип жатат. MeloTTS иштетүү үчүн иштелип чыккан жана процессор менен графикалык процессорду тең колдойт.

Эң жакшысы: Жылдам, көп тилдеги TTS талап кылган продукциялык колдонмолор

Акысыз сынап көрүү

OuteTTSOuteTTS Free

OuteTTS тексттен сүйлөөгө мүмкүнчүлүк берген чоң тил моделдерин кеңейтет, бирок оригиналдык архитектурасын сактайт. Ал llama.cpp (CPU/GPU), Hugging Face Transformers, ExLlamaV2, VLLM жана Transformers.js аркылуу браузердин инференциясын камтыган бир нече backend'дерди колдойт. JSON катары сакталган сүйлөгөндөрдүн профилдеринен үн клондоону колдойт.

Эң жакшысы: Edge-дистрибьютор, браузерге негизделген TTS, ресурстары аз чөйрөлөр

Акысыз сынап көрүү

Pocket TTSPocket TTS Free

Pocket TTS by Kyutai (creators of Moshi) - бул 100М параметрлүү текст-сөз моделинин компакттуу версиясы, ал өз салмагынан алда канча күчтүү. Ал процессордун кубатын үнөмдүү колдонот, бир аудио үлгүсүнөн үн клондоону колдойт жана табигый үн менен сүйлөйт. Кичине өлчөмү аны чектелген ресурстар менен иштөөгө ылайыктуу кылат.

Эң жакшысы: Жөнгө салынышы жеңил, CPU гана колдонулган чөйрөлөр, тез үн клондоо

Акысыз сынап көрүү

Kitten TTSKitten TTS Free

Kitten TTS by KittenML is an ultra-lightweight text-to-speech model built on ONNX. With variants from 15M to 80M parameters (25-80 MB on disk), it delivers high-quality voice synthesis on CPU without requiring a GPU. Features 8 built-in voices, adjustable speech speed, and built-in text preprocessing for numbers, currencies, and units. Ideal for edge deployment and low-latency applications.

Эң жакшысы: Fast lightweight TTS, edge deployment, low-latency applications

Акысыз сынап көрүү

BarkBark Standard

Трансформерге негизделген текст-аудио модели, реалисттик сүйлөмдү, музыканы жана үн эффекттерин жаратат.

Жазуучу: Suno · Лицензия: MIT

Текшерүү

Bark SmallBark Small Standard

Барктын жеңилдетилген версиясы, тездетилген индукция жана аз эс колдонуу менен.

Жазуучу: Suno · Лицензия: MIT

Текшерүү

CosyVoice 2CosyVoice 2 Standard

Alibaba's scalable streaming TTS with human-parity naturalness and near zero latency.

Жазуучу: Alibaba (Tongyi Lab) · Лицензия: Apache 2.0

Текшерүү

Dia TTSDia TTS Standard

Көп сүйлөгөндөрдүн диалогун жаратуучу модел, сүйлөгөндөрдүн ортосунда табигый сүйлөшүүлөрдү жаратат.

Жазуучу: Nari Labs · Лицензия: Apache 2.0

Текшерүү

Parler TTSParler TTS Standard

Сиз каалаган үндү табигый тилде жазыңыз, андан кийин Parler сизге ылайыктуу үндү жаратат.

Жазуучу: Hugging Face · Лицензия: Apache 2.0

Текшерүү

GLM-TTSGLM-TTS Standard

Ачык булактуу TTS моделдеринин арасында символдук каталардын эң төмөнкү деңгээлин камсыз кылат.

Жазуучу: Zhipu AI · Лицензия: GLM-4 License

Текшерүү

IndexTTS-2IndexTTS-2 Standard

Zero-shot TTS менен майда-чүйдөсүнө чейин эмоцияларды башкаруу жана жогорку эмоционалдуулугу.

Жазуучу: Index Team · Лицензия: Bilibili Model License

Текшерүү

Spark TTSSpark TTS Standard

Контролируемые эмоции и стиль речи с помощью подсказок.

Жазуучу: SparkAudio · Лицензия: CC BY-NC-SA 4.0

Текшерүү

GPT-SoVITSGPT-SoVITS Standard

Бир нече секунда ичинде 5 секунддук аудиодон каалаган үндү клондоо үчүн TTS.

Жазуучу: RVC-Boss · Лицензия: MIT

Текшерүү

OrpheusOrpheus Standard

100K сааттык сүйлөм маалыматтары боюнча даярдалган адамдын деңгээлиндеги эмоциялык TTS модели.

Жазуучу: Canopy Labs · Лицензия: Llama 3.2 Community

Текшерүү

Qwen3 TTSQwen3 TTS Standard

Alibaba's multilingual TTS with voice cloning, preset voices, and voice design from text.

Жазуучу: Alibaba (Qwen) · Лицензия: Apache 2.0

Текшерүү

Chatterbox TurboChatterbox Turbo Standard

200 мске чейинки кечигүү жана күлкү, кашык жана башкалар үчүн паралингвистикалык тегдер менен тез Chatterbox.

Жазуучу: Resemble AI · Лицензия: MIT

Текшерүү

Dia 2Dia 2 Standard

Стерео-трекингдик TTS, көп сүйлөгөндөрдүн диалогу жана паралингвистикалык сигналдар менен.

Жазуучу: Nari Labs · Лицензия: Apache 2.0

Текшерүү

VoxCPMVoxCPM Standard

Токенизаторсуз TTS 44.1kHz аудиону контекстке жараша абзацтын бирдейлиги менен чыгарат.

Жазуучу: OpenBMB · Лицензия: Apache 2.0

Текшерүү

TADATADA Standard

Алгоритмдин 5-биттик коду 5-биттик коду менен салыштырганда 50% тездетилген.

Жазуучу: Hume AI · Лицензия: MIT

Текшерүү

VibeVoiceVibeVoice Standard

Подкасттар жана аудиокитептер сыяктуу узак форматтагы көп сүйлөмдүү мазмун үчүн Microsoft модели.

Жазуучу: Microsoft · Лицензия: MIT

Текшерүү

CosyVoice3CosyVoice3 Standard

Next-generation multilingual TTS with bi-streaming, emotion control, and zero-shot voice cloning.

Жазуучу: Alibaba (FunAudioLLM) · Лицензия: Apache 2.0

Текшерүү

ChatterboxChatterbox Premium

Современный нулевой-шот голосовой клонирования с эмоцией контроля от Resemble AI.

_Сапат:

Текшерүү

Tortoise TTSTortoise TTS Premium

Авторегрессивдүү архитектурасы менен сапатка арналган тексттен сүйлөмгө которуу.

_Сапат:

Текшерүү

StyleTTS 2StyleTTS 2 Premium

Адамдык деңгээлдеги текст-сөз стилинин диффузия жана атаандаштык машыгуу аркылуу.

_Сапат:

Текшерүү

OpenVoiceOpenVoice Premium

Стиль, эмоция жана акцентти көзөмөлдөө менен тездик менен үн клондоо.

_Сапат:

Текшерүү

Sesame CSMSesame CSM Premium

Конверсиялык сүйлөмдүн модели, табигый диалогду туура убакытта жана эмоция менен жаратат.

_Сапат:

Текшерүү

MOSS-TTSMOSS-TTS Premium

Ultra-long 20-language TTS supporting up to 1 hour of continuous generation with phoneme-level control.

_Сапат:

Текшерүү

MegaTTS3MegaTTS3 Premium

ByteDance's sparse alignment TTS with adjustable intelligibility vs. speaker similarity.

_Сапат:

Текшерүү

CosyVoice 2CosyVoice 2

Alibaba's scalable streaming TTS with human-parity naturalness and near zero latency.

Тилдер: en, zh, ja, ko, fr, de, it, es

Клондоо

GLM-TTSGLM-TTS

Ачык булактуу TTS моделдеринин арасында символдук каталардын эң төмөнкү деңгээлин камсыз кылат.

Тилдер: en, zh

Клондоо

IndexTTS-2IndexTTS-2

Zero-shot TTS менен майда-чүйдөсүнө чейин эмоцияларды башкаруу жана жогорку эмоционалдуулугу.

Тилдер: en, zh

Клондоо

Spark TTSSpark TTS

Контролируемые эмоции и стиль речи с помощью подсказок.

Тилдер: en, zh

Клондоо

GPT-SoVITSGPT-SoVITS

Бир нече секунда ичинде 5 секунддук аудиодон каалаган үндү клондоо үчүн TTS.

Тилдер: en, zh, ja, ko

Клондоо

ChatterboxChatterbox

Современный нулевой-шот голосовой клонирования с эмоцией контроля от Resemble AI.

Тилдер: en

Клондоо

Tortoise TTSTortoise TTS

Авторегрессивдүү архитектурасы менен сапатка арналган тексттен сүйлөмгө которуу.

Тилдер: en

Клондоо

OpenVoiceOpenVoice

Стиль, эмоция жана акцентти көзөмөлдөө менен тездик менен үн клондоо.

Тилдер: en, zh, ja, ko, fr, de, es, it

Клондоо

Qwen3 TTSQwen3 TTS

Alibaba's multilingual TTS with voice cloning, preset voices, and voice design from text.

Тилдер: en, zh, ja, ko, de, fr, ru, pt, es, it

Клондоо

Chatterbox TurboChatterbox Turbo

200 мске чейинки кечигүү жана күлкү, кашык жана башкалар үчүн паралингвистикалык тегдер менен тез Chatterbox.

Тилдер: en

Клондоо

VoxCPMVoxCPM

Токенизаторсуз TTS 44.1kHz аудиону контекстке жараша абзацтын бирдейлиги менен чыгарат.

Тилдер: en, zh

Клондоо

OuteTTSOuteTTS

LLM-базасынын TTS, CPU, GPU же браузер аркылуу llama.cpp жана Transformers.js аркылуу иштей алат.

Тилдер: en

Клондоо

Pocket TTSPocket TTS

Кютай тарабынан жасалган 100М параметрлүү жеңил модель, бир эле үлгүдөн үн клондоо менен.

Тилдер: en, fr

Клондоо

CosyVoice3CosyVoice3

Next-generation multilingual TTS with bi-streaming, emotion control, and zero-shot voice cloning.

Тилдер: en, zh, ja, ko, de, es, fr, it, ru

Клондоо

MOSS-TTSMOSS-TTS

Ultra-long 20-language TTS supporting up to 1 hour of continuous generation with phoneme-level control.

Тилдер: en, zh, de, es, fr, ja, it, hu, ko, ru, fa, ar, pl, pt, cs, da, sv, el, tr

Клондоо

MegaTTS3MegaTTS3

ByteDance's sparse alignment TTS with adjustable intelligibility vs. speaker similarity.

Тилдер: en, zh

Клондоо

Разработчики

OpenAI-совместимый REST API. Одна конечная точка, 22+ модели. Стриминг поддержка для реальновременных приложений.

  • OpenAI менен шайкеш формат
  • Транслирование TTS для приложений реального времени
  • Чоң тапшырмаларды пакеттик иштетүү
  • Webhook эскертүүлөр
API документациясын көрүү
pip install ttsai npm install @ttsainpm/ttsai
Python
from tts_ai import TTSClient

client = TTSClient(api_key="sk-tts-xxx")
audio = client.generate(
    text="Hello from TTS.ai!",
    model="kokoro",
    voice="af_bella",
)
client.save(audio, "output.mp3")

Баалоо

Акысыз баштаңыз. Өсүп жатканда масштабдаңыз.

Акысыз

$0

15 кредит

  • Kokoro, Piper, VITS, MeloTTS
  • 500 символго чейин
  • 3 саат (каттоо эсеби жок)
Акысыз катталуу

Жүргүзгүч

$9/мүнөт

500 кредит/ай

  • Бардык 22+ модели
  • 100,000 символ бир генерацияда
  • Сөздү клондоо
Баштоо
Эң популярдуу

Про

$29/мүнөт

2,000 кредит/ай

  • Жүргүзгүчтө бардыгы
  • API кирүү
  • Приоритеттик иштетүү
Профиге өтүү

Бизнес

$99/мүнөт

10,000 кредит/ай

  • Бардыгы Pro'до
  • Масштабдуу API
  • Приоритет тизмеси
Ишти алуу

Символ пакеттери менен бирге бардык пландарды көрүү →

Көп берилүүчү суроолор

TTS.ai - эң кеңири AI үн платформасы, 22+ текст-сөз моделдерин, үн клондоону, үн-сөз жана аудио аспаптарды сунуштайт. Бардык моделдер ачык булактуу жана эч кандай өнөктөштүк жок.

Да! TTS.ai Kokoro, Piper, VITS жана MeloTTS моделдери менен текстти сүйлөмгө которууну акысыз сунуштайт. Эч кандай эсеп-фактура талап кылынбайт. 15 000 акысыз символду алуу үчүн жана бардык моделдерге кирүү үчүн катталыңыз. Акы төлөнүүчү пландар $9/айга чейин.

Жылдамдык үчүн Kokoro же Piper колдонуп көрүңүз. Качество үчүн CosyVoice 2 же StyleTTS 2 колдонуп көрүңүз. Сөздү клондоо үчүн Chatterbox же GPT-SoVITS колдонуп көрүңүз. Диалогу үчүн Dia TTS колдонуп көрүңүз. Бирдей текстте бир нече моделди колдонуп көрүңүз.

Да. OpenAI-совместимый REST API для TTS, STT, голосового клонирования и аудио инструментов. Доступно на Pro ($29/mo) и Enterprise ($99/mo) планах. Документацию посмотрите на tts.ai/api/.

Сөздүн сапаты моделге жараша өзгөрөт. CosyVoice 2, StyleTTS 2 жана Chatterbox сыяктуу премиум моделдер табигый интонация жана эмоция менен адамга окшош сүйлөмдү жаратат. Kokoro сыяктуу акысыз моделдер көпчүлүк учурларда жакшы сапатты сунуштайт.

TTS.ai өзүнүн моделдик библиотекасында 30дан ашык тилдерди колдойт. Англис тилинде эң кеңири моделдик колдоо бар, бирок CosyVoice 2 сыяктуу моделдер кытай, япон жана корей тилдерин колдойт; GPT-SoVITS кытай, япон, корей жана англис тилдерин колдойт; жана MeloTTS англис, испан, француз, кытай, япон жана корей тилдерин колдойт.

Да. Бардык иштетүү биздин атайын GPU серверлеринде жүргүзүлөт. Биз сиздин тексттик киргизүүңүздү же генерацияланган аудиону жеткирүүдөн кийин сактабайбыз. Клондоо үчүн жүктөп алынган үн үлгүлөрү учурдагы сессия үчүн гана колдонулат жана сакталбайт. Биз сиздин маалыматтарыңызды эч качан үчүнчү жактарга бербейтпиз же моделдерди үйрөтүү үчүн колдонбойбуз.

Да. TTS.ai менен жаратылган бардык аудио сиздин коммерциялык максатта колдонууга болот, анын ичинде YouTube видеолору, подкасттар, аудиокитептер, тиркеме, жарнамалар жана продуктулар үчүн. Биздин моделдер ачык булак лицензиялары менен (MIT, Apache 2.0) иштелип чыккан. Автордук укуктар же атрибуция талап кылынбайт.

TTS.ai максималдуу сапат үчүн стандарттуу түрдө WAV форматындагы аудиону жаратат. Сиз биздин акысыз аудио конвертерибизди колдонуп, MP3, FLAC, OGG же M4A форматтарына которуп алсаңыз болот. API сиздин тандаган чыгарылыш форматын суроо-талапта түз эле көрсөтүүгө мүмкүндүк берет.

Клондоону каалаган үндүн кыска аудио үлгүсүн жүктөп алыңыз (5 секундага чейин), андан кийин бул үн менен сүйлөшүү үчүн каалаган текстти териңиз. Chatterbox, GPT-SoVITS жана CosyVoice 2 сыяктуу моделдер үн клондоону колдойт. Клондолгон үн тон, акцент жана сүйлөм стилин камтыйт.

Бесплатные модели (Kokoro, Piper, VITS, MeloTTS) не требуют учетной записи и стоят нулевые символы. Стандартные модели (2000 символов/1К ввода) включают Bark, CosyVoice 2, F5-TTS, и Dia. Премиум модели (4000 символов/1К ввода) включают OpenVoice, Chatterbox, StyleTTS 2, и Tortoise. Платежные модели обычно предлагают более высокую качество, больше голосов, и дополнительные возможности, такие как голосовое клонирование.

Ооба. API пакеттик иштетүүнү колдойт, тексттин чоң көлөмүн сүйлөмгө айландыруу үчүн. Бир нече суроону жөнөтүп, натыйжаларды асинхрондук түрдө алуу үчүн UUID тапшырмаларын колдоно аласыз. Enterprise пландары ($99/month) тез пакеттик иштетүү үчүн приоритеттик кезекке кирүү мүмкүнчүлүгүн камтыйт. Аудиокитептерди чыгаруу, курстун мазмуну жана чоң масштабдагы диктордук долбоорлор үчүн идеалдуу.
4.0/5 (22)

Биз эмнени жакшыртсак болот? Сиздин пикириңиз бизге көйгөйлөрдү чечүүгө жардам берет.

AI Voice-ду бүгүн колдонууну баштаңыз

TTS.aiди колдонгон жаратуучулар, иштеп чыгуучулар жана бизнес менен байланышыңыз