Free AI Тексттен сүйлөөгө
33+ ачык булактуу моделдер, 273+ үн, 33+ Тилди тандоо. Тизме-фактура керек эмес.
Сөздүк үчүн керектүү бардык нерсе
30+ ачык булактуу AI моделдери менен иштелип чыккан аспаптар
33+ AI үн моделдери
Бир платформадагы эң кеңири ачык булактуу TTS моделдеринин жыйнагы
Kokoro Акысыз
Kokoro - бул 82 миллион параметрлүү текст-сөз моделинин өзүнүн салмак классынан ашып түшкөн модели. Анын кичинекей өлчөмүне карабастан, ал абдан табигый жана эмоциялык сүйлөмдү жаратат. Kokoro бир нече тилдердин, анын ичинде англис, япон, кытай жана корей тилдерин колдойт, ар кандай эмоциялык үн менен. Ал өтө тез иштейт - аудиону GPU аркылуу реалдык убакытта генерациялоого караганда 100 эсе тез.
Эң жакшысы: Минималдуу кечиктирүү менен жогорку сапаттагы TTS, потоктук колдонмолор
Акысыз сынап көрүү
Piper Акысыз
Piper - Rhasspy тарабынан иштелип чыккан тексттен сүйлөмгө өтүү үчүн жеңил движок, VITS жана larynx архитектураларын колдонот. Ал толугу менен процессор менен иштейт, андыктан ал edge-устройствалар, үй автоматизациясы жана оффлайн TTS талап кылган тиркемелерге идеалдуу. 100дөн ашык үн менен 30дан ашык тилде, Piper Raspberry Pi 4де да табигый үн менен сөздү реалдык убакытта жеткирет.
Эң жакшысы: Жылдам алдын-ала көрүү, жеткиликтүүлүктү жакшыртуу жана орнотулган колдонмолор
Акысыз сынап көрүү
VITS Акысыз
VITS (Variation Inference with adversarial learning for end-to-end Text-to-Speech) - бул параллельдүү, эки баскычтуу моделдерге караганда табигый үн чыгаруучу, бүткүл текстти сүйлөмгө айландыруу методу. Ал вариациялык инференцияны, нормалдаштыруу агымдарын жана атаандаштыкты үйрөтүү процессин колдонот, бул табигый үн чыгаруу сапатын кыйла жогорулатат.
Эң жакшысы: Жалпы максаттагы текст-сөз алмашуу программасы
Акысыз сынап көрүү
MeloTTS Акысыз
MeloTTS by MyShell.ai - бул англис (америкалык, британдык, индиялык, австралиялык), испан, француз, кытай, япон жана корей тилдерин колдогон көп тилдеги текстти которуу библиотекасы. Бул программа өтө тез, текстти процессор менен бир эле учурда иштетип жатат. MeloTTS иштетүү үчүн иштелип чыккан жана процессор менен графикалык процессорду тең колдойт.
Эң жакшысы: Жылдам, көп тилдеги TTS талап кылган продукциялык колдонмолор
Акысыз сынап көрүү
Kani TTS 2 Акысыз
Kani-TTS-2 by NineNineSix - NVIDIA NanoCodec менен Liquid AI LFM2 backbone'у менен курулган 400М параметрлүү өтө жеңил модель. Ал 3ГБ VRAM'да иштейт жана A100 (RTF 0.2)'да ~10 секундада ~2 секундада ~10 секунда сүйлөмдү чыгарат. Азыркы коомдук версия англис тилинде гана `kani-tts-2-en` чектөө пунктун жөнөтөт жана үн клондоого керектүү үн клондоо үчүн үн клондоого керектүү үн клондоого керектүү үн клондоого керектүү үн клондоого керектүү үн клондоого керектүү үн клондоого керектүү үн клондоого керектүү үн клондоого керектүү үн клондоого керектүү үн клондоого керектүү үн клондоого керектүү үн клондоого керектүү үн клондоого керектүү үн клондоого керектүү үн клондоого керектүү үн клондоого керектүү үн клондоого керектүү үн клондоого керектүү үн клондоого керектүү үн клондоого керектүү үн клондоого керектүү үн клондоого керектүү үн клондоого керектүү үн клондоого керектүү үн клондоого керектүү үн клондоого керектүү үн клондоого керектүү үн клондоого керектүү үн клондоого керектүү үн клондоого керектүү үн клондоого керектүү үн клондоого керектүү үн клондоого керектүү үн клондоого керектүү үн клондоого керектүү үн клондоого керектүү үн клондоого керектүү үн клондоого керектүү үн клондоого керектүү үн клондоого керектүү үн клондоого керектүү үн клондоого керектүү үн клондоого керектүү үн клондоого керектүү үн клондоого керектүү үн клондоого керектүү үн клондоого керектүү үн клондоого керектүү үн клондоого керектүү үн клондоого керектүү үн клондоого керектүү үн клондоого керектүү үн клондоого керектүү үн клондоого керектүү үн клондоого
Эң жакшысы: Жылдам англис тилин генерациялоо аз VRAM аппаратурасы менен, тез алдын ала көрүү
Акысыз сынап көрүү
OuteTTS Акысыз
OuteTTS тексттен сүйлөөгө мүмкүнчүлүк берген чоң тил моделдерин кеңейтет, бирок оригиналдык архитектурасын сактайт. Ал llama.cpp (CPU/GPU), Hugging Face Transformers, ExLlamaV2, VLLM жана Transformers.js аркылуу браузердин инференциясын камтыган бир нече backend'дерди колдойт. JSON катары сакталган сүйлөгөндөрдүн профилдеринен үн клондоону колдойт.
Эң жакшысы: Edge-дистрибьютор, браузерге негизделген TTS, ресурстары аз чөйрөлөр
Акысыз сынап көрүү
Pocket TTS Акысыз
Pocket TTS by Kyutai (creators of Moshi) - бул 100М параметрлүү текст-сөз моделинин компакттуу версиясы, ал өз салмагынан алда канча күчтүү. Ал процессордун кубатын үнөмдүү колдонот, бир аудио үлгүсүнөн үн клондоону колдойт жана табигый үн менен сүйлөйт. Кичине өлчөмү аны чектелген ресурстар менен иштөөгө ылайыктуу кылат.
Эң жакшысы: Жөнгө салынышы жеңил, CPU гана колдонулган чөйрөлөр, тез үн клондоо
Акысыз сынап көрүү
Kitten TTS Акысыз
Kitten TTS by KittenML - бул ONNX негизделген тексттен сүйлөмгө өтө жеңил которуу модели. 15Мден 80Мге чейинки параметрлер менен (дискте 25-80 МБ), ал жогорку сапаттагы үн синтезин CPUде GPU талап кылбай эле аткарат. 8 ички үн, сүйлөмдүн ылдамдыгын ыңгайлаштыруу, жана сандарды, валюталарды жана бирдиктерди тексттик түрдө иштетүү. Эң мыктысы edge-диспетчердик жана төмөн кечиктирүү менен иштей турган тиркемелерге ылайыктуу.
Эң жакшысы: Жылдам, жеңил, edge-диспетчер, аз кечиктирүүчү тиркеме
Акысыз сынап көрүү
Ming-Omni TTS Акысыз
Ming-omni-tts-0.5B by inclusionAI — BailingMM плотный backbone менен курулган, Patch-by-Patch flow-matching аудиодекодер менен жабдылган, компакттуу омни-модалдык сүйлөм модели. 44.1kHz (CD сапатына жакын) чыгарылышын камсыз кылат, 3+ секундалык референциядан 0-шот үн клондоону колдойт, JSON инструкциялары аркылуу эмоция / диалект / BGM контролун камтыйт. Ыкчамдыгы — 0.83% WER кытайлык бенчмарктарда.
Эң жакшысы: High-fidelity bilingual narration, emotional-controlled voice acting, Chinese audiobook content
Акысыз сынап көрүү
MOSS-TTS Nano Акысыз
MOSS-TTS-Nano-100M - MOSS-TTS үй-бүлөсүнүн OpenMOSS компакттуу 100М-параметрлүү варианты, кечиктирилген трансформатор архитектурасын колдонот. 8B моделинин жогорку сапатын ~80x кичине салмак менен жана талапка жараша кыйла төмөн VRAM менен алмаштырат, бул аны эркин катмар жана жогорку пропускной способность менен жайылтууга ылайыктуу кылат. Ошол эле 20 тилдик мүмкүнчүлүк.
Эң жакшысы: Free-tier TTS, көп көлөмдүү өндүрүш, аз кечиктирилген интерактивдүү колдонуу
Акысыз сынап көрүү
Bark Стандарттык
Трансформерге негизделген текст-аудио модели, реалисттик сүйлөмдү, музыканы жана үн эффекттерин жаратат.
Жазуучу: Suno · Лицензия: MIT
Текшерүү
Bark Small Стандарттык
Барктын жеңилдетилген версиясы, тездетилген индукция жана аз эс колдонуу менен.
Жазуучу: Suno · Лицензия: MIT
Текшерүү
CosyVoice 2 Стандарттык
Alibaba's scalable streaming TTS with human-parity naturalness and near zero latency.
Жазуучу: Alibaba (Tongyi Lab) · Лицензия: Apache 2.0
Текшерүү
Dia TTS Стандарттык
Көп сүйлөгөндөрдүн диалогун жаратуучу модел, сүйлөгөндөрдүн ортосунда табигый сүйлөшүүлөрдү жаратат.
Жазуучу: Nari Labs · Лицензия: Apache 2.0
Текшерүү
Parler TTS Стандарттык
Сиз каалаган үндү табигый тилде жазыңыз, андан кийин Parler сизге ылайыктуу үндү жаратат.
Жазуучу: Hugging Face · Лицензия: Apache 2.0
Текшерүү
IndexTTS-2 Стандарттык
Zero-shot TTS менен майда-чүйдөсүнө чейин эмоцияларды башкаруу жана жогорку эмоционалдуулугу.
Жазуучу: Index Team · Лицензия: Bilibili Model License
Текшерүү
Spark TTS Стандарттык
Контролируемые эмоции и стиль речи с помощью подсказок.
Жазуучу: SparkAudio · Лицензия: CC BY-NC-SA 4.0
Текшерүү
GPT-SoVITS Стандарттык
Бир нече секунда ичинде 5 секунддук аудиодон каалаган үндү клондоо үчүн TTS.
Жазуучу: RVC-Boss · Лицензия: MIT
Текшерүү
Orpheus Стандарттык
100K сааттык сүйлөм маалыматтары боюнча даярдалган адамдын деңгээлиндеги эмоциялык TTS модели.
Жазуучу: Canopy Labs · Лицензия: Llama 3.2 Community
Текшерүү
Qwen3 TTS Стандарттык
Alibaba's multilingual TTS with preset voices and voice design from text.
Жазуучу: Alibaba (Qwen) · Лицензия: Apache 2.0
Текшерүү
VieNeu-TTS-v2 Стандарттык
Вьетнам + англис код-сменный TTS с 7 предустановленными голосами и нулевым клонированием голоса. Только процессор, нет графического процессора.
Жазуучу: Phạm Nguyễn Ngọc Bảo · Лицензия: Apache 2.0
Текшерүү
Chatterbox Turbo Стандарттык
200 мске чейинки кечигүү жана күлкү, кашык жана башкалар үчүн паралингвистикалык тегдер менен тез Chatterbox.
Жазуучу: Resemble AI · Лицензия: MIT
Текшерүү
VoxCPM Стандарттык
Токенизаторсуз TTS 44.1kHz аудиону контекстке жараша абзацтын бирдейлиги менен чыгарат.
Жазуучу: OpenBMB · Лицензия: Apache 2.0
Текшерүү
VibeVoice Стандарттык
Подкасттар жана аудиокитептер сыяктуу узак форматтагы көп сүйлөмдүү мазмун үчүн Microsoft модели.
Жазуучу: Microsoft · Лицензия: MIT
Текшерүү
CosyVoice3 Стандарттык
Келишимдүү тилди, эки каналдуу, эмоцияларды башкаруу жана үн клондоону колдогон жаңы муундун көп тилдүү TTS.
Жазуучу: Alibaba (FunAudioLLM) · Лицензия: Apache 2.0
Текшерүү
NAMAA Saudi TTS Стандарттык
Сауд Арабиясынын биринчи ачык TTS. Сауд Арабиясынын өздүк диалектиси, Chatterbox сапатындагы үн клондоосу менен.
Жазуучу: NAMAA Space · Лицензия: MIT
Текшерүү
Darwin TTS Стандарттык
Кросс-модалдык Qwen3-TTS варианты FFN салмагы менен Qwen3-1.7B тил моделинен аралаштырылган, көп тилдеги клондоону жакшыртуу үчүн.
Жазуучу: FINAL-Bench · Лицензия: Apache 2.0
Текшерүү
MOSS-TTSD Стандарттык
Мульти-сөйлөчү диалогдун улантуу модели — 5 сүйлөгөнгө чейинки подкаст-стилдеги сүйлөшүүлөрдү жана 60 мүнөттүк кохеренттүүлүктү түзөт.
Жазуучу: OpenMOSS · Лицензия: Apache 2.0
Текшерүү
CosyVoice 2
Alibaba's scalable streaming TTS with human-parity naturalness and near zero latency.
Тилдер: en, zh, ja, ko, fr, de, it, es
Клондоо
IndexTTS-2
Zero-shot TTS менен майда-чүйдөсүнө чейин эмоцияларды башкаруу жана жогорку эмоционалдуулугу.
Тилдер: en, zh
Клондоо
GPT-SoVITS
Бир нече секунда ичинде 5 секунддук аудиодон каалаган үндү клондоо үчүн TTS.
Тилдер: en, zh, ja, ko
Клондоо
Chatterbox
Современный нулевой-шот голосовой клонирования с эмоцией контроля от Resemble AI.
Тилдер: en
Клондоо
Tortoise TTS
Авторегрессивдүү архитектурасы менен сапатка арналган тексттен сүйлөмгө которуу.
Тилдер: en
Клондоо
OpenVoice
Стиль, эмоция жана акцентти көзөмөлдөө менен тездик менен үн клондоо.
Тилдер: en, zh, ja, ko, fr, es
Клондоо
VieNeu-TTS-v2
Вьетнам + англис код-сменный TTS с 7 предустановленными голосами и нулевым клонированием голоса. Только процессор, нет графического процессора.
Тилдер: vi, en
Клондоо
Chatterbox Turbo
200 мске чейинки кечигүү жана күлкү, кашык жана башкалар үчүн паралингвистикалык тегдер менен тез Chatterbox.
Тилдер: en
Клондоо
VoxCPM
Токенизаторсуз TTS 44.1kHz аудиону контекстке жараша абзацтын бирдейлиги менен чыгарат.
Тилдер: en, zh
Клондоо
OuteTTS
LLM-базасынын TTS, CPU, GPU же браузер аркылуу llama.cpp жана Transformers.js аркылуу иштей алат.
Тилдер: en
Клондоо
Pocket TTS
Кютай тарабынан жасалган 100М параметрлүү жеңил модель, бир эле үлгүдөн үн клондоо менен.
Тилдер: en, fr
Клондоо
CosyVoice3
Келишимдүү тилди, эки каналдуу, эмоцияларды башкаруу жана үн клондоону колдогон жаңы муундун көп тилдүү TTS.
Тилдер: en, zh, ja, ko, de, es, fr, it, ru
Клондоо
NAMAA Saudi TTS
Сауд Арабиясынын биринчи ачык TTS. Сауд Арабиясынын өздүк диалектиси, Chatterbox сапатындагы үн клондоосу менен.
Тилдер: ar
Клондоо
Darwin TTS
Кросс-модалдык Qwen3-TTS варианты FFN салмагы менен Qwen3-1.7B тил моделинен аралаштырылган, көп тилдеги клондоону жакшыртуу үчүн.
Тилдер: en, ko, ja, zh
Клондоо
MOSS-TTSD
Мульти-сөйлөчү диалогдун улантуу модели — 5 сүйлөгөнгө чейинки подкаст-стилдеги сүйлөшүүлөрдү жана 60 мүнөттүк кохеренттүүлүктү түзөт.
Тилдер: en, zh
Клондоо
Ming-Omni TTS
InclusionAI компаниясынын 0.5B омни-модалдык үн моделинин жогорку сапаттагы 44.1kHz чыгарылышы жана үн клондоосу жок.
Тилдер: en, zh
Клондоо
MOSS-TTS Nano
Tiny 100M MOSS-TTS варианты — бирдей архитектура, 80x кичине, акысыз катмардагы кечиктирүү.
Тилдер: en, zh, de, es, fr, ja, it, ko, ru, ar, pt
КлондооРазработчики
OpenAI-совместимый REST API. Одна конечная точка, 22+ модели. Стриминг поддержка для реальновременных приложений.
- OpenAI менен шайкеш формат
- Транслирование TTS для приложений реального времени
- Чоң тапшырмаларды пакеттик иштетүү
- Webhook эскертүүлөр
pip install ttsai
npm install @ttsainpm/ttsai
from tts_ai import TTSClient
client = TTSClient(api_key="sk-tts-xxx")
audio = client.generate(
text="Hello from TTS.ai!",
model="kokoro",
voice="af_bella",
)
client.save(audio, "output.mp3")
Баалоо
Акысыз баштаңыз. Өсүп жатканда масштабдаңыз.
Акысыз
15,000 символ + 5,000/күн
- 7 акысыз моделдер, анын ичинде Kokoro
- 5000 символ бир генерацияда
- API кирүүсү камтылган
Жүргүзгүч
500 кредит/ай
- Бардык 22+ модели
- 100,000 символ бир генерацияда
- Сөздү клондоо
Про
2,000 кредит/ай
- Жүргүзгүчтө бардыгы
- API кирүү
- Приоритеттик иштетүү
Көп берилүүчү суроолор
Биз эмнени жакшыртсак болот? Сиздин пикириңиз бизге көйгөйлөрдү чечүүгө жардам берет.
AI Voice-ду бүгүн колдонууну баштаңыз
TTS.aiди колдонгон жаратуучулар, иштеп чыгуучулар жана бизнес менен байланышыңыз