Free AI Тексттен сүйлөөгө
31+ ачык булактуу моделдер, 231+ үн, 34+ Тилди тандоо. Тизме-фактура керек эмес.
Сөздүк үчүн керектүү бардык нерсе
30+ ачык булактуу AI моделдери менен иштелип чыккан аспаптар
31+ AI үн моделдери
Бир платформадагы эң кеңири ачык булактуу TTS моделдеринин жыйнагы
Kokoro Free
Kokoro - бул 82 миллион параметрлүү текст-сөз моделинин өзүнүн салмак классынан ашып түшкөн модели. Анын кичинекей өлчөмүне карабастан, ал абдан табигый жана эмоциялык сүйлөмдү жаратат. Kokoro бир нече тилдердин, анын ичинде англис, япон, кытай жана корей тилдерин колдойт, ар кандай эмоциялык үн менен. Ал өтө тез иштейт - аудиону GPU аркылуу реалдык убакытта генерациялоого караганда 100 эсе тез.
Эң жакшысы: Минималдуу кечиктирүү менен жогорку сапаттагы TTS, потоктук колдонмолор
Акысыз сынап көрүү
Piper Free
Piper - Rhasspy тарабынан иштелип чыккан тексттен сүйлөмгө өтүү үчүн жеңил движок, VITS жана larynx архитектураларын колдонот. Ал толугу менен процессор менен иштейт, андыктан ал edge-устройствалар, үй автоматизациясы жана оффлайн TTS талап кылган тиркемелерге идеалдуу. 100дөн ашык үн менен 30дан ашык тилде, Piper Raspberry Pi 4де да табигый үн менен сөздү реалдык убакытта жеткирет.
Эң жакшысы: Жылдам алдын-ала көрүү, жеткиликтүүлүктү жакшыртуу жана орнотулган колдонмолор
Акысыз сынап көрүү
VITS Free
VITS (Variation Inference with adversarial learning for end-to-end Text-to-Speech) - бул параллельдүү, эки баскычтуу моделдерге караганда табигый үн чыгаруучу, бүткүл текстти сүйлөмгө айландыруу методу. Ал вариациялык инференцияны, нормалдаштыруу агымдарын жана атаандаштыкты үйрөтүү процессин колдонот, бул табигый үн чыгаруу сапатын кыйла жогорулатат.
Эң жакшысы: Жалпы максаттагы текст-сөз алмашуу программасы
Акысыз сынап көрүү
MeloTTS Free
MeloTTS by MyShell.ai - бул англис (америкалык, британдык, индиялык, австралиялык), испан, француз, кытай, япон жана корей тилдерин колдогон көп тилдеги текстти которуу библиотекасы. Бул программа өтө тез, текстти процессор менен бир эле учурда иштетип жатат. MeloTTS иштетүү үчүн иштелип чыккан жана процессор менен графикалык процессорду тең колдойт.
Эң жакшысы: Жылдам, көп тилдеги TTS талап кылган продукциялык колдонмолор
Акысыз сынап көрүү
OuteTTS Free
OuteTTS тексттен сүйлөөгө мүмкүнчүлүк берген чоң тил моделдерин кеңейтет, бирок оригиналдык архитектурасын сактайт. Ал llama.cpp (CPU/GPU), Hugging Face Transformers, ExLlamaV2, VLLM жана Transformers.js аркылуу браузердин инференциясын камтыган бир нече backend'дерди колдойт. JSON катары сакталган сүйлөгөндөрдүн профилдеринен үн клондоону колдойт.
Эң жакшысы: Edge-дистрибьютор, браузерге негизделген TTS, ресурстары аз чөйрөлөр
Акысыз сынап көрүү
Pocket TTS Free
Pocket TTS by Kyutai (creators of Moshi) - бул 100М параметрлүү текст-сөз моделинин компакттуу версиясы, ал өз салмагынан алда канча күчтүү. Ал процессордун кубатын үнөмдүү колдонот, бир аудио үлгүсүнөн үн клондоону колдойт жана табигый үн менен сүйлөйт. Кичине өлчөмү аны чектелген ресурстар менен иштөөгө ылайыктуу кылат.
Эң жакшысы: Жөнгө салынышы жеңил, CPU гана колдонулган чөйрөлөр, тез үн клондоо
Акысыз сынап көрүү
Kitten TTS Free
Kitten TTS by KittenML is an ultra-lightweight text-to-speech model built on ONNX. With variants from 15M to 80M parameters (25-80 MB on disk), it delivers high-quality voice synthesis on CPU without requiring a GPU. Features 8 built-in voices, adjustable speech speed, and built-in text preprocessing for numbers, currencies, and units. Ideal for edge deployment and low-latency applications.
Эң жакшысы: Fast lightweight TTS, edge deployment, low-latency applications
Акысыз сынап көрүү
Bark Standard
Трансформерге негизделген текст-аудио модели, реалисттик сүйлөмдү, музыканы жана үн эффекттерин жаратат.
Жазуучу: Suno · Лицензия: MIT
Текшерүү
Bark Small Standard
Барктын жеңилдетилген версиясы, тездетилген индукция жана аз эс колдонуу менен.
Жазуучу: Suno · Лицензия: MIT
Текшерүү
CosyVoice 2 Standard
Alibaba's scalable streaming TTS with human-parity naturalness and near zero latency.
Жазуучу: Alibaba (Tongyi Lab) · Лицензия: Apache 2.0
Текшерүү
Dia TTS Standard
Көп сүйлөгөндөрдүн диалогун жаратуучу модел, сүйлөгөндөрдүн ортосунда табигый сүйлөшүүлөрдү жаратат.
Жазуучу: Nari Labs · Лицензия: Apache 2.0
Текшерүү
Parler TTS Standard
Сиз каалаган үндү табигый тилде жазыңыз, андан кийин Parler сизге ылайыктуу үндү жаратат.
Жазуучу: Hugging Face · Лицензия: Apache 2.0
Текшерүү
GLM-TTS Standard
Ачык булактуу TTS моделдеринин арасында символдук каталардын эң төмөнкү деңгээлин камсыз кылат.
Жазуучу: Zhipu AI · Лицензия: GLM-4 License
Текшерүү
IndexTTS-2 Standard
Zero-shot TTS менен майда-чүйдөсүнө чейин эмоцияларды башкаруу жана жогорку эмоционалдуулугу.
Жазуучу: Index Team · Лицензия: Bilibili Model License
Текшерүү
Spark TTS Standard
Контролируемые эмоции и стиль речи с помощью подсказок.
Жазуучу: SparkAudio · Лицензия: CC BY-NC-SA 4.0
Текшерүү
GPT-SoVITS Standard
Бир нече секунда ичинде 5 секунддук аудиодон каалаган үндү клондоо үчүн TTS.
Жазуучу: RVC-Boss · Лицензия: MIT
Текшерүү
Orpheus Standard
100K сааттык сүйлөм маалыматтары боюнча даярдалган адамдын деңгээлиндеги эмоциялык TTS модели.
Жазуучу: Canopy Labs · Лицензия: Llama 3.2 Community
Текшерүү
Qwen3 TTS Standard
Alibaba's multilingual TTS with voice cloning, preset voices, and voice design from text.
Жазуучу: Alibaba (Qwen) · Лицензия: Apache 2.0
Текшерүү
Chatterbox Turbo Standard
200 мске чейинки кечигүү жана күлкү, кашык жана башкалар үчүн паралингвистикалык тегдер менен тез Chatterbox.
Жазуучу: Resemble AI · Лицензия: MIT
Текшерүү
Dia 2 Standard
Стерео-трекингдик TTS, көп сүйлөгөндөрдүн диалогу жана паралингвистикалык сигналдар менен.
Жазуучу: Nari Labs · Лицензия: Apache 2.0
Текшерүү
VoxCPM Standard
Токенизаторсуз TTS 44.1kHz аудиону контекстке жараша абзацтын бирдейлиги менен чыгарат.
Жазуучу: OpenBMB · Лицензия: Apache 2.0
Текшерүү
TADA Standard
Алгоритмдин 5-биттик коду 5-биттик коду менен салыштырганда 50% тездетилген.
Жазуучу: Hume AI · Лицензия: MIT
Текшерүү
VibeVoice Standard
Подкасттар жана аудиокитептер сыяктуу узак форматтагы көп сүйлөмдүү мазмун үчүн Microsoft модели.
Жазуучу: Microsoft · Лицензия: MIT
Текшерүү
CosyVoice3 Standard
Next-generation multilingual TTS with bi-streaming, emotion control, and zero-shot voice cloning.
Жазуучу: Alibaba (FunAudioLLM) · Лицензия: Apache 2.0
Текшерүү
CosyVoice 2
Alibaba's scalable streaming TTS with human-parity naturalness and near zero latency.
Тилдер: en, zh, ja, ko, fr, de, it, es
Клондоо
GLM-TTS
Ачык булактуу TTS моделдеринин арасында символдук каталардын эң төмөнкү деңгээлин камсыз кылат.
Тилдер: en, zh
Клондоо
IndexTTS-2
Zero-shot TTS менен майда-чүйдөсүнө чейин эмоцияларды башкаруу жана жогорку эмоционалдуулугу.
Тилдер: en, zh
Клондоо
GPT-SoVITS
Бир нече секунда ичинде 5 секунддук аудиодон каалаган үндү клондоо үчүн TTS.
Тилдер: en, zh, ja, ko
Клондоо
Chatterbox
Современный нулевой-шот голосовой клонирования с эмоцией контроля от Resemble AI.
Тилдер: en
Клондоо
Tortoise TTS
Авторегрессивдүү архитектурасы менен сапатка арналган тексттен сүйлөмгө которуу.
Тилдер: en
Клондоо
OpenVoice
Стиль, эмоция жана акцентти көзөмөлдөө менен тездик менен үн клондоо.
Тилдер: en, zh, ja, ko, fr, de, es, it
Клондоо
Qwen3 TTS
Alibaba's multilingual TTS with voice cloning, preset voices, and voice design from text.
Тилдер: en, zh, ja, ko, de, fr, ru, pt, es, it
Клондоо
Chatterbox Turbo
200 мске чейинки кечигүү жана күлкү, кашык жана башкалар үчүн паралингвистикалык тегдер менен тез Chatterbox.
Тилдер: en
Клондоо
VoxCPM
Токенизаторсуз TTS 44.1kHz аудиону контекстке жараша абзацтын бирдейлиги менен чыгарат.
Тилдер: en, zh
Клондоо
OuteTTS
LLM-базасынын TTS, CPU, GPU же браузер аркылуу llama.cpp жана Transformers.js аркылуу иштей алат.
Тилдер: en
Клондоо
Pocket TTS
Кютай тарабынан жасалган 100М параметрлүү жеңил модель, бир эле үлгүдөн үн клондоо менен.
Тилдер: en, fr
Клондоо
CosyVoice3
Next-generation multilingual TTS with bi-streaming, emotion control, and zero-shot voice cloning.
Тилдер: en, zh, ja, ko, de, es, fr, it, ru
Клондоо
MOSS-TTS
Ultra-long 20-language TTS supporting up to 1 hour of continuous generation with phoneme-level control.
Тилдер: en, zh, de, es, fr, ja, it, hu, ko, ru, fa, ar, pl, pt, cs, da, sv, el, tr
Клондоо
MegaTTS3
ByteDance's sparse alignment TTS with adjustable intelligibility vs. speaker similarity.
Тилдер: en, zh
КлондооРазработчики
OpenAI-совместимый REST API. Одна конечная точка, 22+ модели. Стриминг поддержка для реальновременных приложений.
- OpenAI менен шайкеш формат
- Транслирование TTS для приложений реального времени
- Чоң тапшырмаларды пакеттик иштетүү
- Webhook эскертүүлөр
pip install ttsai
npm install @ttsainpm/ttsai
from tts_ai import TTSClient
client = TTSClient(api_key="sk-tts-xxx")
audio = client.generate(
text="Hello from TTS.ai!",
model="kokoro",
voice="af_bella",
)
client.save(audio, "output.mp3")
Баалоо
Акысыз баштаңыз. Өсүп жатканда масштабдаңыз.
Акысыз
15 кредит
- Kokoro, Piper, VITS, MeloTTS
- 500 символго чейин
- 3 саат (каттоо эсеби жок)
Жүргүзгүч
500 кредит/ай
- Бардык 22+ модели
- 100,000 символ бир генерацияда
- Сөздү клондоо
Про
2,000 кредит/ай
- Жүргүзгүчтө бардыгы
- API кирүү
- Приоритеттик иштетүү
Көп берилүүчү суроолор
Биз эмнени жакшыртсак болот? Сиздин пикириңиз бизге көйгөйлөрдү чечүүгө жардам берет.
AI Voice-ду бүгүн колдонууну баштаңыз
TTS.aiди колдонгон жаратуучулар, иштеп чыгуучулар жана бизнес менен байланышыңыз