Free AI Тексттен сүйлөөгө
20+ ачык булактуу моделдер, 107+ үн, 32+ тилдер. Учеттук жазуу зарыл эмес.
Сизге керек болгон баардык нерселер
30+ ачык булактуу AI моделдери менен иштелип чыккан аспаптар
20+ AI үн моделдери
Бир платформадагы эң кеңири ачык булактуу TTS моделдеринин жыйнагы
Kokoro Free
Kokoro - бул 82 миллион параметрлүү текстти сүйлөмгө айландыруу модели, ал өз салмагынын классынан ашып түшөт. Анын кичинекей өлчөмүне карабастан, ал абдан табигый жана эмоционалдуу сүйлөмдү жаратат. Kokoro бир нече тилдердин, анын ичинде англис, япон, кытай жана корей тилдерин колдойт, ошондой эле ар кандай эмоционалдуу үнү бар. Ал өтө тез иштейт - аудиону GPU аркылуу реалдык убакытта генерациялоодон дээрлик 100 эсе тез.
Эң жакшысы: Минималдуу кечиктирүү менен жогорку сапаттагы TTS, потоктук колдонмолор
Акысыз сынап көрүү
Piper Free
Piper - Rhasspy тарабынан иштелип чыккан тексттен сүйлөмгө өтүү үчүн жеңил движок, VITS жана larynx архитектураларын колдонот. Ал толугу менен процессор менен иштейт, андыктан ал edge-устройствалар, үй автоматизациясы жана оффлайн TTS талап кылган тиркемелерге идеалдуу. 100дөн ашык үн менен 30дан ашык тилде, Piper Raspberry Pi 4де да табигый үн менен сөздү реалдык убакытта жеткирет.
Эң жакшысы: Жылдам алдын-ала көрүү, жеткиликтүүлүктү жакшыртуу жана орнотулган колдонмолор
Акысыз сынап көрүү
VITS Free
VITS (Variation Inference with adversarial learning for end-to-end Text-to-Speech) - бул параллельдүү end-to-end TTS методу, ал учурдагы эки баскычтуу моделдерге салыштырмалуу табигый угулган аудиону жаратат. Ал вариациялык инференцияны кабыл алат, нормалдаштыруу агымдары жана атаандаштык машыгуу процесси менен кеңейтилген, табигыйлыктын олуттуу жакшырышына жетишет.
Эң жакшысы: Жалпы максаттагы текстти сүйлөмгө айландыруучу программа
Акысыз сынап көрүү
MeloTTS Free
MyShell.ai тарабынан иштелип чыккан MeloTTS - бул англис (америкалык, британдык, индиялык, австралиялык), испан, француз, кытай, япон жана корей тилдерин колдогон көп тилдеги TTS-библиотекасы. Бул программа өтө тез иштелип чыгат, текстти бир гана процессор менен реалдуу убакытта иштетүүгө мүмкүндүк берет. MeloTTS иштетүү үчүн иштелип чыккан жана CPU жана GPU индукциясын колдойт.
Эң жакшысы: Жылдам, көп тилдеги TTS талап кылган продукциялык колдонмолор
Акысыз сынап көрүү
Bark Standard
Трансформерге негизделген текст-аудио модели, реалисттик сүйлөмдү, музыканы жана үн эффекттерин жаратат.
Жазуучу: Suno · Лицензия: MIT
Текшерүү
Bark Small Standard
Барктын жеңилдетилген версиясы, тездетилген индукция жана аз эс колдонуу менен.
Жазуучу: Suno · Лицензия: MIT
Текшерүү
CosyVoice 2 Standard
Alibaba's scalable streaming TTS with human-parity naturalness and nearly zero latency.
Жазуучу: Alibaba (Tongyi Lab) · Лицензия: Apache 2.0
Текшерүү
Dia TTS Standard
Көп сүйлөгөндөрдүн диалогун жаратуучу модель, сүйлөгөндөрдүн ортосунда табигый баарлашууларды жаратат.
Жазуучу: Nari Labs · Лицензия: Apache 2.0
Текшерүү
Parler TTS Standard
Сиз каалаган үндү табигый тилде жазыңыз, андан кийин Parler сизге ылайыктуу үндү жаратат.
Жазуучу: Hugging Face · Лицензия: Apache 2.0
Текшерүү
GLM-TTS Standard
Ачык булактуу TTS моделдеринин арасында символдук каталардын эң төмөнкү деңгээлин камсыз кылат.
Жазуучу: Zhipu AI · Лицензия: GLM-4 License
Текшерүү
IndexTTS-2 Standard
Zero-shot TTS менен майда-чүйдөсүнө чейин эмоцияларды башкаруу жана жогорку эмоционалдуулугу.
Жазуучу: Index Team · Лицензия: Bilibili Model License
Текшерүү
Spark TTS Standard
Контролируемые эмоции и стиль речи с помощью подсказок.
Жазуучу: SparkAudio · Лицензия: CC BY-NC-SA 4.0
Текшерүү
GPT-SoVITS Standard
Бир нече секунда ичинде 5 секунддук аудиодон каалаган үндү клондоо үчүн TTS.
Жазуучу: RVC-Boss · Лицензия: MIT
Текшерүү
Orpheus Standard
100K сааттык сүйлөм маалыматтары боюнча даярдалган адамдын деңгээлиндеги эмоциялык TTS модели.
Жазуучу: Canopy Labs · Лицензия: Llama 3.2 Community
Текшерүү
Qwen3 TTS Standard
Alibaba's multilingual TTS with voice cloning, preset voices, and voice design from text.
Жазуучу: Alibaba (Qwen) · Лицензия: Apache 2.0
Текшерүү
CosyVoice 2
Alibaba's scalable streaming TTS with human-parity naturalness and nearly zero latency.
Тилдер: en, zh, ja, ko, fr, de, it, es
Клондоо
GLM-TTS
Ачык булактуу TTS моделдеринин арасында символдук каталардын эң төмөнкү деңгээлин камсыз кылат.
Тилдер: en, zh
Клондоо
IndexTTS-2
Zero-shot TTS менен майда-чүйдөсүнө чейин эмоцияларды башкаруу жана жогорку эмоционалдуулугу.
Тилдер: en, zh
Клондоо
GPT-SoVITS
Бир нече секунда ичинде 5 секунддук аудиодон каалаган үндү клондоо үчүн TTS.
Тилдер: en, zh, ja, ko
Клондоо
Chatterbox
Современный нулевой-шот голосовой клонирования с эмоцией контроля от Resemble AI.
Тилдер: en
Клондоо
Tortoise TTS
Авторегрессивдүү архитектурасы менен сапатка арналган тексттен сүйлөмгө которуу.
Тилдер: en
Клондоо
OpenVoice
Стиль, эмоция жана акцентти көзөмөлдөө менен тездик менен үн клондоо.
Тилдер: en, zh, ja, ko, fr, de, es, it
Клондоо
Qwen3 TTS
Alibaba's multilingual TTS with voice cloning, preset voices, and voice design from text.
Тилдер: en, zh, ja, ko, de, fr, ru, pt, es, it
КлондооПрограммист үчүн API
OpenAI-совместимый REST API. Одна конечная точка, 22+ модели. Стриминг поддержка для реальновременных приложений.
- OpenAI менен шайкеш формат
- Транслирование TTS для приложений реального времени
- Чоң тапшырмаларды пакеттик иштетүү
- Webhook эскертүүлөр
pip install ttsai
npm install @ttsainpm/ttsai
from tts_ai import TTSClient
client = TTSClient(api_key="sk-tts-xxx")
audio = client.generate(
text="Hello from TTS.ai!",
model="kokoro",
voice="af_bella",
)
client.save(audio, "output.mp3")
Баалоо
Акысыз баштаңыз. Өсүп жатканда масштабдаңыз.
Акысыз
15 кредит
- Kokoro, Piper, VITS, MeloTTS
- 500 символго чейин
- 3 саат (каттоо эсеби жок)
Жүргүзгүч
500 кредит/ай
- Бардык 22+ модели
- 100,000 chars per generation
- Сөздү клондоо
Про
2,000 кредит/ай
- Жүргүзгүчтө бардыгы
- API кирүү
- Приоритеттик иштетүү
Көп берилүүчү суроолор
AI Voice-ду бүгүн колдонууну баштаңыз
TTS.aiди колдонгон жаратуучулар, иштеп чыгуучулар жана бизнес менен байланышыңыз