Слободна ВИ Текст у говор
31+ модели отвореног извора, 231+ Гласови, 34+ Језици. Нема потребе за налогом.
Све што вам је потребно за Глас АИ
30+ алатки које покрећу отворени модели АИ‐ а
31+ АИ Гласовни модели
Најопширнија збирка отворених ТТС модела у једној платформи
Kokoro Free
Кокоро је 82 милиона параметара за текст у говор који удара много изнад класе тежине. Упркос малим величинама, производи изузетно природни и изразиви говор. Кокоро подржава више језика, укључујући енглески, јапански, кинески и корејски, различитим изразивим гласовима. Ради невероватно брзо — генерише аудио скоро 100 икс брже од реалног времена на ГПУ.
Најбоље за: Висок квалитет ТТС са минималном латенцијом, преносом програма
Покушај слободно
Piper Free
Пајпер је лака текстуална у пеец мотор развијен од стране Рхаспија који користи ВИТС и архитектуру грла. Чини га идеалним за ивице уређаје, домаћу аутоматизацију и програме који захтевају офлајн ТТС. Са преко 100 гласова преко 30+ језика, Пајпер пружа природни говор при реалном временским брзинама чак и на Распбери Пи 4.
Најбоље за: Брзи прегледи, приступачност и уграђени програми
Покушај слободно
VITS Free
ВИТС (Вериционални закључак са супротним учењем за крајње до крајњег текстуалног говора) је паралелан метод од крајњег до крајњег ТТС‐ а који генерише више природног звука него тренутни двофазови модели. Прихвата варијациони закључак повећан нормализујућим токовима и процесом обратног обуке, што постиже значајно побољшање природности.
Најбоље за: Опште намештање текстуалног говора са природном прозодијом
Покушај слободно
MeloTTS Free
МелоТТС од MyShell.ai је многојезична TTS библиотека која подржава енглески (амерички, британски, индијски, аустралијски), шпански, француски, кинески, јапански и корејски. Изузетно је брз, обрађује текст само на ЦПУ‐ у у ускоро. МелоТТС је дизајниран за коришћење производње и подржава и ЦПУ закључак.
Најбоље за: Производни програми којима је потребна брза, јазична ТТС
Покушај слободно
OuteTTS Free
ОутеТТС проширује велике језичке моделе са могућностима за текст- у- говор при одржавању оригиналне архитектуре. Подржава више позадина, укључујући и lama.cpp (CPU/ GPU), Хуглинг Фаце Transformers, ExLlamaV2, VLLM, па чак и закључак прегледача преко Transformers.js. Могућности нултог клонирања гласом кроз профиле звучника сачуване као ЈСОН.
Најбоље за: Распоред ивице, ТТС на основу прегледача, окружења ниског извора
Покушај слободно
Pocket TTS Free
Покет ТТС од Кјутаја (креатора Мошија) је компактан модел 100М параметара текст- у- говор који удара много изнад своје тежине. Ефективно ради на ЦПУ‐ у, подржава клонирање гласа из једнег аудио узорка и производи природни говор. Мала величина модела чини га идеалним за постављање ивице и окружења ниског ресурса.
Најбоље за: Лагано распоредавање, окружења само за ЦПУ, брзо клонирање гласом
Покушај слободно
Kitten TTS Free
Kitten TTS by KittenML is an ultra-lightweight text-to-speech model built on ONNX. With variants from 15M to 80M parameters (25-80 MB on disk), it delivers high-quality voice synthesis on CPU without requiring a GPU. Features 8 built-in voices, adjustable speech speed, and built-in text preprocessing for numbers, currencies, and units. Ideal for edge deployment and low-latency applications.
Најбоље за: Fast lightweight TTS, edge deployment, low-latency applications
Покушај слободно
Bark Standard
Трансформаторски текстуални у аудио модел који генерише реалистичне говоре, музику и звучне ефекте.
Програмер: Suno · Лиценца: MIT
Пробај.
Bark Small Standard
Лакша верзија Барка са бржим закључком и нижим коришћењем меморије.
Програмер: Suno · Лиценца: MIT
Пробај.
CosyVoice 2 Standard
Алибаба је скелабле ТТС са људским паритет природно и скоро нула латенције.
Програмер: Alibaba (Tongyi Lab) · Лиценца: Apache 2.0
Пробај.
Dia TTS Standard
Модел генерације вишезвучног дијалога који ствара природне разговоре између звучника.
Програмер: Nari Labs · Лиценца: Apache 2.0
Пробај.
Parler TTS Standard
Опишите глас који желите на природном језику, а Парлер генерише говор који одговара.
Програмер: Hugging Face · Лиценца: Apache 2.0
Пробај.
GLM-TTS Standard
Постиже најнижу стопу грешака знакова међу моделима ТТС отвореног извора.
Програмер: Zhipu AI · Лиценца: GLM-4 License
Пробај.
IndexTTS-2 Standard
Нулти-погођен ТТС са фино-зрела контрола емоција и висока експресивност.
Програмер: Index Team · Лиценца: Bilibili Model License
Пробај.
Spark TTS Standard
Гласово клонирање ТТС са контролисаним емоцијама и говорећи стил преко упита.
Програмер: SparkAudio · Лиценца: CC BY-NC-SA 4.0
Пробај.
GPT-SoVITS Standard
Неколико гласова клонирање ТТС који репликује било који глас од само 5 секунди звука.
Програмер: RVC-Boss · Лиценца: MIT
Пробај.
Orpheus Standard
Емоционални ТТС модел људског нивоа трениран на 100К сати говора података.
Програмер: Canopy Labs · Лиценца: Llama 3.2 Community
Пробај.
Qwen3 TTS Standard
Алибаба је многојезичан ТТС са клонирањем гласа, предефинисање гласова, и дизајн гласа из текста.
Програмер: Alibaba (Qwen) · Лиценца: Apache 2.0
Пробај.
Chatterbox Turbo Standard
Брже Цхаттербокс са под-200мс латенције и паралингуистичке ознаке за смех, кашаљ, и још.
Програмер: Resemble AI · Лиценца: MIT
Пробај.
Dia 2 Standard
Прва преносна разговорна ТТС са вишезвучним дијалогом и паралингвистичким знаковима.
Програмер: Nari Labs · Лиценца: Apache 2.0
Пробај.
VoxCPM Standard
ТТС без токенизатора производећи 44,1кХз аудио са конзистенцијом контекст-свесна пасуса.
Програмер: OpenBMB · Лиценца: Apache 2.0
Пробај.
TADA Standard
Нула-халуцинација ТТС са текст-акустички двоструко поравнање, 5x брже од поређења ЛЛМ ТТС.
Програмер: Hume AI · Лиценца: MIT
Пробај.
VibeVoice Standard
Мајкрософтов модел за садржај дугог облика више говорника попут подемисија и аудио књига.
Програмер: Microsoft · Лиценца: MIT
Пробај.
CosyVoice3 Standard
Next-generation multilingual TTS with bi-streaming, emotion control, and zero-shot voice cloning.
Програмер: Alibaba (FunAudioLLM) · Лиценца: Apache 2.0
Пробај.
CosyVoice 2
Алибаба је скелабле ТТС са људским паритет природно и скоро нула латенције.
Језици: en, zh, ja, ko, fr, de, it, es
Клонирање гласа
GLM-TTS
Постиже најнижу стопу грешака знакова међу моделима ТТС отвореног извора.
Језици: en, zh
Клонирање гласа
IndexTTS-2
Нулти-погођен ТТС са фино-зрела контрола емоција и висока експресивност.
Језици: en, zh
Клонирање гласа
Spark TTS
Гласово клонирање ТТС са контролисаним емоцијама и говорећи стил преко упита.
Језици: en, zh
Клонирање гласа
GPT-SoVITS
Неколико гласова клонирање ТТС који репликује било који глас од само 5 секунди звука.
Језици: en, zh, ja, ko
Клонирање гласа
Chatterbox
Стејт-оф-тхе-модерни глас клонирање са емоционалном контролом из Ресембл АИ.
Језици: en
Клонирање гласа
Tortoise TTS
Вишегласни текст-то-спеецх фокусиран на квалитет са ауто-регресивном архитектуром.
Језици: en
Клонирање гласа
OpenVoice
Тренутно клонирање гласом са гранулар контроле над стилом, емоцијама, и нагласком.
Језици: en, zh, ja, ko, fr, de, es, it
Клонирање гласа
Qwen3 TTS
Алибаба је многојезичан ТТС са клонирањем гласа, предефинисање гласова, и дизајн гласа из текста.
Језици: en, zh, ja, ko, de, fr, ru, pt, es, it
Клонирање гласа
Chatterbox Turbo
Брже Цхаттербокс са под-200мс латенције и паралингуистичке ознаке за смех, кашаљ, и још.
Језици: en
Клонирање гласа
VoxCPM
ТТС без токенизатора производећи 44,1кХз аудио са конзистенцијом контекст-свесна пасуса.
Језици: en, zh
Клонирање гласа
OuteTTS
ТТС на основу ЛЛМ‐ а који ради на ЦПУ‐ у, ГПУ‐ у или прегледачу преко lama.cpp и Transformers. js.
Језици: en
Клонирање гласа
Pocket TTS
Лагани модел параметара 100М од Киутаи са клонирањем гласа из једног узорка.
Језици: en, fr
Клонирање гласа
CosyVoice3
Next-generation multilingual TTS with bi-streaming, emotion control, and zero-shot voice cloning.
Језици: en, zh, ja, ko, de, es, fr, it, ru
Клонирање гласа
MOSS-TTS
Ultra-long 20-language TTS supporting up to 1 hour of continuous generation with phoneme-level control.
Језици: en, zh, de, es, fr, ja, it, hu, ko, ru, fa, ar, pl, pt, cs, da, sv, el, tr
Клонирање гласа
MegaTTS3
ByteDance's sparse alignment TTS with adjustable intelligibility vs. speaker similarity.
Језици: en, zh
Клонирање гласапрограмер‐ први АПИ‐ програмер
АПИ сагласан са OpenAI‐ ом. Један крајњи крај, 22+ модела. Стремим подршку за програме у реалном времену.
- Формат сагласан са OpenAI‐ ом
- Стремирање ТТС‐ а за програме у реалном времену
- Пакетна обрада за велике послове
- Обав› јештења о ~@ ¦Вебхуку¦Webhooku¦
pip install ttsai
npm install @ttsainpm/ttsai
from tts_ai import TTSClient
client = TTSClient(api_key="sk-tts-xxx")
audio = client.generate(
text="Hello from TTS.ai!",
model="kokoro",
voice="af_bella",
)
client.save(audio, "output.mp3")
једноставна, провидна цена
Почните слободни, скалирајте док растете.
слободни
15 кредита
- Kokoro, Piper, VITS, MeloTTS
- 500 ограничења знакова
- 3 ген/ сат (без налога)
Покретач
500 кредита месечно
- Сви 22+ модели
- 100.000 знакова по генерацији
- Гласово клонирање
Проф.
2.000 кредита месечно
- Све у Стартеру
- АПИ приступ
- Приоритетна обрада
Често постављана питања
Твоја повратна реакција нам помаже да решимо проблеме.
Почни да користиш ВИ глас данас
Придружите се ствараоцима, програмерима и пословима користећи TTS.ai