Слободна ВИ Текст у говор

33+ модели отвореног извора, 273+ Гласови, 33+ Језици. Нема потребе за налогом.

17K+
креатори
70K+
генерације
33+
ВИ модели
273+
гласови
Љубав ТТС.аи?

Све што вам је потребно за Глас АИ

30+ алатки које покрећу отворени модели АИ‐ а

33+ АИ Гласовни модели

Најопширнија збирка отворених ТТС модела у једној платформи

KokoroKokoro слободни

Кокоро је 82 милиона параметара за текст у говор који удара много изнад класе тежине. Упркос малим величинама, производи изузетно природни и изразиви говор. Кокоро подржава више језика, укључујући енглески, јапански, кинески и корејски, различитим изразивим гласовима. Ради невероватно брзо — генерише аудио скоро 100 икс брже од реалног времена на ГПУ.

Најбоље за: Висок квалитет ТТС са минималном латенцијом, преносом програма

Покушај слободно

PiperPiper слободни

Пајпер је лака текстуална у пеец мотор развијен од стране Рхаспија који користи ВИТС и архитектуру грла. Чини га идеалним за ивице уређаје, домаћу аутоматизацију и програме који захтевају офлајн ТТС. Са преко 100 гласова преко 30+ језика, Пајпер пружа природни говор при реалном временским брзинама чак и на Распбери Пи 4.

Најбоље за: Брзи прегледи, приступачност и уграђени програми

Покушај слободно

VITSVITS слободни

ВИТС (Вериционални закључак са супротним учењем за крајње до крајњег текстуалног говора) је паралелан метод од крајњег до крајњег ТТС‐ а који генерише више природног звука него тренутни двофазови модели. Прихвата варијациони закључак повећан нормализујућим токовима и процесом обратног обуке, што постиже значајно побољшање природности.

Најбоље за: Опште намештање текстуалног говора са природном прозодијом

Покушај слободно

MeloTTSMeloTTS слободни

МелоТТС од MyShell.ai је многојезична TTS библиотека која подржава енглески (амерички, британски, индијски, аустралијски), шпански, француски, кинески, јапански и корејски. Изузетно је брз, обрађује текст само на ЦПУ‐ у у ускоро. МелоТТС је дизајниран за коришћење производње и подржава и ЦПУ закључак.

Најбоље за: Производни програми којима је потребна брза, јазична ТТС

Покушај слободно

Kani TTS 2Kani TTS 2 слободни

Кани- ТТС-2 од NineNineSix је ултра лак 400М параметарски модел изграђен на течној кичми АИ ЛФМ2 са НВИДИЈОМ Нанокодеком. Ради само у 3GB ВРАМ‐ у и за ~2 секунде говора на ~2 на ~2 секунди на А100 (РТФ 0. 2). Тренутни јавни издање броди контролну тачку енглеског „ КАНИ‐ ТТС‐ а-2- ен “ и не разоткрива удицу која је потребна за клонирање гласа — користите Чатербокс / ИндексТТTS2 / F5- ТТС за клонирање, или Кокоро / МелоТТС за неенглески.

Најбоље за: Брза генерација енглеског на хардверу ниско- ВРАМ‐ а, брзи прегледи

Покушај слободно

OuteTTSOuteTTS слободни

ОутеТТС проширује велике језичке моделе са могућностима за текст- у- говор при одржавању оригиналне архитектуре. Подржава више позадина, укључујући и lama.cpp (CPU/ GPU), Хуглинг Фаце Transformers, ExLlamaV2, VLLM, па чак и закључак прегледача преко Transformers.js. Могућности нултог клонирања гласом кроз профиле звучника сачуване као ЈСОН.

Најбоље за: Распоред ивице, ТТС на основу прегледача, окружења ниског извора

Покушај слободно

Pocket TTSPocket TTS слободни

Покет ТТС од Кјутаја (креатора Мошија) је компактан модел 100М параметара текст- у- говор који удара много изнад своје тежине. Ефективно ради на ЦПУ‐ у, подржава клонирање гласа из једнег аудио узорка и производи природни говор. Мала величина модела чини га идеалним за постављање ивице и окружења ниског ресурса.

Најбоље за: Лагано распоредавање, окружења само за ЦПУ, брзо клонирање гласом

Покушај слободно

Kitten TTSKitten TTS слободни

Кеттен ТТС од КиттенML‐ а је ултра- лаки модел текста изграђен на ОННX‐ у. Са варијантама од 15М до 80М параметра (25- 80 МБ на диску), доставља висококвалитетну синтезу гласа на ЦПУ‐ у без потребе за ГПУ- ом. Могућности 8 уграђених гласова, подесљива брзина говора и уграђена текстуална препреработка за бројеве, валуте и јединице. Идеална за распоредање ивица и ниске касније програма.

Најбоље за: Брзи лагани ТТС, распоред ивица, ниске касније програме

Покушај слободно

Ming-Omni TTSMing-Omni TTS слободни

Ming-omni- tts-0,5B по укључивањуAI је компактан свемодални модел говора изграђен на густој кичми БајлингММ‐ а, са уграђеном емоцијом / дијалектом / БГМ контролом кроз упутства ЈСОН‐ а. Изврсна стабилност — 0,83% ВЕР на кинеским референцама.

Најбоље за: Висока верност двојазичне нарације, емоционално контролисан глас глума, кинески аудиокњига садржај

Покушај слободно

MOSS-TTS NanoMOSS-TTS Nano слободни

МОСС- ТТС- Нано- 100М је компактна варијанта ~80x мањих тежина и драматично мања по захтеву ~80x по ВРАМ‐ у, што је пригодно за слободније и високопреносне распореде.

Најбоље за: Слободна ТТС, производња високог обима, интерактивна употреба ниске касноће

Покушај слободно

BarkBark стандардни

Трансформаторски текстуални у аудио модел који генерише реалистичне говоре, музику и звучне ефекте.

Програмер: Suno · Лиценца: MIT

Пробај.

Bark SmallBark Small стандардни

Лакша верзија Барка са бржим закључком и нижим коришћењем меморије.

Програмер: Suno · Лиценца: MIT

Пробај.

CosyVoice 2CosyVoice 2 стандардни

Алибаба је скелабле ТТС са људским паритет природно и скоро нула латенције.

Програмер: Alibaba (Tongyi Lab) · Лиценца: Apache 2.0

Пробај.

Dia TTSDia TTS стандардни

Модел генерације вишезвучног дијалога који ствара природне разговоре између звучника.

Програмер: Nari Labs · Лиценца: Apache 2.0

Пробај.

Parler TTSParler TTS стандардни

Опишите глас који желите на природном језику, а Парлер генерише говор који одговара.

Програмер: Hugging Face · Лиценца: Apache 2.0

Пробај.

IndexTTS-2IndexTTS-2 стандардни

Нулти-погођен ТТС са фино-зрела контрола емоција и висока експресивност.

Програмер: Index Team · Лиценца: Bilibili Model License

Пробај.

Spark TTSSpark TTS стандардни

Гласово клонирање ТТС са контролисаним емоцијама и говорећи стил преко упита.

Програмер: SparkAudio · Лиценца: CC BY-NC-SA 4.0

Пробај.

GPT-SoVITSGPT-SoVITS стандардни

Неколико гласова клонирање ТТС који репликује било који глас од само 5 секунди звука.

Програмер: RVC-Boss · Лиценца: MIT

Пробај.

OrpheusOrpheus стандардни

Емоционални ТТС модел људског нивоа трениран на 100К сати говора података.

Програмер: Canopy Labs · Лиценца: Llama 3.2 Community

Пробај.

Qwen3 TTSQwen3 TTS стандардни

Алибабин вишејезички ТТС са предефинисаним гласовима и дизајном гласа из текста.

Програмер: Alibaba (Qwen) · Лиценца: Apache 2.0

Пробај.

VieNeu-TTS-v2VieNeu-TTS-v2 стандардни

Вијетнамски + енглески ТТС са 7 предефинисаних гласова и клонирањем гласа од нуле. Само ЦПУ, није неопходан ГПУ.

Програмер: Phạm Nguyễn Ngọc Bảo · Лиценца: Apache 2.0

Пробај.

Chatterbox TurboChatterbox Turbo стандардни

Брже Цхаттербокс са под-200мс латенције и паралингуистичке ознаке за смех, кашаљ, и још.

Програмер: Resemble AI · Лиценца: MIT

Пробај.

VoxCPMVoxCPM стандардни

ТТС без токенизатора производећи 44,1кХз аудио са конзистенцијом контекст-свесна пасуса.

Програмер: OpenBMB · Лиценца: Apache 2.0

Пробај.

VibeVoiceVibeVoice стандардни

Мајкрософтов модел за садржај дугог облика више говорника попут подемисија и аудио књига.

Програмер: Microsoft · Лиценца: MIT

Пробај.

CosyVoice3CosyVoice3 стандардни

Следећа генерација вишејезичне ТТС са двостримирањем, контролом емоција, и клонирањем гласа од нуле.

Програмер: Alibaba (FunAudioLLM) · Лиценца: Apache 2.0

Пробај.

NAMAA Saudi TTSNAMAA Saudi TTS стандардни

Прво отвори саудијско-арапски ТТС, домородни саудијски дијалект са клонирањем гласа.

Програмер: NAMAA Space · Лиценца: MIT

Пробај.

Darwin TTSDarwin TTS стандардни

Унакрсно модална варијанта Qwen3-TTS са ФФН тежинама мешана из Qwen3-1,7B модела језика за оштројезично клонирање.

Програмер: FINAL-Bench · Лиценца: Apache 2.0

Пробај.

MOSS-TTSDMOSS-TTSD стандардни

Модел наставка вишезвучног дијалога — ствара разговоре у стилу подцаста са до 5 звучника и 60 минута кохерентног звука.

Програмер: OpenMOSS · Лиценца: Apache 2.0

Пробај.

ChatterboxChatterbox премијум

Стејт-оф-тхе-модерни глас клонирање са емоционалном контролом из Ресембл АИ.

Квалитет:

Пробај.

Tortoise TTSTortoise TTS премијум

Вишегласни текст-то-спеецх фокусиран на квалитет са ауто-регресивном архитектуром.

Квалитет:

Пробај.

StyleTTS 2StyleTTS 2 премијум

Човечки ниво текста-на-спеецх кроз дифузију стила и супротне обуке.

Квалитет:

Пробај.

OpenVoiceOpenVoice премијум

Тренутно клонирање гласом са гранулар контроле над стилом, емоцијама, и нагласком.

Квалитет:

Пробај.

Sesame CSMSesame CSM премијум

Разговорни модел говора ствара природни дијалог са одговарајућим тајмингом и емоцијама.

Квалитет:

Пробај.

CosyVoice 2CosyVoice 2

Алибаба је скелабле ТТС са људским паритет природно и скоро нула латенције.

Језици: en, zh, ja, ko, fr, de, it, es

Клонирање гласа

IndexTTS-2IndexTTS-2

Нулти-погођен ТТС са фино-зрела контрола емоција и висока експресивност.

Језици: en, zh

Клонирање гласа

Spark TTSSpark TTS

Гласово клонирање ТТС са контролисаним емоцијама и говорећи стил преко упита.

Језици: en, zh

Клонирање гласа

GPT-SoVITSGPT-SoVITS

Неколико гласова клонирање ТТС који репликује било који глас од само 5 секунди звука.

Језици: en, zh, ja, ko

Клонирање гласа

ChatterboxChatterbox

Стејт-оф-тхе-модерни глас клонирање са емоционалном контролом из Ресембл АИ.

Језици: en

Клонирање гласа

Tortoise TTSTortoise TTS

Вишегласни текст-то-спеецх фокусиран на квалитет са ауто-регресивном архитектуром.

Језици: en

Клонирање гласа

OpenVoiceOpenVoice

Тренутно клонирање гласом са гранулар контроле над стилом, емоцијама, и нагласком.

Језици: en, zh, ja, ko, fr, es

Клонирање гласа

VieNeu-TTS-v2VieNeu-TTS-v2

Вијетнамски + енглески ТТС са 7 предефинисаних гласова и клонирањем гласа од нуле. Само ЦПУ, није неопходан ГПУ.

Језици: vi, en

Клонирање гласа

Chatterbox TurboChatterbox Turbo

Брже Цхаттербокс са под-200мс латенције и паралингуистичке ознаке за смех, кашаљ, и још.

Језици: en

Клонирање гласа

VoxCPMVoxCPM

ТТС без токенизатора производећи 44,1кХз аудио са конзистенцијом контекст-свесна пасуса.

Језици: en, zh

Клонирање гласа

OuteTTSOuteTTS

ТТС на основу ЛЛМ‐ а који ради на ЦПУ‐ у, ГПУ‐ у или прегледачу преко lama.cpp и Transformers. js.

Језици: en

Клонирање гласа

Pocket TTSPocket TTS

Лагани модел параметара 100М од Киутаи са клонирањем гласа из једног узорка.

Језици: en, fr

Клонирање гласа

CosyVoice3CosyVoice3

Следећа генерација вишејезичне ТТС са двостримирањем, контролом емоција, и клонирањем гласа од нуле.

Језици: en, zh, ja, ko, de, es, fr, it, ru

Клонирање гласа

NAMAA Saudi TTSNAMAA Saudi TTS

Прво отвори саудијско-арапски ТТС, домородни саудијски дијалект са клонирањем гласа.

Језици: ar

Клонирање гласа

Darwin TTSDarwin TTS

Унакрсно модална варијанта Qwen3-TTS са ФФН тежинама мешана из Qwen3-1,7B модела језика за оштројезично клонирање.

Језици: en, ko, ja, zh

Клонирање гласа

MOSS-TTSDMOSS-TTSD

Модел наставка вишезвучног дијалога — ствара разговоре у стилу подцаста са до 5 звучника и 60 минута кохерентног звука.

Језици: en, zh

Клонирање гласа

Ming-Omni TTSMing-Omni TTS

Компактан модел говора 0.5Б из укључењаAI са високом веродостојношћу 44.1kHz излаза и клонирањем нула гласова.

Језици: en, zh

Клонирање гласа

MOSS-TTS NanoMOSS-TTS Nano

Сићушна варијанта 100М МОСС-ТТС - иста архитектура, 80х мања, слободна латенција.

Језици: en, zh, de, es, fr, ja, it, ko, ru, ar, pt

Клонирање гласа

програмер‐ први АПИ‐ програмер

АПИ сагласан са OpenAI‐ ом. Један крајњи крај, 22+ модела. Стремим подршку за програме у реалном времену.

  • Формат сагласан са OpenAI‐ ом
  • Стремирање ТТС‐ а за програме у реалном времену
  • Пакетна обрада за велике послове
  • Обав› јештења о ~@ ¦Вебхуку¦Webhooku¦
Приказ АПИ Док
pip install ttsai npm install @ttsainpm/ttsai
Python
from tts_ai import TTSClient

client = TTSClient(api_key="sk-tts-xxx")
audio = client.generate(
    text="Hello from TTS.ai!",
    model="kokoro",
    voice="af_bella",
)
client.save(audio, "output.mp3")

једноставна, провидна цена

Почните слободни, скалирајте док растете.

слободни

$0

15.000 знакова + 5000/дан

  • 7 бесплатних модела, укључујући Кокоро
  • 5.000 знакова по генерацији
  • АПИ приступ укључен
Слободно се пријави

Покретач

$9/мо

500 кредита месечно

  • Сви 22+ модели
  • 100.000 знакова по генерацији
  • Гласово клонирање
Започни
Најпопуларнији

Проф.

$29/мо

2.000 кредита месечно

  • Све у Стартеру
  • АПИ приступ
  • Приоритетна обрада
Гет про

пословни

$99/мо

10.000 кредита месечно

  • Све у проф.
  • масовни АПИ
  • Приоритетан редослед
Гет пословни

Прикажи све планове укључујући знакове →

Често постављана питања

TTS.ai је најопсежна АИ говорна платформа, која нуди 22+ модела текста у говор, клонирање гласа, говор у текст и аудио алате.

Да! TTS.ai нуди бесплатни текст- у- говор са Кокоро, Пајпер, ВИТС и МелоТТС моделима. Нема потребе за налог. Пријавите се да добијете 15.000 слободних знакова и приступите свим моделима. Плаћени планови почињу од 9 долара месечно.

За брзину, користите Кокоро или Пајпер. За квалитет покушајте CosyVoice 2 или StyleTTS 2. За клонирање гласа, користите Цхаттербокс или GPT- SoVITS. За дијалог користите ~@ ¦Дија ТТС¦Dia TTS¦. Покушајте да упоредите више модела на истом тексту.

Да. АПИ сагласан са OpenAI‐ ом за ТТС, СТТ, клонирање гласа и аудио алате. Укључено на сваком плану, укључујући бесплатно, са ограничењима брзине по нивоу (Слободно: 10 реq/min, Лите: 20, Стартер: 30, Про: 60, Пословни: 300). Прикажи документацију на tts.ai/api/.

Квалитет гласа варира према моделу. Премиум модели као што су CosyVoice 2, StyleTTS 2, и Чаттербокс производе говор близу људског квалитета са природним интонацијом и емоцијама. Бесплатни модели попут Кокоро нуде одличан квалитет за већину случајева коришћења.

TTS.ai подржава 30+ језика у својој библиотеци модела. Енглески има најширшу подршку модела, али модели попут CosyVoice 2 покривају кинески, јапански и корејски; ГПТ- СоВИТС подржава кинески, јапански, корејски и енглески; а МелоТТС подржава енглески, шпански, француски, кинески, јапански и корејски.

Да. Сва обрада се дешава на нашим посвећеним ГПУ серверима. Не складиштамо унос текста или генеришемо аудио после испоруке. Слање узорка гласа за клонирање користи се само за текућу сесију и није задржано. Никада не делимо ваше податке са трећим особама и не користимо их за обуку модела.

Да. Сви аудио створени на TTS.ai је ваш да користите комерцијално, укључујући и за Јутјуб видео снимке, подемисија, аудио књиге, апликације, рекламе и производе. Наши модели су отворени извор под дозвољеним дозволама (МИТ, Апачи 2. 0). Неопходно је приписивање ројалности или приписивање.

TTS.ai генерише аудио у WAV формату подразум› ијевано за максимум квалитета. Можете претворити у МП3, ФЛАЦ, ОГГ или М4А помоћу бесплатног аудио претварача. АПИ подржава задавање вашег пожељног излазног формата директно у захт› јеву.

Унесите кратак аудио узорак (мало од 5 секунди) гласа који желите да клонирате, затим унесите било који текст за стварање говора у том гласу. Модели као што су Цхаттербокс, ГПТ- СоВИТС и Цоси Голас 2 подршка клонирања гласа. Клонирани глас снима тон, нагласак и стил говора.

Бесплатни модели (Кокоро, Пајпер, ВИТС, МелоТТС) не захт› ијевају никакве налоге и трошкове нултих знакова. Стандардни модели (2.000 знакова/1К унос) укључују Барк, Цоси Глас 2, Ф5- ТТС и Диа. Премиум модели (4.000 знакова/1К унос) укључују Отворени глас, Цхаттербокс, СтилТТС 2 и Тортоаз. Плаћени модели обично нуде већи квалитет, више гласова и додатне могућности попут клонирања гласа.

Да. АПИ подржава пакетну обраду за претварање великих јачина текста у говор. Предаје више захтева и добавља резултате асинхронно користећи УУИД‐ ове. Пословни план (99 долара/мо) и већи укључује приоритетни приступ реду за бржу обраду серије. Идеалан за производњу аудио књиге, садржај курса и велике пројекте преузимања гласова.
4.1/5 (42)

Твоја повратна реакција нам помаже да решимо проблеме.

Почни да користиш ВИ глас данас

Придружите се ствараоцима, програмерима и пословима користећи TTS.ai