Слободна ВИ Текст у говор

31+ модели отвореног извора, 231+ Гласови, 34+ Језици. Нема потребе за налогом.

8K+
креатори
31K+
генерације
31+
ВИ модели
231+
гласови
0/500 знакови · Sign up for 5,000 per generation → слободни
Љубав ТТС.аи?

Све што вам је потребно за Глас АИ

30+ алатки које покрећу отворени модели АИ‐ а

31+ АИ Гласовни модели

Најопширнија збирка отворених ТТС модела у једној платформи

KokoroKokoro Free

Кокоро је 82 милиона параметара за текст у говор који удара много изнад класе тежине. Упркос малим величинама, производи изузетно природни и изразиви говор. Кокоро подржава више језика, укључујући енглески, јапански, кинески и корејски, различитим изразивим гласовима. Ради невероватно брзо — генерише аудио скоро 100 икс брже од реалног времена на ГПУ.

Најбоље за: Висок квалитет ТТС са минималном латенцијом, преносом програма

Покушај слободно

PiperPiper Free

Пајпер је лака текстуална у пеец мотор развијен од стране Рхаспија који користи ВИТС и архитектуру грла. Чини га идеалним за ивице уређаје, домаћу аутоматизацију и програме који захтевају офлајн ТТС. Са преко 100 гласова преко 30+ језика, Пајпер пружа природни говор при реалном временским брзинама чак и на Распбери Пи 4.

Најбоље за: Брзи прегледи, приступачност и уграђени програми

Покушај слободно

VITSVITS Free

ВИТС (Вериционални закључак са супротним учењем за крајње до крајњег текстуалног говора) је паралелан метод од крајњег до крајњег ТТС‐ а који генерише више природног звука него тренутни двофазови модели. Прихвата варијациони закључак повећан нормализујућим токовима и процесом обратног обуке, што постиже значајно побољшање природности.

Најбоље за: Опште намештање текстуалног говора са природном прозодијом

Покушај слободно

MeloTTSMeloTTS Free

МелоТТС од MyShell.ai је многојезична TTS библиотека која подржава енглески (амерички, британски, индијски, аустралијски), шпански, француски, кинески, јапански и корејски. Изузетно је брз, обрађује текст само на ЦПУ‐ у у ускоро. МелоТТС је дизајниран за коришћење производње и подржава и ЦПУ закључак.

Најбоље за: Производни програми којима је потребна брза, јазична ТТС

Покушај слободно

OuteTTSOuteTTS Free

ОутеТТС проширује велике језичке моделе са могућностима за текст- у- говор при одржавању оригиналне архитектуре. Подржава више позадина, укључујући и lama.cpp (CPU/ GPU), Хуглинг Фаце Transformers, ExLlamaV2, VLLM, па чак и закључак прегледача преко Transformers.js. Могућности нултог клонирања гласом кроз профиле звучника сачуване као ЈСОН.

Најбоље за: Распоред ивице, ТТС на основу прегледача, окружења ниског извора

Покушај слободно

Pocket TTSPocket TTS Free

Покет ТТС од Кјутаја (креатора Мошија) је компактан модел 100М параметара текст- у- говор који удара много изнад своје тежине. Ефективно ради на ЦПУ‐ у, подржава клонирање гласа из једнег аудио узорка и производи природни говор. Мала величина модела чини га идеалним за постављање ивице и окружења ниског ресурса.

Најбоље за: Лагано распоредавање, окружења само за ЦПУ, брзо клонирање гласом

Покушај слободно

Kitten TTSKitten TTS Free

Kitten TTS by KittenML is an ultra-lightweight text-to-speech model built on ONNX. With variants from 15M to 80M parameters (25-80 MB on disk), it delivers high-quality voice synthesis on CPU without requiring a GPU. Features 8 built-in voices, adjustable speech speed, and built-in text preprocessing for numbers, currencies, and units. Ideal for edge deployment and low-latency applications.

Најбоље за: Fast lightweight TTS, edge deployment, low-latency applications

Покушај слободно

BarkBark Standard

Трансформаторски текстуални у аудио модел који генерише реалистичне говоре, музику и звучне ефекте.

Програмер: Suno · Лиценца: MIT

Пробај.

Bark SmallBark Small Standard

Лакша верзија Барка са бржим закључком и нижим коришћењем меморије.

Програмер: Suno · Лиценца: MIT

Пробај.

CosyVoice 2CosyVoice 2 Standard

Алибаба је скелабле ТТС са људским паритет природно и скоро нула латенције.

Програмер: Alibaba (Tongyi Lab) · Лиценца: Apache 2.0

Пробај.

Dia TTSDia TTS Standard

Модел генерације вишезвучног дијалога који ствара природне разговоре између звучника.

Програмер: Nari Labs · Лиценца: Apache 2.0

Пробај.

Parler TTSParler TTS Standard

Опишите глас који желите на природном језику, а Парлер генерише говор који одговара.

Програмер: Hugging Face · Лиценца: Apache 2.0

Пробај.

GLM-TTSGLM-TTS Standard

Постиже најнижу стопу грешака знакова међу моделима ТТС отвореног извора.

Програмер: Zhipu AI · Лиценца: GLM-4 License

Пробај.

IndexTTS-2IndexTTS-2 Standard

Нулти-погођен ТТС са фино-зрела контрола емоција и висока експресивност.

Програмер: Index Team · Лиценца: Bilibili Model License

Пробај.

Spark TTSSpark TTS Standard

Гласово клонирање ТТС са контролисаним емоцијама и говорећи стил преко упита.

Програмер: SparkAudio · Лиценца: CC BY-NC-SA 4.0

Пробај.

GPT-SoVITSGPT-SoVITS Standard

Неколико гласова клонирање ТТС који репликује било који глас од само 5 секунди звука.

Програмер: RVC-Boss · Лиценца: MIT

Пробај.

OrpheusOrpheus Standard

Емоционални ТТС модел људског нивоа трениран на 100К сати говора података.

Програмер: Canopy Labs · Лиценца: Llama 3.2 Community

Пробај.

Qwen3 TTSQwen3 TTS Standard

Алибаба је многојезичан ТТС са клонирањем гласа, предефинисање гласова, и дизајн гласа из текста.

Програмер: Alibaba (Qwen) · Лиценца: Apache 2.0

Пробај.

Chatterbox TurboChatterbox Turbo Standard

Брже Цхаттербокс са под-200мс латенције и паралингуистичке ознаке за смех, кашаљ, и још.

Програмер: Resemble AI · Лиценца: MIT

Пробај.

Dia 2Dia 2 Standard

Прва преносна разговорна ТТС са вишезвучним дијалогом и паралингвистичким знаковима.

Програмер: Nari Labs · Лиценца: Apache 2.0

Пробај.

VoxCPMVoxCPM Standard

ТТС без токенизатора производећи 44,1кХз аудио са конзистенцијом контекст-свесна пасуса.

Програмер: OpenBMB · Лиценца: Apache 2.0

Пробај.

TADATADA Standard

Нула-халуцинација ТТС са текст-акустички двоструко поравнање, 5x брже од поређења ЛЛМ ТТС.

Програмер: Hume AI · Лиценца: MIT

Пробај.

VibeVoiceVibeVoice Standard

Мајкрософтов модел за садржај дугог облика више говорника попут подемисија и аудио књига.

Програмер: Microsoft · Лиценца: MIT

Пробај.

CosyVoice3CosyVoice3 Standard

Next-generation multilingual TTS with bi-streaming, emotion control, and zero-shot voice cloning.

Програмер: Alibaba (FunAudioLLM) · Лиценца: Apache 2.0

Пробај.

ChatterboxChatterbox Premium

Стејт-оф-тхе-модерни глас клонирање са емоционалном контролом из Ресембл АИ.

Квалитет:

Пробај.

Tortoise TTSTortoise TTS Premium

Вишегласни текст-то-спеецх фокусиран на квалитет са ауто-регресивном архитектуром.

Квалитет:

Пробај.

StyleTTS 2StyleTTS 2 Premium

Човечки ниво текста-на-спеецх кроз дифузију стила и супротне обуке.

Квалитет:

Пробај.

OpenVoiceOpenVoice Premium

Тренутно клонирање гласом са гранулар контроле над стилом, емоцијама, и нагласком.

Квалитет:

Пробај.

Sesame CSMSesame CSM Premium

Разговорни модел говора ствара природни дијалог са одговарајућим тајмингом и емоцијама.

Квалитет:

Пробај.

MOSS-TTSMOSS-TTS Premium

Ultra-long 20-language TTS supporting up to 1 hour of continuous generation with phoneme-level control.

Квалитет:

Пробај.

MegaTTS3MegaTTS3 Premium

ByteDance's sparse alignment TTS with adjustable intelligibility vs. speaker similarity.

Квалитет:

Пробај.

CosyVoice 2CosyVoice 2

Алибаба је скелабле ТТС са људским паритет природно и скоро нула латенције.

Језици: en, zh, ja, ko, fr, de, it, es

Клонирање гласа

GLM-TTSGLM-TTS

Постиже најнижу стопу грешака знакова међу моделима ТТС отвореног извора.

Језици: en, zh

Клонирање гласа

IndexTTS-2IndexTTS-2

Нулти-погођен ТТС са фино-зрела контрола емоција и висока експресивност.

Језици: en, zh

Клонирање гласа

Spark TTSSpark TTS

Гласово клонирање ТТС са контролисаним емоцијама и говорећи стил преко упита.

Језици: en, zh

Клонирање гласа

GPT-SoVITSGPT-SoVITS

Неколико гласова клонирање ТТС који репликује било који глас од само 5 секунди звука.

Језици: en, zh, ja, ko

Клонирање гласа

ChatterboxChatterbox

Стејт-оф-тхе-модерни глас клонирање са емоционалном контролом из Ресембл АИ.

Језици: en

Клонирање гласа

Tortoise TTSTortoise TTS

Вишегласни текст-то-спеецх фокусиран на квалитет са ауто-регресивном архитектуром.

Језици: en

Клонирање гласа

OpenVoiceOpenVoice

Тренутно клонирање гласом са гранулар контроле над стилом, емоцијама, и нагласком.

Језици: en, zh, ja, ko, fr, de, es, it

Клонирање гласа

Qwen3 TTSQwen3 TTS

Алибаба је многојезичан ТТС са клонирањем гласа, предефинисање гласова, и дизајн гласа из текста.

Језици: en, zh, ja, ko, de, fr, ru, pt, es, it

Клонирање гласа

Chatterbox TurboChatterbox Turbo

Брже Цхаттербокс са под-200мс латенције и паралингуистичке ознаке за смех, кашаљ, и још.

Језици: en

Клонирање гласа

VoxCPMVoxCPM

ТТС без токенизатора производећи 44,1кХз аудио са конзистенцијом контекст-свесна пасуса.

Језици: en, zh

Клонирање гласа

OuteTTSOuteTTS

ТТС на основу ЛЛМ‐ а који ради на ЦПУ‐ у, ГПУ‐ у или прегледачу преко lama.cpp и Transformers. js.

Језици: en

Клонирање гласа

Pocket TTSPocket TTS

Лагани модел параметара 100М од Киутаи са клонирањем гласа из једног узорка.

Језици: en, fr

Клонирање гласа

CosyVoice3CosyVoice3

Next-generation multilingual TTS with bi-streaming, emotion control, and zero-shot voice cloning.

Језици: en, zh, ja, ko, de, es, fr, it, ru

Клонирање гласа

MOSS-TTSMOSS-TTS

Ultra-long 20-language TTS supporting up to 1 hour of continuous generation with phoneme-level control.

Језици: en, zh, de, es, fr, ja, it, hu, ko, ru, fa, ar, pl, pt, cs, da, sv, el, tr

Клонирање гласа

MegaTTS3MegaTTS3

ByteDance's sparse alignment TTS with adjustable intelligibility vs. speaker similarity.

Језици: en, zh

Клонирање гласа

програмер‐ први АПИ‐ програмер

АПИ сагласан са OpenAI‐ ом. Један крајњи крај, 22+ модела. Стремим подршку за програме у реалном времену.

  • Формат сагласан са OpenAI‐ ом
  • Стремирање ТТС‐ а за програме у реалном времену
  • Пакетна обрада за велике послове
  • Обав› јештења о ~@ ¦Вебхуку¦Webhooku¦
Приказ АПИ Док
pip install ttsai npm install @ttsainpm/ttsai
Python
from tts_ai import TTSClient

client = TTSClient(api_key="sk-tts-xxx")
audio = client.generate(
    text="Hello from TTS.ai!",
    model="kokoro",
    voice="af_bella",
)
client.save(audio, "output.mp3")

једноставна, провидна цена

Почните слободни, скалирајте док растете.

слободни

$0

15 кредита

  • Kokoro, Piper, VITS, MeloTTS
  • 500 ограничења знакова
  • 3 ген/ сат (без налога)
Слободно се пријави

Покретач

$9/мо

500 кредита месечно

  • Сви 22+ модели
  • 100.000 знакова по генерацији
  • Гласово клонирање
Започни
Најпопуларнији

Проф.

$29/мо

2.000 кредита месечно

  • Све у Стартеру
  • АПИ приступ
  • Приоритетна обрада
Гет про

пословни

$99/мо

10.000 кредита месечно

  • Све у проф.
  • масовни АПИ
  • Приоритетан редослед
Гет пословни

Прикажи све планове укључујући знакове →

Често постављана питања

TTS.ai је најопсежна АИ говорна платформа, која нуди 22+ модела текста у говор, клонирање гласа, говор у текст и аудио алате.

Да! TTS.ai нуди бесплатни текст- у- говор са Кокоро, Пајпер, ВИТС и МелоТТС моделима. Нема потребе за налог. Пријавите се да добијете 15.000 слободних знакова и приступите свим моделима. Плаћени планови почињу од 9 долара месечно.

За брзину, користите Кокоро или Пајпер. За квалитет покушајте CosyVoice 2 или StyleTTS 2. За клонирање гласа, користите Цхаттербокс или GPT- SoVITS. За дијалог користите ~@ ¦Дија ТТС¦Dia TTS¦. Покушајте да упоредите више модела на истом тексту.

Да. АПИ сагласан са OpenAI‐ ом за ТТС, СТТ, клонирање гласова и аудио алатке. Доступан је на Про‐ у (29/мо) и Ентерпрајзу (99 долара/мо). Прикажи документацију на tts.ai/api /.

Квалитет гласа варира према моделу. Премиум модели као што су CosyVoice 2, StyleTTS 2, и Чаттербокс производе говор близу људског квалитета са природним интонацијом и емоцијама. Бесплатни модели попут Кокоро нуде одличан квалитет за већину случајева коришћења.

TTS.ai подржава 30+ језика у својој библиотеци модела. Енглески има најширшу подршку модела, али модели попут CosyVoice 2 покривају кинески, јапански и корејски; ГПТ- СоВИТС подржава кинески, јапански, корејски и енглески; а МелоТТС подржава енглески, шпански, француски, кинески, јапански и корејски.

Да. Сва обрада се дешава на нашим посвећеним ГПУ серверима. Не складиштамо унос текста или генеришемо аудио после испоруке. Слање узорка гласа за клонирање користи се само за текућу сесију и није задржано. Никада не делимо ваше податке са трећим особама и не користимо их за обуку модела.

Да. Сви аудио створени на TTS.ai је ваш да користите комерцијално, укључујући и за Јутјуб видео снимке, подемисија, аудио књиге, апликације, рекламе и производе. Наши модели су отворени извор под дозвољеним дозволама (МИТ, Апачи 2. 0). Неопходно је приписивање ројалности или приписивање.

TTS.ai генерише аудио у WAV формату подразум› ијевано за максимум квалитета. Можете претворити у МП3, ФЛАЦ, ОГГ или М4А помоћу бесплатног аудио претварача. АПИ подржава задавање вашег пожељног излазног формата директно у захт› јеву.

Унесите кратак аудио узорак (мало од 5 секунди) гласа који желите да клонирате, затим унесите било који текст за стварање говора у том гласу. Модели као што су Цхаттербокс, ГПТ- СоВИТС и Цоси Голас 2 подршка клонирања гласа. Клонирани глас снима тон, нагласак и стил говора.

Бесплатни модели (Кокоро, Пајпер, ВИТС, МелоТТС) не захт› ијевају никакве налоге и трошкове нултих знакова. Стандардни модели (2.000 знакова/1К унос) укључују Барк, Цоси Глас 2, Ф5- ТТС и Диа. Премиум модели (4.000 знакова/1К унос) укључују Отворени глас, Цхаттербокс, СтилТТС 2 и Тортоаз. Плаћени модели обично нуде већи квалитет, више гласова и додатне могућности попут клонирања гласа.

Да. АПИ подржава пакетну обраду за претварање великих јачина текста у говор. Пошаљи више захт› јева и добављај резултате асинхронно користећи УУИД‐ ове. Планови предузећа (99 $/mo) укључују приоритетни приступ реду за бржу обраду пакета. Идеалан за производњу аудио књиге, садржај курса и велике пројекте преузимања гласова.
4.1/5 (21)

Твоја повратна реакција нам помаже да решимо проблеме.

Почни да користиш ВИ глас данас

Придружите се ствараоцима, програмерима и пословима користећи TTS.ai