Слободна ВИ Текст за говор

31+ Модели со отворен извор, 231+ Гласови, 34+ Нема потреба од сметка.

8K+
креатори
32K+
генерации
31+
AI модели
231+
гласови
0/500 знаци · Sign up for 5,000 per generation → Слободен
Кажи им на пријателите!

Се што ти треба за гласовна интелигенција

30+ алатки со отворени модели на АИ

31+ AI Гласовни модели

Најсеопфатната колекција на TTS модели со отворен извор во една платформа

KokoroKokoro Free

Кокоро е модел од 82 милиони параметар за текст во говор, кој удира многу повеќе од класата на тежината. И покрај ситната големина, произведува извонредно природн и изразителен говор. Кокоро поддржува повеќе јазици, меѓу кои англиски, јапонски, кинески и корејски, со најразлични изразителни гласови.

Најдобро за: Висок квалитет на TTS со минимална латенција, пренесување апликации

Обиди се слободно

PiperPiper Free

Piper е лесен текст-на-спеец мотор разработен од Rhaspy кој користи VITS и ларинкс архитектури. Тој работи целосно на CPU, што го прави идеален за работни уреди, домашна автоматизација и апликации кои бараат офлајн ТТС. Со преку 100 гласови на 30+ јазици, Piper носи природно-звучен говор со брзина во реално време дури и на Raspberry Pi 4.

Најдобро за: Брзи прегледи, пристапност и вградени апликации

Обиди се слободно

VITSVITS Free

VITS (Вериционално заклучување со спротивно учење за крајно до крај на текстот на говор) е паралелен метод на TTS од крај до крај, кој генерира повеќе природно звукови звукови од сегашните двоетапни модели.

Најдобро за: Општонаменски текст- во- говор со природна прозодија

Обиди се слободно

MeloTTSMeloTTS Free

МелоТТС од MyShell.ai е многојазична TTS библиотека која го поддржува англискиот (американски, британски, индиски, австралиски), шпански, француски, кинески, јапонски и корејски јазик. Многу е брз, обработува текст со брзина во реално време само на процесор. МелоТТС е дизајниран за користење на производството и ги поддржува процесорот и ГПУ заклучоците.

Најдобро за: Производствените апликации на кои им требаат брзи, јазици ТТС

Обиди се слободно

OuteTTSOuteTTS Free

OutetTS ги проширува големите јазични модели со можности за текст- во- говор додека ја зачувува оригиналната архитектура. Таа поддржува повеќе заднини, вклучувајќи lama.cpp (CPU/ GPU), Hugging Face Transformers, ExLlamaV2, VLLM, па дури и прелистувачски заклучоци преку Transformers.js.

Најдобро за: Распоредување на работни делови, TTS базиран на прелистувач, околина со ниски извори

Обиди се слободно

Pocket TTSPocket TTS Free

Покет ТТС од страна на Кјутаи (креатори на Моши) е компактен модел на 100M параметар текст- на-спеех кој удира многу над својата тежина. Тој работи ефикасно на процесор, поддржува клонирање на глас со нулти удар од еден аудио примерок и произведува природно- звучен говор. Малиот модел го прави идеален за распоредување на ивиците и околините со ниски извори.

Најдобро за: Лесно распоредување, околина само за процесор, брзо клонирање на гласот

Обиди се слободно

Kitten TTSKitten TTS Free

Kitten TTS by KittenML is an ultra-lightweight text-to-speech model built on ONNX. With variants from 15M to 80M parameters (25-80 MB on disk), it delivers high-quality voice synthesis on CPU without requiring a GPU. Features 8 built-in voices, adjustable speech speed, and built-in text preprocessing for numbers, currencies, and units. Ideal for edge deployment and low-latency applications.

Најдобро за: Fast lightweight TTS, edge deployment, low-latency applications

Обиди се слободно

BarkBark Standard

Текст-на-аудио модел на трансформатор кој генерира реалистичен говор, музика и звучни ефекти.

Развивач: Suno · Лиценца: MIT

Обиди се.

Bark SmallBark Small Standard

Посветла верзија на Барк со побрз заклучок и пониска употреба на меморија.

Развивач: Suno · Лиценца: MIT

Обиди се.

CosyVoice 2CosyVoice 2 Standard

Алибабабината скалална ТТС со природна човечка паритетност и речиси нула латенција.

Развивач: Alibaba (Tongyi Lab) · Лиценца: Apache 2.0

Обиди се.

Dia TTSDia TTS Standard

Модел на генерирање на повеќеговоричи, кој создава природни разговори помеѓу звучниците.

Развивач: Nari Labs · Лиценца: Apache 2.0

Обиди се.

Parler TTSParler TTS Standard

Опиши го гласот што го сакаш на природниот јазик и Parler генерира совпаѓачки говор.

Развивач: Hugging Face · Лиценца: Apache 2.0

Обиди се.

GLM-TTSGLM-TTS Standard

Постигнува најниска стапка на грешки со знаци меѓу моделите на TTS отворен код.

Развивач: Zhipu AI · Лиценца: GLM-4 License

Обиди се.

IndexTTS-2IndexTTS-2 Standard

Нула-погоден ТТС со фино-зрела контрола на емоциите и висока експресивност.

Развивач: Index Team · Лиценца: Bilibili Model License

Обиди се.

Spark TTSSpark TTS Standard

Гласовното клонирање на ТТС со контролирани емоции и стил на зборување преку испити.

Развивач: SparkAudio · Лиценца: CC BY-NC-SA 4.0

Обиди се.

GPT-SoVITSGPT-SoVITS Standard

Неколку гласови клонирање ТТС кои го репликираат секој глас од само 5 секунди аудио.

Развивач: RVC-Boss · Лиценца: MIT

Обиди се.

OrpheusOrpheus Standard

Емоционалниот модел на ТТС на човеково ниво обучуван за 100 000 часа говорни податоци.

Развивач: Canopy Labs · Лиценца: Llama 3.2 Community

Обиди се.

Qwen3 TTSQwen3 TTS Standard

Повеќејазичната ТТС на Алибаба со клонирање на гласот, претпоставени гласови и дизајн на гласот од текстот.

Развивач: Alibaba (Qwen) · Лиценца: Apache 2.0

Обиди се.

Chatterbox TurboChatterbox Turbo Standard

Побрзо чаттербокс со под-200 метри латенција и паралингуистички ознаки за смеење, кашлање и повеќе.

Развивач: Resemble AI · Лиценца: MIT

Обиди се.

Dia 2Dia 2 Standard

Прв разговорен ТТС со повеќезвучен дијалог и паралингвистички знаци.

Развивач: Nari Labs · Лиценца: Apache 2.0

Обиди се.

VoxCPMVoxCPM Standard

ТТС без токенизирање произведува 44.1kHz аудио со конзистентност на контекстот.

Развивач: OpenBMB · Лиценца: Apache 2.0

Обиди се.

TADATADA Standard

ТТС со нулта халуцинација со текст-акустично двојно порамнување, 5х побрзо од споредбата на ЛЛМ ТТС.

Развивач: Hume AI · Лиценца: MIT

Обиди се.

VibeVoiceVibeVoice Standard

Мајкрософт модел за долгоформирана содржина на мултимедиктори како подкасти и аудио книги.

Развивач: Microsoft · Лиценца: MIT

Обиди се.

CosyVoice3CosyVoice3 Standard

Next-generation multilingual TTS with bi-streaming, emotion control, and zero-shot voice cloning.

Развивач: Alibaba (FunAudioLLM) · Лиценца: Apache 2.0

Обиди се.

ChatterboxChatterbox Premium

Современо клонирање на гласот со контрола на емоциите од Ресембл АИ.

Квалитет:

Обиди се.

Tortoise TTSTortoise TTS Premium

Мулти-гласен текст-на-спиеч се фокусираше на квалитетот со автоматски регресивна архитектура.

Квалитет:

Обиди се.

StyleTTS 2StyleTTS 2 Premium

Човечко ниво на текст во говор преку дифузија во стилот и противречна обука.

Квалитет:

Обиди се.

OpenVoiceOpenVoice Premium

Моментално клонирање на гласот со гранулирана контрола над стилот, емоциите и акцентот.

Квалитет:

Обиди се.

Sesame CSMSesame CSM Premium

Разговорниот модел на говор создава природни дијалоги со соодветен тајминг и емоции.

Квалитет:

Обиди се.

MOSS-TTSMOSS-TTS Premium

Ultra-long 20-language TTS supporting up to 1 hour of continuous generation with phoneme-level control.

Квалитет:

Обиди се.

MegaTTS3MegaTTS3 Premium

ByteDance's sparse alignment TTS with adjustable intelligibility vs. speaker similarity.

Квалитет:

Обиди се.

CosyVoice 2CosyVoice 2

Алибабабината скалална ТТС со природна човечка паритетност и речиси нула латенција.

Јазици: en, zh, ja, ko, fr, de, it, es

Клонирај глас

GLM-TTSGLM-TTS

Постигнува најниска стапка на грешки со знаци меѓу моделите на TTS отворен код.

Јазици: en, zh

Клонирај глас

IndexTTS-2IndexTTS-2

Нула-погоден ТТС со фино-зрела контрола на емоциите и висока експресивност.

Јазици: en, zh

Клонирај глас

Spark TTSSpark TTS

Гласовното клонирање на ТТС со контролирани емоции и стил на зборување преку испити.

Јазици: en, zh

Клонирај глас

GPT-SoVITSGPT-SoVITS

Неколку гласови клонирање ТТС кои го репликираат секој глас од само 5 секунди аудио.

Јазици: en, zh, ja, ko

Клонирај глас

ChatterboxChatterbox

Современо клонирање на гласот со контрола на емоциите од Ресембл АИ.

Јазици: en

Клонирај глас

Tortoise TTSTortoise TTS

Мулти-гласен текст-на-спиеч се фокусираше на квалитетот со автоматски регресивна архитектура.

Јазици: en

Клонирај глас

OpenVoiceOpenVoice

Моментално клонирање на гласот со гранулирана контрола над стилот, емоциите и акцентот.

Јазици: en, zh, ja, ko, fr, de, es, it

Клонирај глас

Qwen3 TTSQwen3 TTS

Повеќејазичната ТТС на Алибаба со клонирање на гласот, претпоставени гласови и дизајн на гласот од текстот.

Јазици: en, zh, ja, ko, de, fr, ru, pt, es, it

Клонирај глас

Chatterbox TurboChatterbox Turbo

Побрзо чаттербокс со под-200 метри латенција и паралингуистички ознаки за смеење, кашлање и повеќе.

Јазици: en

Клонирај глас

VoxCPMVoxCPM

ТТС без токенизирање произведува 44.1kHz аудио со конзистентност на контекстот.

Јазици: en, zh

Клонирај глас

OuteTTSOuteTTS

TTS базиран на LLM кој работи на процесор, GPU или прелистувач преку lama.cpp и Transformers.js.

Јазици: en

Клонирај глас

Pocket TTSPocket TTS

Лесен модел на параметар 100М од Кјутаи со клонирање на гласот од еден примерок.

Јазици: en, fr

Клонирај глас

CosyVoice3CosyVoice3

Next-generation multilingual TTS with bi-streaming, emotion control, and zero-shot voice cloning.

Јазици: en, zh, ja, ko, de, es, fr, it, ru

Клонирај глас

MOSS-TTSMOSS-TTS

Ultra-long 20-language TTS supporting up to 1 hour of continuous generation with phoneme-level control.

Јазици: en, zh, de, es, fr, ja, it, hu, ko, ru, fa, ar, pl, pt, cs, da, sv, el, tr

Клонирај глас

MegaTTS3MegaTTS3

ByteDance's sparse alignment TTS with adjustable intelligibility vs. speaker similarity.

Јазици: en, zh

Клонирај глас

Развивач- прв API

Компатибилна со OpenAI REST API. Една крајна точка, 22+ модели. Забрзувам поддршка за апликациите во реално време.

  • Формат соодветен со OpenAI
  • Стремирам TTS за апликации во реално време
  • Пакетна обработка за големи задачи
  • Веб- куќни известувања
Види API Док
pip install ttsai npm install @ttsainpm/ttsai
Python
from tts_ai import TTSClient

client = TTSClient(api_key="sk-tts-xxx")
audio = client.generate(
    text="Hello from TTS.ai!",
    model="kokoro",
    voice="af_bella",
)
client.save(audio, "output.mp3")

Едноставен, транспарентен цени

Почни слободно, скалирај додека растеш.

Слободен

$0

15 кредити

  • Kokoro, Piper, VITS, MeloTTS
  • Ограничување на знакот
  • 3 ген/ час (без сметка)
Слободно потпиши се

Стартер

$9/мо

500 кредити/месечно

  • Сите 22+ модели
  • 100.000 chars по генерација
  • Гласовно клонирање
Започни
Најпопуларно

Проф.

$29/мо

2000 кредити месечно

  • Се во стартер
  • API пристап
  • Приоритетна обработка
Добиј проф.

Бизнис

$99/мо

10.000 кредити во месец

  • Се' во проф.
  • Масовна API
  • Приоритетна редица
Земи си работа

Ги гледа сите планови вклучувајќи ги и знаците →

Често поставувани прашања

TTS.ai е најсеопфатната АИ гласовна платформа, која нуди 22+ текстуални модели, клонирање на гласот, говор-на-текст и аудио алатки. Сите модели се отворен извор без приклучување на продавачот.

Да! TTS.ai нуди бесплатен текст за говор со Кокоро, Пајпер, ВИТС и МелоТТС модели. Не е потребна сметка. Запиши се за да добиеш 15.000 слободни знаци и пристап до сите модели. Платените планови почнуваат со 9 долари месечно.

За брзина, користете го Kokoro или Piper. За квалитет, обидете се CosyVoice 2 или StyleTTS 2. За клонирање на гласот, користете Chatterbox или GPT- SoVITS. За дијалог, користете Dia TTS. Обидете се со повеќе модели на истиот текст за споредба.

Да. Компатибилно со OpenAI REST API за TTS, STT, гласовно клонирање и аудио алатки. Достапно на Pro (29/mo) и Enterprise ($99/mo) планови. Преглед на документацијата на tts.ai/api /.

Квалитетот на гласот варира според моделот. Премиум модели како CosyVoice 2, StyleTTS 2 и Chatterbox произведуваат речиси човечки квалитетен говор со природна интонација и емоции.

TTS.ai поддржуваат 30+ јазици низ својата макетна библиотека. Англиски има најширока поддршка за моделот, но модели како CosyVoice 2 покриваат кинески, јапонски и корејски; GPT-SoviTS управува со кинески, јапонски, корејски и англиски; и MelotTS поддржува англиски, шпански, француски, кинески, јапонски и корејски.

Да. Сите процеси се случуваат на нашите посветени сервери на GPU. Не го чуваме вашиот текст или генерираме аудио по испраќањето. Внесените образци за глас се користат само за тековната сесија и не се задржани. Никогаш не ги споделуваме вашите податоци со третите страни ниту ги користиме за обука на модели.

Да. Сите аудиоснимки генерирани на TTS.ai е ваше да користите комерцијално, вклучително и за ЈуТјуб видеа, подкасти, аудиокниги, апликации, реклами и производи. Нашите модели се отворен извор под попустливи лиценца (МИТ, Апачи 2.0). Не се потребни ниту хонорари ниту припишување.

TTS.ai генерира аудио во WAV форматот стандардно за максимален квалитет. Може да конвертирате во MP3, FLAC, OGG или M4A користејќи ја нашата слободна аудио конвертерска алатка. API го поддржува наведувањето на вашиот претпочитан излезен формат директно во барањето.

Внесете краток аудио примерок (најмалку 5 секунди) од гласот што сакате да го клонирате, а потоа внесете било кој текст за да генерирате говор во тој глас. Модели како Chatterbox, GPT- SoVITS и CosyVoice 2 поддржуваат клонирање на гласот. Клонираниот глас го снима тонот, акцент и стил на говор.

Бесплатни модели (Kokoro, Piper, VITS, MelotTS) не бараат знаци за сметка и трошоци. Стандардни модели (2.000 знакови/1K инпут) вклучуваат Bark, CosyVoice 2, F5- TTS и Dia. Premium модели (4.000 знакови/1K инпут) вклучуваат OpenVoice, Chatterbox, StyleTTS 2 и Tortoise. Платените модели обично нудат повисок квалитет, повеќе гласови и дополнителни карактеристики како клонирање на гласот.

Да. API поддржува пакетна обработка за претворање на големи томови на текст во говор. Поднесете повеќе барања и преземете резултати асинхронно користејќи ги UUIDs. Плановите за претпријатија ($99/mo) вклучуваат приоритетен пристап во редицата за побрза процесија на серија. Идеален за производството на аудиокниги, содржината на курсот и големите проекти за пренос на глас.
4.0/5 (22)

Твоите повратни информации ни помагаат да ги решиме проблемите.

Почни да користиш ВИ глас денес

Приклучи се кон креаторите, развивачите и бизнисите со TTS.ai