Слободна ВИ Текст за говор

20+ Модели со отворен извор, 107+ Гласови, 32+ Нема потреба од сметка.

1K+
креатори
2K+
генерации
20+
AI модели
107+
гласови
0/500 знаци Слободен
Like TTS.ai? Tell your friends!

Се што ти треба за гласовна интелигенција

30+ алатки со отворени модели на АИ

20+ AI Гласовни модели

Најсеопфатната колекција на TTS модели со отворен извор во една платформа

KokoroKokoro Free

Кокоро е модел од 82 милиони параметар за текст во говор, кој удира многу повеќе од класата на тежината. И покрај ситната големина, произведува извонредно природн и изразителен говор. Кокоро поддржува повеќе јазици, меѓу кои англиски, јапонски, кинески и корејски, со најразлични изразителни гласови.

Најдобро за: Висок квалитет на TTS со минимална латенција, пренесување апликации

Обиди се слободно

PiperPiper Free

Piper е лесен текст-на-спеец мотор разработен од Rhaspy кој користи VITS и ларинкс архитектури. Тој работи целосно на CPU, што го прави идеален за работни уреди, домашна автоматизација и апликации кои бараат офлајн ТТС. Со преку 100 гласови на 30+ јазици, Piper носи природно-звучен говор со брзина во реално време дури и на Raspberry Pi 4.

Најдобро за: Брзи прегледи, пристапност и вградени апликации

Обиди се слободно

VITSVITS Free

VITS (Вериционално заклучување со спротивно учење за крајно до крај на текстот на говор) е паралелен метод на TTS од крај до крај, кој генерира повеќе природно звукови звукови од сегашните двоетапни модели.

Најдобро за: Општонаменски текст- во- говор со природна прозодија

Обиди се слободно

MeloTTSMeloTTS Free

МелоТТС од MyShell.ai е многојазична TTS библиотека која го поддржува англискиот (американски, британски, индиски, австралиски), шпански, француски, кинески, јапонски и корејски јазик. Многу е брз, обработува текст со брзина во реално време само на процесор. МелоТТС е дизајниран за користење на производството и ги поддржува процесорот и ГПУ заклучоците.

Најдобро за: Производствените апликации на кои им требаат брзи, јазици ТТС

Обиди се слободно

BarkBark Standard

Текст-на-аудио модел на трансформатор кој генерира реалистичен говор, музика и звучни ефекти.

Развивач: Suno · Лиценца: MIT

Обиди се.

Bark SmallBark Small Standard

Посветла верзија на Барк со побрз заклучок и пониска употреба на меморија.

Развивач: Suno · Лиценца: MIT

Обиди се.

CosyVoice 2CosyVoice 2 Standard

Алибабабината скалална ТТС со природна човечка паритетност и речиси нула латенција.

Развивач: Alibaba (Tongyi Lab) · Лиценца: Apache 2.0

Обиди се.

Dia TTSDia TTS Standard

Модел на генерирање на повеќеговоричи, кој создава природни разговори помеѓу звучниците.

Развивач: Nari Labs · Лиценца: Apache 2.0

Обиди се.

Parler TTSParler TTS Standard

Опиши го гласот што го сакаш на природниот јазик и Parler генерира совпаѓачки говор.

Развивач: Hugging Face · Лиценца: Apache 2.0

Обиди се.

GLM-TTSGLM-TTS Standard

Постигнува најниска стапка на грешки со знаци меѓу моделите на TTS отворен код.

Развивач: Zhipu AI · Лиценца: GLM-4 License

Обиди се.

IndexTTS-2IndexTTS-2 Standard

Нула-погоден ТТС со фино-зрела контрола на емоциите и висока експресивност.

Развивач: Index Team · Лиценца: Bilibili Model License

Обиди се.

Spark TTSSpark TTS Standard

Гласовното клонирање на ТТС со контролирани емоции и стил на зборување преку испити.

Развивач: SparkAudio · Лиценца: CC BY-NC-SA 4.0

Обиди се.

GPT-SoVITSGPT-SoVITS Standard

Неколку гласови клонирање ТТС кои го репликираат секој глас од само 5 секунди аудио.

Развивач: RVC-Boss · Лиценца: MIT

Обиди се.

OrpheusOrpheus Standard

Емоционалниот модел на ТТС на човеково ниво обучуван за 100 000 часа говорни податоци.

Развивач: Canopy Labs · Лиценца: Llama 3.2 Community

Обиди се.

Qwen3 TTSQwen3 TTS Standard

Повеќејазичната ТТС на Алибаба со клонирање на гласот, претпоставени гласови и дизајн на гласот од текстот.

Развивач: Alibaba (Qwen) · Лиценца: Apache 2.0

Обиди се.

ChatterboxChatterbox Premium

Современо клонирање на гласот со контрола на емоциите од Ресембл АИ.

Квалитет:

Обиди се.

Tortoise TTSTortoise TTS Premium

Мулти-гласен текст-на-спиеч се фокусираше на квалитетот со автоматски регресивна архитектура.

Квалитет:

Обиди се.

StyleTTS 2StyleTTS 2 Premium

Човечко ниво на текст во говор преку дифузија во стилот и противречна обука.

Квалитет:

Обиди се.

OpenVoiceOpenVoice Premium

Моментално клонирање на гласот со гранулирана контрола над стилот, емоциите и акцентот.

Квалитет:

Обиди се.

Sesame CSMSesame CSM Premium

Разговорниот модел на говор создава природни дијалоги со соодветен тајминг и емоции.

Квалитет:

Обиди се.

CosyVoice 2CosyVoice 2

Алибабабината скалална ТТС со природна човечка паритетност и речиси нула латенција.

Јазици: en, zh, ja, ko, fr, de, it, es

Клонирај глас

GLM-TTSGLM-TTS

Постигнува најниска стапка на грешки со знаци меѓу моделите на TTS отворен код.

Јазици: en, zh

Клонирај глас

IndexTTS-2IndexTTS-2

Нула-погоден ТТС со фино-зрела контрола на емоциите и висока експресивност.

Јазици: en, zh

Клонирај глас

Spark TTSSpark TTS

Гласовното клонирање на ТТС со контролирани емоции и стил на зборување преку испити.

Јазици: en, zh

Клонирај глас

GPT-SoVITSGPT-SoVITS

Неколку гласови клонирање ТТС кои го репликираат секој глас од само 5 секунди аудио.

Јазици: en, zh, ja, ko

Клонирај глас

ChatterboxChatterbox

Современо клонирање на гласот со контрола на емоциите од Ресембл АИ.

Јазици: en

Клонирај глас

Tortoise TTSTortoise TTS

Мулти-гласен текст-на-спиеч се фокусираше на квалитетот со автоматски регресивна архитектура.

Јазици: en

Клонирај глас

OpenVoiceOpenVoice

Моментално клонирање на гласот со гранулирана контрола над стилот, емоциите и акцентот.

Јазици: en, zh, ja, ko, fr, de, es, it

Клонирај глас

Qwen3 TTSQwen3 TTS

Повеќејазичната ТТС на Алибаба со клонирање на гласот, претпоставени гласови и дизајн на гласот од текстот.

Јазици: en, zh, ja, ko, de, fr, ru, pt, es, it

Клонирај глас

Развивач- прв API

Компатибилна со OpenAI REST API. Една крајна точка, 22+ модели. Забрзувам поддршка за апликациите во реално време.

  • Формат соодветен со OpenAI
  • Стремирам TTS за апликации во реално време
  • Пакетна обработка за големи задачи
  • Веб- куќни известувања
Види API Док
pip install ttsai npm install @ttsainpm/ttsai
Python
from tts_ai import TTSClient

client = TTSClient(api_key="sk-tts-xxx")
audio = client.generate(
    text="Hello from TTS.ai!",
    model="kokoro",
    voice="af_bella",
)
client.save(audio, "output.mp3")

Едноставен, транспарентен цени

Почни слободно, скалирај додека растеш.

Слободен

$0

15 кредити

  • Kokoro, Piper, VITS, MeloTTS
  • Ограничување на знакот
  • 3 ген/ час (без сметка)
Слободно потпиши се

Стартер

$9/мо

500 кредити/месечно

  • Сите 22+ модели
  • 100,000 chars per generation
  • Гласовно клонирање
Започни
Најпопуларно

Проф.

$29/мо

2000 кредити месечно

  • Се во стартер
  • API пристап
  • Приоритетна обработка
Добиј проф.

Бизнис

$99/мо

10.000 кредити во месец

  • Се' во проф.
  • Масовна API
  • Приоритетна редица
Земи си работа

Ги гледа сите планови вклучувајќи ги и знаците →

Често поставувани прашања

TTS.ai е најсеопфатната АИ гласова платформа која нуди 22+ модели за текст во говор, клонирање на гласот, говор-на-текст и аудио алатки. Сите модели се отворен извор без приклучување на продавачот.

Да! TTS.ai нуди бесплатен текст за говор со Кокоро, Пајпер, ВИТС и МелоТТС модели. Не е потребна сметка. Запиши се за да добиеш 15.000 слободни знаци и пристап до сите модели. Платените планови почнуваат со 9 долари месечно.

За брзина, користете го Kokoro или Piper. За квалитет, обидете се CosyVoice 2 или StyleTTS 2. За клонирање на гласот, користете Chatterbox или GPT- SoVITS. За дијалог, користете Dia TTS. Обидете се со повеќе модели на истиот текст за споредба.

Да. Компатибилно со OpenAI REST API за TTS, STT, гласовно клонирање и аудио алатки. Достапно на Pro (29/mo) и Enterprise ($99/mo) планови. Преглед на документацијата на tts.ai/api /.

Квалитетот на гласот варира според моделот. Премиум модели како CosyVoice 2, StyleTTS 2 и Chatterbox произведуваат речиси човечки квалитетен говор со природна интонација и емоции.

TTS.ai ја поддржува 30+ јазици низ својата макетна библиотека. Англиски има најширока поддршка за моделот, но модели како CosyVoice 2 покриваат кинески, јапонски и корејски; GPT-SoviTS управува со кинески, јапонски, корејски и англиски; и MelotTS поддржува англиски, шпански, француски, кинески, јапонски и корејски.

Да. Сите процеси се случуваат на нашите посветени сервери на GPU. Не го чуваме вашиот текст или генерираме аудио по испраќањето. Внесените образци за глас се користат само за тековната сесија и не се задржани. Никогаш не ги споделуваме вашите податоци со третите страни ниту ги користиме за обука на модели.

Да. Сите аудиоснимки генерирани на TTS.ai е ваше да користите комерцијално, вклучително и за ЈуТјуб видеа, подкасти, аудиокниги, апликации, реклами и производи. Нашите модели се отворен извор под попустливи лиценца (МИТ, Апачи 2.0). Не се потребни ниту хонорари ниту припишување.

TTS.ai генерира аудио во WAV форматот стандардно за максимален квалитет. Може да конвертирате во MP3, FLAC, OGG или M4A користејќи ја нашата слободна аудио конвертерска алатка. API го поддржува одредувањето на вашиот претпочитан излезен формат директно во барањето.

Внесете краток аудио примерок (најмалку 5 секунди) од гласот што сакате да го клонирате, а потоа внесете било кој текст за да генерирате говор во тој глас. Модели како Chatterbox, GPT- SoVITS и CosyVoice 2 поддржуваат клонирање на гласот. Клонираниот глас го снима тонот, акцент и стил на говор.

Бесплатни модели (Kokoro, Piper, VITS, MelotTS) не бараат знаци за сметка и трошоци. Стандардни модели (2.000 знакови/1K инпут) вклучуваат Bark, CosyVoice 2, F5- TTS и Dia. Premium модели (4.000 знакови/1K инпут) вклучуваат OpenVoice, Chatterbox, StyleTTS 2 и Tortoise. Платените модели обично нудат повисок квалитет, повеќе гласови и дополнителни карактеристики како клонирање на гласот.

Да. API поддржува пакетна обработка за претворање на големи томови на текст во говор. Поднесете повеќе барања и преземете резултати асинхронно користејќи ги UUIDs. Плановите за претпријатија ($99/mo) вклучуваат приоритетен пристап во редицата за побрза процесија на серија. Идеален за производството на аудиокниги, содржината на курсот и големите проекти за пренос на глас.
4.0/5 (8)

Почни да користиш ВИ глас денес

Приклучи се кон креаторите, развивачите и бизнисите со TTS.ai