Слободна ВИ Текст за говор
31+ Модели со отворен извор, 231+ Гласови, 34+ Нема потреба од сметка.
Се што ти треба за гласовна интелигенција
30+ алатки со отворени модели на АИ
31+ AI Гласовни модели
Најсеопфатната колекција на TTS модели со отворен извор во една платформа
Kokoro Free
Кокоро е модел од 82 милиони параметар за текст во говор, кој удира многу повеќе од класата на тежината. И покрај ситната големина, произведува извонредно природн и изразителен говор. Кокоро поддржува повеќе јазици, меѓу кои англиски, јапонски, кинески и корејски, со најразлични изразителни гласови.
Најдобро за: Висок квалитет на TTS со минимална латенција, пренесување апликации
Обиди се слободно
Piper Free
Piper е лесен текст-на-спеец мотор разработен од Rhaspy кој користи VITS и ларинкс архитектури. Тој работи целосно на CPU, што го прави идеален за работни уреди, домашна автоматизација и апликации кои бараат офлајн ТТС. Со преку 100 гласови на 30+ јазици, Piper носи природно-звучен говор со брзина во реално време дури и на Raspberry Pi 4.
Најдобро за: Брзи прегледи, пристапност и вградени апликации
Обиди се слободно
VITS Free
VITS (Вериционално заклучување со спротивно учење за крајно до крај на текстот на говор) е паралелен метод на TTS од крај до крај, кој генерира повеќе природно звукови звукови од сегашните двоетапни модели.
Најдобро за: Општонаменски текст- во- говор со природна прозодија
Обиди се слободно
MeloTTS Free
МелоТТС од MyShell.ai е многојазична TTS библиотека која го поддржува англискиот (американски, британски, индиски, австралиски), шпански, француски, кинески, јапонски и корејски јазик. Многу е брз, обработува текст со брзина во реално време само на процесор. МелоТТС е дизајниран за користење на производството и ги поддржува процесорот и ГПУ заклучоците.
Најдобро за: Производствените апликации на кои им требаат брзи, јазици ТТС
Обиди се слободно
OuteTTS Free
OutetTS ги проширува големите јазични модели со можности за текст- во- говор додека ја зачувува оригиналната архитектура. Таа поддржува повеќе заднини, вклучувајќи lama.cpp (CPU/ GPU), Hugging Face Transformers, ExLlamaV2, VLLM, па дури и прелистувачски заклучоци преку Transformers.js.
Најдобро за: Распоредување на работни делови, TTS базиран на прелистувач, околина со ниски извори
Обиди се слободно
Pocket TTS Free
Покет ТТС од страна на Кјутаи (креатори на Моши) е компактен модел на 100M параметар текст- на-спеех кој удира многу над својата тежина. Тој работи ефикасно на процесор, поддржува клонирање на глас со нулти удар од еден аудио примерок и произведува природно- звучен говор. Малиот модел го прави идеален за распоредување на ивиците и околините со ниски извори.
Најдобро за: Лесно распоредување, околина само за процесор, брзо клонирање на гласот
Обиди се слободно
Kitten TTS Free
Kitten TTS by KittenML is an ultra-lightweight text-to-speech model built on ONNX. With variants from 15M to 80M parameters (25-80 MB on disk), it delivers high-quality voice synthesis on CPU without requiring a GPU. Features 8 built-in voices, adjustable speech speed, and built-in text preprocessing for numbers, currencies, and units. Ideal for edge deployment and low-latency applications.
Најдобро за: Fast lightweight TTS, edge deployment, low-latency applications
Обиди се слободно
Bark Standard
Текст-на-аудио модел на трансформатор кој генерира реалистичен говор, музика и звучни ефекти.
Развивач: Suno · Лиценца: MIT
Обиди се.
Bark Small Standard
Посветла верзија на Барк со побрз заклучок и пониска употреба на меморија.
Развивач: Suno · Лиценца: MIT
Обиди се.
CosyVoice 2 Standard
Алибабабината скалална ТТС со природна човечка паритетност и речиси нула латенција.
Развивач: Alibaba (Tongyi Lab) · Лиценца: Apache 2.0
Обиди се.
Dia TTS Standard
Модел на генерирање на повеќеговоричи, кој создава природни разговори помеѓу звучниците.
Развивач: Nari Labs · Лиценца: Apache 2.0
Обиди се.
Parler TTS Standard
Опиши го гласот што го сакаш на природниот јазик и Parler генерира совпаѓачки говор.
Развивач: Hugging Face · Лиценца: Apache 2.0
Обиди се.
GLM-TTS Standard
Постигнува најниска стапка на грешки со знаци меѓу моделите на TTS отворен код.
Развивач: Zhipu AI · Лиценца: GLM-4 License
Обиди се.
IndexTTS-2 Standard
Нула-погоден ТТС со фино-зрела контрола на емоциите и висока експресивност.
Развивач: Index Team · Лиценца: Bilibili Model License
Обиди се.
Spark TTS Standard
Гласовното клонирање на ТТС со контролирани емоции и стил на зборување преку испити.
Развивач: SparkAudio · Лиценца: CC BY-NC-SA 4.0
Обиди се.
GPT-SoVITS Standard
Неколку гласови клонирање ТТС кои го репликираат секој глас од само 5 секунди аудио.
Развивач: RVC-Boss · Лиценца: MIT
Обиди се.
Orpheus Standard
Емоционалниот модел на ТТС на човеково ниво обучуван за 100 000 часа говорни податоци.
Развивач: Canopy Labs · Лиценца: Llama 3.2 Community
Обиди се.
Qwen3 TTS Standard
Повеќејазичната ТТС на Алибаба со клонирање на гласот, претпоставени гласови и дизајн на гласот од текстот.
Развивач: Alibaba (Qwen) · Лиценца: Apache 2.0
Обиди се.
Chatterbox Turbo Standard
Побрзо чаттербокс со под-200 метри латенција и паралингуистички ознаки за смеење, кашлање и повеќе.
Развивач: Resemble AI · Лиценца: MIT
Обиди се.
Dia 2 Standard
Прв разговорен ТТС со повеќезвучен дијалог и паралингвистички знаци.
Развивач: Nari Labs · Лиценца: Apache 2.0
Обиди се.
VoxCPM Standard
ТТС без токенизирање произведува 44.1kHz аудио со конзистентност на контекстот.
Развивач: OpenBMB · Лиценца: Apache 2.0
Обиди се.
TADA Standard
ТТС со нулта халуцинација со текст-акустично двојно порамнување, 5х побрзо од споредбата на ЛЛМ ТТС.
Развивач: Hume AI · Лиценца: MIT
Обиди се.
VibeVoice Standard
Мајкрософт модел за долгоформирана содржина на мултимедиктори како подкасти и аудио книги.
Развивач: Microsoft · Лиценца: MIT
Обиди се.
CosyVoice3 Standard
Next-generation multilingual TTS with bi-streaming, emotion control, and zero-shot voice cloning.
Развивач: Alibaba (FunAudioLLM) · Лиценца: Apache 2.0
Обиди се.
CosyVoice 2
Алибабабината скалална ТТС со природна човечка паритетност и речиси нула латенција.
Јазици: en, zh, ja, ko, fr, de, it, es
Клонирај глас
GLM-TTS
Постигнува најниска стапка на грешки со знаци меѓу моделите на TTS отворен код.
Јазици: en, zh
Клонирај глас
IndexTTS-2
Нула-погоден ТТС со фино-зрела контрола на емоциите и висока експресивност.
Јазици: en, zh
Клонирај глас
Spark TTS
Гласовното клонирање на ТТС со контролирани емоции и стил на зборување преку испити.
Јазици: en, zh
Клонирај глас
GPT-SoVITS
Неколку гласови клонирање ТТС кои го репликираат секој глас од само 5 секунди аудио.
Јазици: en, zh, ja, ko
Клонирај глас
Chatterbox
Современо клонирање на гласот со контрола на емоциите од Ресембл АИ.
Јазици: en
Клонирај глас
Tortoise TTS
Мулти-гласен текст-на-спиеч се фокусираше на квалитетот со автоматски регресивна архитектура.
Јазици: en
Клонирај глас
OpenVoice
Моментално клонирање на гласот со гранулирана контрола над стилот, емоциите и акцентот.
Јазици: en, zh, ja, ko, fr, de, es, it
Клонирај глас
Qwen3 TTS
Повеќејазичната ТТС на Алибаба со клонирање на гласот, претпоставени гласови и дизајн на гласот од текстот.
Јазици: en, zh, ja, ko, de, fr, ru, pt, es, it
Клонирај глас
Chatterbox Turbo
Побрзо чаттербокс со под-200 метри латенција и паралингуистички ознаки за смеење, кашлање и повеќе.
Јазици: en
Клонирај глас
VoxCPM
ТТС без токенизирање произведува 44.1kHz аудио со конзистентност на контекстот.
Јазици: en, zh
Клонирај глас
OuteTTS
TTS базиран на LLM кој работи на процесор, GPU или прелистувач преку lama.cpp и Transformers.js.
Јазици: en
Клонирај глас
Pocket TTS
Лесен модел на параметар 100М од Кјутаи со клонирање на гласот од еден примерок.
Јазици: en, fr
Клонирај глас
CosyVoice3
Next-generation multilingual TTS with bi-streaming, emotion control, and zero-shot voice cloning.
Јазици: en, zh, ja, ko, de, es, fr, it, ru
Клонирај глас
MOSS-TTS
Ultra-long 20-language TTS supporting up to 1 hour of continuous generation with phoneme-level control.
Јазици: en, zh, de, es, fr, ja, it, hu, ko, ru, fa, ar, pl, pt, cs, da, sv, el, tr
Клонирај глас
MegaTTS3
ByteDance's sparse alignment TTS with adjustable intelligibility vs. speaker similarity.
Јазици: en, zh
Клонирај гласРазвивач- прв API
Компатибилна со OpenAI REST API. Една крајна точка, 22+ модели. Забрзувам поддршка за апликациите во реално време.
- Формат соодветен со OpenAI
- Стремирам TTS за апликации во реално време
- Пакетна обработка за големи задачи
- Веб- куќни известувања
pip install ttsai
npm install @ttsainpm/ttsai
from tts_ai import TTSClient
client = TTSClient(api_key="sk-tts-xxx")
audio = client.generate(
text="Hello from TTS.ai!",
model="kokoro",
voice="af_bella",
)
client.save(audio, "output.mp3")
Едноставен, транспарентен цени
Почни слободно, скалирај додека растеш.
Слободен
15 кредити
- Kokoro, Piper, VITS, MeloTTS
- Ограничување на знакот
- 3 ген/ час (без сметка)
Стартер
500 кредити/месечно
- Сите 22+ модели
- 100.000 chars по генерација
- Гласовно клонирање
Проф.
2000 кредити месечно
- Се во стартер
- API пристап
- Приоритетна обработка
Често поставувани прашања
Твоите повратни информации ни помагаат да ги решиме проблемите.
Почни да користиш ВИ глас денес
Приклучи се кон креаторите, развивачите и бизнисите со TTS.ai