Слободна ВИ Текст за говор
22+ модели со отворен извор, 100+ гласови, 32+ Нема потреба од сметка.
Се што ти треба за гласовна интелигенција
26 алатки напојени со 24+ модели со отворен извор на АИ
22+ AI Гласовни модели
Најсеопфатната колекција на TTS модели со отворен извор во една платформа
Kokoro Free
Kokoro is an 82 million parameter text-to-speech model that punches well above its weight class. Despite its tiny size, it produces remarkably natural and expressive speech. Kokoro supports multiple languages including English, Japanese, Chinese, and Korean with a variety of expressive voices. It runs incredibly fast — generating audio nearly 100x faster than real-time on a GPU.
Најдобро за: High-quality TTS with minimal latency, streaming applications
Обиди се слободноPiper Free
Piper is a lightweight text-to-speech engine developed by Rhasspy that uses VITS and larynx architectures. It runs entirely on CPU, making it ideal for edge devices, home automation, and applications requiring offline TTS. With over 100 voices across 30+ languages, Piper delivers natural-sounding speech at real-time speeds even on a Raspberry Pi 4.
Најдобро за: Quick previews, accessibility, and embedded applications
Обиди се слободноVITS Free
VITS (Variational Inference with adversarial learning for end-to-end Text-to-Speech) is a parallel end-to-end TTS method that generates more natural sounding audio than current two-stage models. It adopts variational inference augmented with normalizing flows and an adversarial training process, achieving a significant improvement in naturalness.
Најдобро за: General-purpose text-to-speech with natural prosody
Обиди се слободноMeloTTS Free
MeloTTS by MyShell.ai is a multilingual TTS library supporting English (American, British, Indian, Australian), Spanish, French, Chinese, Japanese, and Korean. It is extremely fast, processing text at near real-time speed on CPU alone. MeloTTS is designed for production use and supports both CPU and GPU inference.
Најдобро за: Производствените апликации на кои им требаат брзи, јазици ТТС
Обиди се слободноBark Standard
Transformer-based text-to-audio model that generates realistic speech, music, and sound effects.
Развивач: Suno · Лиценца: MIT
Обиди се.Bark Small Standard
Lighter version of Bark with faster inference and lower memory usage.
Развивач: Suno · Лиценца: MIT
Обиди се.CosyVoice 2 Standard
Alibaba's scalable streaming TTS with human-parity naturalness and near-zero latency.
Развивач: Alibaba (Tongyi Lab) · Лиценца: Apache 2.0
Обиди се.Dia TTS Standard
Модел на генерирање на повеќеговоричи, кој создава природни разговори помеѓу звучниците.
Развивач: Nari Labs · Лиценца: Apache 2.0
Обиди се.Parler TTS Standard
Describe the voice you want in natural language and Parler generates matching speech.
Развивач: Hugging Face · Лиценца: Apache 2.0
Обиди се.IndexTTS-2 Standard
Zero-shot TTS with fine-grained emotion control and high expressiveness.
Развивач: Index Team · Лиценца: Apache 2.0
Обиди се.Spark TTS Standard
Voice cloning TTS with controllable emotion and speaking style via prompts.
Развивач: SparkAudio · Лиценца: Apache 2.0
Обиди се.GPT-SoVITS Standard
Few-shot voice cloning TTS that replicates any voice from just 5 seconds of audio.
Развивач: RVC-Boss · Лиценца: MIT
Обиди се.Orpheus Standard
Human-level emotional TTS model trained on 100K hours of speech data.
Развивач: Canopy Labs · Лиценца: Llama 3.2 Community
Обиди се.Qwen3 TTS Standard
Alibaba's multilingual TTS with voice cloning, preset voices, and voice design from text.
Развивач: Alibaba (Qwen) · Лиценца: Apache 2.0
Обиди се.CosyVoice 2
Alibaba's scalable streaming TTS with human-parity naturalness and near-zero latency.
Јазици: en, zh, ja, ko, fr, de, it, es
Клонирај гласIndexTTS-2
Zero-shot TTS with fine-grained emotion control and high expressiveness.
Јазици: en, zh
Клонирај гласSpark TTS
Voice cloning TTS with controllable emotion and speaking style via prompts.
Јазици: en, zh
Клонирај гласGPT-SoVITS
Few-shot voice cloning TTS that replicates any voice from just 5 seconds of audio.
Јазици: en, zh, ja, ko
Клонирај гласChatterbox
Современо клонирање на гласот со контрола на емоциите од Ресембл АИ.
Јазици: en
Клонирај гласTortoise TTS
Мулти-гласен текст-на-спиеч се фокусираше на квалитетот со автоматски регресивна архитектура.
Јазици: en
Клонирај гласOpenVoice
Моментално клонирање на гласот со гранулирана контрола над стилот, емоциите и акцентот.
Јазици: en, zh, ja, ko, fr, de, es, it
Клонирај гласQwen3 TTS
Alibaba's multilingual TTS with voice cloning, preset voices, and voice design from text.
Јазици: en, zh, ja, ko, de, fr, ru, pt, es, it
Клонирај гласРазвивач- прв API
Компатибилна со OpenAI REST API. Една крајна точка, 22+ модели. Забрзувам поддршка за апликациите во реално време.
- Формат соодветен со OpenAI
- Стремирам TTS за апликации во реално време
- Пакетна обработка за големи задачи
- Веб- куќни известувања
import requests
response = requests.post(
"https://api.tts.ai/v1/tts/",
headers={"Authorization": "Bearer sk-tts-xxx"},
json={
"model": "kokoro",
"text": "Hello from TTS.ai!",
"voice": "af_bella",
}
)
with open("output.mp3", "wb") as f:
f.write(response.content)
Едноставен, транспарентен цени
Почни слободно, скалирај додека растеш.
Слободен
50 кредити
- Kokoro, Piper, VITS, MeloTTS
- Ограничување на знакот
- 3 ген/ час (без сметка)
Стартер
500 кредити/месечно
- Сите 22+ модели
- Ограничување на знаците
- Гласовно клонирање
Проф.
2000 кредити месечно
- Се во стартер
- API пристап
- Приоритетна обработка
Ентерпрајз
10.000 кредити во месец
- Се' во проф.
- Масовна API
- Приоритетна редица
Често поставувани прашања
Почни да користиш ВИ глас денес
Приклучете се кон креаторите, развивачите и бизнисите со TTS.ai