Слободна ВИ Текст за говор

22+ модели со отворен извор, 100+ гласови, 32+ Нема потреба од сметка.

0/500 знаци Слободен
Нема кредитна картичка 50 слободни кредити 32+ јазици Комерцијална употреба е во ред
0:00 / 0:00
Download Audio Врската истекува за 24 часа
Кажи им на пријателите!

Се што ти треба за гласовна интелигенција

26 алатки напојени со 24+ модели со отворен извор на АИ

22+ AI Гласовни модели

Најсеопфатната колекција на TTS модели со отворен извор во една платформа

Kokoro Free

Kokoro is an 82 million parameter text-to-speech model that punches well above its weight class. Despite its tiny size, it produces remarkably natural and expressive speech. Kokoro supports multiple languages including English, Japanese, Chinese, and Korean with a variety of expressive voices. It runs incredibly fast — generating audio nearly 100x faster than real-time on a GPU.

Најдобро за: High-quality TTS with minimal latency, streaming applications

Обиди се слободно

Piper Free

Piper is a lightweight text-to-speech engine developed by Rhasspy that uses VITS and larynx architectures. It runs entirely on CPU, making it ideal for edge devices, home automation, and applications requiring offline TTS. With over 100 voices across 30+ languages, Piper delivers natural-sounding speech at real-time speeds even on a Raspberry Pi 4.

Најдобро за: Quick previews, accessibility, and embedded applications

Обиди се слободно

VITS Free

VITS (Variational Inference with adversarial learning for end-to-end Text-to-Speech) is a parallel end-to-end TTS method that generates more natural sounding audio than current two-stage models. It adopts variational inference augmented with normalizing flows and an adversarial training process, achieving a significant improvement in naturalness.

Најдобро за: General-purpose text-to-speech with natural prosody

Обиди се слободно

MeloTTS Free

MeloTTS by MyShell.ai is a multilingual TTS library supporting English (American, British, Indian, Australian), Spanish, French, Chinese, Japanese, and Korean. It is extremely fast, processing text at near real-time speed on CPU alone. MeloTTS is designed for production use and supports both CPU and GPU inference.

Најдобро за: Производствените апликации на кои им требаат брзи, јазици ТТС

Обиди се слободно

Bark Standard

Transformer-based text-to-audio model that generates realistic speech, music, and sound effects.

Развивач: Suno · Лиценца: MIT

Обиди се.

Bark Small Standard

Lighter version of Bark with faster inference and lower memory usage.

Развивач: Suno · Лиценца: MIT

Обиди се.

CosyVoice 2 Standard

Alibaba's scalable streaming TTS with human-parity naturalness and near-zero latency.

Развивач: Alibaba (Tongyi Lab) · Лиценца: Apache 2.0

Обиди се.

Dia TTS Standard

Модел на генерирање на повеќеговоричи, кој создава природни разговори помеѓу звучниците.

Развивач: Nari Labs · Лиценца: Apache 2.0

Обиди се.

Parler TTS Standard

Describe the voice you want in natural language and Parler generates matching speech.

Развивач: Hugging Face · Лиценца: Apache 2.0

Обиди се.

IndexTTS-2 Standard

Zero-shot TTS with fine-grained emotion control and high expressiveness.

Развивач: Index Team · Лиценца: Apache 2.0

Обиди се.

Spark TTS Standard

Voice cloning TTS with controllable emotion and speaking style via prompts.

Развивач: SparkAudio · Лиценца: Apache 2.0

Обиди се.

GPT-SoVITS Standard

Few-shot voice cloning TTS that replicates any voice from just 5 seconds of audio.

Развивач: RVC-Boss · Лиценца: MIT

Обиди се.

Orpheus Standard

Human-level emotional TTS model trained on 100K hours of speech data.

Развивач: Canopy Labs · Лиценца: Llama 3.2 Community

Обиди се.

Qwen3 TTS Standard

Alibaba's multilingual TTS with voice cloning, preset voices, and voice design from text.

Развивач: Alibaba (Qwen) · Лиценца: Apache 2.0

Обиди се.

Chatterbox Premium

Современо клонирање на гласот со контрола на емоциите од Ресембл АИ.

Квалитет:

Обиди се.

Tortoise TTS Premium

Мулти-гласен текст-на-спиеч се фокусираше на квалитетот со автоматски регресивна архитектура.

Квалитет:

Обиди се.

StyleTTS 2 Premium

Human-level text-to-speech through style diffusion and adversarial training.

Квалитет:

Обиди се.

OpenVoice Premium

Моментално клонирање на гласот со гранулирана контрола над стилот, емоциите и акцентот.

Квалитет:

Обиди се.

CosyVoice 2

Alibaba's scalable streaming TTS with human-parity naturalness and near-zero latency.

Јазици: en, zh, ja, ko, fr, de, it, es

Клонирај глас

IndexTTS-2

Zero-shot TTS with fine-grained emotion control and high expressiveness.

Јазици: en, zh

Клонирај глас

Spark TTS

Voice cloning TTS with controllable emotion and speaking style via prompts.

Јазици: en, zh

Клонирај глас

GPT-SoVITS

Few-shot voice cloning TTS that replicates any voice from just 5 seconds of audio.

Јазици: en, zh, ja, ko

Клонирај глас

Chatterbox

Современо клонирање на гласот со контрола на емоциите од Ресембл АИ.

Јазици: en

Клонирај глас

Tortoise TTS

Мулти-гласен текст-на-спиеч се фокусираше на квалитетот со автоматски регресивна архитектура.

Јазици: en

Клонирај глас

OpenVoice

Моментално клонирање на гласот со гранулирана контрола над стилот, емоциите и акцентот.

Јазици: en, zh, ja, ko, fr, de, es, it

Клонирај глас

Qwen3 TTS

Alibaba's multilingual TTS with voice cloning, preset voices, and voice design from text.

Јазици: en, zh, ja, ko, de, fr, ru, pt, es, it

Клонирај глас

Развивач- прв API

Компатибилна со OpenAI REST API. Една крајна точка, 22+ модели. Забрзувам поддршка за апликациите во реално време.

  • Формат соодветен со OpenAI
  • Стремирам TTS за апликации во реално време
  • Пакетна обработка за големи задачи
  • Веб- куќни известувања
Види API Док
Python
import requests

response = requests.post(
    "https://api.tts.ai/v1/tts/",
    headers={"Authorization": "Bearer sk-tts-xxx"},
    json={
        "model": "kokoro",
        "text": "Hello from TTS.ai!",
        "voice": "af_bella",
    }
)

with open("output.mp3", "wb") as f:
    f.write(response.content)

Едноставен, транспарентен цени

Почни слободно, скалирај додека растеш.

Слободен

$0

50 кредити

  • Kokoro, Piper, VITS, MeloTTS
  • Ограничување на знакот
  • 3 ген/ час (без сметка)
Слободно потпиши се

Стартер

$9/мо

500 кредити/месечно

  • Сите 22+ модели
  • Ограничување на знаците
  • Гласовно клонирање
Започни
Најпопуларно

Проф.

$29/мо

2000 кредити месечно

  • Се во стартер
  • API пристап
  • Приоритетна обработка
Добиј проф.

Ентерпрајз

$99/мо

10.000 кредити во месец

  • Се' во проф.
  • Масовна API
  • Приоритетна редица
Продажба на контакти

View all plans including credit packs →

Често поставувани прашања

TTS.ai е најсеопфатната АИ гласова платформа која нуди 22+ модели за текст во говор, клонирање на гласот, говор-на-текст и аудио алатки. Сите модели се отворен извор без приклучување на продавачот.

Да! TTS.ai нуди бесплатен текст за говор со Кокоро, Пајпер, ВИТС и Мелотс. Не е потребна сметка. Запиши се за да добиеш 50 бесплатни кредити и пристап до сите модели. Платените планови почнуваат со 9 долари месечно.

За брзина, користете го Kokoro или Piper. За квалитет, обидете се CosyVoice 2 или StyleTTS 2. За клонирање на гласот, користете Chatterbox или GPT- SoVITS. За дијалог, користете Dia TTS. Обидете се со повеќе модели на истиот текст за споредба.

Да. Компатибилно со OpenAI REST API за TTS, STT, гласовно клонирање и аудио алатки. Достапно на Pro (29/mo) и Enterprise ($99/mo) планови. Преглед на документацијата на tts.ai/api /.

Квалитетот на гласот варира според моделот. Премиум модели како CosyVoice 2, StyleTTS 2 и Chatterbox произведуваат речиси човечки квалитетен говор со природна интонација и емоции.

TTS.ai ја поддржува 30+ јазици низ својата макетна библиотека. Англиски има најширока поддршка за моделот, но модели како CosyVoice 2 покриваат кинески, јапонски и корејски; GPT-SoviTS управува со кинески, јапонски, корејски и англиски; и MelotTS поддржува англиски, шпански, француски, кинески, јапонски и корејски.

Да. Сите процеси се случуваат на нашите посветени сервери на GPU. Не го чуваме вашиот текст или генерираме аудио по испраќањето. Внесените образци за глас се користат само за тековната сесија и не се задржани. Никогаш не ги споделуваме вашите податоци со третите страни ниту ги користиме за обука на модели.

Yes. All audio generated on TTS.ai is yours to use commercially, including for YouTube videos, podcasts, audiobooks, apps, advertisements, and products. Our models are open source under permissive licenses (MIT, Apache 2.0). No royalties or attribution required.

TTS.ai генерира аудио во WAV форматот стандардно за максимален квалитет. Може да конвертирате во MP3, FLAC, OGG или M4A користејќи ја нашата слободна аудио конвертерска алатка. API го поддржува одредувањето на вашиот претпочитан излезен формат директно во барањето.

Upload a short audio sample (as little as 5 seconds) of the voice you want to clone, then type any text to generate speech in that voice. Models like Chatterbox, GPT-SoVITS, and CosyVoice 2 support voice cloning. The cloned voice captures tone, accent, and speaking style.

Бесплатни модели (Kokoro, Piper, VITS, MelotTS) не бараат кредити за сметка и нула цена. Стандардни модели (2 кредити/1K знакови) вклучуваат Bark, CosyVoice 2, F5-TTS и Dia. Premium модели (4 кредити/1K знаци) вклучуваат OpenVoice, Chatterbox, StyleTTS 2 и Tortoise. Платените модели обично нудат повисок квалитет, повеќе гласови и дополнителни карактеристики како клонирање на гласот.

Да. API поддржува пакетна обработка за претворање на големи томови на текст во говор. Поднесете повеќе барања и преземете резултати асинхронно користејќи ги UUIDs. Плановите за претпријатија ($99/mo) вклучуваат приоритетен пристап во редицата за побрза процесија на серија. Идеален за производството на аудиокниги, содржината на курсот и големите проекти за пренос на глас.
5.0/5 (1)

Почни да користиш ВИ глас денес

Приклучете се кон креаторите, развивачите и бизнисите со TTS.ai