Слободна ВИ Текст у говор

22+ модела отвореног извора, 100+ гласова, 32+ Језици. Нема потребе за налогом.

0/500 знакови слободни
Нема кредитне картице 50 бесплатних кредита 32+ језици Комерцијална употреба у реду
0:00 / 0:00
Download Audio Веза истекава за 24х
Реци својим пријатељима!

Све што вам је потребно за Глас АИ

26 алатки покретаних 24+ отвореним моделима АИ

22+ АИ Гласовни модели

Најопширнија збирка отворених ТТС модела у једној платформи

Kokoro Free

Kokoro is an 82 million parameter text-to-speech model that punches well above its weight class. Despite its tiny size, it produces remarkably natural and expressive speech. Kokoro supports multiple languages including English, Japanese, Chinese, and Korean with a variety of expressive voices. It runs incredibly fast — generating audio nearly 100x faster than real-time on a GPU.

Најбоље за: High-quality TTS with minimal latency, streaming applications

Покушај слободно

Piper Free

Piper is a lightweight text-to-speech engine developed by Rhasspy that uses VITS and larynx architectures. It runs entirely on CPU, making it ideal for edge devices, home automation, and applications requiring offline TTS. With over 100 voices across 30+ languages, Piper delivers natural-sounding speech at real-time speeds even on a Raspberry Pi 4.

Најбоље за: Quick previews, accessibility, and embedded applications

Покушај слободно

VITS Free

VITS (Variational Inference with adversarial learning for end-to-end Text-to-Speech) is a parallel end-to-end TTS method that generates more natural sounding audio than current two-stage models. It adopts variational inference augmented with normalizing flows and an adversarial training process, achieving a significant improvement in naturalness.

Најбоље за: General-purpose text-to-speech with natural prosody

Покушај слободно

MeloTTS Free

MeloTTS by MyShell.ai is a multilingual TTS library supporting English (American, British, Indian, Australian), Spanish, French, Chinese, Japanese, and Korean. It is extremely fast, processing text at near real-time speed on CPU alone. MeloTTS is designed for production use and supports both CPU and GPU inference.

Најбоље за: Производни програми којима је потребна брза, јазична ТТС

Покушај слободно

Bark Standard

Transformer-based text-to-audio model that generates realistic speech, music, and sound effects.

Програмер: Suno · Лиценца: MIT

Пробај.

Bark Small Standard

Lighter version of Bark with faster inference and lower memory usage.

Програмер: Suno · Лиценца: MIT

Пробај.

CosyVoice 2 Standard

Alibaba's scalable streaming TTS with human-parity naturalness and near-zero latency.

Програмер: Alibaba (Tongyi Lab) · Лиценца: Apache 2.0

Пробај.

Dia TTS Standard

Модел генерације вишезвучног дијалога који ствара природне разговоре између звучника.

Програмер: Nari Labs · Лиценца: Apache 2.0

Пробај.

Parler TTS Standard

Describe the voice you want in natural language and Parler generates matching speech.

Програмер: Hugging Face · Лиценца: Apache 2.0

Пробај.

IndexTTS-2 Standard

Zero-shot TTS with fine-grained emotion control and high expressiveness.

Програмер: Index Team · Лиценца: Apache 2.0

Пробај.

Spark TTS Standard

Voice cloning TTS with controllable emotion and speaking style via prompts.

Програмер: SparkAudio · Лиценца: Apache 2.0

Пробај.

GPT-SoVITS Standard

Few-shot voice cloning TTS that replicates any voice from just 5 seconds of audio.

Програмер: RVC-Boss · Лиценца: MIT

Пробај.

Orpheus Standard

Human-level emotional TTS model trained on 100K hours of speech data.

Програмер: Canopy Labs · Лиценца: Llama 3.2 Community

Пробај.

Qwen3 TTS Standard

Alibaba's multilingual TTS with voice cloning, preset voices, and voice design from text.

Програмер: Alibaba (Qwen) · Лиценца: Apache 2.0

Пробај.

Chatterbox Premium

Стејт-оф-тхе-модерни глас клонирање са емоционалном контролом из Ресембл АИ.

Квалитет:

Пробај.

Tortoise TTS Premium

Вишегласни текст-то-спеецх фокусиран на квалитет са ауто-регресивном архитектуром.

Квалитет:

Пробај.

StyleTTS 2 Premium

Human-level text-to-speech through style diffusion and adversarial training.

Квалитет:

Пробај.

OpenVoice Premium

Instant voice cloning with granular control over style, emotion, and accent.

Квалитет:

Пробај.

CosyVoice 2

Alibaba's scalable streaming TTS with human-parity naturalness and near-zero latency.

Језици: en, zh, ja, ko, fr, de, it, es

Клонирање гласа

IndexTTS-2

Zero-shot TTS with fine-grained emotion control and high expressiveness.

Језици: en, zh

Клонирање гласа

Spark TTS

Voice cloning TTS with controllable emotion and speaking style via prompts.

Језици: en, zh

Клонирање гласа

GPT-SoVITS

Few-shot voice cloning TTS that replicates any voice from just 5 seconds of audio.

Језици: en, zh, ja, ko

Клонирање гласа

Chatterbox

Стејт-оф-тхе-модерни глас клонирање са емоционалном контролом из Ресембл АИ.

Језици: en

Клонирање гласа

Tortoise TTS

Вишегласни текст-то-спеецх фокусиран на квалитет са ауто-регресивном архитектуром.

Језици: en

Клонирање гласа

OpenVoice

Instant voice cloning with granular control over style, emotion, and accent.

Језици: en, zh, ja, ko, fr, de, es, it

Клонирање гласа

Qwen3 TTS

Alibaba's multilingual TTS with voice cloning, preset voices, and voice design from text.

Језици: en, zh, ja, ko, de, fr, ru, pt, es, it

Клонирање гласа

програмер‐ први АПИ‐ програмер

АПИ сагласан са OpenAI‐ ом. Један крајњи крај, 22+ модела. Стремим подршку за програме у реалном времену.

  • Формат сагласан са OpenAI‐ ом
  • Стремирање ТТС‐ а за програме у реалном времену
  • Пакетна обрада за велике послове
  • Обав› јештења о ~@ ¦Вебхуку¦Webhooku¦
Приказ АПИ Док
Python
import requests

response = requests.post(
    "https://api.tts.ai/v1/tts/",
    headers={"Authorization": "Bearer sk-tts-xxx"},
    json={
        "model": "kokoro",
        "text": "Hello from TTS.ai!",
        "voice": "af_bella",
    }
)

with open("output.mp3", "wb") as f:
    f.write(response.content)

једноставна, провидна цена

Почните слободни, скалирајте док растете.

слободни

$0

50 кредита

  • Kokoro, Piper, VITS, MeloTTS
  • 500 ограничења знакова
  • 3 ген/ сат (без налога)
Слободно се пријави

Покретач

$9/мо

500 кредита месечно

  • Сви 22+ модели
  • Ограничење 5.000 знакова
  • Гласово клонирање
Започни
Најпопуларнији

Проф.

$29/мо

2.000 кредита месечно

  • Све у Стартеру
  • АПИ приступ
  • Приоритетна обрада
Гет про

Ентерпрајз

$99/мо

10.000 кредита месечно

  • Све у проф.
  • масовни АПИ
  • Приоритетан редослед
Продаја контаката

View all plans including credit packs →

Често постављана питања

ТТС.аи је најопсежна АИ говорна платформа, која нуди 22+ моделе за текст у говор, клонирање гласом, говор за текст и аудио алате.

Да! ТТС.аи нуди бесплатан текст- у- говор са Кокоро, Пајпер, ВИТС и МелоТТС моделима. Нема потребе за налог. Пријавите се за 50 бесплатних кредита и приступ свим моделима. Плаћени планови почињу од 9 долара месечно.

За брзину, користите Кокоро или Пајпер. За квалитет покушајте CosyVoice 2 или StyleTTS 2. За клонирање гласа, користите Цхаттербокс или GPT- SoVITS. За дијалог користите ~@ ¦Дија ТТС¦Dia TTS¦. Покушајте да упоредите више модела на истом тексту.

Да. АПИ сагласан са OpenAI‐ ом за ТТС, СТТ, клонирање гласова и аудио алатке. Доступан је на Про‐ у (29/мо) и Ентерпрајзу (99 долара/мо). Прикажи документацију на tts.ai/api /.

Квалитет гласа варира према моделу. Премиум модели као што су CosyVoice 2, StyleTTS 2, и Чаттербокс производе говор близу људског квалитета са природним интонацијом и емоцијама. Бесплатни модели попут Кокоро нуде одличан квалитет за већину случајева коришћења.

ТТС.аи подржава 30+ језика у својој библиотеци модела. Енглески има најширшу подршку модела, али модели попут CosyVoice 2 покривају кинески, јапански и корејски; ГПТ- СоВИТС подржава кинески, јапански, корејски и енглески; а МелоТТС подржава енглески, шпански, француски, кинески, јапански и корејски.

Да. Сва обрада се дешава на нашим посвећеним ГПУ серверима. Не складиштамо унос текста или генеришемо аудио после испоруке. Слање узорка гласа за клонирање користи се само за текућу сесију и није задржано. Никада не делимо ваше податке са трећим особама и не користимо их за обуку модела.

Yes. All audio generated on TTS.ai is yours to use commercially, including for YouTube videos, podcasts, audiobooks, apps, advertisements, and products. Our models are open source under permissive licenses (MIT, Apache 2.0). No royalties or attribution required.

ТТС.аи подразум› ијевано генерише звук у WAV формату за максимални квалитет. Можете претворити у МП3, ФЛАЦ, ОГГ или М4А помоћу наше бесплатне алатке аудио претварача. АПИ подржава одређивање вашег пожељног излазног формата директно у захт› јеву.

Upload a short audio sample (as little as 5 seconds) of the voice you want to clone, then type any text to generate speech in that voice. Models like Chatterbox, GPT-SoVITS, and CosyVoice 2 support voice cloning. The cloned voice captures tone, accent, and speaking style.

Бесплатни модели (Кокоро, Пајпер, ВИТС, МелоТТС) не захт› ијевају налог и нулти кредит. Стандардни модели (2 кредита/1К знакова) укључују Барк, Цоси Глас 2, Ф5- ТТС и Диа. Премиум модели (4 кредита/1К знакова) укључују отворени глас, Цхаттербокс, СтилТТС 2 и Тортоис. Плаћени модели обично нуде већи квалитет, више гласова и додатне могућности попут клонирања гласа.

Да. АПИ подржава пакетну обраду за претварање великих јачина текста у говор. Пошаљи више захт› јева и добављај резултате асинхронно користећи УУИД‐ ове. Планови предузећа (99 $/mo) укључују приоритетни приступ реду за бржу обраду пакета. Идеалан за производњу аудио књиге, садржај курса и велике пројекте преузимања гласова.
5.0/5 (1)

Почни да користиш ВИ глас данас

Придружите се ствараоцима, програмерима и пословима користећи ТТС.аи