Free AI Test għal Diskors

22+ open-source mudelli, 100+ vuċijiet, 32+ L-ebda kont meħtieġ.

0/500 karattri Liberi
Ebda karta ta' kreditu 50 krediti b'xejn 32+ lingwi Użu kummerċjali OK
0:00 / 0:00
Download Audio Il-link tiskadi f'24 siegħa
Bħal TTS.ai? Għid lill-ħbieb tiegħek!

Dak kollu li għandek bżonn għall-vuċi AI

26 għodda mħaddma minn 24+ mudelli tal-AI b'sors miftuħ

22+ Mudelli tal-Vuċi AI

L-aktar kollezzjoni komprensiva ta' mudelli TTS b'sors miftuħ f'pjattaforma waħda

KokoroKokoro Free

Kokoro is an 82 million parameter text-to-speech model that punches well above its weight class. Despite its tiny size, it produces remarkably natural and expressive speech. Kokoro supports multiple languages including English, Japanese, Chinese, and Korean with a variety of expressive voices. It runs incredibly fast — generating audio nearly 100x faster than real-time on a GPU.

L-aħjar għal: High-quality TTS with minimal latency, streaming applications

Ipprova b'xejn

PiperPiper Free

Piper is a lightweight text-to-speech engine developed by Rhasspy that uses VITS and larynx architectures. It runs entirely on CPU, making it ideal for edge devices, home automation, and applications requiring offline TTS. With over 100 voices across 30+ languages, Piper delivers natural-sounding speech at real-time speeds even on a Raspberry Pi 4.

L-aħjar għal: Quick previews, accessibility, and embedded applications

Ipprova b'xejn

VITSVITS Free

VITS (Variational Inference with adversarial learning for end-to-end Text-to-Speech) is a parallel end-to-end TTS method that generates more natural sounding audio than current two-stage models. It adopts variational inference augmented with normalizing flows and an adversarial training process, achieving a significant improvement in naturalness.

L-aħjar għal: General-purpose text-to-speech with natural prosody

Ipprova b'xejn

MeloTTSMeloTTS Free

MeloTTS by MyShell.ai is a multilingual TTS library supporting English (American, British, Indian, Australian), Spanish, French, Chinese, Japanese, and Korean. It is extremely fast, processing text at near real-time speed on CPU alone. MeloTTS is designed for production use and supports both CPU and GPU inference.

L-aħjar għal: Applikazzjonijiet tal-produzzjoni li jeħtieġu veloċi, multilingwi TTS

Ipprova b'xejn

BarkBark Standard

Transformer-based text-to-audio model that generates realistic speech, music, and sound effects.

Żviluppatur: Suno · Liċenzja: MIT

Ipprovaha

Bark SmallBark Small Standard

Lighter version of Bark with faster inference and lower memory usage.

Żviluppatur: Suno · Liċenzja: MIT

Ipprovaha

CosyVoice 2CosyVoice 2 Standard

Alibaba's scalable streaming TTS with human-parity naturalness and near-zero latency.

Żviluppatur: Alibaba (Tongyi Lab) · Liċenzja: Apache 2.0

Ipprovaha

Dia TTSDia TTS Standard

Mudell tal-ġenerazzjoni tad-djalogu b'ħafna kelliema li joħloq konversazzjonijiet naturali bejn kelliema.

Żviluppatur: Nari Labs · Liċenzja: Apache 2.0

Ipprovaha

Parler TTSParler TTS Standard

Describe the voice you want in natural language and Parler generates matching speech.

Żviluppatur: Hugging Face · Liċenzja: Apache 2.0

Ipprovaha

IndexTTS-2IndexTTS-2 Standard

Zero-shot TTS with fine-grained emotion control and high expressiveness.

Żviluppatur: Index Team · Liċenzja: Apache 2.0

Ipprovaha

Spark TTSSpark TTS Standard

Voice cloning TTS with controllable emotion and speaking style via prompts.

Żviluppatur: SparkAudio · Liċenzja: Apache 2.0

Ipprovaha

GPT-SoVITSGPT-SoVITS Standard

Few-shot voice cloning TTS that replicates any voice from just 5 seconds of audio.

Żviluppatur: RVC-Boss · Liċenzja: MIT

Ipprovaha

OrpheusOrpheus Standard

Human-level emotional TTS model trained on 100K hours of speech data.

Żviluppatur: Canopy Labs · Liċenzja: Llama 3.2 Community

Ipprovaha

Qwen3 TTSQwen3 TTS Standard

Alibaba's multilingual TTS with voice cloning, preset voices, and voice design from text.

Żviluppatur: Alibaba (Qwen) · Liċenzja: Apache 2.0

Ipprovaha

ChatterboxChatterbox Premium

State-of-the-art klonazzjoni vuċi żero-shot b'kontroll emozzjoni minn Resemble AI.

Kwalità:

Ipprovaha

Tortoise TTSTortoise TTS Premium

Multi-vuċi test-to-diskors iffokat fuq il-kwalità bl-arkitettura autoregressive.

Kwalità:

Ipprovaha

StyleTTS 2StyleTTS 2 Premium

Human-level text-to-speech through style diffusion and adversarial training.

Kwalità:

Ipprovaha

OpenVoiceOpenVoice Premium

Instant klonazzjoni vuċi b'kontroll granulari fuq l-istil, emozzjoni, u l-aċċent.

Kwalità:

Ipprovaha

CosyVoice 2CosyVoice 2

Alibaba's scalable streaming TTS with human-parity naturalness and near-zero latency.

Lingwi: en, zh, ja, ko, fr, de, it, es

Il-vuċi tal-klonu

IndexTTS-2IndexTTS-2

Zero-shot TTS with fine-grained emotion control and high expressiveness.

Lingwi: en, zh

Il-vuċi tal-klonu

Spark TTSSpark TTS

Voice cloning TTS with controllable emotion and speaking style via prompts.

Lingwi: en, zh

Il-vuċi tal-klonu

GPT-SoVITSGPT-SoVITS

Few-shot voice cloning TTS that replicates any voice from just 5 seconds of audio.

Lingwi: en, zh, ja, ko

Il-vuċi tal-klonu

ChatterboxChatterbox

State-of-the-art klonazzjoni vuċi żero-shot b'kontroll emozzjoni minn Resemble AI.

Lingwi: en

Il-vuċi tal-klonu

Tortoise TTSTortoise TTS

Multi-vuċi test-to-diskors iffokat fuq il-kwalità bl-arkitettura autoregressive.

Lingwi: en

Il-vuċi tal-klonu

OpenVoiceOpenVoice

Instant klonazzjoni vuċi b'kontroll granulari fuq l-istil, emozzjoni, u l-aċċent.

Lingwi: en, zh, ja, ko, fr, de, es, it

Il-vuċi tal-klonu

Qwen3 TTSQwen3 TTS

Alibaba's multilingual TTS with voice cloning, preset voices, and voice design from text.

Lingwi: en, zh, ja, ko, de, fr, ru, pt, es, it

Il-vuċi tal-klonu

L-ewwel API tal-iżviluppatur

OpenAI-kompatibbli REST API. One endpoint, 22+ mudelli. Streaming appoġġ għall-applikazzjonijiet fil-ħin reali.

  • Format kompatibbli ma’ OpenAI
  • Streaming TTS għall-applikazzjonijiet fil-ħin reali
  • Ipproċessar tal-lott għall-impjiegi kbar
  • Notifiki tal-webhook
Ara d-dokumenti tal-API
Python
import requests

response = requests.post(
    "https://api.tts.ai/v1/tts/",
    headers={"Authorization": "Bearer sk-tts-xxx"},
    json={
        "model": "kokoro",
        "text": "Hello from TTS.ai!",
        "voice": "af_bella",
    }
)

with open("output.mp3", "wb") as f:
    f.write(response.content)

Sempliċi, prezzijiet trasparenti

Ibda b'xejn. Skala kif tikber.

Liberi

$0

50 kreditu

  • Kokoro, Piper, VITS, MeloTTS
  • Limitu ta’ 500 karattru
  • 3 gen/siegħa (l-ebda kont)
Irreġistra b'xejn

Starter

$9/6 xhur

500 kreditu / xahar

  • Kollha 22+ mudelli
  • Limitu ta’ 5,000 karattru
  • Klonazzjoni tal-vuċi
Ibda
L-aktar popolari

Għaliex

$29/6 xhur

2,000 kreditu/xahar

  • Kollox fi Starter
  • Aċċess għall-API
  • Ipproċessar ta’ prijorità
Ikseb Pro

Intrapriża

$99/6 xhur

10,000 kreditu/xahar

  • Kollox fil-Pro
  • API bl-ingrossa
  • Kju ta’ prijorità
Ikkuntattja l-Bejgħ

View all plans including credit packs →

Mistoqsijiet Frekwenti (FAQ)

TTS.ai hija l-aktar pjattaforma komprensiva tal-vuċi tal-AI, li toffri 22 + mudelli ta ’test għal diskors, klonazzjoni tal-vuċi, diskors għal test, u għodod awdjo.Il-mudelli kollha huma sors miftuħ mingħajr lock-in tal-bejjiegħ.

Iva! TTS.ai joffri test-to-talk b'xejn mal-mudelli Kokoro, Piper, VITS, u MeloTTS. L-ebda kont meħtieġ. Irreġistra biex tikseb 50 kreditu b'xejn u aċċess għall-mudelli kollha.

Għall-veloċità, uża Kokoro jew Piper. Għall-kwalità, ipprova CosyVoice 2 jew StyleTTS 2. Għall-ikklonjar tal-vuċi, uża Chatterbox jew GPT-SoVITS. Għad-djalogu, uża Dia TTS. Ipprova mudelli multipli fuq l-istess test biex tqabbel.

Iva. OpenAI-kompatibbli REST API għal TTS, STT, klonazzjoni vuċi, u l-għodod awdjo. Disponibbli fuq Pro ($29/mo) u l-Intrapriża ($99/mo) pjanijiet. Ara d-dokumentazzjoni fuq tts.ai/api/.

Il-kwalità tal-vuċi tvarja skont il-mudell. Mudelli Premium bħal CosyVoice 2, StyleTTS 2, u Chatterbox jipproduċu diskors ta' kwalità kważi umana b'intonazzjoni u emozzjoni naturali.

TTS.ai jappoġġja 30 + lingwi fil-librerija mudell tagħha.Ingliż għandu l-appoġġ mudell usa', iżda mudelli bħal CosyVoice 2 jkopru Ċiniż, Ġappuniż, u Korean; GPT-SoVITS jimmaniġġja Ċiniż, Ġappuniż, Korean, u l-Ingliż; u MeloTTS jappoġġja l-Ingliż, l-Ispanjol, il-Franċiż, Ċiniż, Ġappuniż, u Korean.

Iva. L-ipproċessar kollu jsir fuq is-servers tal-GPU ddedikati tagħna. Aħna ma naħżnux l-input tat-test tiegħek jew l-awdjo ġġenerat wara l-kunsinna. Il-kampjuni tal-vuċi mgħobbija għall-ikklonjar jintużaw biss għas-sessjoni attwali u ma jinżammux. Aħna qatt ma naqsmu d-dejta tiegħek ma' partijiet terzi jew nużawha biex inħarrġu mudelli.

Yes. All audio generated on TTS.ai is yours to use commercially, including for YouTube videos, podcasts, audiobooks, apps, advertisements, and products. Our models are open source under permissive licenses (MIT, Apache 2.0). No royalties or attribution required.

TTS.ai jiġġenera awdjo fil-format WAV b'mod awtomatiku għall-kwalità massima. inti tista taqleb għall-MP3, FLAC, OGG, jew M4A bl-użu tagħna ħielsa Awdjo konvertitur għodda. l-API jappoġġja l-ispeċifikazzjoni tiegħek preferut output format direttament fit-talba.

Upload a short audio sample (as little as 5 seconds) of the voice you want to clone, then type any text to generate speech in that voice. Models like Chatterbox, GPT-SoVITS, and CosyVoice 2 support voice cloning. The cloned voice captures tone, accent, and speaking style.

Mudelli ħielsa (Kokoro, Piper, VITS, MeloTTS) jeħtieġu l-ebda kont u l-ispiża żero krediti. mudelli Standard (2 krediti/1K karattri) jinkludu Bark, CosyVoice 2, F5-TTS, u Dia. mudelli Premium (4 krediti/1K karattri) jinkludu OpenVoice, Chatterbox, StyleTTS 2, u Tortoise. mudelli mħallsa ġeneralment joffru kwalità ogħla, aktar vuċijiet, u l-karatteristiċi addizzjonali bħal klonazzjoni vuċi.

Iva. L-API jappoġġja l-ipproċessar tal-lott għall-konverżjoni ta' volumi kbar ta' test għal diskors. Ippreżenta talbiet multipli u rkupra r-riżultati b'mod asinkronu billi tuża UUIDs tax-xogħol. Il-pjanijiet tal-intrapriża ($ 99 / xahar) jinkludu aċċess prijoritarju għall-kju għall-ipproċessar tal-lott aktar mgħaġġel. Ideali għall-produzzjoni tal-awdjobook, kontenut tal-kors, u proġetti ta' voiceover fuq skala kbira.
5.0/5 (1)

Ibda tuża AI Voice Illum

Ingħaqad kreaturi, żviluppaturi, u n-negozji li jużaw TTS.ai