Free AI Teksti në Fjalë

22+ modele me burim të hapur, 100+ zëra, 32+ Nuk kërkohet llogari.

0/500 gërma I lirë
Pa kartë krediti 50 kreditë falas 32+ gjuhë Përdorimi komercial OK
0:00 / 0:00
Download Audio Lidhja skadoi për 24 orë
Si TTS.ai?

Gjithçka që ju duhet për AI-në e zërit

26 instrumentë të mbështetur nga 24+ modele të inteligjencës artificiale të hapura

22+ modele zërash AI

Koleksioni më i plotë i modeleve të TTS me burim të hapur në një platformë

KokoroKokoro Free

Kokoro is an 82 million parameter text-to-speech model that punches well above its weight class. Despite its tiny size, it produces remarkably natural and expressive speech. Kokoro supports multiple languages including English, Japanese, Chinese, and Korean with a variety of expressive voices. It runs incredibly fast — generating audio nearly 100x faster than real-time on a GPU.

Më e mira për: High-quality TTS with minimal latency, streaming applications

Provoje falas

PiperPiper Free

Piper is a lightweight text-to-speech engine developed by Rhasspy that uses VITS and larynx architectures. It runs entirely on CPU, making it ideal for edge devices, home automation, and applications requiring offline TTS. With over 100 voices across 30+ languages, Piper delivers natural-sounding speech at real-time speeds even on a Raspberry Pi 4.

Më e mira për: Quick previews, accessibility, and embedded applications

Provoje falas

VITSVITS Free

VITS (Variational Inference with adversarial learning for end-to-end Text-to-Speech) is a parallel end-to-end TTS method that generates more natural sounding audio than current two-stage models. It adopts variational inference augmented with normalizing flows and an adversarial training process, achieving a significant improvement in naturalness.

Më e mira për: General-purpose text-to-speech with natural prosody

Provoje falas

MeloTTSMeloTTS Free

MeloTTS by MyShell.ai is a multilingual TTS library supporting English (American, British, Indian, Australian), Spanish, French, Chinese, Japanese, and Korean. It is extremely fast, processing text at near real-time speed on CPU alone. MeloTTS is designed for production use and supports both CPU and GPU inference.

Më e mira për: Aplikacionet e prodhimit kanë nevojë për TTS të shpejtë dhe shumëgjuhësh

Provoje falas

BarkBark Standard

Transformer-based text-to-audio model that generates realistic speech, music, and sound effects.

Programuesi: Suno · Liçenca: MIT

Provoje.

Bark SmallBark Small Standard

Lighter version of Bark with faster inference and lower memory usage.

Programuesi: Suno · Liçenca: MIT

Provoje.

CosyVoice 2CosyVoice 2 Standard

Alibaba's scalable streaming TTS with human-parity naturalness and near-zero latency.

Programuesi: Alibaba (Tongyi Lab) · Liçenca: Apache 2.0

Provoje.

Dia TTSDia TTS Standard

Modeli i krijimit të dialogut me shumë folës që krijon biseda natyrore midis folësve.

Programuesi: Nari Labs · Liçenca: Apache 2.0

Provoje.

Parler TTSParler TTS Standard

Describe the voice you want in natural language and Parler generates matching speech.

Programuesi: Hugging Face · Liçenca: Apache 2.0

Provoje.

IndexTTS-2IndexTTS-2 Standard

Zero-shot TTS with fine-grained emotion control and high expressiveness.

Programuesi: Index Team · Liçenca: Apache 2.0

Provoje.

Spark TTSSpark TTS Standard

Voice cloning TTS with controllable emotion and speaking style via prompts.

Programuesi: SparkAudio · Liçenca: Apache 2.0

Provoje.

GPT-SoVITSGPT-SoVITS Standard

Few-shot voice cloning TTS that replicates any voice from just 5 seconds of audio.

Programuesi: RVC-Boss · Liçenca: MIT

Provoje.

OrpheusOrpheus Standard

Human-level emotional TTS model trained on 100K hours of speech data.

Programuesi: Canopy Labs · Liçenca: Llama 3.2 Community

Provoje.

Qwen3 TTSQwen3 TTS Standard

Alibaba's multilingual TTS with voice cloning, preset voices, and voice design from text.

Programuesi: Alibaba (Qwen) · Liçenca: Apache 2.0

Provoje.

ChatterboxChatterbox Premium

Klonimi i zërit me kontroll emocionesh nga Resemble AI.

Cilësia:

Provoje.

Tortoise TTSTortoise TTS Premium

Tekst-në-folje me shumë zëra të përqëndruar në cilësinë me arkitekturë autoregresive.

Cilësia:

Provoje.

StyleTTS 2StyleTTS 2 Premium

Human-level text-to-speech through style diffusion and adversarial training.

Cilësia:

Provoje.

OpenVoiceOpenVoice Premium

Klonimi i menjëhershëm i zërit me kontroll të hollësishëm mbi stilin, emocionet dhe theksin.

Cilësia:

Provoje.

CosyVoice 2CosyVoice 2

Alibaba's scalable streaming TTS with human-parity naturalness and near-zero latency.

Gjuhë: en, zh, ja, ko, fr, de, it, es

Klono zërin

IndexTTS-2IndexTTS-2

Zero-shot TTS with fine-grained emotion control and high expressiveness.

Gjuhë: en, zh

Klono zërin

Spark TTSSpark TTS

Voice cloning TTS with controllable emotion and speaking style via prompts.

Gjuhë: en, zh

Klono zërin

GPT-SoVITSGPT-SoVITS

Few-shot voice cloning TTS that replicates any voice from just 5 seconds of audio.

Gjuhë: en, zh, ja, ko

Klono zërin

ChatterboxChatterbox

Klonimi i zërit me kontroll emocionesh nga Resemble AI.

Gjuhë: en

Klono zërin

Tortoise TTSTortoise TTS

Tekst-në-folje me shumë zëra të përqëndruar në cilësinë me arkitekturë autoregresive.

Gjuhë: en

Klono zërin

OpenVoiceOpenVoice

Klonimi i menjëhershëm i zërit me kontroll të hollësishëm mbi stilin, emocionet dhe theksin.

Gjuhë: en, zh, ja, ko, fr, de, es, it

Klono zërin

Qwen3 TTSQwen3 TTS

Alibaba's multilingual TTS with voice cloning, preset voices, and voice design from text.

Gjuhë: en, zh, ja, ko, de, fr, ru, pt, es, it

Klono zërin

Developer-First API

REST API e përshtatshme me OpenAI. Një pikë përfundimtare, më shumë se 22 modele. Mbështetje streaming për aplikacionet në kohë reale.

  • Format i përshtatshëm OpenAI
  • Streaming TTS për aplikacionet në kohë reale
  • Përpunimi i grupeve për punë të mëdha
  • Njoftime webhook
Shiko dokumentet e API
Python
import requests

response = requests.post(
    "https://api.tts.ai/v1/tts/",
    headers={"Authorization": "Bearer sk-tts-xxx"},
    json={
        "model": "kokoro",
        "text": "Hello from TTS.ai!",
        "voice": "af_bella",
    }
)

with open("output.mp3", "wb") as f:
    f.write(response.content)

Çmime të thjeshta, transparente

Fillo i lirë.Shkallezohu ndërsa rritesh.

I lirë

$0

50 kreditë

  • Kokoro, Piper, VITS, MeloTTS
  • Kufiri i 500 karakterëve
  • 3 gjen/orë (pa llogari)
Regjistrohu pa pagesë

Fillues

$9/Mb

500 credits/month

  • Të gjitha 22+ modelet
  • Kufiri i 5,000 karakterëve
  • Klonimi i zërit
Fillo
Popullariteti

Pro

$29/Mb

2,000 credits/month

  • Gjithçka në Starter
  • Hyrja në API
  • Përpunimi i përparësisë
Bëhu Pro

Enterprise.

$99/Mb

10,000 credits/month

  • Gjithçka në Pro
  • Bulk API
  • Rreshta e përparësisë
Kontakti për shitjet

View all plans including credit packs →

Pyetje të shpeshta

TTS.ai është platforma më e gjerë e zërit të inteligjencës artificiale, duke ofruar më shumë se 22 modele tekst-në-folje, klonim zëri, fjalë-në-tekst, dhe instrumente audio. Të gjithë modelet janë me burim të hapur pa bllokimin e shitësit.

Po! TTS.ai ofron tekst-në-folje falas me modelet Kokoro, Piper, VITS, dhe MeloTTS. Nuk kërkohet llogari. Regjistrohu për të marrë 50 kreditë falas dhe akses në të gjitha modelet. Planet e paguar fillojnë nga $9/muaj.

Për shpejtësi, përdor Kokoro ose Piper. Për cilësi, provo CosyVoice 2 ose StyleTTS 2. Për klonim zëri, përdor Chatterbox ose GPT-SoVITS. Për dialog, përdor Dia TTS. Provo disa modele në të njëjtin tekst për t'u krahasuar.

Po. API REST e përshtatshme me OpenAI për TTS, STT, klonimin e zërit dhe instrumentët audio. Në dispozicion në planet Pro ($29/muaj) dhe Enterprise ($99/muaj). Shiko dokumentacionin tek tts.ai/api/.

Cilësia e zërit ndryshon sipas modelit. Modelet Premium si CosyVoice 2, StyleTTS 2, dhe Chatterbox prodhojnë fjalë me cilësi pothuajse njerëzore me intonacion natyror dhe emocione. Modelet pa pagesë si Kokoro ofrojnë cilësi të shkëlqyer për shumicën e rasteve të përdorimit.

TTS.ai mbështet më shumë se 30 gjuhë nëpërmjet bibliotekës së modelit të saj. Anglishtja ka mbështetjen më të gjerë të modelit, por modelet si CosyVoice 2 mbulojnë kinezisht, japonisht dhe koreanisht; GPT-SoVITS trajton kinezisht, japonisht, koreanisht dhe anglisht; dhe MeloTTS mbështet anglisht, spanjisht, frëngjisht, kinezisht, japonisht dhe koreanisht.

Po. E gjithë përpunimi ndodh në serverat tanë të dedikuar GPU. Ne nuk ruajmë tekstin tuaj të hyrës apo audion e gjeneruar pas dorëzimit. Shembujt e zërit të ngarkuar për klonim përdoren vetëm për seancën aktuale dhe nuk ruhen. Ne kurrë nuk i ndajmë të dhënat tuaja me të tretat apo i përdorim ato për të trajnuar modelet.

Yes. All audio generated on TTS.ai is yours to use commercially, including for YouTube videos, podcasts, audiobooks, apps, advertisements, and products. Our models are open source under permissive licenses (MIT, Apache 2.0). No royalties or attribution required.

TTS.ai gjeneron audio në formatin WAV në mënyrë të prezgjedhur për cilësinë maksimale. Mund të konvertosh në MP3, FLAC, OGG, ose M4A duke përdorur instrumentin tonë të lirë të konvertimit të audios. API suporton specifikimin e formatit të preferuar të daljes drejtpërsëdrejti në kërkesë.

Upload a short audio sample (as little as 5 seconds) of the voice you want to clone, then type any text to generate speech in that voice. Models like Chatterbox, GPT-SoVITS, and CosyVoice 2 support voice cloning. The cloned voice captures tone, accent, and speaking style.

Modelet pa pagesë (Kokoro, Piper, VITS, MeloTTS) nuk kërkojnë llogari dhe kushton zero kreditë. Modelet standarde (2 kreditë/1K karaktere) përfshijnë Bark, CosyVoice 2, F5-TTS, dhe Dia. Modelet Premium (4 kreditë/1K karaktere) përfshijnë OpenVoice, Chatterbox, StyleTTS 2, dhe Tortoise. Modelet me pagesë zakonisht ofrojnë cilësi më të lartë, më shumë zëra, dhe funksione shtesë si klonimi i zërit.

Po. API suporton përpunimin e grupeve për konvertimin e volumeve të mëdha të tekstit në fjalë. Paraqitja e kërkesave të shumta dhe marrja e rezultateve në mënyrë asinkrone duke përdorur UUID-të e punës. Planet Enterprise ($99/muaj) përfshijnë hyrjen në radhën e përparësisë për përpunimin më të shpejtë të grupeve. Ideale për prodhimin e audio librave, përmbajtjen e kurseve dhe projektet e votimit në shkallë të madhe.
5.0/5 (1)

Fillo përdorimin e zërit AI sot

Bashkohu me krijues, zhvillues dhe biznese duke përdorur TTS.ai