Free AI Teks-ka-waca

82M параметрлер Ultra-cepet Suara ekspresif Berbilang Basa Ngadukung streaming

Nokia 808 PureView dipirantèni kodhak VGA lan fitur LED flash,.

Cepat · 1.5GB VRAM Coba

Piper

CPU-friendly Ora ana sambungan 100+ swara 30+ basa Bantuan SSML

A gancang, lokal neural teks ka basa sistem dioptimalkeun pikeun Raspberry Pi jeung alat embedded.

Cepat · 0 (CPU only) VRAM Coba

VITS

Sintetis pungkasan-nganti-akhir Prosodi alami Kesimpulan cepet Akeh pangrekam

Dina basa Inggris, kecap-kecap ieu dipaké pikeun ngabédakeun kecap-kecap anu béda-béda.

Cepat · 1GB VRAM Coba

MeloTTS

CPU-optimized Berbilang Basa Aksara Akeh Produksi Latensi Rendah

Dina basa Indonésia, kecap-kecap anu digunakeun dina kecap-kecap basa Sunda digolongkeun kana kecap-kecap minimal.

Cepat · 0.5GB (GPU optional) VRAM Coba

Bark

Efek swara Ngleksan/ngrengsek Generasi musik 100+ speakers Berbilang Basa

Model teks-ka-audio dumasar kana transformator anu ngahasilkeun basa, musik, sareng efek sora anu realistis.

Larang · 5GB VRAM Coba

Bark Small

Lightweight Luwih cepet tinimbang Bark lengkap Basa emosional Berbilang Basa

Versi anyar iki luwih cepet, luwih efisien, lan luwih murah.

Media · 2GB VRAM Coba

CosyVoice 2

Streaming Kloning Zero-shot Cross-language Kontrol emosi Human-parity

Sacara umum, alam semesta diklasifikasikeun kana alam semesta statis, alam semesta dinamis, sarta alam semesta dinamis-statis.

Dia TTS

Multi-speaker Ngembangake dialog Panggonan alam Ekspresi emosi Parameter

Multi-speaker dialog generasi model nu ngahasilkeun percakapan alami antara speaker.

Parler TTS

Keterangan Suara Kontrol basa alami Penciptaan swara fleksibel Ora butuh swara sing ditetepake

Ngajelaskeun sora anu anjeun pikahoyong dina basa alami sarta Parler bakal ngahasilkeun basa anu cocog.

Indic Parler TTS

11 Basa Jawa Keterangan Suara Kontrol basa alami Basa Jawa Kuno

Basa Jawa 8+ digunakaké kanggo komunikasi antara masarakat Jawa.

Larang · 8GB VRAM Coba

KhanomTan TTS

Thai TTS Akeh panggeser Arsitektur YourTTS Lisénsi Commercial-safe

Basa Sunda diwangun ku 11 aksara, anu diwangun ku 12 hurup.

Cepat · 2GB VRAM Coba

IndexTTS-2

Kontrol emosi Zero-shot Vektor emosi Basa ekspresif Kontrol granular

Sacara umum, algoritma

Spark TTS

Kloning suara Kontrol emosi Kontrol gaya Prompt-based Kloning 5 detik

Telepon sélulér dipaké pikeun komunikasi, komunikasi interpersonal, sareng komunikasi interpersonal.

GPT-SoVITS

Kloning 5 detik Suara nyanyi Panjenengan bisa sinau High Fidelity Cross-language

Sacara umum, spésiés-spésiés ieu diklasifikasikeun kana 5 subspesies, anu masing-masing diklasifikasikeun kana 5 subspesies.

Larang · 6GB VRAM Coba

Orpheus

Emosi tingkat manungsa 100K awr o hyfforddiant Pentingan alami Basa ekspresif

100.000 taun kapungkur, spésiés-spésiés dinosaurus diklasifikasikeun dumasar kana data fosil.

Chatterbox

Kloning Zero-shot Kontrol emosi High Fidelity Gaya transfer Kloning sampel tunggal

Sacara umum, algoritma

Tortoise TTS

Kualitas paling dhuwur Multi-suara Arsitektur DALL-E Kloning suara Regression otomatis

Sacara umum, téks-ka-wacana multi-vokal fokus kana kualitas sareng arsitektur autoregressif.

Larang · 8GB VRAM Coba

StyleTTS 2

Tingkat manungsa Gaya diffusion Latihan lawan Variasi alami High Fidelity

Sacara historis, basa Sunda diwangun ku basa lisan, basa tulisan, jeung basa lisan.

OpenVoice

Kloning langsung Konversi Suara Kontrol emosi Kontrol Aksara Berbilang Basa

Sacara umum, basa Inggris diklasifikasikaké dumasar kana basa, dialek, lan gaya basa.

Qwen3 TTS

Kloning suara 9 preset voices Desain swara saka teks Kontrol emosi

Alibaba's multilingual TTS with voice cloning, preset voices, and voice design from text.

Media · 7GB VRAM Coba

VieNeu-TTS-v2

7 swara sing ditetepake (aksen Lor + Kidul) En-Vi kode-switch Kloning swara (3-5s referensi) Podcast / multi-speaker support CPU-waktos — ora butuh GPU

Vietnam + Inggris kode-switching TTS kalawan 7 sora pra-ditetepkeun sarta zero-shot kloning sora. CPU-only, no GPU diperlukeun.

Cepat · CPU VRAM Coba

Sesame CSM

Konversi Tanggal alami Turn-taking Backchannel 1B параметрлер

Sacara umum, komunikasi interpersonal ngawengku komunikasi verbal, non-verbal, sareng interpersonal.

Larang · 8GB VRAM Coba

Chatterbox Turbo

Sub-200ms latency Tag Paralinguistic 6x wektu nyata Kloning suara Tanda banyu

2000 - 2001 - Dilaksanakeun pameran seni rupa, seni rupa, seni rupa, seni rupa, seni rupa, seni rupa.

Cepat · 2GB VRAM Coba

VoxCPM

Audio Tokenizer-free Cross-language kloning Konteks-dikira LoRA fine-tuning

Nokia 4310 dipirantèni kodhak 1.3 MP lan fitur LED flash,.

Cepat · 4GB VRAM Coba

Kani TTS 2

3GB VRAM Ultra-cepet Kloning suara Lightweight NanoCodec

400MHz, 300MHz

Cepat · 3GB VRAM Coba

OuteTTS

CPU inferensi Browser Sawetara backends Profil panggemar

LLM-basa TTS sing dioperasikake ing CPU, GPU, utawa browser liwat llama.cpp lan Transformers.js.

Larang · 2GB VRAM Coba

VibeVoice

Multi-speaker 90 min Podcast Konsistensi speaker 200ms streaming

Microsoft model kanggo konten multi-speaker bentuk panjang kaya podcasts lan audiobooks.

Cepat · 4GB VRAM Coba

Pocket TTS

Parameter 100M CPU inferensi Kloning suara Kloning sampel tunggal Edge-ready

100M parameter model lightweight dening Kyutai karo kloning swara saka siji sampel.

Cepat · 1GB VRAM Coba

Kitten TTS

CPU-kanggo- Ukuran model kurang saka 80MB 8 swarane ing Kontrol kecepatan Berbasis ONNX Allbwn 24kHz

TTS ultra-lembut ing ngisor 80MB. Dijalanake ing CPU tanpa GPU.

Cepat · 0GB VRAM Coba

CosyVoice3

Bi-streaming Kontrol emosi Kloning suara Kontrol kecepatan/volume Instruksi

TTS generasi salajengna multi-basa kalayan bi-streaming, kontrol emosi, sarta kloning sora zero-shot.

Cepat · 4GB VRAM Coba

NAMAA Saudi TTS

Arab Saudi Arab Standar Modern Kloning swara Zero-shot Kontrol emosi Basa asli

TTS Arab Saudi kapisan. Dialek asli Saudi kalawan kloning sora kualitas Chatterbox.

Media · 6GB VRAM Coba

Darwin TTS

Kloning suara Cross-language FFN-dicampur 4 basa utama Qwen3 backbone

Qwen3-TTS, versi cross-modal Qwen3-TTS, nganggo FFN, dicampuran saka Qwen3-1.7B, kanggo kloning multi-basa.

Media · 7GB VRAM Coba

MOSS-TTSD

Dialog multi-pangutara 5 speakers 60min audio koherente Kloning suara Podcast-optimized

Diantarana, 100 menit anu diwangun ku 500 kecap, 100 menit anu diwangun ku 500 kecap, sarta 100 menit anu diwangun ku 500 kecap.

Media · 12GB VRAM Coba

Ming-Omni TTS

44.1kHz keluaran Kloning suara Kontrol emosi Kontrol dialek Penciptaan BGM Kompakt 0.5B

Nokia 5310 dipirantèni kodhak 1.3 MP, fitur LED flash, fitur autofocus, and built-in microphone.

Media · 3GB VRAM Coba

MOSS-TTS Nano