Libreng AI > Teksto sa Pagsasalita
31+ > open-source modelo, 231+ mga tinig, 34+ Hindi kinakailangan ang account.
> Lahat ng kailangan mo para sa Voice AI
> 30+ mga tool na pinalakas ng mga modelo ng open-source AI
31+ Mga modelo ng boses ng AI
> Ang pinaka-komprehensibong koleksyon ng mga modelo ng open-source TTS sa isang platform
Kokoro Free
Ang Kokoro ay isang 82 milyong parameter na modelo ng text-to-speech na may mga punch na mas mataas sa timbang nito. Sa kabila ng maliit na sukat nito, ito ay lumilikha ng kapansin-pansin na natural at masining na pagsasalita. Sinusuportahan ng Kokoro ang maraming wika kabilang ang Ingles, Hapon, Intsik, at Koreano na may iba't ibang mga masining na boses.
Pinakamahusay para sa: > Mataas na kalidad na TTS na may minimum na latency, streaming application
Subukan ito para sa libreng
Piper Free
Ang Piper ay isang lightweight text-to-speech engine na binuo ng Rhasspy na gumagamit ng VITS at larynx architectures. Ito ay tumatakbo ng buo sa CPU, na ginagawang perpekto para sa mga aparatong gilid, home automation, at mga application na nangangailangan ng offline TTS. Sa higit sa 100 mga boses sa 30+ wika, ang Piper ay naghahatid ng natural na tunog na pagsasalita sa real-time na bilis kahit na sa isang Raspberry Pi4.
Pinakamahusay para sa: > Mabilis na preview, accessibility, at naka-embed na mga application
Subukan ito para sa libreng
VITS Free
Ang VITS (Variation Inference with adversarial learning for end-to-end Text-to-Speech) ay isang parallel end-to-end na paraan ng TTS na bumubuo ng mas natural na tunog na audio kaysa sa kasalukuyang dalawang-stage na modelo. Ito ay gumagamit ng variation inference na pinahusay ng normalisasyon ng daloy at isang adversarial na proseso ng pagsasanay, na nakamit ang isang makabuluhang pagpapabuti sa naturalness.
Pinakamahusay para sa: > Pangkalahatang-layunin na teksto-sa-pagsasalita na may natural na prosody
Subukan ito para sa libreng
MeloTTS Free
Ang MeloTTS ay isang multilingual na TTS library na sumusuporta sa Ingles (Amerikano, Briton, Indian, Australian), Espanyol, Pranses, Intsik, Hapon, at Koreano. Ito ay lubhang mabilis, pagpoproseso ng teksto sa malapit na real-time na bilis sa CPU lamang. MeloTTS ay dinisenyo para sa paggamit ng produksyon at sumusuporta sa parehong CPU at GPU pagbubuod.
Pinakamahusay para sa: > Production application na nangangailangan ng mabilis, multilingual TTS
Subukan ito para sa libreng
OuteTTS Free
Ang OuteTTS ay nagpapalawak ng mga malalaking modelo ng wika na may kakayahang text-to-speech habang pinapanatili ang orihinal na arkitektura. Sinusuportahan nito ang maraming mga backend kabilang ang llama.cpp (CPU / GPU), Hugging Face Transformers, ExLlamaV2, VLLM, at kahit na browser inference sa pamamagitan ng Transformers.js.
Pinakamahusay para sa: > Edge pagpapatupad, browser-based TTS, mababang-resource kapaligiran
Subukan ito para sa libreng
Pocket TTS Free
Ang Pocket TTS ni Kyutai (mga tagapaglikha ng Moshi) ay isang compact na 100M parameter na modelo ng text-to-speech na may kakayahang mag-punch ng mas mataas kaysa sa timbang nito. Mahusay itong gumagana sa CPU, sumusuporta sa zero-shot na cloning ng boses mula sa isang solong sample ng audio, at gumagawa ng natural na tunog na pagsasalita.
Pinakamahusay para sa: > Magaan pag-deploy, CPU-lamang kapaligiran, mabilis na boses cloning
Subukan ito para sa libreng
Kitten TTS Free
Kitten TTS by KittenML is an ultra-lightweight text-to-speech model built on ONNX. With variants from 15M to 80M parameters (25-80 MB on disk), it delivers high-quality voice synthesis on CPU without requiring a GPU. Features 8 built-in voices, adjustable speech speed, and built-in text preprocessing for numbers, currencies, and units. Ideal for edge deployment and low-latency applications.
Pinakamahusay para sa: Fast lightweight TTS, edge deployment, low-latency applications
Subukan ito para sa libreng
Bark Standard
Ang mga ito ay mga modelong text-to-audio na may basehan sa transformer na bumubuo ng mga realistikong pananalita, musika, at mga epekto ng tunog.
Tagabuo: Suno · Lisensya: MIT
Subukan ito
Bark Small Standard
Ang mga ito ay may mas mababang presyon ng dugo at mas mababang presyon ng dugo.
Tagabuo: Suno · Lisensya: MIT
Subukan ito
CosyVoice 2 Standard
Ang mga ito ay ang mga sumusunod: Ang mga natural na bilang ay mga natural na bilang na may hangganan.
Tagabuo: Alibaba (Tongyi Lab) · Lisensya: Apache 2.0
Subukan ito
Dia TTS Standard
Ang mga modelong multi-speaker na dialog generation ay lumilikha ng mga natural na pag-uusap sa pagitan ng mga nagsasalita.
Tagabuo: Nari Labs · Lisensya: Apache 2.0
Subukan ito
Parler TTS Standard
> Ipaliwanag ang boses na gusto mo sa natural na wika at Parler bumubuo ng tumutugma na pananalita.
Tagabuo: Hugging Face · Lisensya: Apache 2.0
Subukan ito
GLM-TTS Standard
Ang mga ito ay ang mga pinaka-karaniwang mga uri ng mga modelong TTS.
Tagabuo: Zhipu AI · Lisensya: GLM-4 License
Subukan ito
IndexTTS-2 Standard
Ang mga ito ay may mataas na lebel ng kontrol sa emosyon at pag-iisip.
Tagabuo: Index Team · Lisensya: Bilibili Model License
Subukan ito
Spark TTS Standard
> Voice cloning TTS na may kontroladong damdamin at pagsasalita estilo sa pamamagitan ng mga prompt.
Tagabuo: SparkAudio · Lisensya: CC BY-NC-SA 4.0
Subukan ito
GPT-SoVITS Standard
Ang mga ito ay mga karaniwang mga halimbawa ng mga selula na may5mga kromosoma.
Tagabuo: RVC-Boss · Lisensya: MIT
Subukan ito
Orpheus Standard
Ang mga 100,000 mga tao ay namatay sa 100,000 mga araw ng digmaan.
Tagabuo: Canopy Labs · Lisensya: Llama 3.2 Community
Subukan ito
Qwen3 TTS Standard
Ang mga wikang Awstronesyo ay isang pangkat ng mga wikang Austronesyo, isang pangkat ng mga wikang Austronesyo na sinasalita sa Pilipinas.
Tagabuo: Alibaba (Qwen) · Lisensya: Apache 2.0
Subukan ito
Chatterbox Turbo Standard
Ang mga ito ay kinabibilangan ng mga 200 mga uri ng mga halaman, mga 200 mga uri ng mga hayop, at mga 200 mga uri ng mga halaman.
Tagabuo: Resemble AI · Lisensya: MIT
Subukan ito
Dia 2 Standard
Ang mga ito ay kinabibilangan ng mga multi-lingual na mga wika at mga wikang paralinguistiko.
Tagabuo: Nari Labs · Lisensya: Apache 2.0
Subukan ito
VoxCPM Standard
Ang 1444 Electra ay isang planetang hindi pangunahin.
Tagabuo: OpenBMB · Lisensya: Apache 2.0
Subukan ito
TADA Standard
Ang mga ito ay may karaniwang mga katangian ng mga selula ng T. elegans, ngunit may mga pagkakaiba sa mga selula ng T. lymphoides.
Tagabuo: Hume AI · Lisensya: MIT
Subukan ito
VibeVoice Standard
Ang modelo ng Microsoft para sa mahabang anyo ng multi-speaker na nilalaman tulad ng mga podcast at audiobooks.
Tagabuo: Microsoft · Lisensya: MIT
Subukan ito
CosyVoice3 Standard
Next-generation multilingual TTS with bi-streaming, emotion control, and zero-shot voice cloning.
Tagabuo: Alibaba (FunAudioLLM) · Lisensya: Apache 2.0
Subukan ito
CosyVoice 2
Ang mga ito ay ang mga sumusunod: Ang mga natural na bilang ay mga natural na bilang na may hangganan.
Wika: en, zh, ja, ko, fr, de, it, es
Clone Voice
GLM-TTS
Ang mga ito ay ang mga pinaka-karaniwang mga uri ng mga modelong TTS.
Wika: en, zh
Clone Voice
IndexTTS-2
Ang mga ito ay may mataas na lebel ng kontrol sa emosyon at pag-iisip.
Wika: en, zh
Clone Voice
Spark TTS
> Voice cloning TTS na may kontroladong damdamin at pagsasalita estilo sa pamamagitan ng mga prompt.
Wika: en, zh
Clone Voice
GPT-SoVITS
Ang mga ito ay mga karaniwang mga halimbawa ng mga selula na may5mga kromosoma.
Wika: en, zh, ja, ko
Clone Voice
Chatterbox
Ang mga ito ay tinatawag na mga "zero-shot" na mga clone na may kakayahang kontrolin ang mga emosyon.
Wika: en
Clone Voice
Tortoise TTS
Ang mga salitang ito ay karaniwang ginagamit sa mga tekstong relihiyoso.
Wika: en
Clone Voice
OpenVoice
> Instant boses cloning na may granular kontrol sa estilo, damdamin, at accent.
Wika: en, zh, ja, ko, fr, de, es, it
Clone Voice
Qwen3 TTS
Ang mga wikang Awstronesyo ay isang pangkat ng mga wikang Austronesyo, isang pangkat ng mga wikang Austronesyo na sinasalita sa Pilipinas.
Wika: en, zh, ja, ko, de, fr, ru, pt, es, it
Clone Voice
Chatterbox Turbo
Ang mga ito ay kinabibilangan ng mga 200 mga uri ng mga halaman, mga 200 mga uri ng mga hayop, at mga 200 mga uri ng mga halaman.
Wika: en
Clone Voice
OuteTTS
Ang mga ito ay kinabibilangan ng mga karaniwang mga uri ng mga CPU, GPU, at mga processor.
Wika: en
Clone Voice
Pocket TTS
Ang 1000000000000000000♠100 M ay isang likas na bilang na pagkatapos ng 100 at bago ng 109.
Wika: en, fr
Clone Voice
CosyVoice3
Next-generation multilingual TTS with bi-streaming, emotion control, and zero-shot voice cloning.
Wika: en, zh, ja, ko, de, es, fr, it, ru
Clone Voice
MOSS-TTS
Ultra-long 20-language TTS supporting up to 1 hour of continuous generation with phoneme-level control.
Wika: en, zh, de, es, fr, ja, it, hu, ko, ru, fa, ar, pl, pt, cs, da, sv, el, tr
Clone Voice
MegaTTS3
ByteDance's sparse alignment TTS with adjustable intelligibility vs. speaker similarity.
Wika: en, zh
Clone VoiceDeveloper-una API
> OpenAI-kapareho REST API. Isang endpoint, 22+ modelo. Streaming suporta para sa mga real-time na mga application.
- tl> OpenAI-compatible format
- > Streaming TTS para sa real-time apps
- > Batch pagpoproseso para sa malaking trabaho
- > Webhook mga notification
pip install ttsai
npm install @ttsainpm/ttsai
from tts_ai import TTSClient
client = TTSClient(api_key="sk-tts-xxx")
audio = client.generate(
text="Hello from TTS.ai!",
model="kokoro",
voice="af_bella",
)
client.save(audio, "output.mp3")
> Simple, transparent na pagpepresyo
> Magsimula nang libre. Scale habang lumalaki ka.
Libre
> 15,000 mga character
- Kokoro, Piper, VITS, MeloTTS
- > 500 character na limitasyon
- >3gen/oras (walang account)
Pasimula
> 500,000 mga character / buwan
- Lahat ng 22+ modelo
- > 100,000 mga character sa bawat henerasyon
- > Voice pag-clone
Pro
> 2,000,000 mga character / buwan
- Lahat ng bagay sa Starter
- API pag-access
- > Priority pagpoproseso
Negosyo
> 10,000,000 mga character / buwan
- Lahat ng bagay sa Pro
- Bulk API
- > Priority queue
> Tingnan ang lahat ng mga plano kabilang ang mga pack ng character →
Mga Madalas Itanong
> Ano ang maaari naming mapabuti? Tutulong sa amin ang iyong feedback na ayusin ang mga isyu.
> Magsimula sa Paggamit ng AI Voice Ngayon
> Sumali sa mga tagalikha, developer, at mga negosyo na gumagamit ng TTS.ai