Libreng AI > Teksto sa Pagsasalita

> 22+ open-source na mga modelo, 100+ boses, 32+ tl> wika. Walang account kinakailangan.

0/500 Mga character Libre
Walang credit card > 50 libreng credits 32+ Mga wika > Komersyal na paggamit OK
0:00 / 0:00
Download Audio > Link expires sa 24h
Tulad ng TTS.ai? Sabihin sa iyong mga kaibigan!

> Lahat ng kailangan mo para sa Voice AI

> 26 mga tool na pinalakas ng 24+ open-source AI modelo

> 22+ AI modelo ng boses

> Ang pinaka-komprehensibong koleksyon ng mga modelo ng open-source TTS sa isang platform

KokoroKokoro Free

Kokoro is an 82 million parameter text-to-speech model that punches well above its weight class. Despite its tiny size, it produces remarkably natural and expressive speech. Kokoro supports multiple languages including English, Japanese, Chinese, and Korean with a variety of expressive voices. It runs incredibly fast — generating audio nearly 100x faster than real-time on a GPU.

Pinakamahusay para sa: High-quality TTS with minimal latency, streaming applications

> Subukan ang Libre

PiperPiper Free

Piper is a lightweight text-to-speech engine developed by Rhasspy that uses VITS and larynx architectures. It runs entirely on CPU, making it ideal for edge devices, home automation, and applications requiring offline TTS. With over 100 voices across 30+ languages, Piper delivers natural-sounding speech at real-time speeds even on a Raspberry Pi 4.

Pinakamahusay para sa: Quick previews, accessibility, and embedded applications

> Subukan ang Libre

VITSVITS Free

VITS (Variational Inference with adversarial learning for end-to-end Text-to-Speech) is a parallel end-to-end TTS method that generates more natural sounding audio than current two-stage models. It adopts variational inference augmented with normalizing flows and an adversarial training process, achieving a significant improvement in naturalness.

Pinakamahusay para sa: General-purpose text-to-speech with natural prosody

> Subukan ang Libre

MeloTTSMeloTTS Free

MeloTTS by MyShell.ai is a multilingual TTS library supporting English (American, British, Indian, Australian), Spanish, French, Chinese, Japanese, and Korean. It is extremely fast, processing text at near real-time speed on CPU alone. MeloTTS is designed for production use and supports both CPU and GPU inference.

Pinakamahusay para sa: > Production application na nangangailangan ng mabilis, multilingual TTS

> Subukan ang Libre

BarkBark Standard

Transformer-based text-to-audio model that generates realistic speech, music, and sound effects.

Tagabuo: Suno · Lisensya: MIT

Subukan ito

Bark SmallBark Small Standard

Lighter version of Bark with faster inference and lower memory usage.

Tagabuo: Suno · Lisensya: MIT

Subukan ito

CosyVoice 2CosyVoice 2 Standard

Alibaba's scalable streaming TTS with human-parity naturalness and near-zero latency.

Tagabuo: Alibaba (Tongyi Lab) · Lisensya: Apache 2.0

Subukan ito

Dia TTSDia TTS Standard

Multi-speaker dialog generation model na lumilikha ng mga natural na pag-uusap sa pagitan ng mga nagsasalita.

Tagabuo: Nari Labs · Lisensya: Apache 2.0

Subukan ito

Parler TTSParler TTS Standard

Describe the voice you want in natural language and Parler generates matching speech.

Tagabuo: Hugging Face · Lisensya: Apache 2.0

Subukan ito

IndexTTS-2IndexTTS-2 Standard

Zero-shot TTS with fine-grained emotion control and high expressiveness.

Tagabuo: Index Team · Lisensya: Apache 2.0

Subukan ito

Spark TTSSpark TTS Standard

Voice cloning TTS with controllable emotion and speaking style via prompts.

Tagabuo: SparkAudio · Lisensya: Apache 2.0

Subukan ito

GPT-SoVITSGPT-SoVITS Standard

Few-shot voice cloning TTS that replicates any voice from just 5 seconds of audio.

Tagabuo: RVC-Boss · Lisensya: MIT

Subukan ito

OrpheusOrpheus Standard

Human-level emotional TTS model trained on 100K hours of speech data.

Tagabuo: Canopy Labs · Lisensya: Llama 3.2 Community

Subukan ito

Qwen3 TTSQwen3 TTS Standard

Alibaba's multilingual TTS with voice cloning, preset voices, and voice design from text.

Tagabuo: Alibaba (Qwen) · Lisensya: Apache 2.0

Subukan ito

ChatterboxChatterbox Premium

Ang mga ito ay tinatawag na "zero-shot" voice cloning na may emotion control mula sa Resemble AI.

Kalidad:

Subukan ito

Tortoise TTSTortoise TTS Premium

Ang multi-voice text-to-speech ay nakatuon sa kalidad na may autoregressive architecture.

Kalidad:

Subukan ito

StyleTTS 2StyleTTS 2 Premium

Human-level text-to-speech through style diffusion and adversarial training.

Kalidad:

Subukan ito

OpenVoiceOpenVoice Premium

> Instant boses cloning na may granular kontrol sa estilo, damdamin, at accent.

Kalidad:

Subukan ito

CosyVoice 2CosyVoice 2

Alibaba's scalable streaming TTS with human-parity naturalness and near-zero latency.

Wika: en, zh, ja, ko, fr, de, it, es

Clone ng boses

IndexTTS-2IndexTTS-2

Zero-shot TTS with fine-grained emotion control and high expressiveness.

Wika: en, zh

Clone ng boses

Spark TTSSpark TTS

Voice cloning TTS with controllable emotion and speaking style via prompts.

Wika: en, zh

Clone ng boses

GPT-SoVITSGPT-SoVITS

Few-shot voice cloning TTS that replicates any voice from just 5 seconds of audio.

Wika: en, zh, ja, ko

Clone ng boses

ChatterboxChatterbox

Ang mga ito ay tinatawag na "zero-shot" voice cloning na may emotion control mula sa Resemble AI.

Wika: en

Clone ng boses

Tortoise TTSTortoise TTS

Ang multi-voice text-to-speech ay nakatuon sa kalidad na may autoregressive architecture.

Wika: en

Clone ng boses

OpenVoiceOpenVoice

> Instant boses cloning na may granular kontrol sa estilo, damdamin, at accent.

Wika: en, zh, ja, ko, fr, de, es, it

Clone ng boses

Qwen3 TTSQwen3 TTS

Alibaba's multilingual TTS with voice cloning, preset voices, and voice design from text.

Wika: en, zh, ja, ko, de, fr, ru, pt, es, it

Clone ng boses

Developer-unang API

> OpenAI-compatible REST API. Isang endpoint, 22+ modelo. Streaming suporta para sa real-time na mga application.

  • tl> OpenAI-compatible format
  • > Streaming TTS para sa real-time apps
  • > Batch pagpoproseso para sa malaking trabaho
  • > Webhook mga notification
Tingnan ang API Docs
Python
import requests

response = requests.post(
    "https://api.tts.ai/v1/tts/",
    headers={"Authorization": "Bearer sk-tts-xxx"},
    json={
        "model": "kokoro",
        "text": "Hello from TTS.ai!",
        "voice": "af_bella",
    }
)

with open("output.mp3", "wb") as f:
    f.write(response.content)

> Simple, Transparent Pagpepresyo

> Magsimula nang libre. Scale habang lumalaki ka.

Libre

$0

> 50 credits

  • Kokoro, Piper, VITS, MeloTTS
  • > 500 character na limitasyon
  • >3gen/oras (walang account)
Mag-sign up para sa libreng

Simula

$9/ML

> 500 credits/buwan

  • Lahat ng 22+ modelo
  • > 5,000 character na limitasyon
  • > Voice pag-clone
Magsisimula
Karamihan Popular

Pro

$29/ML

> 2,000 credits/buwan

  • Lahat ng bagay sa Starter
  • API pag-access
  • > Priority pagpoproseso
Kumuha ng Pro

Enterprise

$99/ML

> 10,000 credits/buwan

  • Lahat ng bagay sa Pro
  • Bulk API
  • > Priority queue
> Makipag-ugnay sa Sales

View all plans including credit packs →

Mga Madalas Itanong

Ang TTS.ai ay ang pinaka-komprehensibong AI voice platform, na nag-aalok ng 22+ text-to-speech models, voice cloning, speech-to-text, at audio tools. Ang lahat ng mga modelo ay open source at walang vendor lock-in.

> Oo! TTS.ai nag-aalok ng libreng text-to-speech na may Kokoro, Piper, VITS, at MeloTTS modelo. Walang account na kinakailangan. Mag-sign up upang makakuha ng 50 libreng credits at access sa lahat ng mga modelo. Paid plano simula sa $ 9 / buwan.

Para sa bilis, gumamit ng Kokoro o Piper. Para sa kalidad, subukan ang CosyVoice2o StyleTTS 2. Para sa cloning ng boses, gumamit ng Chatterbox o GPT-SoVITS. Para sa dialogue, gumamit ng Dia TTS. Subukan ang maraming mga modelo sa parehong teksto upang ihambing.

> Oo. OpenAI-compatible REST API para sa TTS, STT, boses cloning, at audio tools. Available sa Pro ($ 29 / buwan) at Enterprise ($ 99 / buwan) plano. Tingnan ang dokumentasyon sa tts.ai / api /.

> Ang kalidad ng boses ay nag-iiba ayon sa modelo. Ang mga premium na modelo tulad ng CosyVoice 2, StyleTTS 2, at Chatterbox ay gumagawa ng malapit sa kalidad ng tao na pagsasalita na may natural na intonasyon at emosyon. Ang mga libreng modelo tulad ng Kokoro ay nag-aalok ng mahusay na kalidad para sa karamihan ng mga kaso ng paggamit.

Ang Ingles ay may pinakamalawak na suporta sa modelo, ngunit ang mga modelo tulad ng CosyVoice2ay sumasaklaw sa Intsik, Hapon, at Koreano; ang GPT-SoVITS ay humahawak sa Intsik, Hapon, Koreano, at Ingles; at ang MeloTTS ay sumusuporta sa Ingles, Espanyol, Pranses, Intsik, Hapon, at Koreano.

> Oo. Ang lahat ng pagpoproseso ay nangyayari sa aming mga dedikadong GPU server. Hindi namin i-save ang iyong text input o nabuo audio pagkatapos ng paghahatid. Upload na sample ng boses para sa cloning ay ginagamit lamang para sa kasalukuyang session at ay hindi pinananatili. Hindi namin ibahagi ang iyong data sa mga third party o gamitin ito upang magsanay ng mga modelo.

Yes. All audio generated on TTS.ai is yours to use commercially, including for YouTube videos, podcasts, audiobooks, apps, advertisements, and products. Our models are open source under permissive licenses (MIT, Apache 2.0). No royalties or attribution required.

> TTS.ai bumubuo ng audio sa WAV format sa pamamagitan ng default para sa pinakamataas na kalidad. Maaari mong i-convert sa MP3, FLAC, OGG, o M4A gamit ang aming libreng Audio Converter tool. Ang API ay sumusuporta sa pagtukoy ng iyong ginustong output format nang direkta sa kahilingan.

Upload a short audio sample (as little as 5 seconds) of the voice you want to clone, then type any text to generate speech in that voice. Models like Chatterbox, GPT-SoVITS, and CosyVoice 2 support voice cloning. The cloned voice captures tone, accent, and speaking style.

tl> Libreng mga modelo (Kokoro, Piper, VITS, MeloTTS) ay nangangailangan ng walang account at gastos zero credits. Standard na mga modelo (2 credits / 1K character) isama Bark, CosyVoice 2, F5-TTS, at Dia. Premium na mga modelo (4 credits / 1K character) isama OpenVoice, Chatterbox, StyleTTS 2, at Tortoise.

> Oo. Ang API ay sumusuporta sa batch processing para sa pag-convert ng malaking dami ng teksto sa pagsasalita. Mag-submit ng maraming mga kahilingan at makuha ang mga resulta asynchronously gamit ang trabaho UUIDs. Enterprise plano ($ 99 / buwan) kasama ang priyoridad queue access para sa mas mabilis na batch processing. Ideal para sa audiobook produksyon, kurso ng nilalaman, at malaking-scale voiceover proyekto.
5.0/5 (1)

tl> Simulan ang Paggamit ng AI Voice Ngayon

> Sumali sa mga tagalikha, developer, at mga negosyo na gumagamit ng TTS.ai