Laisva AI Tekstas į kalbą

22+ atvirojo kodo modeliai, 100+ balsai, 32+ kalbos. Sąskaitos nereikia.

0/500 simboliai Neapmuitinama
Nėra kredito kortelės 50 nemokamų kreditų 32+ kalbos Naudojimas komerciniais tikslais
0:00 / 0:00
Download Audio Sąsaja baigiasi 24 val.
Kaip TTS.ai?

22+ AI Balso modeliai

Išsamiausias atvirojo kodo TTS modelių rinkinys vienoje platformoje

KokoroKokoro Free

Kokoro is an 82 million parameter text-to-speech model that punches well above its weight class. Despite its tiny size, it produces remarkably natural and expressive speech. Kokoro supports multiple languages including English, Japanese, Chinese, and Korean with a variety of expressive voices. It runs incredibly fast — generating audio nearly 100x faster than real-time on a GPU.

Geriausias už: High-quality TTS with minimal latency, streaming applications

Bandyti nemokamai

PiperPiper Free

Piper is a lightweight text-to-speech engine developed by Rhasspy that uses VITS and larynx architectures. It runs entirely on CPU, making it ideal for edge devices, home automation, and applications requiring offline TTS. With over 100 voices across 30+ languages, Piper delivers natural-sounding speech at real-time speeds even on a Raspberry Pi 4.

Geriausias už: Quick previews, accessibility, and embedded applications

Bandyti nemokamai

VITSVITS Free

VITS (Variational Inference with adversarial learning for end-to-end Text-to-Speech) is a parallel end-to-end TTS method that generates more natural sounding audio than current two-stage models. It adopts variational inference augmented with normalizing flows and an adversarial training process, achieving a significant improvement in naturalness.

Geriausias už: General-purpose text-to-speech with natural prosody

Bandyti nemokamai

MeloTTSMeloTTS Free

MeloTTS by MyShell.ai is a multilingual TTS library supporting English (American, British, Indian, Australian), Spanish, French, Chinese, Japanese, and Korean. It is extremely fast, processing text at near real-time speed on CPU alone. MeloTTS is designed for production use and supports both CPU and GPU inference.

Geriausias už: Gamybos programos, kurioms reikia greitų, daugiakalbių TTS

Bandyti nemokamai

BarkBark Standard

Transformer-based text-to-audio model that generates realistic speech, music, and sound effects.

Programuotojas: Suno · Licencija: MIT

Pabandyk

Bark SmallBark Small Standard

Lighter version of Bark with faster inference and lower memory usage.

Programuotojas: Suno · Licencija: MIT

Pabandyk

CosyVoice 2CosyVoice 2 Standard

Alibaba's scalable streaming TTS with human-parity naturalness and near-zero latency.

Programuotojas: Alibaba (Tongyi Lab) · Licencija: Apache 2.0

Pabandyk

Dia TTSDia TTS Standard

Kelių garsiakalbių dialogo generavimo modelis, kuris sukuria natūralius pokalbius tarp garsiakalbių.

Programuotojas: Nari Labs · Licencija: Apache 2.0

Pabandyk

Parler TTSParler TTS Standard

Describe the voice you want in natural language and Parler generates matching speech.

Programuotojas: Hugging Face · Licencija: Apache 2.0

Pabandyk

IndexTTS-2IndexTTS-2 Standard

Zero-shot TTS with fine-grained emotion control and high expressiveness.

Programuotojas: Index Team · Licencija: Apache 2.0

Pabandyk

Spark TTSSpark TTS Standard

Voice cloning TTS with controllable emotion and speaking style via prompts.

Programuotojas: SparkAudio · Licencija: Apache 2.0

Pabandyk

GPT-SoVITSGPT-SoVITS Standard

Few-shot voice cloning TTS that replicates any voice from just 5 seconds of audio.

Programuotojas: RVC-Boss · Licencija: MIT

Pabandyk

OrpheusOrpheus Standard

Human-level emotional TTS model trained on 100K hours of speech data.

Programuotojas: Canopy Labs · Licencija: Llama 3.2 Community

Pabandyk

Qwen3 TTSQwen3 TTS Standard

Alibaba's multilingual TTS with voice cloning, preset voices, and voice design from text.

Programuotojas: Alibaba (Qwen) · Licencija: Apache 2.0

Pabandyk

ChatterboxChatterbox Premium

Šiuolaikinės nulinės fotografijos balso klonavimas su emocijų reguliavimu iš Reemble AI.

Kokybė:

Pabandyk

Tortoise TTSTortoise TTS Premium

Daugiabalsis tekstas-to-speech sutelktas į kokybę su autoregesyvios architektūros.

Kokybė:

Pabandyk

StyleTTS 2StyleTTS 2 Premium

Human-level text-to-speech through style diffusion and adversarial training.

Kokybė:

Pabandyk

OpenVoiceOpenVoice Premium

Instant voice cloning with granular control over style, emotion, and accent.

Kokybė:

Pabandyk

CosyVoice 2CosyVoice 2

Alibaba's scalable streaming TTS with human-parity naturalness and near-zero latency.

Kalbos: en, zh, ja, ko, fr, de, it, es

Klonuoti balsą

IndexTTS-2IndexTTS-2

Zero-shot TTS with fine-grained emotion control and high expressiveness.

Kalbos: en, zh

Klonuoti balsą

Spark TTSSpark TTS

Voice cloning TTS with controllable emotion and speaking style via prompts.

Kalbos: en, zh

Klonuoti balsą

GPT-SoVITSGPT-SoVITS

Few-shot voice cloning TTS that replicates any voice from just 5 seconds of audio.

Kalbos: en, zh, ja, ko

Klonuoti balsą

ChatterboxChatterbox

Šiuolaikinės nulinės fotografijos balso klonavimas su emocijų reguliavimu iš Reemble AI.

Kalbos: en

Klonuoti balsą

Tortoise TTSTortoise TTS

Daugiabalsis tekstas-to-speech sutelktas į kokybę su autoregesyvios architektūros.

Kalbos: en

Klonuoti balsą

OpenVoiceOpenVoice

Instant voice cloning with granular control over style, emotion, and accent.

Kalbos: en, zh, ja, ko, fr, de, es, it

Klonuoti balsą

Qwen3 TTSQwen3 TTS

Alibaba's multilingual TTS with voice cloning, preset voices, and voice design from text.

Kalbos: en, zh, ja, ko, de, fr, ru, pt, es, it

Klonuoti balsą

Programuotojas- pirmasis API

Suderinamas REST API. Vienas rezultatas, 22+ modeliai. Srauto palaikymas realiu laiku taikomosios programos.

  • Su atvirais raštais suderinamas formatas
  • Realaus laiko programėlių transliavimas TTS
  • Partijos tvarkymas dideliems darbams
  • Pranešimai apie žiniatinklio kabiną
Rodyti API dokumentus
Python
import requests

response = requests.post(
    "https://api.tts.ai/v1/tts/",
    headers={"Authorization": "Bearer sk-tts-xxx"},
    json={
        "model": "kokoro",
        "text": "Hello from TTS.ai!",
        "voice": "af_bella",
    }
)

with open("output.mp3", "wb") as f:
    f.write(response.content)

Paprastas, skaidrus kainų nustatymas

Pradėti nemokamai. Mastelis, kai jūs augate.

Neapmuitinama

$0

50 kreditų

  • Kokoro, Piper, VITS, MeloTTS
  • 500 ženklų riba
  • 3 gen/val. (sąskaitos nėra)
Užsiregistruoti nemokamai

Pradžia

$9/s. c.

500 kreditų per mėnesį

  • Visi 22+ modeliai
  • 5 000 ženklų riba
  • Balso klonavimas
Paleisti
Populiariausi

Pro

$29/s. c.

2 000 kreditų per mėnesį

  • Viskas pradžioje
  • API prieiga
  • Prioritetinis tvarkymas
Gauti Pro

Įmonė

$99/s. c.

10 000 kreditų per mėnesį

  • Viskas Pro
  • Bulkinė API
  • Prioritetinė eilutė
Kontaktų pardavimai

View all plans including credit packs →

Dažnai užduodami klausimai

TTS.ai yra išsamiausia AI balso platforma, siūlanti 22+ teksto-į-speech modelius, balso klonavimą, kalbos-teksto ir garso įrankius. Visi modeliai yra atviras šaltinis be pardavėjo užrakinimo.

Taip! TTS.ai siūlo nemokamą tekstą į žymeklį su Kokoro, Piper, VITS ir MeloTTTS modeliais. Sąskaitos nereikia. Užsiregistruoti norint gauti 50 nemokamus kreditus ir pasiekti visus modelius. Mokami planai prasideda nuo 9 $.

Dėl greičio, naudoti Kokoro arba Piper. Kokybės, pabandykite CosyVoice 2 arba StyleTTS 2. Balso klonavimui, naudokite Chatterbox arba GPT-SoVITS. Dialogui, naudokite Dia TTS. Pabandykite kelis modelius tame pačiame tekste palyginti.

Taip. OpenAI suderinama REST API TTS, STT, balso klonavimo, ir garso įrankiai. pasiekiama Pro ($29/mo) ir Enterprise ($99/mo) planuose. Peržiūrėti dokumentus ne tts.ai/api/.

Balso kokybė skiriasi pagal modelį.Premium modeliai kaip CosyVoice 2, StyleTTS 2 ir Chatterbox gamina beveik žmogaus kokybės kalbą su natūralia intonacija ir emocijomis. Nemokami modeliai, tokie kaip Kokoro siūlo puikią kokybę daugumai naudojimo atvejų.

TTS.ai palaiko 30+ kalbų per savo pavyzdinę biblioteką. Anglų kalba turi plačiausią modelio paramą, bet modeliai kaip CosyVoice 2 apima kinų, japonų, ir korėjiečių; GPT-SoVITS tvarko kinų, japonų, korėjiečių, ir anglų; ir MeloTTTS palaiko anglų, ispanų, prancūzų, kinų, japonų, ir korėjiečių.

Taip. Visi procesai vyksta mūsų skirtuose GPU serveriuose. Mes nesaugome jūsų teksto įvesties ar nesukuriame garso po pristatymo. Įkeliami balso mėginiai klonavimui naudojami tik esamai sesijai ir nėra saugomi. Mes niekada nesidaliname jūsų duomenimis su trečiosiomis šalimis ir nenaudojame jų modeliams treniruoti.

Yes. All audio generated on TTS.ai is yours to use commercially, including for YouTube videos, podcasts, audiobooks, apps, advertisements, and products. Our models are open source under permissive licenses (MIT, Apache 2.0). No royalties or attribution required.

TTS.ai generuoja garso WAV formatu pagal nutylėjimą maksimaliai kokybei. Galite konvertuoti į MP3, FLAC, OGG, arba M4A naudojant mūsų nemokamai Audio Converter įrankis. API palaiko nurodyti savo pageidaujamą išvesties formatą tiesiogiai prašymu.

Upload a short audio sample (as little as 5 seconds) of the voice you want to clone, then type any text to generate speech in that voice. Models like Chatterbox, GPT-SoVITS, and CosyVoice 2 support voice cloning. The cloned voice captures tone, accent, and speaking style.

Nemokami modeliai (Kokoro, Piper, VITS, MeloTTS) nereikalauja jokių sąskaitų ir nebrangių kreditų. Standartiniai modeliai (2 kreditai/1K simboliai) apima barką, cosyVoice 2, F5-TTS ir Dia. Premium modeliai (4 kreditai/1K simboliai) apima OpenVoice, Chatterbox, StyleTTS 2 ir Tortoise. Mokami modeliai paprastai siūlo aukštesnę kokybę, daugiau balsų, ir papildomų funkcijų, tokių kaip balso klonavimas.

Taip. API palaiko partijos apdorojimo konvertuoti didelius kiekius teksto į kalbą. Pateikti keletą užklausų ir gauti rezultatus asinchroniškai naudojant darbą UUID. Įmonės planai ($99/mo) apima prioritetinę eilę prieigą greitesniam serijos apdorojimui. Idealiai tinka garso knygų gamybai, žinoma turinys, ir didelio masto balso perėmimo projektai.
5.0/5 (1)

Pradėti AIS balso naudojimą šiandien

Prisijunkite kūrėjai, kūrėjai, ir verslo naudojant TTS.ai