Vapaa tekoäly Teksti puheenaiheeksi

22+ avoimen lähdekoodin mallia, 100+ ääntä, 32+ Kieliä. Ei tiliä.

0/500 hahmot Vapaa
Ei luottokorttia 50 ilmaista luottoa 32+ kielet Kaupallinen käyttö OK
0:00 / 0:00
Lataa ääni Linkki päättyy 24h
Kuten TTS.ai? Kerro ystävillesi!

22+ tekoälyn äänimallit

Kattava kokoelma avoimen lähdekoodin TTS-malleja yhdellä alustalla

KokoroKokoro Free

Kokoro is an 82 million parameter text-to-speech model that punches well above its weight class. Despite its tiny size, it produces remarkably natural and expressive speech. Kokoro supports multiple languages including English, Japanese, Chinese, and Korean with a variety of expressive voices. It runs incredibly fast — generating audio nearly 100x faster than real-time on a GPU.

Paras: High-quality TTS with minimal latency, streaming applications

Kokeile vapaasti

PiperPiper Free

Piper is a lightweight text-to-speech engine developed by Rhasspy that uses VITS and larynx architectures. It runs entirely on CPU, making it ideal for edge devices, home automation, and applications requiring offline TTS. With over 100 voices across 30+ languages, Piper delivers natural-sounding speech at real-time speeds even on a Raspberry Pi 4.

Paras: Quick previews, accessibility, and embedded applications

Kokeile vapaasti

VITSVITS Free

VITS (Variational Inference with adversarial learning for end-to-end Text-to-Speech) is a parallel end-to-end TTS method that generates more natural sounding audio than current two-stage models. It adopts variational inference augmented with normalizing flows and an adversarial training process, achieving a significant improvement in naturalness.

Paras: General-purpose text-to-speech with natural prosody

Kokeile vapaasti

MeloTTSMeloTTS Free

MeloTTS by MyShell.ai is a multilingual TTS library supporting English (American, British, Indian, Australian), Spanish, French, Chinese, Japanese, and Korean. It is extremely fast, processing text at near real-time speed on CPU alone. MeloTTS is designed for production use and supports both CPU and GPU inference.

Paras: Tuotantosovelluksia, jotka tarvitsevat nopeita, monikielisiä TTS-sovelluksia

Kokeile vapaasti

BarkBark Standard

Transformer-based text-to-audio model that generates realistic speech, music, and sound effects.

Kehittäjä: Suno · Lisenssi: MIT

Kokeile.

Bark SmallBark Small Standard

Lighter version of Bark with faster inference and lower memory usage.

Kehittäjä: Suno · Lisenssi: MIT

Kokeile.

CosyVoice 2CosyVoice 2 Standard

Alibaba's scalable streaming TTS with human-parity naturalness and near-zero latency.

Kehittäjä: Alibaba (Tongyi Lab) · Lisenssi: Apache 2.0

Kokeile.

Dia TTSDia TTS Standard

Monikielisten dialogien sukupolven malli, joka luo luonnollisia keskusteluja puhujien välillä.

Kehittäjä: Nari Labs · Lisenssi: Apache 2.0

Kokeile.

Parler TTSParler TTS Standard

Describe the voice you want in natural language and Parler generates matching speech.

Kehittäjä: Hugging Face · Lisenssi: Apache 2.0

Kokeile.

IndexTTS-2IndexTTS-2 Standard

Zero-shot TTS with fine-grained emotion control and high expressiveness.

Kehittäjä: Index Team · Lisenssi: Apache 2.0

Kokeile.

Spark TTSSpark TTS Standard

Voice cloning TTS with controllable emotion and speaking style via prompts.

Kehittäjä: SparkAudio · Lisenssi: Apache 2.0

Kokeile.

GPT-SoVITSGPT-SoVITS Standard

Few-shot voice cloning TTS that replicates any voice from just 5 seconds of audio.

Kehittäjä: RVC-Boss · Lisenssi: MIT

Kokeile.

OrpheusOrpheus Standard

Human-level emotional TTS model trained on 100K hours of speech data.

Kehittäjä: Canopy Labs · Lisenssi: Llama 3.2 Community

Kokeile.

Qwen3 TTSQwen3 TTS Standard

Alibaba's multilingual TTS with voice cloning, preset voices, and voice design from text.

Kehittäjä: Alibaba (Qwen) · Lisenssi: Apache 2.0

Kokeile.

ChatterboxChatterbox Premium

Huippuluokan nollaäänikloonaus ja tunteiden hallinta tekoälystä.

Laatu:

Kokeile.

Tortoise TTSTortoise TTS Premium

Moniääninen tekstipuhe keskittyi laatuun autoregressiivisen arkkitehtuurin avulla.

Laatu:

Kokeile.

StyleTTS 2StyleTTS 2 Premium

Human-level text-to-speech through style diffusion and adversarial training.

Laatu:

Kokeile.

OpenVoiceOpenVoice Premium

Välitön äänenkloonaus, jolla hallitaan rakeisesti tyyliä, tunteita ja korostusta.

Laatu:

Kokeile.

CosyVoice 2CosyVoice 2

Alibaba's scalable streaming TTS with human-parity naturalness and near-zero latency.

Kielet: en, zh, ja, ko, fr, de, it, es

Klooniääni

IndexTTS-2IndexTTS-2

Zero-shot TTS with fine-grained emotion control and high expressiveness.

Kielet: en, zh

Klooniääni

Spark TTSSpark TTS

Voice cloning TTS with controllable emotion and speaking style via prompts.

Kielet: en, zh

Klooniääni

GPT-SoVITSGPT-SoVITS

Few-shot voice cloning TTS that replicates any voice from just 5 seconds of audio.

Kielet: en, zh, ja, ko

Klooniääni

ChatterboxChatterbox

Huippuluokan nollaäänikloonaus ja tunteiden hallinta tekoälystä.

Kielet: en

Klooniääni

Tortoise TTSTortoise TTS

Moniääninen tekstipuhe keskittyi laatuun autoregressiivisen arkkitehtuurin avulla.

Kielet: en

Klooniääni

OpenVoiceOpenVoice

Välitön äänenkloonaus, jolla hallitaan rakeisesti tyyliä, tunteita ja korostusta.

Kielet: en, zh, ja, ko, fr, de, es, it

Klooniääni

Qwen3 TTSQwen3 TTS

Alibaba's multilingual TTS with voice cloning, preset voices, and voice design from text.

Kielet: en, zh, ja, ko, de, fr, ru, pt, es, it

Klooniääni

Kehittäjä-Ensimmäinen API

OpenAI-yhteensopiva REST API. Yksi päätetapahtuma, 22+-mallia. Suoratoistotuki reaaliaikaisiin sovelluksiin.

  • OpenAI-yhteensopiva muoto
  • Virrataan TTS:ää reaaliaikaisiin sovelluksiin
  • Erän käsittely suurille työpaikoille
  • Verkkokoukkuilmoitukset
Näytä API-dokumentit
Python
import requests

response = requests.post(
    "https://api.tts.ai/v1/tts/",
    headers={"Authorization": "Bearer sk-tts-xxx"},
    json={
        "model": "kokoro",
        "text": "Hello from TTS.ai!",
        "voice": "af_bella",
    }
)

with open("output.mp3", "wb") as f:
    f.write(response.content)

Yksinkertainen, läpinäkyvä hinnoittelu

Aloita vapaalla ja laajenna kasvaessasi.

Vapaa

$0

50 opintopistettä

  • Kokoro, Piper, VITS, MeloTTS
  • 500 merkin raja-arvo
  • 3 gen/tunti (ei tiliä)
Rekisteröidy ilmaiseksi

Käynnistin

$9/m

500 opintopistettä kuukaudessa

  • Kaikki 22+-mallit
  • 5 000 merkin raja-arvo
  • Äänien kloonaus
Aloita
Suosituin

Pro

$29/m

2 000 opintopistettä kuukaudessa

  • Kaikki Starterissa
  • API-yhteys
  • Ensisijainen käsittely
Hae Pro

Yritystoiminta

$99/m

10 000 opintopistettä/kuukausi

  • Kaikki Prossa
  • Bulk API
  • Ensisijainen jono
Contact Sales

View all plans including credit packs →

Usein kysyttyjä kysymyksiä

TTS.ai on kattavin tekoälyäänialusta, joka tarjoaa 22+ tekstistä puheentoistoon -malleja, äänikloonausta, puheesta tekstiin -työkaluja ja äänityökaluja. Kaikki mallit ovat avoimen lähdekoodin mukaisia ilman toimittajan lukitusta.

Kyllä! TTS.ai tarjoaa kokoomuksen, Piperin, VITS:n ja MeloTTS:n mallien kanssa ilmaisen tekstipuheen. Tiliä ei tarvita. Rekisteröidy 50 ilmaiseksi ja pääset kaikkiin malleihin. Maksetut suunnitelmat alkavat 9 dollarista kuukaudessa.

Käytä nopeuteen Kokoroa tai Piperia. Kokeile CosyVoice 2:ta tai Styletts 2:ta. Äänikloonaamiseen käytä Chatterboxia tai GPT-SoVITS:iä. Käytä dia TTS:ää. Vertaa useita malleja samaan tekstiin.

Kyllä. OpenAI-yhteensopiva REST API TTS-, STT-, äänikloonaus- ja äänityökaluille. Saatavilla Pron ($29/mo) ja Enterprisen ($99/mo) suunnitelmista. Katso dokumentit osoitteessa tts.ai/api/.

Äänenlaatu vaihtelee mallien mukaan. Huippumallit, kuten CosyVoice 2, Styletts 2 ja Chatterbox, tuottavat lähes ihmisläheistä laadukasta puhetta, jossa on luonnollinen intonaatio ja tunne. Kokoron kaltaiset vapaat mallit tarjoavat erinomaista laatua useimpiin käyttökohteisiin.

TTS.ai tukee 30:tä ylikieltä mallikirjastossaan. Englannin mallisto on laajin, mutta CosyVoice 2:n kaltaiset mallit kattavat kiinalaiset, japanilaiset ja korealaiset. GPT-SoVITS käsittelee kiinaa, japania, koreaa ja englantia, ja MeloTTS tukee englantia, espanjaa, ranskaa, kiinaa, japania ja koreaa.

Kyllä. Kaikki käsittely tapahtuu omistetuilla GPU-palvelimillamme. Emme tallenna tekstituloksiasi tai luo ääntä toimituksen jälkeen. Ladattuja ääninäytteitä kloonaukseen käytetään vain nykyisessä istunnossa, eikä niitä säilytetä. Emme koskaan jaa tietojasi kolmansille osapuolille tai käytä niitä mallien kouluttamiseen.

Yes. All audio generated on TTS.ai is yours to use commercially, including for YouTube videos, podcasts, audiobooks, apps, advertisements, and products. Our models are open source under permissive licenses (MIT, Apache 2.0). No royalties or attribution required.

TTS.ai luo äänen WAV-muodossa oletuksena maksimilaadun. Voit muuntaa MP3, FLAC, OGG tai M4A:ksi käyttämällä ilmaista Audio Converter -työkaluamme. API tukee haluamaasi lähtömuotoa suoraan pyynnössä.

Upload a short audio sample (as little as 5 seconds) of the voice you want to clone, then type any text to generate speech in that voice. Models like Chatterbox, GPT-SoVITS, and CosyVoice 2 support voice cloning. The cloned voice captures tone, accent, and speaking style.

Vapaat mallit (Kokoro, Piper, VITS, MeloTTS) eivät vaadi tiliä ja maksavat nollapisteitä. Vakiomallit (2 op/1K merkkiä) sisältävät Barkin, CosyVoice 2, F5-TTS ja Dia. Premium-mallit (4 op/1K merkkiä) sisältävät OpenVoicen, Chatterboxin, StyleTTS 2 ja Tortoisen. Maksetut mallit tarjoavat yleensä korkeamman laadun, enemmän ääniä ja muita ominaisuuksia, kuten äänen kloonausta.

Kyllä. API tukee erien käsittelyä suurten tekstimäärien muuntamiseksi puheeksi. Lähetä useita pyyntöjä ja hae tulokset yhtäjaksoisesti käyttäen työn UUID-tietoja. Yrityssuunnitelmiin (99 dollaria/m) kuuluu nopeamman eränkäsittelyn ensisijainen jonotus. Ihanteellinen audiobook-tuotannolle, kurssin sisällölle ja laajamittaisille puheprojekteille.
5.0/5 (1)

Ala käyttää tekoälyääntä nykyään

Liity TTS.ain kehittäjiin, kehittäjiin ja yrityksiin