Vapaa tekoäly Teksti puheenaiheeksi

20+ avoimen lähdekoodin mallit, 107+ äänet, 32+ Kieliä. Ei tiliä.

1K+
tekijät
2K+
sukupolvet
20+
Tekoälymallit
107+
äänet
0/500 hahmot Vapaa
Kuten TTS.ai? Kerro ystävillesi!

Kaikki mitä tarvitset puheälyyn

Avoimen lähdekoodin tekoälymalleilla toimivat 30+ työkalua

20+ Al-äänimallit

Kattava kokoelma avoimen lähdekoodin TTS-malleja yhdellä alustalla

KokoroKokoro Free

Kokoro on 82 miljoonan parametrin tekstistä ääneen -malli, joka lyö selvästi painoluokkansa yläpuolelle. Pienestä koostaan huolimatta se tuottaa huomattavan luonnollisen ja ilmaisukykyisen puheen. Kokoro tukee useita kieliä, kuten englantia, japania, kiinaa ja koreaa erilaisilla ilmaisuäänillä. Se toimii uskomattoman nopeasti – tuottaa äänen lähes 100 kertaa nopeammin kuin reaaliaikaisesti GPU:lla.

Paras: Korkealaatuinen TTS, minimaalinen latenssi, suoratoistosovellukset

Kokeile vapaasti

PiperPiper Free

Piper on Rhasspyn kehittämä kevyt teksti-to-speech-moottori, joka käyttää VITS- ja kurkunpääarkkitehtuureja. Se toimii täysin prosessorilla, mikä tekee siitä ihanteellisen reunalaitteille, kodin automaatiolle ja sovelluksille, jotka vaativat offline TTS:ää. Yli 100 äänellä 30 + kielellä Piper pitää luonnolta kuulostavaa puhetta reaaliaikaisesti jopa Vadelma Pi 4:llä.

Paras: Nopea esikatselu, saavutettavuus ja sulautetut sovellukset

Kokeile vapaasti

VITSVITS Free

VITS (Variaational Interference with advertial learning for end-to-end Text-to-Speech) on rinnakkainen TTS-menetelmä, joka tuottaa luonnollisempaa kaikuääntä kuin nykyiset kaksivaiheiset mallit. Siinä otetaan käyttöön variaatiomainen päättely, jota lisätään normalisoivilla virroilla ja advertiaalisella koulutusprosessilla ja jolla saavutetaan merkittävä parannus luonnollisuudessa.

Paras: Yleiskäyttöinen tekstistä puheen ollen, luonnollinen prosody

Kokeile vapaasti

MeloTTSMeloTTS Free

MeloTTS by MyShell.ai on monikielinen TTS-kirjasto, joka tukee englantia (amerikkalainen, britti, intialainen, australialainen), espanjaa, ranskaa, kiinaa, japania ja koreaa. Se on erittäin nopea ja käsittelee tekstiä lähes reaaliaikaisesti pelkästään prosessorilla. MeloTTS on suunniteltu tuotantokäyttöön ja tukee sekä CPU:n että GPU:n päättelyä.

Paras: Tuotantosovelluksia, jotka tarvitsevat nopeita, monikielisiä TTS-sovelluksia

Kokeile vapaasti

BarkBark Standard

Transformer-pohjainen teksti-audio-malli, joka tuottaa realistisia puhe-, musiikki- ja äänitehosteita.

Kehittäjä: Suno · Lisenssi: MIT

Kokeile.

Bark SmallBark Small Standard

Kevyempi versio Barkista nopeammalla päättelyllä ja pienemmällä muistinkäytöllä.

Kehittäjä: Suno · Lisenssi: MIT

Kokeile.

CosyVoice 2CosyVoice 2 Standard

Alibaban skaalautuva suoratoisto TTS:n ihmispariteetilla ja lähes nollan latenssilla.

Kehittäjä: Alibaba (Tongyi Lab) · Lisenssi: Apache 2.0

Kokeile.

Dia TTSDia TTS Standard

Monikielisten dialogien sukupolven malli, joka luo luonnollisia keskusteluja puhujien välillä.

Kehittäjä: Nari Labs · Lisenssi: Apache 2.0

Kokeile.

Parler TTSParler TTS Standard

Kuvaile haluamaasi ääntä luonnollisella kielellä, ja Parler luo sopivan puheen.

Kehittäjä: Hugging Face · Lisenssi: Apache 2.0

Kokeile.

GLM-TTSGLM-TTS Standard

Avoimen lähdekoodin TTS-mallien pienin merkkivirheprosentti saavutetaan.

Kehittäjä: Zhipu AI · Lisenssi: GLM-4 License

Kokeile.

IndexTTS-2IndexTTS-2 Standard

Zero-shot TTS, hienorakeinen tunteiden hallinta ja suuri ilmaisukyky.

Kehittäjä: Index Team · Lisenssi: Bilibili Model License

Kokeile.

Spark TTSSpark TTS Standard

Äänikloonaus TTS:n ohjattavalla tunteella ja puhetyylillä kehotuksilla.

Kehittäjä: SparkAudio · Lisenssi: CC BY-NC-SA 4.0

Kokeile.

GPT-SoVITSGPT-SoVITS Standard

Vain harvan kuvan ääni kloonaa TTS-ääntä, joka jäljittelee ääntä vain viiden sekunnin ääninopeudesta.

Kehittäjä: RVC-Boss · Lisenssi: MIT

Kokeile.

OrpheusOrpheus Standard

Ihmistason tunneperäinen TTS-malli kouluttautui 100 000 tunnin puhedataan.

Kehittäjä: Canopy Labs · Lisenssi: Llama 3.2 Community

Kokeile.

Qwen3 TTSQwen3 TTS Standard

Alibaban monikielinen TTS, jossa on äänen kloonaus, ennakkoäänet ja äänisuunnittelu tekstistä.

Kehittäjä: Alibaba (Qwen) · Lisenssi: Apache 2.0

Kokeile.

ChatterboxChatterbox Premium

Huippuluokan nollaäänikloonaus ja tunteiden hallinta tekoälystä.

Laatu:

Kokeile.

Tortoise TTSTortoise TTS Premium

Moniääninen tekstipuhe keskittyi laatuun autoregressiivisen arkkitehtuurin avulla.

Laatu:

Kokeile.

StyleTTS 2StyleTTS 2 Premium

Ihmistason tekstistä puheenaiheeksi tyylin levittämisen ja vastakkaisen treenin avulla.

Laatu:

Kokeile.

OpenVoiceOpenVoice Premium

Välitön äänenkloonaus, jolla hallitaan rakeisesti tyyliä, tunteita ja korostusta.

Laatu:

Kokeile.

Sesame CSMSesame CSM Premium

Keskustelupuhemalli luo luonnollista vuoropuhelua sopivalla ajoituksella ja tunteella.

Laatu:

Kokeile.

CosyVoice 2CosyVoice 2

Alibaban skaalautuva suoratoisto TTS:n ihmispariteetilla ja lähes nollan latenssilla.

Kielet: en, zh, ja, ko, fr, de, it, es

Klooniääni

GLM-TTSGLM-TTS

Avoimen lähdekoodin TTS-mallien pienin merkkivirheprosentti saavutetaan.

Kielet: en, zh

Klooniääni

IndexTTS-2IndexTTS-2

Zero-shot TTS, hienorakeinen tunteiden hallinta ja suuri ilmaisukyky.

Kielet: en, zh

Klooniääni

Spark TTSSpark TTS

Äänikloonaus TTS:n ohjattavalla tunteella ja puhetyylillä kehotuksilla.

Kielet: en, zh

Klooniääni

GPT-SoVITSGPT-SoVITS

Vain harvan kuvan ääni kloonaa TTS-ääntä, joka jäljittelee ääntä vain viiden sekunnin ääninopeudesta.

Kielet: en, zh, ja, ko

Klooniääni

ChatterboxChatterbox

Huippuluokan nollaäänikloonaus ja tunteiden hallinta tekoälystä.

Kielet: en

Klooniääni

Tortoise TTSTortoise TTS

Moniääninen tekstipuhe keskittyi laatuun autoregressiivisen arkkitehtuurin avulla.

Kielet: en

Klooniääni

OpenVoiceOpenVoice

Välitön äänenkloonaus, jolla hallitaan rakeisesti tyyliä, tunteita ja korostusta.

Kielet: en, zh, ja, ko, fr, de, es, it

Klooniääni

Qwen3 TTSQwen3 TTS

Alibaban monikielinen TTS, jossa on äänen kloonaus, ennakkoäänet ja äänisuunnittelu tekstistä.

Kielet: en, zh, ja, ko, de, fr, ru, pt, es, it

Klooniääni

Kehittäjä-Ensimmäinen API

OpenAI-yhteensopiva REST API. Yksi päätetapahtuma, 22+-mallia. Suoratoistotuki reaaliaikaisiin sovelluksiin.

  • OpenAI-yhteensopiva muoto
  • Virrataan TTS:ää reaaliaikaisiin sovelluksiin
  • Erän käsittely suurille työpaikoille
  • Verkkokoukkuilmoitukset
Näytä API-dokumentit
pip install ttsai npm install @ttsainpm/ttsai
Python
from tts_ai import TTSClient

client = TTSClient(api_key="sk-tts-xxx")
audio = client.generate(
    text="Hello from TTS.ai!",
    model="kokoro",
    voice="af_bella",
)
client.save(audio, "output.mp3")

Yksinkertainen, läpinäkyvä hinnoittelu

Aloita vapaalla ja laajenna kasvaessasi.

Vapaa

$0

15 opintopistettä

  • Kokoro, Piper, VITS, MeloTTS
  • 500 merkin raja-arvo
  • 3 gen/tunti (ei tiliä)
Rekisteröidy ilmaiseksi

Käynnistin

$9/m

500 opintopistettä kuukaudessa

  • Kaikki 22+-mallit
  • 100 000 chars per sukupolvi
  • Äänien kloonaus
Aloita
Suosituin

Pro

$29/m

2 000 opintopistettä kuukaudessa

  • Kaikki Starterissa
  • API-yhteys
  • Ensisijainen käsittely
Hae Pro

Bisnekset

$99/m

10 000 opintopistettä/kuukausi

  • Kaikki Prossa
  • Bulk API
  • Ensisijainen jono
Hanki bisnestä

Näytä kaikki suunnitelmat, mukaan lukien merkkipakkaukset →

Usein kysyttyjä kysymyksiä

TTS.ai on kattavin tekoälyäänialusta, joka tarjoaa 22+ tekstistä puheentoistoon -malleja, äänikloonausta, puheesta tekstiin -työkaluja ja äänityökaluja. Kaikki mallit ovat avoimen lähdekoodin mukaisia ilman toimittajan lukitusta.

Kyllä! TTS.ai tarjoaa kokoomuksen, Piperin, VITS:n ja MeloTTS:n mallien kanssa ilmaisen tekstipuheen. Tiliä ei tarvita. Rekisteröidy saadaksesi 15 000 ilmaista merkkiä ja pääset kaikkiin malleihin. Maksetut suunnitelmat alkavat 9 dollarista kuukaudessa.

Käytä nopeuteen Kokoroa tai Piperia. Kokeile CosyVoice 2:ta tai Styletts 2:ta. Äänikloonaamiseen käytä Chatterboxia tai GPT-SoVITS:iä. Käytä dia TTS:ää. Vertaa useita malleja samaan tekstiin.

Kyllä. OpenAI-yhteensopiva REST API TTS-, STT-, äänikloonaus- ja äänityökaluille. Saatavilla Pron ($29/mo) ja Enterprisen ($99/mo) suunnitelmista. Katso dokumentit osoitteessa tts.ai/api/.

Äänenlaatu vaihtelee mallien mukaan. Huippumallit, kuten CosyVoice 2, Styletts 2 ja Chatterbox, tuottavat lähes ihmisläheistä laadukasta puhetta, jossa on luonnollinen intonaatio ja tunne. Kokoron kaltaiset vapaat mallit tarjoavat erinomaista laatua useimpiin käyttökohteisiin.

TTS.ai tukee 30:tä ylikieltä mallikirjastossaan. Englannin mallisto on laajin, mutta CosyVoice 2:n kaltaiset mallit kattavat kiinalaiset, japanilaiset ja korealaiset. GPT-SoVITS käsittelee kiinaa, japania, koreaa ja englantia, ja MeloTTS tukee englantia, espanjaa, ranskaa, kiinaa, japania ja koreaa.

Kyllä. Kaikki käsittely tapahtuu omistetuilla GPU-palvelimillamme. Emme tallenna tekstituloksiasi tai luo ääntä toimituksen jälkeen. Ladattuja ääninäytteitä kloonaukseen käytetään vain nykyisessä istunnossa, eikä niitä säilytetä. Emme koskaan jaa tietojasi kolmansille osapuolille tai käytä niitä mallien kouluttamiseen.

Kyllä. Kaikki TTS.ai:lla tuotettu ääni on sinun kaupallisesti käytettäväsi, mukaan lukien YouTube-videot, podcastit, äänikirjat, sovellukset, mainokset ja tuotteet. Mallimme ovat avoimen lähdekoodin sallivia lisenssejä (MIT, Apache 2.0). Rojalteja tai jakoa ei tarvita.

TTS.ai luo äänen WAV-muodossa oletuksena maksimilaadun. Voit muuntaa MP3, FLAC, OGG tai M4A:ksi käyttämällä ilmaista Audio Converter -työkaluamme. API tukee haluamaasi lähtömuotoa suoraan pyynnössä.

Lataa lyhyt ääninäyte (alle 5 sekuntia) ääntä, jonka haluat kloonata, ja kirjoita sitten mitä tahansa tekstiä puheen tuottamiseksi tuohon ääneen. Mallit, kuten Chatterbox, GPT-SoVITS ja CosyVoice 2, tukevat äänen kloonausta. Kloonattu ääni vangitsee äänensävyn, korostuksen ja puhetyylin.

Vapaat mallit (Kokoro, Piper, VITS, MeloTTS) eivät vaadi tiliä ja maksavat nolla merkkiä. Vakiomallit (2 000 merkkiä/1K syöttöä) sisältävät Barkin, CosyVoice 2, F5-TTS ja Dia. Premium-malleja (4 000 merkkiä/1K syöttöä) ovat OpenVoice, Chatterbox, StyletTS 2 ja Tortoise. Maksulliset mallit tarjoavat yleensä parempaa laatua, enemmän ääniä ja muita ominaisuuksia, kuten äänen kloonausta.

Kyllä. API tukee erien käsittelyä suurten tekstimäärien muuntamiseksi puheeksi. Lähetä useita pyyntöjä ja hae tulokset yhtäjaksoisesti käyttäen työn UUID-tietoja. Yrityssuunnitelmiin (99 dollaria/m) kuuluu nopeamman eränkäsittelyn ensisijainen jonotus. Ihanteellinen audiobook-tuotannolle, kurssin sisällölle ja laajamittaisille puheprojekteille.
4.0/5 (8)

Ala käyttää tekoälyääntä nykyään

Liity TTS.ai:a käyttäviin luojiin, kehittäjiin ja yrityksiin