Tasuta tehisintellekt Tekst kõnele

31+ avatud lähtekoodiga mudelid; 231+ hääled, 34+ keeli. Kontot ei ole vaja.

8K+
loojad
32K+
generatsioonidunit synonyms for matching user input
31+
AI mudelid
231+
hääled
0/500 märgid · Sign up for 5,000 per generation → Vaba
Armastus TTS.ai?

Kõik, mida vajate hääl AI

30+ avatud lähtekoodiga tehisintellektimudelitel töötavad tööriistad

31+ AI häälemudelid

Kõige ulatuslikum avatud lähtekoodiga TTS-mudelite kogu ühes platvormis

KokoroKokoro Vaba

Kokoro on 82 miljonit parameetrit teksti-kõne mudel, mis lööb oluliselt üle oma kaaluklassi. Vaatamata oma tillukese suurusega, see toodab märkimisväärselt loomulik ja väljendusrikas kõne. Kokoro toetab mitmeid keeli, sealhulgas inglise, jaapani, hiina ja Korea erinevaid väljendusrikkaid hääli. See töötab uskumatult kiire ~ genereerib heli peaaegu 100x kiiremini kui reaalajas GPU.

Parim: Kvaliteetne TTS minimaalse latentsiga, streaming rakendused

Proovi tasuta

PiperPiper Vaba

Piper on kerge teksti kõneks mootor välja töötatud Rhasspy, mis kasutab VITS ja kõri arhitektuuri. See töötab täielikult CPU, muutes selle ideaalseks serva seadmed, koduautomaatika, ja rakendused nõuavad offline TTS. Üle 100 hääled üle 30+ keeles, Piper pakub loomulik kõlav kõne reaalajas isegi Vaarika Pi 4.

Parim: Kiire eelvaatlus, ligipääsetavus ja põimitud rakendused

Proovi tasuta

VITSVITS Vaba

VITS (Variational Inference with võistlev õppe lõpp-to-end Tekst-to-Speech) on paralleelne lõpp-to-end TTS meetod, mis tekitab loomuliku heli kui praegune kaheastmeline mudelid. See võtab variational järeldus laiendatud normaliseerida voolud ja võistlev koolitusprotsess, saavutades olulise paranemise loomulikkus.

Parim: Üldotstarbeline tekst-kõne loomuliku prosoodiaga

Proovi tasuta

MeloTTSMeloTTS Vaba

MyShell.ai MeloTTS on mitmekeelne TTS raamatukogu, mis toetab inglise (Ameerika, Briti, India, Austraalia), hispaania, prantsuse, hiina, jaapani ja korea keelt. See on väga kiire, töötledes teksti peaaegu reaalajas kiirusega CPU üksi. MeloTTS on mõeldud tootmiseks ja toetab nii CPU ja GPU järeldus.

Parim: Tootmisrakendused, mis vajavad kiiret mitmekeelset TTS-d

Proovi tasuta

OuteTTSOuteTTS Vaba

OuteTTS laiendab suuri keelemudeleid teksti kõneks saamise võimalustega, säilitades samal ajal originaalarhitektuuri. See toetab mitmeid taustaprogramme, sealhulgas lama.cpp (CPU/GPU), Huging Face Transformers, ExLlamaV2, VLLM ja isegi brauseri järeldamist Transformers.js kaudu. Omadused null-shot hääl kloonimine läbi kõlari profiilid salvestatud JSON.

Parim: Edge kasutuselevõtt, brauseripõhine TTS, madala ressursiga keskkond

Proovi tasuta

Pocket TTSPocket TTS Vaba

Tasku TTS poolt Kyutai (loojad Moshi) on kompaktne 100M parameeter teksti-kõne mudel, mis lööb hästi üle oma kaalu. See töötab tõhusalt CPU, toetab null-shot hääl kloonimine ühe helinäidis ja toodab loomulik kõlav kõne. Väike mudel suurus teeb ideaalne servade kasutuselevõtu ja madala ressursiga keskkondades.

Parim: Kergkaalu kasutamine, ainult protsessoris kasutatavad keskkonnad, kiire hääle kloonimine

Proovi tasuta

Kitten TTSKitten TTS Vaba

Kitten TTS poolt KittenML on ultra-valguse teksti-kõne mudel ehitatud ONNX. Mis variandid 15M kuni 80M parameetrid (25-80 MB kettal), see pakub kvaliteetse häälesünteesi CPU ilma, et oleks vaja GPU. Omadused 8 sisseehitatud hääled, reguleeritav kõnekiirus, ja sisseehitatud teksti eeltöötlus numbrid, valuutade ja üksused. Ideaalne servade kasutuselevõtu ja madala-latentse rakendusi.

Parim: Kiire kerge TTS, servade kasutamine, madala tugevusega rakendused

Proovi tasuta

BarkBark Standardne

Transformer-põhine teksti-to-audio mudel, mis tekitab realistlik kõne, muusika, ja heliefekte.

Arendaja: Suno · Litsents: MIT

Proovi seda.

Bark SmallBark Small Standardne

Kergem versioon Bark kiirem järeldus ja madalam mälu kasutamine.

Arendaja: Suno · Litsents: MIT

Proovi seda.

CosyVoice 2CosyVoice 2 Standardne

Alibaba skaleeritav streaming TTS koos inimese-parity naturalness ja liginull latency.

Arendaja: Alibaba (Tongyi Lab) · Litsents: Apache 2.0

Proovi seda.

Dia TTSDia TTS Standardne

Mitme kõlariga dialoogi genereerimise mudel, mis loob kõnelejate vahel loomuliku vestluse.

Arendaja: Nari Labs · Litsents: Apache 2.0

Proovi seda.

Parler TTSParler TTS Standardne

Kirjelda oma soovitud häält loomulikus keeles ja Parler loob sobiva kõne.

Arendaja: Hugging Face · Litsents: Apache 2.0

Proovi seda.

GLM-TTSGLM-TTS Standardne

Saavutab avatud lähtekoodiga TTS-mudelite madalaima märgi veamäära.

Arendaja: Zhipu AI · Litsents: GLM-4 License

Proovi seda.

IndexTTS-2IndexTTS-2 Standardne

Null-shot TTS peeneteraline emotsioonide kontrolli ja kõrge väljendusvõimega.

Arendaja: Index Team · Litsents: Bilibili Model License

Proovi seda.

Spark TTSSpark TTS Standardne

Hääl kloonimine TTS kontrollitav emotsioonide ja rääkimisstiili kaudu.

Arendaja: SparkAudio · Litsents: CC BY-NC-SA 4.0

Proovi seda.

GPT-SoVITSGPT-SoVITS Standardne

Vähesed helid kloonivad TTS-d, mis jäljendavad igat häält vaid 5 sekundi helist.

Arendaja: RVC-Boss · Litsents: MIT

Proovi seda.

OrpheusOrpheus Standardne

Inimese tasemel emotsionaalne TTS mudel treenitud 100K tundi kõne andmeid.

Arendaja: Canopy Labs · Litsents: Llama 3.2 Community

Proovi seda.

Qwen3 TTSQwen3 TTS Standardne

Alibaba mitmekeelne TTS koos hääl kloonimine, eelseadistatud hääled, ja hääl disain tekstist.

Arendaja: Alibaba (Qwen) · Litsents: Apache 2.0

Proovi seda.

Chatterbox TurboChatterbox Turbo Standardne

Kiirem Chatterbox sub-200ms latency ja paralinguistlik sildid naeru, köha, ja rohkem.

Arendaja: Resemble AI · Litsents: MIT

Proovi seda.

Dia 2Dia 2 Standardne

Streaming-esimene jutuajamine TTS multi-speaker dialoogi ja paralinguistlik vihjeid.

Arendaja: Nari Labs · Litsents: Apache 2.0

Proovi seda.

VoxCPMVoxCPM Standardne

Tokenizer-free TTS producing 44,1kHz audio with context-aware paragraph consistance.

Arendaja: OpenBMB · Litsents: Apache 2.0

Proovi seda.

TADATADA Standardne

Nullhallutsinatsioonid TTS teksti-akustiline dual joondamine, 5x kiiremini kui võrreldav LLM TTS.

Arendaja: Hume AI · Litsents: MIT

Proovi seda.

VibeVoiceVibeVoice Standardne

Microsoft mudel pikaform multi-kõlar sisu nagu podcasts ja audiobooks.

Arendaja: Microsoft · Litsents: MIT

Proovi seda.

CosyVoice3CosyVoice3 Standardne

Next-generation multilingual TTS with bi-streaming, emotion control, and zero-shot voice cloning.

Arendaja: Alibaba (FunAudioLLM) · Litsents: Apache 2.0

Proovi seda.

ChatterboxChatterbox Premium

"State-of-the-art null-shot hääl kloonimine emotsioonide kontrolli Remonte AI.

Kvaliteet:

Proovi seda.

Tortoise TTSTortoise TTS Premium

Mitme häälega teksti kõne-kõne keskendus kvaliteedi autoregressiivne arhitektuur.

Kvaliteet:

Proovi seda.

StyleTTS 2StyleTTS 2 Premium

Inimese tasemel teksti kõne-kõne kaudu stiili difusiooni ja võistlevate koolitus.

Kvaliteet:

Proovi seda.

OpenVoiceOpenVoice Premium

Kiire hääl kloonimine granuleeritud kontrolli stiil, emotsioonid, ja aktsent.

Kvaliteet:

Proovi seda.

Sesame CSMSesame CSM Premium

Vestluskõne mudel, mis loob loomuliku dialoogi sobiva ajastuse ja emotsioonidega.

Kvaliteet:

Proovi seda.

MOSS-TTSMOSS-TTS Premium

Ultra-long 20-language TTS supporting up to 1 hour of continuous generation with phoneme-level control.

Kvaliteet:

Proovi seda.

MegaTTS3MegaTTS3 Premium

ByteDance's sparse alignment TTS with adjustable intelligibility vs. speaker similarity.

Kvaliteet:

Proovi seda.

CosyVoice 2CosyVoice 2

Alibaba skaleeritav streaming TTS koos inimese-parity naturalness ja liginull latency.

Keeled: en, zh, ja, ko, fr, de, it, es

Klooni hääl

GLM-TTSGLM-TTS

Saavutab avatud lähtekoodiga TTS-mudelite madalaima märgi veamäära.

Keeled: en, zh

Klooni hääl

IndexTTS-2IndexTTS-2

Null-shot TTS peeneteraline emotsioonide kontrolli ja kõrge väljendusvõimega.

Keeled: en, zh

Klooni hääl

Spark TTSSpark TTS

Hääl kloonimine TTS kontrollitav emotsioonide ja rääkimisstiili kaudu.

Keeled: en, zh

Klooni hääl

GPT-SoVITSGPT-SoVITS

Vähesed helid kloonivad TTS-d, mis jäljendavad igat häält vaid 5 sekundi helist.

Keeled: en, zh, ja, ko

Klooni hääl

ChatterboxChatterbox

"State-of-the-art null-shot hääl kloonimine emotsioonide kontrolli Remonte AI.

Keeled: en

Klooni hääl

Tortoise TTSTortoise TTS

Mitme häälega teksti kõne-kõne keskendus kvaliteedi autoregressiivne arhitektuur.

Keeled: en

Klooni hääl

OpenVoiceOpenVoice

Kiire hääl kloonimine granuleeritud kontrolli stiil, emotsioonid, ja aktsent.

Keeled: en, zh, ja, ko, fr, de, es, it

Klooni hääl

Qwen3 TTSQwen3 TTS

Alibaba mitmekeelne TTS koos hääl kloonimine, eelseadistatud hääled, ja hääl disain tekstist.

Keeled: en, zh, ja, ko, de, fr, ru, pt, es, it

Klooni hääl

Chatterbox TurboChatterbox Turbo

Kiirem Chatterbox sub-200ms latency ja paralinguistlik sildid naeru, köha, ja rohkem.

Keeled: en

Klooni hääl

VoxCPMVoxCPM

Tokenizer-free TTS producing 44,1kHz audio with context-aware paragraph consistance.

Keeled: en, zh

Klooni hääl

OuteTTSOuteTTS

LLM-põhine TTS, mis töötab CPU, GPU, või brauseri kaudu lama.cpp ja Transformers.js.

Keeled: en

Klooni hääl

Pocket TTSPocket TTS

Kyutai kerge 100M parameetri mudel, mille puhul ühe proovi hääl kloonitakse.

Keeled: en, fr

Klooni hääl

CosyVoice3CosyVoice3

Next-generation multilingual TTS with bi-streaming, emotion control, and zero-shot voice cloning.

Keeled: en, zh, ja, ko, de, es, fr, it, ru

Klooni hääl

MOSS-TTSMOSS-TTS

Ultra-long 20-language TTS supporting up to 1 hour of continuous generation with phoneme-level control.

Keeled: en, zh, de, es, fr, ja, it, hu, ko, ru, fa, ar, pl, pt, cs, da, sv, el, tr

Klooni hääl

MegaTTS3MegaTTS3

ByteDance's sparse alignment TTS with adjustable intelligibility vs. speaker similarity.

Keeled: en, zh

Klooni hääl

Arendaja- esimene API

OpenAI ühilduv REST API. Üks tulemusnäitaja, 22+ mudelid. Streaming toetust reaalajas rakendusi.

  • OpenAI- ga ühilduv vorming
  • Trimmimine TTS reaalajas rakendused
  • Partii töötlemine suurte tööde jaoks
  • Veebikonksu teated
API dokkide vaatamine
pip install ttsai npm install @ttsainpm/ttsai
Python
from tts_ai import TTSClient

client = TTSClient(api_key="sk-tts-xxx")
audio = client.generate(
    text="Hello from TTS.ai!",
    model="kokoro",
    voice="af_bella",
)
client.save(audio, "output.mp3")

Lihtne ja läbipaistev hinnakujundus

Alusta tasuta, skaleeri kasvades.

Vaba

$0

15 krediiti

  • Kokoro, Piper, VITS, MeloTTS
  • 500 tähemärgi piirang
  • 3 g/h (kontot ei ole)
Registreeru tasuta

Starter

$9/munit description in lists

500 krediiti kuus

  • Kõik 22+ mudelit
  • 100 000 tähemärki generatsiooni kohta
  • Hääle kloonimine
Alusta
Kõige populaarsem

Pro

$29/munit description in lists

2000 krediiti kuus

  • Kõik Starter'is
  • API-juurdepääs
  • Prioriteetne töötlemine
Hangi proff

Äri

$99/munit description in lists

10 000 krediiti kuus

  • Kõik on Pro's
  • Pulk API
  • Prioriteetne järjekord
Hangi äri

Vaata kõiki plaane, kaasa arvatud märgipakette →

Korduma kippuvad küsimused

TTS.ai on kõige terviklikum tehisintellekti häälplatvorm, mis pakub 22+ tekstist kõneni mudeleid, kõne kloonimist, kõnest tekstini ja audiovahendeid. Kõik mudelid on avatud lähtekoodiga ilma müüjata.

Jah! TTS.ai pakub tasuta teksti kõneks Kokoro, Piper, VITS, ja MeloTTS mudelid. Ei ole vaja. Registreeru, et saada 15,000 tasuta tähemärki ja juurdepääsu kõigile mudelitele. Tasulised plaanid algavad $9/kuus.

Kiiruse saamiseks kasutage Kokorot või Piperit. Kvaliteetseks proovige CosyVoice 2 või StyleTTS 2. Hääle kloonimiseks kasutage Chatterboxi või GPT- Sovits'i. Dialoogi jaoks kasutage Dia TTS- d. Võrrelda tuleb mitut mudelit samas tekstis.

Jah. OpenAI-ühilduv REST API TTS, STT, hääl kloonimine, ja audio tööriistad. Saadaval Pro ($29/mo) ja Enterprise ($99/mo) plaanid. Vaata dokumente tts.ai/api /.

Hääle kvaliteet varieerub mudeli järgi. Premium mudelid nagu CosyVoice 2, StyleTTS 2 ja Chatterbox toota inimeselähedane kvaliteet kõne loomulik intonatsioon ja emotsioonid. Tasuta mudelid nagu Kokoro pakkuda suurepärast kvaliteeti enamikul juhtudel.

TTS.ai toetab 30+ keelt oma mudeliraamatukogus. Inglise keelel on kõige laiem mudeli toetus, kuid sellised mudelid nagu CosyVoice 2 hõlmavad hiina, jaapani ja korea keelt; GPT-SoviTS tegeleb hiina, jaapani, korea ja inglise keelega ning MeloTTS toetab inglise, hispaania, prantsuse, hiina, jaapani ja korea keelt.

Jah. Kogu töötlemine toimub meie spetsiaalsetes GPU serverites. Me ei salvesta sinu tekstisisendit või genereeritud audiot pärast kohaletoimetamist. Üleslaaditud helinäidiseid kloonimiseks kasutatakse ainult aktiivse seansi jaoks ja neid ei säilitata. Me ei jaga kunagi sinu andmeid kolmandate osapooltega ega kasuta seda mudelite treenimiseks.

Jah. Kõik heli loodud TTS.ai on teie kasutada kaubanduslikult, sealhulgas YouTube videod, podcasts, audioraamatud, rakendused, reklaamid, ja tooted. Meie mudelid on avatud lähtekoodiga alusel lubatud litsentsid (MIT, Apache 2.0). Nr litsentsitasud või määramine vaja.

TTS.ai loob heli WAV formaadis vaikimisi maksimaalse kvaliteedi. Saate teisendada MP3, FLAC, OGG või M4A kasutades meie tasuta Audio Converter tööriist. API toetab täpsustada oma eelistatud väljundvorming otse taotluse.

Laadib üles lühikese helinäidise (pisuke kui 5 sekundit) häälest, mida soovid kloonida, ning kirjutab siis mis tahes teksti kõne tekitamiseks hääles. Sellised mudelid nagu Chatterbox, GPT- Sovetts ja CosyVoice 2 toetavad hääle kloonimist. Kloonitud hääl haarab tooni, aktsendi ja kõnelemise stiili.

Tasuta mudelid (Kokoro, Piper, VITS, MeloTTS) ei nõua konto ja kulu null tähemärki. Standardmudelid (2000 tähemärki/1K sisend) sisaldavad Bark, CosyVoice 2, F5-TTS ja Dia. Premium mudelid (4000 tähemärki/1K sisend) sisaldavad OpenVoice, Chatterbox, StyleTTS 2 ja Tortoise. Tasustatud mudelid pakuvad üldiselt kõrgema kvaliteediga, rohkem hääli, ja täiendavaid funktsioone nagu hääl kloonimine.

Jah. API toetab partii töötlemise teisendamiseks suurtes kogustes teksti kõne. Saada mitu päringut ja saada tulemusi asünkroonselt kasutades töö UUTID. Ettevõtte plaanid ($99/mo) sisaldavad prioriteet järjekorra juurdepääsu kiiremaks partii töötlemise. Ideaalne audioraamat tootmise, muidugi sisu, ja suuremahuliste hääleüle projekte.
4.0/5 (22)

Mida me võiks parandada? Teie tagasiside aitab meil lahendada küsimusi.

Alusta AI-hääle kasutamist tänapäeval

Liitu loojate, arendajate ja ettevõtetega, kasutades TTS.ai