Lähteteksti tekst kõnemudelitele

Iga TTS mudel meie platvormil on avatud lähtekoodiga ärisõbralik litsentsid. MIT, Apache 2.0 ~ ei patenteeritud lock-in, ei kasutamise piirangud, ei üllatus litsentsimise tasud. Kasutage neid läbi meie majutatud API, või ise-host neid oma infrastruktuuri täieliku kontrolli.

Avatud lähtekoodiga MIT- litsents Apache 2. 0 Isemajandav GitHub

Proovi seda nüüd.

Tasuta Kokoro, Piper, VITS, MeloTTS
Sinu loodud heli ilmub siia
Genereeritud
Allalaadimine
Armastus TTS.ai?

Avatud lähtekoodiga TTS-i eelised

Miks avatud lähtekoodiga mudelid on teie projektide jaoks olulised

Kõik avatud lähtekoodiga Litsentseeritud

Iga mudel TTS.ai kasutab lubava avatud lähtekoodiga litsentsi.

MIT / Apache 2.0

Mudelid on litsentseeritud MIT või Apache 2.0, kõige lubavama avatud lähtekoodiga litsentsid. Kasutada kaubanduslikult, muuta, levitada ~ No kitsendusi.

Isemajandav

Lae tahes mudel ja käivitada see oma riistvara. Täielik kontroll oma andmeid, latency, ja infrastruktuuri. Ei pilv sõltuvus vaja.

GPU optimeeritud

Mudelid on optimeeritud NVIDIA GPU koos CUDA toetust. Piper töötab CPU ainult. Enamik mudeleid vajavad 2-8GB VRAM tõhus järeldus.

Kogukond jääb püsima

Aktiivne avatud lähtekoodiga kogukonnad säilitada ja parandada neid mudeleid. Toetused teretulnud esitama vigu, parandusi, ja uusi hääli GitHub.

Kommertskasutus OK

Kõik mudelid lubavad oma litsentside alusel ärilist kasutust. Ehitada tooteid, müüa teenuseid ja luua ilma litsentsitasude või kasutustasudeta ärilist sisu.

Meie avatud lähtekoodiga mudeli kataloog

Iga mudel, selle litsents ja mida see kõige paremini teeb

KokoroKokoro

Free

Lightweight 82M parameter model delivering studio-quality speech with blazing-fast inference.

Fast 5/5

Parim: Apache 2.0 ~ parim kvaliteet tasuta mudel, 82M params, lihtne ise-host

Proovi Kokoro

PiperPiper

Free

A fast, local neural text to speech system optimized for Raspberry Pi and embedded devices.

Fast 3/5

Parim: MIT ~ Ainult CPU, ideaalne serv seadmed ja sisseehitatud isehosting

Proovi Piper

VITSVITS

Free

Conditional variational autoencoder with adversarial learning for end-to-end text-to-speech.

Fast 3/5

Parim: MIT ~ foundational arhitektuur, mida kasutavad paljud järgmise etapi mudelid

Proovi VITS

BarkBark

Standard

Transformer-based text-to-audio model that generates realistic speech, music, and sound effects.

Slow 4/5

Parim: MIT ~ unikaalne audio genereerimise võimeid üle standard TTS

Proovi Bark

Tortoise TTSTortoise TTS

Premium

Multi-voice text-to-speech focused on quality with autoregressive architecture.

Slow 5/5 Hääle kloonimine

Parim: Apache 2.0 Maksimumkvaliteet, laialdaselt uuritud viite rakendamine

Proovi Tortoise TTS

OpenVoiceOpenVoice

Premium

Instant voice cloning with granular control over style, emotion, and accent.

Medium 4/5 Hääle kloonimine

Parim: MIT ~ avatud lähtekoodiga hääl kloonimine granuleeritud stiilis kontroll

Proovi OpenVoice

Kuidas kasutada avatud lähtekoodiga TTS-i

Kasutage meie võõrustatud API või käivitada mudeleid ise

1

Ava lähtekoodiga mudelite uurimine

Vaata meie kataloogi 20+ avatud lähtekoodiga TTS mudelitest. Iga mudelleht näitab litsentsi, arhitektuuri, võimeid ja isehostimise nõudeid.

2

Proovi oma brauseris

Test tahes mudel otse TTS.ai installimata midagi. Meie GPU serverid käsitseda töötlemine nii, et saate hinnata kvaliteeti enne pühendumist isehosting.

3

Ennasttäis või kasuta meie APIt

Klooni mudel repos alates GitHub ja käivitada kohapeal, või kasutada meie võõrustatud API tootmiseks. Isehosting annab täieliku kontrolli; meie API pakub hallata infrastruktuuri.

4

Ehita rakendus

Integreerida TTS oma toodet kasutades isehostitud mudelid või meie REST API. Kõik mudelid on kaubanduslikult kasutatavad ilma litsentsimistasusid või litsentsitasusid.

Litsentsi võrdlus

Kõik mudelid TTS.ai kasutada ärisõbralik avatud lähtekoodiga litsentsid

Näidis Litsents Kaubanduslik kasutamine Muudatus Endast eemalehoidmine Atributsioon
Kokoro Apache 2.0 Nõutav
Piper MIT Valikuline
VITS MIT Valikuline
MeloTTS MIT Valikuline
Chatterbox MIT Valikuline
Tortoise TTS Apache 2.0 Nõutav
StyleTTS 2 MIT Valikuline
OpenVoice MIT Valikuline
Sesame CSM Apache 2.0 Nõutav
Orpheus Llama 3.2 "Built with Llama"

Isehosting vs Hosted API

Käivitage ise modellid või laske meil infrastruktuuriga tegeleda.

Ennasttäis oma riistvara

Iga mudel TTS.ai on saadaval avatud lähtekoodiga projekti GitHub või Hugging Face. Lae kaalud, installida sõltuvused, ja käivitada järeldus oma GPUs. Sul on täielik kontroll latency, privaatsus, ja skaleerimine.

  • Täielik andmete privaatsus audio ei lahku kunagi serverist
  • Taotluse esitamisega seotud kulusid pärast esialgset loomist ei ole
  • Kohandatud peenhäälestus sinu enda andmete järgi
  • Nõuab GPU riistvara (NVIDIA soovitatav)
  • Sa hallata uuendusi, skaleerimine, ja sõltuvused

TTS.ai Hosted API kasutamine

Saada kohene juurdepääs kõigile 20+ mudelid läbi ühe REST API. Me tegeleme GPU pakkumine, mudeli uuendused, järjekorda juhtimine, ja skaleerimine. Üks API võti annab teile juurdepääsu iga mudeli ~ ei ole vaja hallata eraldi kasutuselevõtud.

  • GPU riistvara pole vaja
  • Kõik 20+ mudelid läbi ühe API
  • Automaatsed mudeliuuendused ja täiustused
  • 99,9% uptime koos liigse infrastruktuuriga
  • Maksa ainult selle eest, mida kasutad

Kiire algus: API või Self-Host

Kasutage meie hosted API, või installida Kokoro kohapeal minutit

Valik 1: TTS.ai Hosted API Lihtsaim
import requests

response = requests.post("https://api.tts.ai/v1/tts", json={
    "text": "Open source TTS with a simple API.",
    "model": "kokoro",
    "voice": "af_heart",
    "format": "wav"
}, headers={"Authorization": "Bearer YOUR_API_KEY"})

with open("output.wav", "wb") as f:
    f.write(response.content)
Variant 2: Iseseisvus Pipiga Täielik kontroll
# Install Kokoro locally
pip install kokoro

# Generate speech on your own GPU
import kokoro

pipeline = kokoro.KPipeline(lang_code="a")
generator = pipeline("Hello from your own server!", voice="af_heart")
for i, (gs, ps, audio) in enumerate(generator):
    kokoro.save(audio, f"output_{i}.wav")

Avatud lähtekoodiga, taskukohane hinnakujundus

Meie võõrustatud API teeb avatud lähtekoodiga TTS kättesaadavaks ilma GPU-sid haldamata.

Vaba tase

$0

50 krediiti registreerimisel

  • 4 avatud lähtekoodiga mudelid tasuta
  • Põhikasutuseks registreerumine puudub@ info: whatsthis
  • Lubatud kaubanduslik kasutamine

Starter

$9

500 000 tähemärki kuus

  • Kõik 20+ avatud lähtekoodiga mudelid
  • Hääle kloonimine
  • API-juurdepääs

Pro

$29

2 000 000 tähemärki kuus

  • GPU prioriteetne töötlemine
  • Kõik lisatasumudelid
  • Ettevõtlustoetus
Vaata täielikku hinnakujundust

Korduma kippuvad küsimused

Üldised küsimused avatud lähtekoodiga teksti kõne

Jah. Iga mudel TTS.ai kasutab lubatud avatud lähtekoodiga litsentsi ~ kas MIT või Apache 2.0. Me konkreetselt välistada mudelid piiravad litsentsid (nagu Coqui's CPML või mittekaubanduslik CC-BY-NC). Saate kontrollida iga mudeli litsentsi oma GitHub hoidla.

Mõlemad on lubatud avatud lähtekoodiga litsentsid, mis võimaldavad ärilist kasutamist, muutmist ja ümberjaotamist. Apache 2.0 lisab selgesõnalisi patenditoetusi ja nõuab koodi muutmisel muudatuste tegemist. MIT on lihtsam väiksemate nõudmistega. Mõlemad on ärisõbralikud.

Jah. Iga mudel võib olla isehostitud. Kloon mudeli hoidla GitHub, installida sõltuvused, alla laadida mudeli kaal, ja käivitada järeldus. Pakume dokumentatsioon iga mudeli isehosting nõuded, sealhulgas GPU, RAM, ja Python versioon.

Nõuded on mudeliti erinevad. Piper ei vaja GPU (ainult CPU). Kokoro ja MeloTTS vajavad 1-2GB VRAM. Enamik standardmudeleid vajavad 4GB VRAM. Tortoise ja Seesami CSM vaja 8GB. NVIDIA RTX 3060 (12GB) saab käivitada enamik mudeleid mugavalt.

Jah. Avatud lähtekoodiga litsentsid võimaldavad muuta, sealhulgas peenhäälestus. Mudelid nagu GPT- Sovits ja Bark pakuvad peenhäälestusskripte. Modelle saab treenida oma häälandmetes, et luua kohandatud hääli või parandada konkreetsete keelte jõudlust.

Parimad avatud lähtekoodiga mudelid (Kokoro, StyleTTS 2, Chatterbox) sobivad nüüd äriteenustega või ületavad neid, nagu ElevenLabs ja Google TTS kvaliteedi võrdlusalusena. Kommertsteenuste peamine eelis on hallata infrastruktuuri ja toetada, mitte helikvaliteeti.

Me oleme nad juba välistanud. XTTS/XTTS-v2 (Coqui's CPML ~ mittekaubanduslik), F5-TTS (CC-BY-NC ~ mittekaubanduslik) ja Higgs-v2 (Boson Licence ~ piirav) olid kõik eemaldatud. Iga mudel TTS.ai on kontrollitud kaubandusliku kasutamise ohutu.

Jah. Enamik mudeleid aktsepteerib kogukonna panust läbi GitHub. Saate esitada veateateid, uute keelte kõnesalvestisi, koodiparandusi ja dokumentatsiooni. Kontrollige iga mudeli GitHub hoidla panuse juhiseid ja aktiivseid küsimusi.

GPU mälu jagamiseks laadige mudelid peale ja laadige tühjaks. Meie GPU server töötab 20+ mudeliga 4x Tesla P40 (96GB kogu VRAM), kasutades dünaamilist laadimist. Isehostmiseks võib üks 24GB GPU teenindada samaaegselt 3-5 mudelit.

Paljud mudelid pakuvad ametlikke Docker pilte või Dockerfiles. Mitme mudeli käivitamiseks saab luua kohandatud Docker setup koos NVIDIA Container Toolkit GPU juurdepääsu. Meie API serveri arhitektuur võib olla viiterakendus.

Enamik mudeleid nõuab Python 3.10.-3.12. Coqui TTS (VITS) vajab spetsiaalselt Python 3.11. Soovitame Python 3.12 enamikule mudelitele. Kontrollige iga mudeli nõudeid.txt täpse versiooni ühilduvuse.txt.

Jah. MIT ja Apache 2.0 litsentsid lubavad selgesõnaliselt ärilist kasutust. SaaS-i tooteid, mobiilirakendusi, mänge ja teenuseid saab ehitada ilma litsentsitasude, litsentsitasude või omistamisnõueteta (kuigi omistamist hinnatakse).
5.0/5 (1)

Mida me võiks parandada? Teie tagasiside aitab meil lahendada küsimusi.

Proovi tänapäeval avatud lähtekoodiga TTS- d

20+ avatud lähtekoodiga mudelid, kõik kaubanduslikult litsentseeritud. Kasuta meie API või isehost ~ valik on sinu.