Fungu la Maneno Latolewa Wazi kwa Mifano ya Usemi

Kila mfano wa TTS kwenye jukwaa letu ni chanzo kilicho wazi cha leseni za kibiashara. MT, Apache 2.0 hakuna mrengo wa kufuli, hakuna vizuizi vya matumizi, wala leseni za kushtukia.

Chanzo cha Pekee SIKILIZA Apache 2.0 Mwenye Kujitakia Mema GitHab

Kijaribu Sasa

Nikiwa huru na Kokoro, Piper, VITS, MetoTTTS
Sauti yako iliyotokezwa itatokea hapa
Genested
Pakia
Waeleze rafiki zako kuhusu mapenzi ya TTS.ai?

Mojawapo ya Faida za Kutokeza Chanzo cha Habari

Kwa nini mifano iliyo wazi kuhusu miradi yenu

Picha zote za Wazi

Kila kigezo kwenye TTS.ai hutumia leseni ya kupeana huduma nje ya nyumba. Hakuna masanduku meusi, hakuna mchuuzi wa kufuli, hakuna ada zisizotarajiwa za leseni.

MIT / Apache 2.0

Magendo yana leseni chini ya MIT au Apache 2.0, leseni za bure zaidi.

Mwenye Kujitakia Mema

Pakua kiolezo chochote na utumie vifaa vyako mwenyewe.

GPU Optureed

Magendo yanaandaliwa kwa ajili ya NVIDIA GUs kwa msaada wa CUDA. Piper anakimbia CPU pekee.

Jumuiya Yadumishwa

Jumuiya zinazotoa misaada kwa uhuru zinadumisha na kuboresha miundo hii. Michango inawakaribisha wadudu, maendeleo, na sauti mpya kwenye GitHub.

Biashara Itumie Vizuri

Waigaji wote huruhusu matumizi ya kibiashara chini ya leseni zao.

Kioo cha Msingi Wetu cha Wazi

Kila kiolezo, leseni yacho, na kile ifanyacho kwa njia bora zaidi

KokoroKokoro

Free

Lightweight 82M parameter model delivering studio-quality speech with blazing-fast inference.

Fast 5/5

Faida kwa: Apache 2.0 Équipe bora zaidi bila malipo, 82M params, rahisi kujichukia

Jaribu Kokoro

PiperPiper

Free

A fast, local neural text to speech system optimized for Raspberry Pi and embedded devices.

Fast 3/5

Faida kwa: MIT CPU-peli pekee, inafaa kabisa kwa vifaa vya kisasa na kujifungia ndani

Jaribu Piper

VITSVITS

Free

Conditional variational autoencoder with adversarial learning for end-to-end text-to-speech.

Fast 3/5

Faida kwa: MILIMA ya msingi iliyotumiwa na watu wengi walio chini ya mto

Jaribu VITS

BarkBark

Standard

Transformer-based text-to-audio model that generates realistic speech, music, and sound effects.

Slow 4/5

Faida kwa: MIT É ni uwezo wa pekee wa kusikia unaoshinda kiwango cha kawaida cha TTS

Jaribu Bark

Tortoise TTSTortoise TTS

Premium

Multi-voice text-to-speech focused on quality with autoregressive architecture.

Slow 5/5 Sauti Yaungana

Faida kwa: Utekelezaji bora kabisa wa marejezo wa Apache 2.0

Jaribu Tortoise TTS

OpenVoiceOpenVoice

Premium

Instant voice cloning with granular control over style, emotion, and accent.

Medium 4/5 Sauti Yaungana

Faida kwa: SAUTI ya sauti huru inayoibuka kwa kutumia mfumo wa sauti

Jaribu OpenVoice

Jinsi ya Kutumia Picha Zilizo Wazi

Tumia gari letu aina ya API au Kabla ya kuwa violezo

1

Kuchunguza Magendo ya Wazi

Weka orodha yetu ya violezo 20 vya TTS vilivyo wazi. Kila ukurasa wa kigezo unaonyesha leseni, usanifu - majengo, uwezo, na matakwa ya kibinafsi.

2

Jaribu Katika Kijimbo Chako

Jaribuni kigezo chochote kati ya TTS.ai bila kuweka chochote.

3

Kujiona Wenyewe au Kutumia API Yetu

Mfano wa Clone unatokana na GitHab na unaendeshwa katika eneo letu, au unatumika kama mimi kwa ajili ya uzalishaji. Kujitolea kunatudhibiti kabisa; na API tunaandaa miundo ya msingi inayosimamiwa na serikali.

4

Jenga Matumizi Yako

TEGEMEA TTS katika bidhaa yako kwa kutumia waigaji wetu waliojitutututu au REST API.Mila zote zinaweza kuuzwa bila ada za leseni au za kifalme.

Ulinganifu Mkali

Waigaji wote wa mtandao wa TTS.ai wanatumia leseni za kibiashara za kutoa huduma huru

Mfano Lenzi Matumizi ya Biashara Fizi Mwenye Kujitosheleza mwenyewe Oktribuion
Kokoro Apache 2.0 Zahitajiwa
Piper MIT Njia ya kuchagua
VITS MIT Njia ya kuchagua
MeloTTS MIT Njia ya kuchagua
Chatterbox MIT Njia ya kuchagua
Tortoise TTS Apache 2.0 Zahitajiwa
StyleTTS 2 MIT Njia ya kuchagua
OpenVoice MIT Njia ya kuchagua
Sesame CSM Apache 2.0 Zahitajiwa
Orpheus Llama 3.2 "Built with Llama"

Kuzurura - zurura API

Run models yourself or let us handle the infrastructure

Fanyeni kazi kwa bidii.

Kila mfano wa watu TTS.ai unapatikana kama mradi ulio wazi wa GitHub au Hang Face.

  • Habari kamili kuhusu faragha TIMOTHEO sauti haziachi kamwe mtunzaji wako
  • Hakuna gharama kwa kila moja baada ya mpango wa awali
  • Desturi za kutakia mema kwenye data yako mwenyewe
  • Vifaa vya Kuigwa (NIVIDIA vilipendekeza)
  • Unashughulikia habari mpya, ukakamao, na utegemeaji

Matumizi ya Watu TTS.ai Wakukaribisha API

Unaweza kupata mara moja mifano yote 20+ kupitia alama moja ya PES API. Tunashughulika na uandaaji wa GPU, taarifa mpya za kigezo, usimamizi wa foleni, na upambaji wa vyuma. Njia moja inakupa nafasi ya kupata kila kiolezo cha gari.[5] Hakuna haja ya kusimamia shughuli tofauti.

  • Hakuna Vifaa vya GPU vinavyohitajiwa
  • Waigaji wote 20+ kupitia API
  • Habari mpya na maendeleo yanayotokana na magari
  • 99.9% ya saa za juu zenye miundo - msingi ya rangi nyekundu
  • Toeni katika vile mnavyo vitumia

Mwanzo wa Haraka: API au Self-Host

Tumia API, au weka Kokoro katika eneo letu kwa dakika chache

Dokezo la 1: TTS.ai Watekwa API Wenye Furaha Zaidi
import requests

response = requests.post("https://api.tts.ai/v1/tts", json={
    "text": "Open source TTS with a simple API.",
    "model": "kokoro",
    "voice": "af_heart",
    "format": "wav"
}, headers={"Authorization": "Bearer YOUR_API_KEY"})

with open("output.wav", "wb") as f:
    f.write(response.content)
Njia ya 2: Jipe moyo kabisa kwa kutumia pipi Udhibiti Kamili
# Install Kokoro locally
pip install kokoro

# Generate speech on your own GPU
import kokoro

pipeline = kokoro.KPipeline(lang_code="a")
generator = pipeline("Hello from your own server!", voice="af_heart")
for i, (gs, ps, audio) in enumerate(generator):
    kokoro.save(audio, f"output_{i}.wav")

Chanzo cha Pekee, Kinavutia Sana

Mwakilishi wetu API anafanya TTS zipatikane wazi bila ya usimamizi wa GPUs.

Tier Huru

$0

15 sifa kwa kutiwa sahihi

  • 4 Waigaji wa wazi bila malipo
  • Hakuna ishara ya kutumiwa kwa msingi
  • Utumizi wa kibiashara uliruhusu

keyboard label

$9

Wahusika 500,000/miezi

  • Waigaji wote 20+ walio huru
  • Kufanyizwa kwa Sauti
  • Njia ya kuingia

Project

$29

Wahusika 2,000,000/Mwezi

  • Utengenezaji wa GPU
  • Njia zote za kupunguza uzito
  • Utegemezo wa ziada
Mandhari Kamili

Maswali Ambayo Watu Huuliza Mara Nyingi

Maswali ya kawaida juu ya chanzo cha wazi cha maneno

Ndiyo. kila mfano wa watu TTS.ai hutumia leseni ya wazi isiyo na leseni ya kuandaliwa na watu binafsi ya bure..

Yote mawili ni leseni zinazoruhusu matumizi ya kibiashara, kurekebisha, na kugawa upya. Apache 2.0 inatoa haki ya haki iliyo wazi na inataka kubadilisha kama mtarekebisha msimbo huu.

Naam. Kila kigezo chaweza kujichorelea mwenyewe. Clione ni kielelezo kilichotokana na GitHub, kuweka miundo ya kujitegemea, kupakua vyuma vya muundo wa namna, na kupiga picha za kushindilia. Tunaandaa hati za matakwa ya kila mwanamitindo ikiwa ni pamoja na toleo la GPU, RAM, na Python.

Matakwa hutofautiana kwa kigezo. Piper hahitaji GPU (CPU pekee). Kokoro na MelTTS wanahitaji 1-2GB VRAM. Vielelezo vingi vya kawaida huhitaji 4GB VRAM. Tortoise na Sesame CSB. An NVIDIA RTX 3060 (12GB) vyaweza kuwa na vigezo vingi vya usalama.

Vyeti huru huruhusu marekebisho pamoja na uzuri wa sauti yako kutengeneza sauti za kawaida au kuboresha utendaji wa lugha fulani hususa.

Waigaji wa juu (Kokoro, StyTS 2, Chatterbox) sasa wanafaana au wanapita huduma za kibiashara kama vile ElevenLabs na Google TTS katika alama za hali ya juu. Faida kubwa ya huduma za kibiashara inasimamiwa na miundo mbinu na kuungwa mkono, wala si ubora wa sauti.

Tayari tumeziondoa. XTTS/XTTS-v2 (CPML's CPML unon-biashara), F5-TTTS (CC-BY-NC isiyo ya kibiashara), na Higgs-v2 (Boson Licen License. Kila kigezo cha TTS.ai kimethibitishwa kuwa salama kibiashara.

Waigaji wengi hukubali michango ya kijamii kupitia GitHub. Unaweza kutoa taarifa za wadudu, sauti zilizorekodiwa kwa ajili ya lugha mpya, maendeleo ya mfumo wa sheria, na hati.

Vituo vyetu kwenye mtandao wa 4x Tesla P40 (PERGB VRAM) vinakuwa na namna 20 za kupandisha vitu kwenye mtandao wa GPU. Kwa matumizi ya nguvu, jopo la 24GB GPU linaweza kuwa na vigezo 3-5 kwa ujumla.

Kwa kuwa kuna mifano mbalimbali, unaweza kujenga taasisi ya Docker na kampuni ya NVIDIA yenye kituo cha Vifaa vya GPU. Ujenzi wetu wa ujenzi unaweza kutumika kama utekelezaji wa marejezo.

Vielelezo vingi huhitaji Python 3.10-3.12. Coqui TTS (VITS) hasa mahitaji ya Python 3.11. Tunapendekeza Python 3.12 kwa ajili ya violezo vingi. Chunguza matakwa ya kila kiolezo.txt kwa ajili ya namna hususa ya usawa.

Naam.MT and Apache 2.0 inaruhusu matumizi ya kibiashara. Mwaweza kujenga bidhaa za SaaaS, programu za simu, michezo, na huduma kwa kutumia waigaji hawa wasio na ada za leseni, makao ya kifalme, au matakwa ya ziada (tary contribution inathaminiwa).
5.0/5 (1)

Uwezo wako wa kutatua matatizo ni nini?

Jaribu Chanzo Kilicho Wazi TESTO Leo

20+ Waigaji wa wazi wa misaada, wote wakiwa na nia ya kibiashara.