Açıq mənbəli Text-to-Speech Modelləri

Platformamızın hər bir TTS modeli kommersiya üçün əlverişli lisenziyalarla açıq mənbəlidir. MIT, Apache 2.0 - heç bir mülkiyyət hüququ yoxdur, istifadə məhdudiyyətləri yoxdur, təəccüblü lisenziya xərcləri yoxdur. Onları bizim hosted API vasitəsilə istifadə edin, ya da onları öz infrastrukturunuzda tam nəzarətlə öz-özünə host edin.

Açıq mənbə MIT Lisenziya Apache 2.0 Öz-özünə GitHub

İndi Yoxla

Kokoro, Piper, VITS, MeloTTS ilə pulsuz
Yaratdığınız səs buraya görünəcək
_Yarat
Endir
TTS.ai-ni sevirsiniz? Dostlarınıza deyin!

Açıq mənbəli TTS üstünlükləri

Açıq mənbə modellərinin layihələriniz üçün nə üçün əhəmiyyətli olduğu

Bütün Açıq Mənbə Lisenziyaları

TTS.ai üzərindəki hər bir model açıq mənbəli lisenziyanı istifadə edir. Heç bir patentli qara qutu, heç bir satıcı bağlantısı, heç bir gözlənilməz lisenziya haqqı yoxdur.

Apache

Modellər ən sərt açıq mənbə lisenziyası olan MIT və ya Apache 2.0 lisenziyaları altındadır. Ticari istifadə, dəyişdirmə, yenidən paylama - məhdudiyyət yoxdur.

Öz-özünə

Hər hansı bir model yükləyin və onu öz qurğularınızda işlədin. Məlumatlarınız, gecikmə və infrastrukturunuz üzərində tam nəzarət edin. Bulud asılılığı tələb olunmur.

GPU Optimizasiyası

Modellər CUDA dəstəkli NVIDIA GPU-lar üçün optimallaşdırılmışdır. Piper yalnız CPU-da işləyir. Çox modellərin səmərəli nəticə çıxarmaq üçün 2-8GB VRAM tələb olunur.

Cəmiyyət tərəfindən idarə olunur

Aktiv açıq mənbə icmaları bu modelləri saxlayır və yaxşılaşdırır. Köməkliklər qəbul edilir — səhvləri, yaxşılaşdırmaları və yeni səsləri GitHub-a göndərin.

Ticari İstifadə

Bütün modellər öz lisenziyası altında kommersiya istifadəsinə icazə verir. Məhsulları inşa edin, xidmətləri satın və royalti və ya istifadə haqqı olmadan kommersiya məzmunu yaradın.

Açıq mənbəli model katalogumuz

Hər bir model, onun lisenziyası və ən yaxşı etdiyi şey

KokoroKokoro

Free

Lightweight 82M parameter model delivering studio-quality speech with blazing-fast inference.

Fast 5/5

Ən Yaxşı: Apache 2.0 — ən yaxşı keyfiyyətli pulsuz model, 82M parametr, öz-özünə host etmək asandır

_Yoxla Kokoro

PiperPiper

Free

A fast, local neural text to speech system optimized for Raspberry Pi and embedded devices.

Fast 3/5

Ən Yaxşı: MIT — yalnız CPU, kənar avadanlıqlar və daxili öz-hosting üçün ideal

_Yoxla Piper

VITSVITS

Free

Conditional variational autoencoder with adversarial learning for end-to-end text-to-speech.

Fast 3/5

Ən Yaxşı: MIT — bir çox aşağı axın modelləri tərəfindən istifadə edilən əsas quruluşu

_Yoxla VITS

BarkBark

Standard

Transformer-based text-to-audio model that generates realistic speech, music, and sound effects.

Slow 4/5

Ən Yaxşı: MIT — standart TTS-dən kənar unikal səs yaratma qabiliyyətləri

_Yoxla Bark

Tortoise TTSTortoise TTS

Premium

Multi-voice text-to-speech focused on quality with autoregressive architecture.

Slow 5/5 Səs Klonlama

Ən Yaxşı: Apache 2.0 — maksimum keyfiyyətli, geniş araşdırılmış istinad tətbiqi

_Yoxla Tortoise TTS

OpenVoiceOpenVoice

Premium

Instant voice cloning with granular control over style, emotion, and accent.

Medium 4/5 Səs Klonlama

Ən Yaxşı: MIT — açıq mənbəli səs klonlaşdırma və granular üslub idarəsi

_Yoxla OpenVoice

Açıq mənbəli TTS-i necə istifadə etmək olar

Bizim hosted API-mizi istifadə et ya da öz modellərinizi işə sal

1

Açıq mənbəli modelləri kəşf et

20-dən çox açıq mənbəli TTS modelinin katalogunu axtarın. Hər bir model səhifəsi lisenziya, arxitektura, imkanlar və öz-özünə hosting tələblərini göstərir.

2

Səyyahınızda Yoxla

Heç bir şey quraşdırmadan TTS.ai üzərində hər hansı bir modeli test edin. Bizim GPU serverlərimiz prosesi idarə edir, buna görə də özünüz host etməzdən əvvəl keyfiyyəti qiymətləndirə bilərsiniz.

3

Özünüz qovşaq ya da API-mizi istifadə edin

GitHub-dan model repozitorlarını klonlayın və yerli olaraq işlədin, ya da istehsal üçün host edilmiş API-mizi istifadə edin. Öz-hostinq tam nəzarəti verir; bizim API idarə olunan infrastrukturu təmin edir.

4

Proqramınızı inşa edin

TTS-i öz-özünə host edilmiş modellər və ya REST API-miz vasitəsilə məhsulunuza birləşdirin. Bütün modellər lisenziya haqqı və ya royalti olmadan kommersiya məqsədilə istifadə edilə bilər.

Lisenziya Müqayisəsi

TTS.ai-də bütün modellər kommersiya üçün əlverişli açıq mənbə lisenziyası istifadə edir

Model Lisenziya Ticari İstifadə Dəyişdir Öz-özünə qovşaq Əlavə Et
Kokoro Apache 2.0 Gərəklidir
Piper MIT İmkansız
VITS MIT İmkansız
MeloTTS MIT İmkansız
Chatterbox MIT İmkansız
Tortoise TTS Apache 2.0 Gərəklidir
StyleTTS 2 MIT İmkansız
OpenVoice MIT İmkansız
Sesame CSM Apache 2.0 Gərəklidir
Orpheus Llama 3.2 "Built with Llama"

Öz-özünə qovşaq vs qovşaq API

Modelləri özünüz işlədin ya da infrastrukturu bizim idarə edək

Sağlamlığınızda öz-özünə qovşaq

TTS.ai üzərindəki hər bir model GitHub və ya Hugging Face-də açıq mənbə layihəsi olaraq mövcuddur. Yükü yükləyin, asılılıqları quraşdırın və öz GPU-larınızda nəticə çıxarın. Siz gecikmə, məxfilik və ölçmə üzərində tam nəzarətə maliksiniz.

  • Tam məxfilik — səs heç vaxt vericinizi tərk etmir
  • Başlanğıc qurğudan sonra istək başına xərc yoxdur
  • Öz məlumatlarınız üzərində təyinatlı yaxşılaşdırma
  • Grafik prosessor tələb olunur (NVIDIA məsləhət görülür)
  • Yeniləmələri, ölçüləri və asılılıqları idarə edirsiniz

TTS.ai qovşaq API-ni işlət

Bir REST API vasitəsilə bütün 20+ modellərə dərhal çıxış əldə edin. Biz GPU təminatı, model yeniləmələri, növbə idarəetmə və ölçmə ilə məşğul oluruq. Bir API açarı hər bir modelə çıxış verir - ayrı-ayrı işə salmaları idarə etməyə ehtiyac yoxdur.

  • GPU hardverinə ehtiyac yoxdur
  • Bir API vasitəsilə bütün 20+ modellər
  • Avtomatik model yeniləmələri və yaxşılaşdırmalar
  • 99.9% iş vaxtı
  • Yalnız istifadə etdiyiniz şeyə görə ödəyin

Tez Başla: API və ya Özəl-Host

Bizim hosted API-mizi istifadə et, ya da Kokoro'yu yerli olaraq bir neçə dəqiqədə quraşdır

1-ci seçim: TTS.ai Hosted API Ən asan
import requests

response = requests.post("https://api.tts.ai/v1/tts", json={
    "text": "Open source TTS with a simple API.",
    "model": "kokoro",
    "voice": "af_heart",
    "format": "wav"
}, headers={"Authorization": "Bearer YOUR_API_KEY"})

with open("output.wav", "wb") as f:
    f.write(response.content)
2-ci seçim: pip ilə öz-özünə qovşaq Tam İdarəetmə
# Install Kokoro locally
pip install kokoro

# Generate speech on your own GPU
import kokoro

pipeline = kokoro.KPipeline(lang_code="a")
generator = pipeline("Hello from your own server!", voice="af_heart")
for i, (gs, ps, audio) in enumerate(generator):
    kokoro.save(audio, f"output_{i}.wav")

Açıq mənbə, ucuz qiymət

Bizim host edilmiş API açıq mənbəli TTS-i GPU-ları idarə etmədən əldə edilə bilir.

_Fərqli səviyyələr

$0

15,000 karakter qeydiyyatda

  • 4 açıq mənbə modelləri pulsuz
  • Əsas istifadə üçün qeydiyyat yoxdur
  • Ticari istifadəyə icazə verilir

Başlat

$9

500,000 karakter/ay

  • Bütün 20+ açıq mənbə modelləri
  • Sesi təkrarla
  • API girişi

Pro

$29

2,000,000 karakter/ay

  • GPU işləmə prioriteti
  • Bütün premium modellər
  • Enterprise dəstəyi
Tam qiyməti göstər

Tez-tez Sorulan Sual

Açıq mənbəli mətndən-sözə keçid haqqında yayılmış suallar

Bəli. TTS.ai-də hər bir model açıq mənbəli lisenziya ilə işlənir — ya MIT ya da Apache 2.0. Biz məhdudlaşdırıcı lisenziyalarla işlənən modelləri (Coqui'nin CPML və ya ticarətsiz CC-BY-NC kimi) istisna edirik. Hər bir modelin lisenziyasını GitHub repozitoriyasında yoxlaya bilərsiniz.

İkisi də kommersiya istifadəsinə, dəyişdirilməsinə və yenidən paylanmasına icazə verən açıq mənbəli lisenziyalardır. Apache 2.0 açıq patent verilməsi əlavə edir və kodu dəyişdirdiyiniz zaman dəyişiklikləri bildirməyi tələb edir. MIT daha az tələblərlə daha sadədir. İkisi də biznes üçün əlverişlidir.

Bəli. Hər bir model öz-özünə host edilə bilər. GitHub-dan model repozitoriyasının klonunu, asılılıqları quraşdırın, model ağırlıqlarını yükləyin və nəticəni işə salın. Biz hər bir modelin öz-özünə host edilməsi tələbləri üçün GPU, RAM və Python versiyası da daxil olmaqla sənədləşdirmə təmin edirik.

Təkliflər modeldən asılı olaraq dəyişir. Piper üçün GPU lazım deyil (yalnız CPU). Kokoro və MeloTTS üçün 1-2 GB VRAM lazımdır. Bir çox standart model üçün 4 GB VRAM lazımdır. Tortoise və Sesame CSM üçün 8 GB lazımdır. Bir NVIDIA RTX 3060 (12GB) modellərin çoxunu rahat işlədə bilər.

Bəli. Açıq mənbə lisenziyaları düzəltmə də daxil olmaqla dəyişikliyə icazə verir. GPT-SoVITS və Bark kimi modellər düzəltmə skriptləri təklif edir. Öz səs məlumatlarınız üzərində modelləri öyrədib öz səslərinizi yarada və ya müəyyən dillər üçün performansı yaxşılaşdıra bilərsiniz.

Top açıq mənbə modelləri (Kokoro, StyleTTS 2, Chatterbox) indi keyfiyyət göstəricilərində ElevenLabs və Google TTS kimi kommersiya xidmətləri ilə eynidir və ya üstündür. Komersiya xidmətlərinin əsas üstünlüyü idarə olunan infrastruktur və dəstəkdir, səs keyfiyyəti deyil.

Biz onları artıq istisna etmişik. XTTS/XTTS-v2 (Coqui's CPML — ticarət üçün deyil), F5-TTS (CC-BY-NC — ticarət üçün deyil), və Higgs-v2 (Boson Lisenziya — məhdudlaşdırıcı) hamısı çıxarılmışdır. TTS.ai-də hər bir model ticarət üçün təhlükəsiz olduğu təsdiqlənmişdir.

Bəli. Çox modellər GitHub vasitəsilə ictimai iştirakı qəbul edir. Siz xəta məlumatları, yeni dillər üçün səs qeydləri, kod yaxşılaşdırmaları və sənədləri təqdim edə bilərsiniz. Hər bir modelin GitHub repozitoriyasında iştirak qaydaları və aktiv problemlər üçün baxın.

GPU yaddaşını paylaşmaq üçün tələb olunan modelləri yükləyin və boş olduqda yükləyin. Bizim GPU serverimiz dinamik yükləmə istifadə edərək 4x Tesla P40 (96GB ümumi VRAM) üzərində 20+ modeli işlədir. Öz-özünə hostinq üçün tək bir 24GB GPU 3-5 modelə eyni zamanda xidmət edə bilər.

Bir çox modellər rəsmi Docker görüntüləri və ya Dockerfilslər təmin edir. Birdən çox modelin işlədilməsi üçün NVIDIA Container Toolkit ilə GPU-ya çıxış üçün ödənişli Docker qurğusunu quraşdıra bilərsiniz. Bizim API server mimarimiz istinad tətbiqi kimi xidmət edə bilər.

Çox modellər Python 3.10-3.12 tələb edir. Coqui TTS (VITS) xüsusilə Python 3.11 tələb edir. Çox modellər üçün Python 3.12 tövsiyə edirik. Hər modelin tələbləri.txt-ni tam versiya uyğunluğu üçün yoxlayın.

Bəli. MIT və Apache 2.0 lisenziyası açıq şəkildə kommersiya istifadəsinə icazə verir. Bu modelləri istifadə edərək SaaS məhsulları, mobil tətbiqlər, oyunlar və xidmətləri lisenziyalı ödənişlər, royaltilər və ya təsnif tələbləri olmadan qura bilərsiniz (təsnif tələbləri qiymətləndirilir).
5.0/5 (1)

Nəyi yaxşılaşdıra bilərik? Sizin rəyiniz problemləri düzəltməyə kömək edir.

Açıq mənbəli TTS-i bu gün sınayın

20+ açıq mənbəli modellər, bütün kommersiya lisenziyalı. Bizim API və ya öz-host istifadə edin - seçim sizindir.