Açık kaynaklı metinden konuşmaya modeller

Platformumuzdaki her TTS modeli ticari olarak uygun lisanslarla açık kaynaktır. MIT, Apache 2.0 — mülkiyet hakları, kullanım kısıtlamaları, sürpriz lisans ücretleri yok. Onları bizim hosted API üzerinden kullanın, ya da kendi altyapınızda tam kontrol altında kendi kendinize hoste edin.

Açık kaynak MIT Lisansı Apache 2.0 Kendine-Konaklayıcı GitHub'da

Şimdi Dene

Kokoro, Piper, VITS, MeloTTS ile ücretsiz
Oluşturduğunuz ses burada görünecek
Oluşturuldu
İndir
TTS.ai'yi seviyor musunuz?

Açık Kaynak TTS Faydaları

Açık kaynak modellerinin projeleriniz için neden önemli olduğu

Tüm açık kaynak lisanslı

TTS.ai'deki her model açık kaynak lisansı kullanıyor. mülkiyet kara kutuları yok, satıcıya bağlılık yok, beklenmedik lisans ücretleri yok.

MIT / Apache 2.0

Modeller MIT veya Apache 2.0 lisansı altındadır, en izin veren açık kaynak lisansları. Ticari olarak kullanın, değiştirin, yeniden dağıtın — kısıtlama yok.

Kendine-Konaklayıcı

Herhangi bir modeli indirin ve kendi donanımınızda çalıştırın. Verilerinizin, gecikmenizin ve altyapınızın tamamını kontrol edin. Bulut bağımlılığı gerekmez.

GPU Optimize

Modeller CUDA desteği ile NVIDIA GPU'lar için optimizasyon yapılmıştır. Piper sadece CPU'da çalışır. Çoğu model verimli çıkarımlar için 2-8GB VRAM gerektirir.

Toplum tarafından bakımlı

Aktif açık kaynak toplulukları bu modelleri bakım ve geliştirme ile ilgilenir. katkılarda bulunmak memnuniyetle karşılanır — hatalar, iyileştirmeler ve yeni sesleri GitHub'a gönderin.

Ticari Kullanım İyi

Tüm modeller lisansları altında ticari kullanıma izin verir. Ürünler inşa edin, hizmetler satın ve ticari içerik yaratın, hiçbir telif veya kullanım ücreti olmadan.

Açık Kaynak Model Kataloğumuz

Her model, lisansı ve en iyi yaptığı şey.

KokoroKokoro

Free

Lightweight 82M parameter model delivering studio-quality speech with blazing-fast inference.

Fast 5/5

En iyi: Apache 2.0 — en iyi kaliteli ücretsiz model, 82M parametre, kendi kendine konumlandırması kolay

Dene. Kokoro

PiperPiper

Free

A fast, local neural text to speech system optimized for Raspberry Pi and embedded devices.

Fast 3/5

En iyi: MIT — Sadece CPU, uç cihazlar ve entegre kendi kendine hizmet için mükemmel

Dene. Piper

VITSVITS

Free

Conditional variational autoencoder with adversarial learning for end-to-end text-to-speech.

Fast 3/5

En iyi: MIT — birçok alt model tarafından kullanılan temel mimari

Dene. VITS

BarkBark

Standard

Transformer-based text-to-audio model that generates realistic speech, music, and sound effects.

Slow 4/5

En iyi: MIT — standart TTS'nin ötesinde eşsiz ses üretme yetenekleri

Dene. Bark

Tortoise TTSTortoise TTS

Premium

Multi-voice text-to-speech focused on quality with autoregressive architecture.

Slow 5/5 Ses Klonlama

En iyi: Apache 2.0 — maksimum kalite, geniş çapta incelenen referans uygulaması

Dene. Tortoise TTS

OpenVoiceOpenVoice

Premium

Instant voice cloning with granular control over style, emotion, and accent.

Medium 4/5 Ses Klonlama

En iyi: MIT — açık kaynaklı ses klonlama ve ince ince stil kontrolü

Dene. OpenVoice

Açık Kaynak TTS Nasıl Kullanılır

Hosted API'mizi kullanın veya modelleri kendiniz çalıştırın

1

Açık Kaynak Modellerini Keşfedin

20+ açık kaynak TTS modelinin katalogumuzu inceleyin. Her model sayfası lisans, mimari, yetenekler ve kendine-hosting gereksinimlerini gösterir.

2

Tarayıcınızda deneyin

Herhangi bir modeli TTS.ai üzerinde doğrudan test edebilirsiniz. GPU sunucularımız işlemleri üstlenir, böylece kendi kendinize konumlandırmaya karar vermeden önce kaliteyi değerlendirebilirsiniz.

3

Kendinize konum verin veya API'mizi kullanın

GitHub'dan model depolarını klonlayıp yerel olarak çalıştır, ya da üretim için hosted API'mizi kullan. Özel hosting tam kontrol sağlar; API'miz yönetilen altyapı sağlar.

4

Uygulamalarınızı Oluşturun

Kendine ait modelleri veya REST API'mizi kullanarak TTS'yi ürününüze entegre edin. Tüm modeller lisans ücretleri veya telif ücretleri olmadan ticari olarak kullanılabilir.

Lisans Karşılaştırması

TTS.ai'deki tüm modellerde ticari olarak kullanışlı açık kaynak lisansları kullanılır.

Model Lisans Ticari Kullanım Değiştirme Kendi-Konaklayıcı Ait
Kokoro Apache 2.0 Gerekir
Piper MIT İhtiyaç Duyulacak
VITS MIT İhtiyaç Duyulacak
MeloTTS MIT İhtiyaç Duyulacak
Chatterbox MIT İhtiyaç Duyulacak
Tortoise TTS Apache 2.0 Gerekir
StyleTTS 2 MIT İhtiyaç Duyulacak
OpenVoice MIT İhtiyaç Duyulacak
Sesame CSM Apache 2.0 Gerekir
Orpheus Llama 3.2 "Built with Llama"

Özel Hosting vs. Konuk API

Modelleri kendiniz çalıştırın ya da altyapıyı bize bırakın

Kendinize donanımınızda konaklayınız

TTS.ai'deki her model GitHub veya Hugging Face'de açık kaynak projesi olarak mevcuttur. Ağırlıkları indirin, bağımlılıkları yükleyin ve kendi GPU'larınızda çıkarım yapabilirsiniz. Gecikme, gizlilik ve ölçekleme üzerinde tam kontrolünüz var.

  • Tam veri gizliliği — ses sunucunuzdan asla ayrılmaz
  • Başlangıç kurulumundan sonra isteğe bağlı ücret yok
  • Kendi verileriniz üzerinde özel düzenleme
  • GPU donanım gerektirir (NVIDIA tavsiye edilir)
  • Güncellemeleri, ölçeklendirmeyi ve bağımlılıkları yönetiyorsunuz

TTS.ai Hosted API kullan

Tek bir REST API aracılığıyla 20+ modelin tümüne anında erişim sağlayın. GPU teminatı, model güncellemeleri, kuyruk yönetimi ve ölçeklendirmeyi üstleniyoruz. Tek bir API anahtarı size her modele erişim sağlar — ayrı dağıtımları yönetmeye gerek yok.

  • GPU donanıma ihtiyaç yok
  • Tek bir API üzerinden tüm 20+ model
  • Otomatik model güncellemeleri ve iyileştirmeler
  • Gereksiz altyapı ile %99,9 çalışma zamanı
  • Sadece kullandığınız için ödeme yapın.

Kısa Başlangıç: API veya Kendi Kendine Konuşucu

Kokoro'yu dakikalar içinde yerel olarak kur veya bizim hosted API'mizi kullan

Seçenek 1: TTS.ai Konuk API En kolayı.
import requests

response = requests.post("https://api.tts.ai/v1/tts", json={
    "text": "Open source TTS with a simple API.",
    "model": "kokoro",
    "voice": "af_heart",
    "format": "wav"
}, headers={"Authorization": "Bearer YOUR_API_KEY"})

with open("output.wav", "wb") as f:
    f.write(response.content)
Seçenek 2: pip ile kendi- konaklayıcı Tam Kontrol
# Install Kokoro locally
pip install kokoro

# Generate speech on your own GPU
import kokoro

pipeline = kokoro.KPipeline(lang_code="a")
generator = pipeline("Hello from your own server!", voice="af_heart")
for i, (gs, ps, audio) in enumerate(generator):
    kokoro.save(audio, f"output_{i}.wav")

Açık Kaynak, Ucuz Fiyatlar

Hosted API'miz açık kaynaklı TTS'yi GPU'ları yönetmeden erişilebilir hale getirir.

Özgür Katman

$0

15 kredi kayıt sırasında

  • 4 açık kaynak modeli ücretsiz
  • Temel kullanım için kayıt yok
  • Ticari kullanıma izin verildi

Başlatıcı

$9

500.000 karakter/ay

  • Tüm 20+ açık kaynak modelleri
  • Ses klonlama
  • API erişimi

Pro

$29

2,000,000 karakter/ay

  • Öncelik GPU işlemi
  • Tüm premium modelleri
  • Kurumsal destek
Tam Fiyatı Gör

Sıkça Sorulan Sorular

Açık kaynaklı metin-söz dönüşümü hakkında sıkça sorulan sorular

Evet. TTS.ai'deki her model açık kaynak lisansı kullanır — MIT veya Apache 2.0. Kısıtlayıcı lisansları olan modelleri (Coqui'nin CPML veya ticari olmayan CC-BY-NC gibi) özel olarak dışlıyoruz. Her modelin lisansını GitHub deposu üzerinden doğrulayabilirsiniz.

Her ikisi de ticari kullanım, değiştirme ve yeniden dağıtmaya izin veren açık kaynak lisanslardır. Apache 2.0 açıkça patent verilmesi ve kodu değiştirdiğinizde değişiklikleri belirtmenizi gerektirir. MIT daha az gereksinimle daha basittir. Her ikisi de iş dostudur.

Evet. Her model kendi başına konumlandırılabilir. GitHub'dan model deposunu klonla, bağımlılıkları yükle, model ağırlıklarını indirme ve çıkarımı yürüt. GPU, RAM ve Python sürümü dahil olmak üzere her modelin kendi başına konumlandırma gereksinimleri için belgeler sağlayalım.

Şartlar modelden modele değişir. Piper GPU gerektirmez (yalnızca CPU). Kokoro ve MeloTTS 1-2GB VRAM gerektirir. Çoğu standart model 4GB VRAM gerektirir. Tortoise ve Sesame CSM 8GB gerektirir. Bir NVIDIA RTX 3060 (12GB) çoğu modeli rahatlıkla çalıştırabilir.

Evet. Açık kaynak lisansları, düzeltme de dahil olmak üzere değişikliklere izin verir. GPT-SoVITS ve Bark gibi modellerde düzeltme scriptleri bulunur. Özel sesleri oluşturmak veya belirli dillerde performansı artırmak için modelleri kendi ses verileriniz üzerinde eğitebilirsiniz.

En iyi açık kaynak modelleri (Kokoro, StyleTTS 2, Chatterbox) artık kalite referanslarında ElevenLabs ve Google TTS gibi ticari hizmetlerle eşleşiyor veya onları geçiyor. ticari hizmetlerin başlıca avantajı ses kalitesi değil, yönetilen altyapı ve destektir.

Onları zaten dışladık. XTTS/XTTS-v2 (Coqui'nin CPML - ticari olmayan), F5-TTS (CC-BY-NC - ticari olmayan) ve Higgs-v2 (Boson Lisansı - kısıtlayıcı) hepsi kaldırıldı. TTS.ai'deki her model ticari kullanım için güvenli olduğu doğrulandı.

Evet. Çoğu model GitHub üzerinden topluluk katkılarını kabul eder. Hata raporları, yeni dil için ses kayıtları, kod iyileştirmeleri ve belgeleri gönderebilirsiniz. Katkı yönergeleri ve aktif sorunlar için her modelin GitHub deposunu kontrol edin.

Modelleri isteğe göre yükleyin ve GPU belleğini paylaşmak için boşken yükleyin. GPU sunucumuz dinamik yükleme kullanarak 4x Tesla P40 (96GB toplam VRAM) üzerinde 20+ modeli çalıştırıyor. Kendi başına konumlandırma için tek bir 24GB GPU aynı anda 3-5 modele hizmet edebilir.

Birçok model resmi Docker görüntüleri veya Dockerfiller sağlar. Çok sayıda model çalıştırmak için, GPU erişimi için NVIDIA Container Toolkit ile özel bir Docker kurulumu oluşturabilirsiniz. API sunucu mimarimiz referans uygulaması olarak hizmet edebilir.

Çoğu model Python 3.10-3.12 gerektirir. Coqui TTS (VITS) özellikle Python 3.11 gerektirir. Çoğu model için Python 3.12 önerilir. Her modelin kesin sürüm uyumluluğu için requirements.txt'yi kontrol edin.

Evet. MIT ve Apache 2.0 lisansları açıkça ticari kullanıma izin verir. Bu modelleri kullanarak lisans ücretleri, telif ücretleri veya kaynak gösterme gereksinimi olmadan SaaS ürünleri, mobil uygulamalar, oyunlar ve hizmetler inşa edebilirsiniz (her ne kadar kaynak gösterme takdir edilse de).
5.0/5 (1)

Neyi geliştirebiliriz?

Açık Kaynak TTS'yi Bugün Deneyin

20+ açık kaynaklı model, hepsi ticari lisanslı. API'mizi kullanın veya kendi kendinizi konumlandırın - seçim sizin.