Hata / Özellik İstek Raporu

Açık kaynaklı metinden konuşmaya modeller

Platformumuzdaki her TTS modeli ticari olarak uygun lisanslarla açık kaynaktır. MIT, Apache 2.0 — mülkiyet hakları, kullanım kısıtlamaları, sürpriz lisans ücretleri yok. Onları bizim hosted API üzerinden kullanın, ya da kendi altyapınızda tam kontrol altında kendi kendinize hoste edin.

Açık kaynak MIT Lisansı Apache 2.0 Kendine-Konaklayıcı GitHub'da

Tam TTS Düzenleyicisi API belgeleri

Şimdi Dene

0/500

Kokoro, Piper, VITS, MeloTTS ile ücretsiz

Oluşturduğunuz ses burada görünecek

Tamamlayıcı TTS düzenleyicisini aç

Açık Kaynak TTS Faydaları

Açık kaynak modellerinin projeleriniz için neden önemli olduğu

Tüm açık kaynak lisanslı

TTS.ai'deki her model açık kaynak lisansı kullanıyor. mülkiyet kara kutuları yok, satıcıya bağlılık yok, beklenmedik lisans ücretleri yok.

MIT / Apache 2.0

Modeller MIT veya Apache 2.0 lisansı altındadır, en izin veren açık kaynak lisansları. Ticari olarak kullanın, değiştirin, yeniden dağıtın — kısıtlama yok.

Kendine-Konaklayıcı

Herhangi bir modeli indirin ve kendi donanımınızda çalıştırın. Verilerinizin, gecikmenizin ve altyapınızın tamamını kontrol edin. Bulut bağımlılığı gerekmez.

GPU Optimize

Modeller CUDA desteği ile NVIDIA GPU'lar için optimizasyon yapılmıştır. Piper sadece CPU'da çalışır. Çoğu model verimli çıkarımlar için 2-8GB VRAM gerektirir.

Toplum tarafından bakımlı

Aktif açık kaynak toplulukları bu modelleri bakım ve geliştirme ile ilgilenir. katkılarda bulunmak memnuniyetle karşılanır — hatalar, iyileştirmeler ve yeni sesleri GitHub'a gönderin.

Ticari Kullanım İyi

Tüm modeller lisansları altında ticari kullanıma izin verir. Ürünler inşa edin, hizmetler satın ve ticari içerik yaratın, hiçbir telif veya kullanım ücreti olmadan.

Açık Kaynak Model Kataloğumuz

Her model, lisansı ve en iyi yaptığı şey.

Kokoro

Free

Lightweight 82M parameter model delivering studio-quality speech with blazing-fast inference.

Hızlı 5/5

En iyi: Apache 2.0 — en iyi kaliteli ücretsiz model, 82M parametre, kendi kendine konumlandırması kolay

Dene. Kokoro

Piper

Free

A fast, local neural text to speech system optimized for Raspberry Pi and embedded devices.

Hızlı 3/5

En iyi: MIT — Sadece CPU, uç cihazlar ve entegre kendi kendine hizmet için mükemmel

Dene. Piper

VITS

Free

Conditional variational autoencoder with adversarial learning for end-to-end text-to-speech.

Hızlı 3/5

En iyi: MIT — birçok alt model tarafından kullanılan temel mimari

Dene. VITS

Bark

Standard

Transformer-based text-to-audio model that generates realistic speech, music, and sound effects.

Yavaş 4/5

En iyi: MIT — standart TTS'nin ötesinde eşsiz ses üretme yetenekleri

Dene. Bark

Tortoise TTS

Premium

Multi-voice text-to-speech focused on quality with autoregressive architecture.

Yavaş 5/5 Ses Klonlama

En iyi: Apache 2.0 — maksimum kalite, geniş çapta incelenen referans uygulaması

Dene. Tortoise TTS

OpenVoice

Premium

Instant voice cloning with granular control over style, emotion, and accent.

Orta 4/5 Ses Klonlama

En iyi: MIT — açık kaynaklı ses klonlama ve ince ince stil kontrolü

Dene. OpenVoice

Açık Kaynak TTS Nasıl Kullanılır

Hosted API'mizi kullanın veya modelleri kendiniz çalıştırın

Açık Kaynak Modellerini Keşfedin

20+ açık kaynak TTS modelinin katalogumuzu inceleyin. Her model sayfası lisans, mimari, yetenekler ve kendine-hosting gereksinimlerini gösterir.

Tarayıcınızda deneyin

Herhangi bir modeli TTS.ai üzerinde doğrudan test edebilirsiniz. GPU sunucularımız işlemleri üstlenir, böylece kendi kendinize konumlandırmaya karar vermeden önce kaliteyi değerlendirebilirsiniz.

Kendinize konum verin veya API'mizi kullanın

GitHub'dan model depolarını klonlayıp yerel olarak çalıştır, ya da üretim için hosted API'mizi kullan. Özel hosting tam kontrol sağlar; API'miz yönetilen altyapı sağlar.

Uygulamalarınızı Oluşturun

Kendine ait modelleri veya REST API'mizi kullanarak TTS'yi ürününüze entegre edin. Tüm modeller lisans ücretleri veya telif ücretleri olmadan ticari olarak kullanılabilir.

Lisans Karşılaştırması

TTS.ai'deki tüm modellerde ticari olarak kullanışlı açık kaynak lisansları kullanılır.

Model	Lisans	Ait
Kokoro	Apache 2.0	Gerekir
Piper	MIT	İhtiyaç Duyulacak
VITS	MIT	İhtiyaç Duyulacak
MeloTTS	MIT	İhtiyaç Duyulacak
Chatterbox	MIT	İhtiyaç Duyulacak
Tortoise TTS	Apache 2.0	Gerekir
StyleTTS 2	MIT	İhtiyaç Duyulacak
OpenVoice	MIT	İhtiyaç Duyulacak
Sesame CSM	Apache 2.0	Gerekir
Orpheus	Llama 3.2	"Built with Llama"

Bu Modelleri Ücretsiz Dene

Özel Hosting vs. Konuk API

Modelleri kendiniz çalıştırın ya da altyapıyı bize bırakın

Kendinize donanımınızda konaklayınız

TTS.ai'deki her model GitHub veya Hugging Face'de açık kaynak projesi olarak mevcuttur. Ağırlıkları indirin, bağımlılıkları yükleyin ve kendi GPU'larınızda çıkarım yapabilirsiniz. Gecikme, gizlilik ve ölçekleme üzerinde tam kontrolünüz var.

Tam veri gizliliği — ses sunucunuzdan asla ayrılmaz
Başlangıç kurulumundan sonra isteğe bağlı ücret yok
Kendi verileriniz üzerinde özel düzenleme
GPU donanım gerektirir (NVIDIA tavsiye edilir)
Güncellemeleri, ölçeklendirmeyi ve bağımlılıkları yönetiyorsunuz

TTS.ai Hosted API kullan

Tek bir REST API aracılığıyla 20+ modelin tümüne anında erişim sağlayın. GPU teminatı, model güncellemeleri, kuyruk yönetimi ve ölçeklendirmeyi üstleniyoruz. Tek bir API anahtarı size her modele erişim sağlar — ayrı dağıtımları yönetmeye gerek yok.

GPU donanıma ihtiyaç yok
Tek bir API üzerinden tüm 20+ model
Otomatik model güncellemeleri ve iyileştirmeler
Gereksiz altyapı ile %99,9 çalışma zamanı
Sadece kullandığınız için ödeme yapın.

Bunun Yerine Konuk API Kullan

Kısa Başlangıç: API veya Kendi Kendine Konuşucu

Kokoro'yu dakikalar içinde yerel olarak kur veya bizim hosted API'mizi kullan

Seçenek 1: TTS.ai Konuk API En kolayı.

import requests

response = requests.post("https://api.tts.ai/v1/tts", json={
    "text": "Open source TTS with a simple API.",
    "model": "kokoro",
    "voice": "af_heart",
    "format": "wav"
}, headers={"Authorization": "Bearer YOUR_API_KEY"})

with open("output.wav", "wb") as f:
    f.write(response.content)

Seçenek 2: pip ile kendi- konaklayıcı Tam Kontrol

# Install Kokoro locally
pip install kokoro

# Generate speech on your own GPU
import kokoro

pipeline = kokoro.KPipeline(lang_code="a")
generator = pipeline("Hello from your own server!", voice="af_heart")
for i, (gs, ps, audio) in enumerate(generator):
    kokoro.save(audio, f"output_{i}.wav")

API Belgesini Göster

Açık Kaynak, Ucuz Fiyatlar

Hosted API'miz açık kaynaklı TTS'yi GPU'ları yönetmeden erişilebilir hale getirir.

Özgür Katman

15 kredi kayıt sırasında

4 açık kaynak modeli ücretsiz
Temel kullanım için kayıt yok
Ticari kullanıma izin verildi

Başlatıcı

500.000 karakter/ay

Tüm 20+ açık kaynak modelleri
Ses klonlama
API erişimi

Pro

$29

2,000,000 karakter/ay

Öncelik GPU işlemi
Tüm premium modelleri
Kurumsal destek

Tam Fiyatı Gör

Sıkça Sorulan Sorular

Açık kaynaklı metin-söz dönüşümü hakkında sıkça sorulan sorular

Evet. TTS.ai'deki her model açık kaynak lisansı kullanır — MIT veya Apache 2.0. Kısıtlayıcı lisansları olan modelleri (Coqui'nin CPML veya ticari olmayan CC-BY-NC gibi) özel olarak dışlıyoruz. Her modelin lisansını GitHub deposu üzerinden doğrulayabilirsiniz.

Her ikisi de ticari kullanım, değiştirme ve yeniden dağıtmaya izin veren açık kaynak lisanslardır. Apache 2.0 açıkça patent verilmesi ve kodu değiştirdiğinizde değişiklikleri belirtmenizi gerektirir. MIT daha az gereksinimle daha basittir. Her ikisi de iş dostudur.

Evet. Her model kendi başına konumlandırılabilir. GitHub'dan model deposunu klonla, bağımlılıkları yükle, model ağırlıklarını indirme ve çıkarımı yürüt. GPU, RAM ve Python sürümü dahil olmak üzere her modelin kendi başına konumlandırma gereksinimleri için belgeler sağlayalım.

Şartlar modelden modele değişir. Piper GPU gerektirmez (yalnızca CPU). Kokoro ve MeloTTS 1-2GB VRAM gerektirir. Çoğu standart model 4GB VRAM gerektirir. Tortoise ve Sesame CSM 8GB gerektirir. Bir NVIDIA RTX 3060 (12GB) çoğu modeli rahatlıkla çalıştırabilir.

Evet. Açık kaynak lisansları, düzeltme de dahil olmak üzere değişikliklere izin verir. GPT-SoVITS ve Bark gibi modellerde düzeltme scriptleri bulunur. Özel sesleri oluşturmak veya belirli dillerde performansı artırmak için modelleri kendi ses verileriniz üzerinde eğitebilirsiniz.

En iyi açık kaynak modelleri (Kokoro, StyleTTS 2, Chatterbox) artık kalite referanslarında ElevenLabs ve Google TTS gibi ticari hizmetlerle eşleşiyor veya onları geçiyor. ticari hizmetlerin başlıca avantajı ses kalitesi değil, yönetilen altyapı ve destektir.

Onları zaten dışladık. XTTS/XTTS-v2 (Coqui'nin CPML - ticari olmayan), F5-TTS (CC-BY-NC - ticari olmayan) ve Higgs-v2 (Boson Lisansı - kısıtlayıcı) hepsi kaldırıldı. TTS.ai'deki her model ticari kullanım için güvenli olduğu doğrulandı.

Evet. Çoğu model GitHub üzerinden topluluk katkılarını kabul eder. Hata raporları, yeni dil için ses kayıtları, kod iyileştirmeleri ve belgeleri gönderebilirsiniz. Katkı yönergeleri ve aktif sorunlar için her modelin GitHub deposunu kontrol edin.

Modelleri isteğe göre yükleyin ve GPU belleğini paylaşmak için boşken yükleyin. GPU sunucumuz dinamik yükleme kullanarak 4x Tesla P40 (96GB toplam VRAM) üzerinde 20+ modeli çalıştırıyor. Kendi başına konumlandırma için tek bir 24GB GPU aynı anda 3-5 modele hizmet edebilir.

Birçok model resmi Docker görüntüleri veya Dockerfiller sağlar. Çok sayıda model çalıştırmak için, GPU erişimi için NVIDIA Container Toolkit ile özel bir Docker kurulumu oluşturabilirsiniz. API sunucu mimarimiz referans uygulaması olarak hizmet edebilir.

Çoğu model Python 3.10-3.12 gerektirir. Coqui TTS (VITS) özellikle Python 3.11 gerektirir. Çoğu model için Python 3.12 önerilir. Her modelin kesin sürüm uyumluluğu için requirements.txt'yi kontrol edin.

Evet. MIT ve Apache 2.0 lisansları açıkça ticari kullanıma izin verir. Bu modelleri kullanarak lisans ücretleri, telif ücretleri veya kaynak gösterme gereksinimi olmadan SaaS ürünleri, mobil uygulamalar, oyunlar ve hizmetler inşa edebilirsiniz (her ne kadar kaynak gösterme takdir edilse de).

5.0/5 (1)

Açık Kaynak TTS'yi Bugün Deneyin

20+ açık kaynaklı model, hepsi ticari lisanslı. API'mizi kullanın veya kendi kendinizi konumlandırın - seçim sizin.

Ücretsiz Kayıt Ol Fiyatları Gör

Açık kaynaklı metinden konuşmaya modeller

Şimdi Dene

TTS.ai'yi seviyor musunuz?

Açık Kaynak TTS Faydaları

Tüm açık kaynak lisanslı

MIT / Apache 2.0

Kendine-Konaklayıcı

GPU Optimize

Toplum tarafından bakımlı

Ticari Kullanım İyi

Açık Kaynak Model Kataloğumuz

Kokoro

Piper

VITS

Bark

Tortoise TTS

OpenVoice

Açık Kaynak TTS Nasıl Kullanılır

Açık Kaynak Modellerini Keşfedin

Tarayıcınızda deneyin

Kendinize konum verin veya API'mizi kullanın

Uygulamalarınızı Oluşturun

Lisans Karşılaştırması

Özel Hosting vs. Konuk API

Kendinize donanımınızda konaklayınız

TTS.ai Hosted API kullan

Kısa Başlangıç: API veya Kendi Kendine Konuşucu

Açık Kaynak, Ucuz Fiyatlar

Özgür Katman

Başlatıcı

Pro

Sıkça Sorulan Sorular

Bütün TTS.ai modelleri gerçekten açık kaynak mı?

MIT ve Apache 2.0 lisansları arasındaki fark nedir?

Bu modelleri kendi sunucuma kendim konumlandırabilir miyim?

TTS modellerini kendi kendine yönetmek için hangi GPU'ya ihtiyacım var?

Açık kaynaklı TTS modellerini iyileştirebilir miyim?

Açık kaynaklı TTS modelleri ticari hizmetlerle nasıl karşılaştırılır?

Kısıtlayıcı lisansları olan modellerden kaçınmam gerekiyor mu?

Bu açık kaynak modellerine katkıda bulunabilir miyim?

Birden fazla modeli tek bir GPU sunucusunda nasıl çalıştırırım?

Kendine-hosting için bir Docker görüntüsü var mı?

Kendime ev sahipliği yapmak için hangi Python sürümüne ihtiyacım var?

Bu modelleri kullanarak ticari bir ürün inşa edebilir miyim?

Açık Kaynak TTS'yi Bugün Deneyin