Ашық кодты мәтіннен сөйлеуге түрлендіргішName

Біздің платформамыздағы әрбір ТТС моделі коммерциялық ыңғайлы лицензиялармен ашық көзге ие. MIT, Apache 2. 0 — меншік құқығы жоқ, қолдану шектеулері жоқ, таңқаларлық лицензиялық төлемдер жоқ. Оларды біздің хостталған API арқылы қолданыңыз, немесе оларды толық бақылаумен өзіңіздің инфрақұрылымыңызда хосттаңыз.

Ашық көзі MIT лицензиясы Apache 2.0 Өз- өзі GitHub

Қазір сынап көру

Kokoro, Piper, VITS, MeloTTS-пен тегінName
Жіберілген аудиосы осында көрсетіледі
Жіберілген
Жүктеп алу
TTS.ai ұнады ма? Достарыңызға хабарлаңыз!

Ашық кодты TTS артықшылықтары

Ашық көз моделінің жобаларыңыз үшін неліктен маңызды екені

Барлығы ашық код лицензиясымен

TTS.ai-дегі әрбір модель ашық-көздік лицензиясымен жұмыс істейді. Ешқандай патенттік қара қалта жоқ, өндірушіге тәуелділік жоқ, күтпеген лицензиялық төлемдер жоқ.

MIT / Apache 2. 0

Модельдер MIT немесе Apache 2. 0 лицензияларымен шығарылады, бұл ашық- бастапқы код лицензияларының ең жеңіл түрі. Коммерциялық мақсатта қолдануға, өзгертуге, таратуға болады — шектеулер жоқ.

Өз- өзі

Кез келген модельді жүктеп алып, өз жабдықтарыңызда орындаңыз. Деректеріңізді, кешіктіруді және инфрақұрылымды толық бақылауға алыңыз. Бұлт қызметіне тәуелділік қажет емес.

Графикалық процессорға ыңғайланған

Модельдер CUDA қолдауымен NVIDIA графикалық процессорлары үшін оптимизацияланған. Piper тек процессормен жұмыс істейді. Көптеген модельдер тиімді есептеу үшін 2- 8 ГБ видео жад қажет етеді.

Жалпы жетілдірілген

Бұл модельдерді белсенді ашық көздер қауымдастығы қолдап, жетілдіріп отырады. Қосымша ұсыныстар қабылданады — қателерді, жетілдірулерді және жаңа пікірлерді GitHub-қа жіберіңіз.

Коммерциялық пайдалануға рұқсат

Барлық үлгілер өздерінің лицензиялары бойынша коммерциялық пайдалануға рұқсат береді. Өнімдерді құру, қызметтерді сату және коммерциялық мазмұнды жасау үшін авторлық ақы немесе пайдалану ақысы қажет емес.

Ашық көз моделі каталогы

Әрбір үлгі, оның лицензиясы және оның ең жақсы қасиеттері

KokoroKokoro

Free

Lightweight 82M parameter model delivering studio-quality speech with blazing-fast inference.

Fast 5/5

Келесіге ең қолайлы: Apache 2. 0 — ең жоғары сапалы еркін үлгі, 82М параметр, өзін- өзі хосттау оңай

Сынау Kokoro

PiperPiper

Free

A fast, local neural text to speech system optimized for Raspberry Pi and embedded devices.

Fast 3/5

Келесіге ең қолайлы: MIT — тек процессорды пайдаланады, шеттік құрылғылар мен ендірілген өзін- өзі хосттау үшін керемет

Сынау Piper

VITSVITS

Free

Conditional variational autoencoder with adversarial learning for end-to-end text-to-speech.

Fast 3/5

Келесіге ең қолайлы: MIT — көптеген төменгі деңгейдегі модельдер қолданатын негізі архитектурасы

Сынау VITS

BarkBark

Standard

Transformer-based text-to-audio model that generates realistic speech, music, and sound effects.

Slow 4/5

Келесіге ең қолайлы: MIT — стандартты TTS- тан тыс ерекше дыбыс шығару мүмкіндіктері

Сынау Bark

Tortoise TTSTortoise TTS

Premium

Multi-voice text-to-speech focused on quality with autoregressive architecture.

Slow 5/5 Дыбысты көшіру

Келесіге ең қолайлы: Apache 2. 0 - жоғары сапалы, кеңінен зерттелген референциялық жүзеге асыру

Сынау Tortoise TTS

OpenVoiceOpenVoice

Premium

Instant voice cloning with granular control over style, emotion, and accent.

Medium 4/5 Дыбысты көшіру

Келесіге ең қолайлы: MIT — ашық кодты дыбыс клондау және ірі стилді басқару

Сынау OpenVoice

Ашық көздегі TTS-ті қалай қолдануға болады

Біздің хостталған API қолданыңыз немесе модельдерді өзіңіз орындаңыз

1

Ашық кодты модельдерді зерттеу

Біздің 20-дан астам ашық кодты TTS үлгілерінің каталогын қараңыз. Әрбір үлгінің бетінде лицензия, архитектура, мүмкіндіктер және өзін-өзі хосттау талаптары көрсетілген.

2

Шолғыңызда сынап көріңіз

TTS.ai-де кез келген модельді орнатпастан тікелей сынап көріңіз. Біздің GPU серверлері өңдеуді жүзеге асырады, сондықтан сіз өзіңіздің хостингке кіріспес бұрын сапаны бағалай аласыз.

3

Өзіңіз хосттау немесе API- ны қолдану

GitHub-тан үлгі репозиториясын клондап, жергілікті түрде орындаңыз, немесе өндіріс үшін біздің хостталған API-ны қолданыңыз. Өзіңіздің хосттауыңыз толық бақылауды береді; біздің API басқарылатын инфрақұрылымды ұсынады.

4

Қолданбаны құруName

Тілді аудару қызметін өзіңіздің өніміңізге өзіңіздің хостинг моделіңіз немесе REST API- мыз арқылы енгізіңіз. Барлық модельдер коммерциялық мақсатта лицензиялық төлемдерсіз қолданылады.

Лицензияның салыстыруы

TTS.ai- дегі барлық модельдер коммерциялық ашық- бастапқы код лицензияларын қолданады

Үлгі Лицензия Коммерциялық Өзгерту Өз- өзі Аттестациялау
Kokoro Apache 2.0 Негізгі
Piper MIT Қосымша
VITS MIT Қосымша
MeloTTS MIT Қосымша
Chatterbox MIT Қосымша
Tortoise TTS Apache 2.0 Негізгі
StyleTTS 2 MIT Қосымша
OpenVoice MIT Қосымша
Sesame CSM Apache 2.0 Негізгі
Orpheus Llama 3.2 "Built with Llama"

Өз- өзімен хостинг және хостинг API

Модельдерді өзіңіз жегу немесе инфрақұрылымды бізге тапсыру

Жабдықтарыңыздағы өзін- өзі хосттау

TTS.ai-дегі әрбір модель GitHub немесе Hugging Face-тегі ашық жоба ретінде қол жетімді. Жүктеуді жүктеп алыңыз, тәуелділіктерді орнатыңыз, және өзіңіздің графикалық процессорыңызда нәтижелерді орындаңыз. Сіз кешіктіруді, құпиялылықты және масштабтауды толық басқара аласыз.

  • Толық деректер құпиялылығы — аудио серверіңізді тастап кетпейді
  • Бастапқы баптаудан кейін бір сұраныс үшін төлем жоқ
  • Өзіңіздің деректеріңізді баптау
  • Графикалық процессор керек (NVIDIA ұсынылады)
  • Жаңартулар, масштабтау және тәуелділіктерді басқару

TTS.ai хостталған API қолданылсын

Бір ғана REST API арқылы 20+ модельге бірден қол жеткізіңіз. Біз GPU- ны қамтамасыз ету, модельді жаңарту, кезекті басқару және масштабтау мәселелерін шешеміз. Бір API кілті әрбір модельге қол жеткізуге мүмкіндік береді - бөлек орналастыруды басқару қажеті жоқ.

  • Графикалық процессор жады қажет емес
  • Барлық 20+ үлгі бір API арқылы
  • Модельдерді автоматты түрде жаңарту және жақсарту
  • 99,9% жұмыс істеу уақыты, қосымша инфрақұрылым
  • Тек қолданғаныңыз үшін төлеңіз

Тез бастау: API не өз- өзі

Біздің хостталған API-ні қолданыңыз, немесе Kokoro-ны бірнеше минут ішінде жергілікті орнатыңыз

1- параметр: TTS.ai хостталған API Ең оңай
import requests

response = requests.post("https://api.tts.ai/v1/tts", json={
    "text": "Open source TTS with a simple API.",
    "model": "kokoro",
    "voice": "af_heart",
    "format": "wav"
}, headers={"Authorization": "Bearer YOUR_API_KEY"})

with open("output.wav", "wb") as f:
    f.write(response.content)
2- параметрі: pip арқылы өзін- өзі басқару Толық басқару
# Install Kokoro locally
pip install kokoro

# Generate speech on your own GPU
import kokoro

pipeline = kokoro.KPipeline(lang_code="a")
generator = pipeline("Hello from your own server!", voice="af_heart")
for i, (gs, ps, audio) in enumerate(generator):
    kokoro.save(audio, f"output_{i}.wav")

Ашық кодты, қолжетімді баға

Біздің хостинг API ашық көздегі TTS-ті графикалық процессорларды басқарусыз қолжетімді етеді.

Бос қабат

$0

15000 таңба тіркеу кезінде

  • 4 ашық-көз моделі тегін
  • Негізгі пайдалану үшін тіркеу жоқ
  • Коммерциялық пайдалануға рұқсат

Бастауыш

$9

500, 000 таңба/ ай

  • Барлық 20+ ашық көз моделі
  • Дыбысын көшіру
  • API қатынау

Профиль

$29

2,000,000 таңба/ ай

  • Графикалық процессордың артықшылығы
  • Барлық премиум үлгілері
  • Кәсіпорын қолдауы
Толық бағасын қарау

Жиі қойылатын сұрақтар

Ашық көздегі мәтіннен сөйлеуге аудару туралы жиі қойылатын сұрақтарName

Иә. TTS.ai-дегі әрбір модель MIT немесе Apache 2.0 лицензиясымен ашық-көздік лицензиясын қолданады. Біз шектеулі лицензиясы бар модельдерді (мысалы, Coqui's CPML немесе коммерциялық емес CC-BY-NC) ерекше алып тастаймыз. Әрбір модельдің лицензиясын оның GitHub репозиториясында тексере аласыз.

Екеуі де коммерциялық пайдалануға, өзгертуге және қайта таратуға рұқсат беретін ашық- бастапқы код лицензиялары. Apache 2. 0 патенттік құқықтарды қосады және кодты өзгерткенде өзгерістерді хабарлауды талап етеді. MIT қарапайым, талаптары аз. Екеуі де бизнеске ыңғайлы.

Әрбір модель өздігінен хостталады. Модель репозиториясын GitHub-тан клондап, тәуелділіктерді орнатып, модель салмақтарын жүктеп алып, нәтижелерді шығарыңыз. Әрбір модельдің өздігінен хостталу талаптары, соның ішінде графикалық процессор, жад және Python нұсқасы туралы құжаттаманы ұсынамыз.

Талаптары модельге қарай өзгереді. Piper графикалық процессор қажет етпейді (процессор ғана қажет). Kokoro мен MeloTTS үшін 1-2 ГБ видео жад қажет. Стандартты модельдер үшін 4 ГБ видео жад қажет. Tortoise мен Sesame CSM үшін 8 ГБ қажет. NVIDIA RTX 3060 (12 ГБ) моделдердің көпшілігі үшін жеткілікті.

Иә. Ашық кодтар лицензиясы өзгертуге, соның ішінде түзетуге мүмкіндік береді. GPT- SoVITS және Bark сияқты модельдер түзету скрипттерін ұсынады. Сіз өзіңіздің дауыс деректеріңіз бойынша модельдерді даярлап, өзіңіздің дауыстарыңызды жасай аласыз немесе белгілі бір тілдер үшін жұмысын жақсарта аласыз.

Ашық кодты ең үздік модельдер (Kokoro, StyleTTS 2, Chatterbox) қазір ElevenLabs және Google TTS сияқты коммерциялық қызметтерді сапалық көрсеткіштер бойынша теңестіріп, тіпті жеңіп шықты. Коммерциялық қызметтердің басты артықшылығы - басқару инфрақұрылымы мен қолдау, дыбыс сапасы емес.

Біз оларды әлі де шығарып тастадық. XTTS/XTTS-v2 (Coqui's CPML — коммерциялық емес), F5-TTS (CC-BY-NC — коммерциялық емес), және Higgs-v2 (Бозон лицензиясы — шектеулі) барлығы алынып тасталды. TTS.ai-дегі барлық модельдер коммерциялық пайдалануға қауіпсіз екеніне көз жеткізілді.

Иә. Модельдердің көпшілігі GitHub арқылы қоғамдастық үлесін қабылдайды. Қате туралы хабарламаларды, жаңа тілдер үшін дыбыс жазуларды, кодты жақсартуларды және құжаттаманы жібере аласыз. Әрбір модельдің GitHub репозиториясын қатысу ережелері мен белсенді мәселелерін тексеріңіз.

Сұраныс бойынша модельдерді жүктеу және GPU жадымен бөлісу үшін бос болған кезде жүктеуден босату. Біздің GPU серверіміз 4x Tesla P40 (жалпы VRAM 96 ГБ) динамикалық жүктеу арқылы 20+ модельді орындайды. Өзін-өзі хосттау үшін бір 24 ГБ GPU бір мезгілде 3-5 модельге қызмет көрсете алады.

Көптеген үлгілер ресми Docker бейнелерін немесе Dockerfiles файлдарын ұсынады. Бірнеше модельдерді орындау үшін, NVIDIA Container Toolkit-пен GPU-ға қол жеткізу үшін өзіңіздің Docker-ді құра аласыз. Біздің API сервер архитектурасы сілтемелік іске асыру ретінде қызмет ете алады.

Көптеген модельдер Python 3.10-3.12-ні қажет етеді. Coqui TTS (VITS) үшін Python 3.11 қажет. Көптеген модельдер үшін Python 3.12-ні ұсынамыз. Әрбір модельдің requirements.txt файлын нұсқасының сәйкестігін тексеріңіз.

Иә. MIT және Apache 2.0 лицензиялары коммерциялық пайдалануға рұқсат береді. Осы модельдерді пайдаланып, SaaS өнімдерін, мобильді қолданбаларды, ойындарды және қызметтерді лицензиялық төлемдерсіз, авторлық төлемдерсіз немесе авторлық құқықты көрсету талаптарысыз құра аласыз (бірақ авторлық құқықты көрсетуді сұраймыз).
5.0/5 (1)

Нені жақсартуға болады? Сіздің пікіріңіз бізге қателерді түзетуге көмектеседі.

Ашық кодты TTS-ті бүгін сынап көріңіз

20+ ашық-көз моделі, барлығы коммерциялық лицензиямен. API немесе өз-өзін хостингті қолданыңыз - таңдау сіздің қолыңызда.