Модельҳои матн ба сухани манбаи кушодаName

Ҳар як модели TTS дар платформаи мо манбаи кушод бо иҷозатномаҳои тиҷоратӣ дӯстона аст. MIT, Apache 2. 0 - бе маҳдудиятҳои моликият, бе маҳдудиятҳои истифода, бе пардохтҳои иҷозатномадиҳии ҳайратовар. Онҳоро тавассути API- и мо истифода баред ё онҳоро дар инфрасохтори худ бо назорати пурра истифода баред.

Манбаъи кушод Иҷозатномаи MIT Apache 2. 0 Худмуайянкунанда GitHubGenericName

Ҳоло кӯшиш кунед

Озод бо Kokoro, Piper, VITS, MeloTTS
Шумо дар ин ҷо садои эҷодшударо пайдо мекунед
Сохта шуд
Боркунӣ
Шумо TTS.ai-ро дӯст медоред? Ба дӯстонатон бигӯед!

Манбаи кушод

Чаро моделҳои манбаи кушода барои лоиҳаҳои шумо муҳиманд

Ҳамаи манбаи кушод

Ҳар як намуна дар TTS.ai иҷозатномаи кушоди кушодро истифода мебарад. Ягон қуттии сиёҳи дорои ҳуқуқи муаллифӣ, ягон бастани истеҳсолкунанда, ягон пардохти иҷозатномаи ғайричашмдошт.

MIT / Apache 2. 0

Models are licensed under MIT or Apache 2.0, the most permissive open-source licenses. Use commercially, modify, redistribute — no restrictions.

Худмуайянкунанда

Боркунии ҳар як намуна ва иҷрои он дар сахтафзори худ. Идоракунии пурраи додаҳо, интизорӣ ва инфрасохтор. Не зарурати вобастагии абр.

Барқарорсозии GPU

Намунаҳо барои GPU-ҳои NVIDIA бо пуштибонии CUDA оптимизатсия шудаанд. Piper танҳо дар CPU кор мекунад. Бисёре аз намунаҳо барои натиҷагирии самаранок 2-8 ГБ VRAM лозиманд.

Мудири ҷамъият

Ин моделҳо аз ҷониби ҷомеаҳои фаъоли сарчашмаи кушода нигоҳ дошта ва такмил дода мешаванд. Ҳамкориҳо пазируфта мешаванд — хатогиҳо, такмилдиҳиҳо ва овозҳои нав дар GitHub фиристода мешаванд.

Истифодаи тиҷоратӣ

Ҳамаи намунаҳо истифодаи тиҷоратиро дар доираи иҷозатномаҳои худ иҷозат медиҳанд. Маҳсулотро бунёд кунед, хизматрасониҳоро фурӯшед ва мундариҷаи тиҷоратиро бидуни ҳаққи муаллифӣ ё ҳаққи истифода эҷод кунед.

Каталоги моделҳои кушодаи мо

Ҳар як намуна, иҷозатномаи он ва он чӣ беҳтарин аст

KokoroKokoro

Free

Lightweight 82M parameter model delivering studio-quality speech with blazing-fast inference.

Fast 5/5

Беҳтарин барои: Apache 2. 0 — беҳтарин сифати модели озод, 82M параметрҳо, осон барои худ- хостинг

Кӯшиш кунед Kokoro

PiperPiper

Free

A fast, local neural text to speech system optimized for Raspberry Pi and embedded devices.

Fast 3/5

Беҳтарин барои: MIT — танҳо CPU, барои дастгоҳҳои периферӣ ва худи соҳибони дарунсохт комил аст

Кӯшиш кунед Piper

VITSVITS

Free

Conditional variational autoencoder with adversarial learning for end-to-end text-to-speech.

Fast 3/5

Беҳтарин барои: MIT — сохтори асосӣ, ки аз ҷониби бисёр моделҳои поёнӣ истифода мешавад

Кӯшиш кунед VITS

BarkBark

Standard

Transformer-based text-to-audio model that generates realistic speech, music, and sound effects.

Slow 4/5

Беҳтарин барои: MIT — қобилияти беназир барои эҷоди садо аз TTS-и стандартӣ

Кӯшиш кунед Bark

Tortoise TTSTortoise TTS

Premium

Multi-voice text-to-speech focused on quality with autoregressive architecture.

Slow 5/5 Тасвири овоз

Беҳтарин барои: Apache 2. 0 - сифати максималӣ, васеъ омӯхташудаи татбиқи истинод

Кӯшиш кунед Tortoise TTS

OpenVoiceOpenVoice

Premium

Instant voice cloning with granular control over style, emotion, and accent.

Medium 4/5 Тасвири овоз

Беҳтарин барои: MIT — нусхаи овози манбаи кушода бо назорати услуби гранулӣ

Кӯшиш кунед OpenVoice

Чӣ тавр истифода бурдани TTS- и манбаи кушода

Истифодаи API-и мо ё худи шумо иҷро кардани намунаҳо

1

Таҳқиқи моделҳои манбаи кушода

Баррасии каталоги мо бо 20+ моделҳои TTS-и манбаи кушода. Ҳар як саҳифаи модел иҷозатнома, меъморӣ, қобилияти ва талаботи худи хостингро нишон медиҳад.

2

Дар браузери худ кӯшиш кунед

Санҷиши ҳар як намунаи бевосита дар TTS.ai бе насб кардани ягон чизе. Серверҳои GPU-и мо коркарди онро идора мекунанд, то шумо сифати онро пеш аз худи худи худ муайян кунед.

3

Худ- соҳиб ё истифодаи API- и мо

Тасвири нусхаи репозитория аз GitHub ва иҷрои маҳаллӣ, ё истифодаи API-и мо барои истеҳсолот. Худ-хостинг назорати пурра медиҳад; API-и мо инфрасохтори идорашавандаро таъмин мекунад.

4

Сохтани барномаи худ

ТТС- ро бо истифодаи моделҳои худидоракунӣ ё API- и REST- и мо ба маҳсулоти худ пайваст кунед. Ҳамаи моделҳо барои истифодаи тиҷоратӣ бе пардохти иҷозатнома ё ҳаққи муаллиф истифода мешаванд.

Муқоисаи иҷозатномаҳо

Ҳамаи моделҳои TTS.ai иҷозатномаҳои кушоди тиҷоратии дӯстонаро истифода мебаранд

& Намуна Иҷозатнома Истифодаи тиҷоратӣ Тағйирот Худкор Атрибут
Kokoro Apache 2.0 Дархостӣ
Piper MIT & Интихоби тоза кардан
VITS MIT & Интихоби тоза кардан
MeloTTS MIT & Интихоби тоза кардан
Chatterbox MIT & Интихоби тоза кардан
Tortoise TTS Apache 2.0 Дархостӣ
StyleTTS 2 MIT & Интихоби тоза кардан
OpenVoice MIT & Интихоби тоза кардан
Sesame CSM Apache 2.0 Дархостӣ
Orpheus Llama 3.2 "Built with Llama"

Мудири худкор ва мудири API

Худ иҷро кардани намунаҳо ё ба мо иҷозат диҳед, ки бо инфрасохтор кор кунем

Худкоркунии соҳиб дар сахтафзори шумо

Ҳар як намуна дар TTS.ai ҳамчун лоиҳаи манбаи кушод дар GitHub ё Hugging Face дастрас аст. Вазнҳоро зеркашӣ кунед, вобастагиро насб кунед ва баррасиро дар GPU-ҳои худ иҷро кунед. Шумо назорати пурраи интизорӣ, махфият ва андозагирии худро доред.

  • Махфияти пурраи маълумот — садо ҳеҷ гоҳ сервери шуморо тарк намекунад
  • Бе хароҷоти дархост баъди танзимоти аввала
  • Танзимоти оддӣ барои маълумоти худ
  • Дастгоҳи GPU лозим аст (NVIDIA тавсия дода мешавад)
  • Шумо бо навсозиҳо, андоза ва вобастагиҳо идора мекунед

Истифодаи TTS.ai API- и соҳиб

Даромади фаврӣ ба ҳамаи 20+ моделҳо тавассути як API-и REST. Мо таъминоти GPU, навсозии модел, идоракунии навбат ва андозагирии онро идора мекунем. Як калиди API ба шумо дастрасӣ ба ҳар як моделро медиҳад - зарурати идоракунии ҷойгиркуниҳои алоҳида нест.

  • Ягон сахтафзор барои GPU лозим нест
  • Ҳамаи 20+ намунаҳо тавассути як API
  • Навсозии худкори намуна ва беҳтаркунӣ
  • 99. 9% вақти корӣ бо инфрасохтори зиёдатӣ
  • Танҳо барои он чизе ки истифода мекунед, пардохт кунед

Оғози тез: API ё худи соҳиб

Истифодаи API-и мо ё насб кардани Kokoro дар якчанд дақиқа

Интихоби 1: TTS.ai API- и соҳиб Беҳтарин
import requests

response = requests.post("https://api.tts.ai/v1/tts", json={
    "text": "Open source TTS with a simple API.",
    "model": "kokoro",
    "voice": "af_heart",
    "format": "wav"
}, headers={"Authorization": "Bearer YOUR_API_KEY"})

with open("output.wav", "wb") as f:
    f.write(response.content)
Интихоби 2: худкор бо pip Идоракунии пурра
# Install Kokoro locally
pip install kokoro

# Generate speech on your own GPU
import kokoro

pipeline = kokoro.KPipeline(lang_code="a")
generator = pipeline("Hello from your own server!", voice="af_heart")
for i, (gs, ps, audio) in enumerate(generator):
    kokoro.save(audio, f"output_{i}.wav")

Манбаъи кушод, нархгузории дастрас

API-и мо TTS-и кушодро дастрас мекунад, ки бе идоракунии GPU-ҳо дастрас аст.

Сатҳи озод

$0

15 кредитҳо ҳангоми бақайдгирӣ

  • 4 моделҳои кушодаи озод
  • Барои истифодаи асосӣ қайд кардан лозим нест
  • Истифодаи тиҷоратӣ иҷозат дода шудааст

Оғозкунанда

$9

500, 000 аломат/ моҳ

  • Ҳамаи 20+ моделҳои манбаи кушода
  • Тасвири овоз
  • Дастрасии API

Про

$29

2,000,000 аломат/ моҳ

  • Пешрафти GPU
  • Ҳамаи намунаҳои Premium
  • Пуштибонии корпоративӣ
Намоиши нархгузории пурра

Саволҳои пурсидашаванда

Саволҳои маъмул дар бораи матни кушодаи сухан

Ҳар як намуна дар TTS.ai иҷозатномаи кушоди иҷозатдиҳандаро истифода мебарад — ё MIT ё Apache 2.0. Мо махсусан намунаҳоро бо иҷозатномаҳои маҳдудкунанда (ба монанди CPML-и Coqui ё CC-BY-NC-и ғайрикоммерсиалӣ) истисно мекунем. Шумо метавонед иҷозатномаи ҳар як намунаро дар репозиторияи GitHub-и он тафтиш кунед.

Ҳар ду иҷозатномаҳои кушодаи сарчашмаҳои кушода мебошанд, ки истифодаи тиҷоратиро, тағйирдиҳӣ ва такроркуниро иҷозат медиҳанд. Apache 2. 0 иҷозатномаҳои патентӣ илова мекунад ва талаб мекунад, ки агар шумо рамзро тағйир диҳед, тағйиротҳоро муайян кунед. MIT оддӣтар аст ва талаботҳо камтар аст. Ҳар ду барои тиҷорат мувофиқанд.

Yes. Every model can be self-hosted. Clone the model repository from GitHub, install dependencies, download model weights, and run inference. We provide documentation for each model's self-hosting requirements including GPU, RAM, and Python version.

Талаботҳо вобаста ба модел фарқ мекунанд. Piper ба GPU ниёз надорад (танҳо ба CPU). Kokoro ва MeloTTS ба 1-2 ГБ VRAM ниёз доранд. Бисёре аз моделҳои стандартӣ ба 4 ГБ VRAM ниёз доранд. Tortoise ва Sesame CSM ба 8 ГБ ниёз доранд. NVIDIA RTX 3060 (12 ГБ) метавонад аксари моделҳоро ба осонӣ иҷро кунад.

Да. Лицензияҳои манбаи кушод тағйиротро, аз ҷумла танзимотро иҷозат медиҳанд. Намунаҳои монанди GPT-SoVITS ва Bark скриптҳои танзимотро пешниҳод мекунанд. Шумо метавонед намунаҳоро бо додаҳои овозии худ барои эҷоди овозҳои оддӣ ё беҳтар кардани иҷроиш барои забонҳои мушаххас таълим диҳед.

Модельҳои беҳтарини кушодаи сарчашма (Kokoro, StyleTTS 2, Chatterbox) ҳоло хидматҳои тиҷоратиро ба монанди ElevenLabs ва Google TTS дар нишондиҳандаҳои сифат баробар мекунанд ё аз онҳо боло мераванд. Хусусияти асосии хидматҳои тиҷоратӣ ин идоракунии инфрасохтор ва дастгирӣ, на сифати аудио мебошад.

Мо аллакай онҳоро хориҷ кардем. XTTS/XTTS-v2 (Coqui's CPML — ғайрикоммерсиалӣ), F5-TTS (CC-BY-NC — ғайрикоммерсиалӣ), ва Higgs-v2 (Бозон Лицензия — маҳдудкунанда) ҳамаи онҳо хориҷ карда шуданд. Ҳар як намуна дар TTS.ai барои истифодаи тиҷоратӣ бехатар аст.

Бале. Бисёре аз моделҳо саҳми ҷомеаро тавассути GitHub қабул мекунанд. Шумо метавонед гузоришҳои хатогиҳо, сабти овоз барои забонҳои нав, такмилдиҳии код ва ҳуҷҷатҳоро фиристед. Барои дастурҳои саҳм ва масъалаҳои фаъол репозиторияи GitHub-и ҳар як моделро тафтиш кунед.

Боркунии моделҳо дар вақти талабот ва боркунии онҳо дар вақти хомӯшӣ барои тақсимоти хотираи GPU. Сервери GPU-и мо 20+ моделро дар 4x Tesla P40 (96GB VRAM-и умумӣ) бо истифода аз боркунии динамикӣ иҷро мекунад. Барои худи хостинг, як GPU-и 24GB метавонад 3-5 моделро якҷоя хизмат расонад.

Бисёр моделҳо тасвирҳои расмии Docker ё файлҳои Dockerfiles-ро пешниҳод мекунанд. Барои иҷрои бисёр моделҳо, шумо метавонед танзимоти Docker-и оддиро бо NVIDIA Container Toolkit барои дастрасии GPU сохта метавонед. Архитектураи сервери API-и мо метавонад ҳамчун татбиқи истинод хизмат кунад.

Бисёре аз моделҳо Python 3.10-3.12-ро талаб мекунанд. Coqui TTS (VITS) махсусан Python 3.11-ро талаб мекунад. Мо Python 3.12-ро барои бисёре аз моделҳо тавсия медиҳем. Барои созишмандии дурусти версияи ҳар як модел requirements.txt-ро тафтиш кунед.

Ҳа. Иҷозатномаҳои MIT ва Apache 2.0 истифодаи тиҷоратиро иҷозат медиҳанд. Шумо метавонед маҳсулоти SaaS, барномаҳои мобилӣ, бозиҳо ва хизматрасониҳоро бо истифодаи ин моделҳо бе пардохти иҷозатнома, ҳаққи муаллифӣ ё талаботи аломатгузорӣ (гарчанде ки аломатгузорӣ қадр карда мешавад) созед.
5.0/5 (1)

Чӣ чизро метавонем беҳтар кунем? Бозгашти шумо ба мо дар ислоҳи мушкилиҳо кӯмак мекунад.

Имрӯз озмоиши TTS- и кушодаи манбаъ

20+ моделҳои кушодаи сарчашма, ҳамаи онҳо бо иҷозатномаи тиҷоратӣ. API-и моро истифода баред ё худи мизбон - интихоби шумост.