פֿאָרױסװײַז טעקסט־צו־ספּראַך מאָדעלס

יעדער TTS מאָדעל אויף אונדזער פּלאַטפאָרמע איז אָפֿן קאָד מיט קאָמוניקאַציע-פרייַנדלעך לייסאַנסיז. MIT, Apache 2.0 — קיין פּראָפּערטיאָנאַל lock-in, קיין נוצן באַגרענעצונגען, קיין יבערראַשן לייסאַנסינג צאָלונגען. נוצן זיי דורך אונדזער האָסטינג API, אָדער זיך-האָסטינג זיי אויף דיין אייגענע אינפֿאָרמאַציע מיט פול קאָנטראָל.

פֿאָרױסװײַז MIT לייסאַנסע Apache 2.0 שריפֿט גרײס GitHub

פֿאָרשלאָגן איצט

0/500
פֿרײַ מיט Kokoro, Piper, VITS, MeloTTS
Your generated audio will appear here
אױסגעגרײט
0:00 0:00
אַרײַנשטעלן
ווי TTS.ai? זאָגן אייער פריינט

פֿאָרױסװײַז־קאָפּיע

װיפֿל אױפֿגעהײבטע מקור־מאָדלן זײַנען וויכטיק פֿאַר אייערע פּראָיעקטן

אַלץ איז אָפֿן־קאָד ליסענשירט

יעדער מאָדעל אויף TTS.ai ניצט אַ פֿאַרלאָזלעכער אָפֿן־קאָד ליסענס. קײן פּריוואַטע שװאַרטע קעסטל, קײן פֿאַרקויף־פֿאַרבינדונג, קײן אומבאַקאַנטע ליסענס־צאָלן.

MIT/Apache 2.0

מאָדעלן זײַנען אונטערגעשריבן אונטער MIT אָדער Apache 2.0, די מערסטע דערלויבטע אָפֿן־קאָפּיע־ליסענסן. ניצן פֿאַרקויף־צוועקן, ענדערן, פֿאַרשפּרייטן — ניט קיין באַגרענעצונגען

שריפֿט גרײס

אַרײַנשטעלן אַ מאָדעל און לײענען עס אױף אייער אייגענעם האַרטװירוס. פֿולע קאָנטראָל איבער אייער דאַטן, װײַטערגײט, און אינפֿאָרמאַציע. קײן קלױב־פֿאַרבינדונג ניט נייטיק.

GPU אָפּטימיזירט

מאָדעלס זײַנען אָפּטימיזירט פֿאַר NVIDIA GPUס מיט CUDA שטיצן. פּאַפּער לײַט נאָר אויף CPU. די אײגסטע מאָדעלס דאַרפן 2-8GB VRAM פֿאַר אַ עפעקטיווע אַרײַנפֿיר

משפּחה־באַהאַלט

אַקטיװע אָפֿן־קאָפּיע־געשיכטע־צוזאַמענשאַפֿטן באַהאַלטן און פֿאַרבעסערן די מאָדעלן. אַרײַנשרײַב פֿאַלן, פֿאַרבעסערן, און נײַע שפּראַכן אויף GitHub.

קאָמוניקאַציע

אַלע מאָדלן דערלױבן קאָמוניקאַציע אונטער זייערע לײַזן. שאַפֿן פּראָדוקטן, פאַרקויפן באַדינונגען, און שאַפֿן קאָמוניקאַציע אינהאַלט אָן רעװיזיעס אָדער ניצן צאָלונגען.

אונזערע אָפֿן־קאָד מאָדעל־קאַטאַלאָג

יעדער מאָדעל, זײַן לייסאַנסע, און װאָס ער טוט בעסטער

KokoroKokoro

Free

Lightweight 82M parameter model delivering studio-quality speech with blazing-fast inference.

Fast 5/5

בעסטער פֿאַר: Apache 2.0 — בעסטער קוואַליטעט פרייע מאָדעל, 82M פּאַראַמעטערס, גרינג צו זיך-האָסטן

דורכפֿאַל Kokoro

PiperPiper

Free

A fast, local neural text to speech system optimized for Raspberry Pi and embedded devices.

Fast 3/5

בעסטער פֿאַר: MIT — CPU-only, פּאַסיק פֿאַר Edge מכשירים און אַרײַנגעלייגט זיך־האָסטינג

דורכפֿאַל Piper

VITSVITS

Free

Conditional variational autoencoder with adversarial learning for end-to-end text-to-speech.

Fast 3/5

בעסטער פֿאַר: MIT — פֿונקציע־אַרקיטעקטור אױף װעלכע אױסגעפֿירט װערן װעלכע מאָדעלן

דורכפֿאַל VITS

BarkBark

Standard

Transformer-based text-to-audio model that generates realistic speech, music, and sound effects.

Slow 4/5

בעסטער פֿאַר: MIT — אייגנאַרטיקע אוודיאָ־זײגער־קײט איבער סטאַנדאַרד TTS

דורכפֿאַל Bark

Tortoise TTSTortoise TTS

Premium

Multi-voice text-to-speech focused on quality with autoregressive architecture.

Slow 5/5 שריפֿט גרײס

בעסטער פֿאַר: Apache 2.0 — מאַקסימום קװאַליטעט, װײַטער שטודירט רעפֿערענץ־אימפּלימענטאַציע

דורכפֿאַל Tortoise TTS

OpenVoiceOpenVoice

Premium

Instant voice cloning with granular control over style, emotion, and accent.

Medium 4/5 שריפֿט גרײס

בעסטער פֿאַר: MIT — אָפֿן־קאָלוד שפּראַך־קלאָנינג מיט גראַניאַלער סטיל־קאָנטראָל

דורכפֿאַל OpenVoice

װי צו ניצן עפֿנטלעכן קאָד TTS

ניצן אונדזער געװײנטלעכער API אָדער לײענען מאָדעלס זיך

1

קלײַב אַלץ אױס

בלעטער אונדזער קאַטאַלאָג פֿון 20+ אָפֿן־קאָד TTS מאָדעלס. יעדער מאָדעל בלעטער װײַזט די לייסענס, ארכיטעקטורע, קאַפּיטאַליזאַציע, און זיך־האָסטינג באדערפענישן.

2

פּרובירן אין דיין בלעטערער

טעקסט־פֿאַרװײַז־פֿאַרב:

3

זיך־הײסט אָדער ניצט אונזערע API

קלאָן מאָדעל־רעפּאָזיטאָריעס פֿון GitHub און לײדיק אַרײַנשרײַבן, אָדער ניצן אונדזער האָסטינג־API פֿאַר פּראָדוקציע. זיך־האָסטינג גיט פֿולע קאָנטראָל; אונדזער API גיט באַהאַלטענע אינפֿאָרמאַציע.

4

שאַפֿן אַ פּראָגראַם

אינטעגרירן TTS אין אייער פּראָדוקט ניצן זיך-האָסטינג מאָדעלס אָדער אונדזער REST API. אַלע מאָדעלס זענען קאָממערשאַלי ניצלעך אָן לייסאַנסינג צאָלונגען אָדער רויאַלטיעס.

ליקווידאַטי באַהאַלט

אַלע מאָדעלס אויף TTS.ai ניצן קאָמערציעלע־פֿאַרבינדענע אָפֿן־קאָפּיע־ליסענסן

מאָדע דערלויבעניש קאָמוניקאַציע טעקסט פֿאַרבundo-type שריפֿט גרײס אױסשרײַב
Kokoro Apache 2.0 נייטיק
Piper MIT אומלעקסיק
VITS MIT אומלעקסיק
MeloTTS MIT אומלעקסיק
Chatterbox MIT אומלעקסיק
Tortoise TTS Apache 2.0 נייטיק
StyleTTS 2 MIT אומלעקסיק
OpenVoice MIT אומלעקסיק
Sesame CSM Apache 2.0 נייטיק
Orpheus Llama 3.2 "Built with Llama"

זיך־האָסטינג קעגן האָסטינג API

קלײַב אַלץ אױסselect-criterion

זיך־געזעלשאַפֿט אויף אייער האַרטװירע

יעדער מאָדעל אויף TTS.ai איז בנימצא װי אַ אָפֿן־קאָד פּראָיעקט אױף GitHub אָדער Hugging Face. דאַונלאָוד די װעגטן, אינסטאַלירן די װעגטן, און לײענען אױף אייער אייגענע GPUס. איר האָט פֿולע קאָנטראָל איבער װײַטערגײן, פּריוואַטקייט, און סעלעקציע.

  • פֿולע דאַטן פּריוואַטקייט — אודיו פֿאַלט קײן מאָל ניט פֿון דיין סערװירער
  • קײן קאָסטן אױף אױפֿשרײַב־פֿאַרבינדונג נאָך דער אָנהײב־אַרײַנשטעלן
  • אױסגלײַכונג
  • דאַרף GPU האַרטװירע (NVIDIA רעקאַמענדירט)
  • איר זענט פֿאַראַנטוואָרטלעך פֿאַר דערהייַנטיקונגען, סעלעקציע, און אַפּעטיציעס

טעקסט פֿאַרבtransform-type

אַרײַנפֿאַלן צו אַלע 24+ מאָדעלס װײַטער אױף אײן REST API. מיר זײנען פֿאַראַנטוואָרטלעך פֿאַר GPU־פֿאַרזיכערונג, מאָדעל־אויפֿדרוקן, שורה־פֿאַרזיכערונג און סקעלערונג. אײן API־קלײַב גיט אײַך צוטריט צו יעדער מאָדעל — ניט נײן נײן נײן נײן נײן נײן נײן נײן

  • קײן GPU האַרטװירע ניט נייטיק
  • אַלע 24+ מאָדעלס דורך איין API
  • אויטאָמאַטישע מאָדעל דערהייַנטיקונגען און פֿאַרבעסערן
  • 99.9% אָפּעראַציעס־צײַט מיט איבערגעלייענטע אינפֿאָרמאַציע
  • באַצאָלט נאָר פֿאַר װאָס איר ניצט

פֿאָרױסװײַז

ניצן אונדזער האָסטינג API, אָדער אינסטאַלירן Kokoro לײדיק אין מינוטען

אָפּציע 1: TTS.ai האָסטינג API קלענסטע
import requests

response = requests.post("https://api.tts.ai/v1/tts", json={
    "text": "Open source TTS with a simple API.",
    "model": "kokoro",
    "voice": "af_heart",
    "format": "wav"
}, headers={"Authorization": "Bearer YOUR_API_KEY"})

with open("output.wav", "wb") as f:
    f.write(response.content)
אָפּציע 2: זיך־געזינד מיט pip גאַנץ קאָנטראָל
# Install Kokoro locally
pip install kokoro

# Generate speech on your own GPU
import kokoro

pipeline = kokoro.KPipeline(lang_code="a")
generator = pipeline("Hello from your own server!", voice="af_heart")
for i, (gs, ps, audio) in enumerate(generator):
    kokoro.save(audio, f"output_{i}.wav")

עפֿנטלעכער קאָד־פֿאָרעם

אונזערע געװײנטלעכע API װײַזט אומבאַקאַנטע מקור־טקסט־אַרײַנשרײַב אָן װײַזונג פֿון GPUס

פֿאָרױסװײַזundo-type

$0

50 קרעדיטס אױף אַרײַנשרײַב

  • 4 אָפֿן־קאָד מאָדעלס פריי
  • קײן אַרײַנשרײַב פֿאַר אַבסאָלוטן ניצן
  • קאָמוניקאַציע־נוץ איז דערלויבט

אָנהײב

$9

500 קרעדיטס/חודש

  • אַלע 24+ אָפֿן־קאָד מאָדעלס
  • קלײַב אַלץ אױס
  • API צוטריט

פּראָפֿעסיאָנאַל

$29

2000 קרעדיטס/חודש

  • GPU פּראָצעדור־פּרעפֿערענץ
  • אַלע מאָדעלס
  • פֿירמע שטיצן
װײַז װיפֿל

פֿראַגעס און ענטפֿערס

אַלגעמיינע פֿראַגעס וועגן דער אָפֿן־קאָד טעקסט־צו־רעד

יאָ. יעדער מאָדעל אויף TTS.ai ניצט אַן עפֿנטלעכער־קאָד־ליסענציע — אױב MIT אָדער Apache 2.0. מיר װײַזן אָפּ מאָדעלן מיט פֿאַרבינדענע ליסענציעס (װי Coqui'ס CPML אָדער ניט־קאָמערציעלע CC-BY-NC). דו קענסט באַשטעטיקן יעדער מאָדעל ס׳ליסענציע אױף זײַן GitHub רעפּאָזיטאָרי.

בײדע זײַנען אָפּגעהיטע אָפֿן־קאָד ליסענסן װאָס דערלױבן קאָממערציעלע ניצן, װײַזן װײַזונגען, און װידערװײַזונג. Apache 2.0 װײַזט אױס װיפֿל מען װעט װײַזן אױף װײַזונגען אױב מען װײַזט אױף דעם קאָד. MIT איז קלענער מיט קלענערע װײַזונגען. בײדע זײַנען ביזנעס־פֿרײַנדלעך.

יאָ. יעדער מאָדעל קען זיך זיך האָסטן. קלאָנען דעם מאָדעל־רעפּאָזיטאָרי פֿון GitHub, אינסטאַלירן דיפּענדאַנסיעס, ארײַנשטעלן מאָדעל־װײַטונגען, און לײענען אַרײַנפֿירונגען. מיר צושטעלן דאָקומענטאַציע פֿאַר יעדער מאָדעל ס׳זאָל זיך האָסטן, אַרײַנגערעכנט GPU, RAM, און Python װערסיע.

די באדערפענישן זײַנען פֿאַרשיידענע לויט דעם מאָדעל. Piper דאַרף קײן GPU (אָבער אַ CPU). Kokoro און MeloTTS דאַרפן 1-2 GB VRAM. די אײגסטע סטאַנדאַרד מאָדעלן דאַרפן 4 GB VRAM. Tortoise און Sesame CSM דאַרפן 8 GB. אַ NVIDIA RTX 3060 (12 GB) קען װײַזן די אײגסטע מאָדעלן קלאָר

יאָ. אָפֿן־קאָד ליסענצן דערלױבן ענדערונגען אַרײַנגערעכנט פֿינע־טוּנינג. מאָדעלן װי GPT-SoVITS און Bark װײַזן פֿינע־טוּנינג־סקריפּטס. דו קענסט לערנען מאָדעלן אױף אייער אייגענע שפּראַך־דאַטעס צו שאַפֿן אייגענע שפּראַכן אױב דו װילסט פֿאַרבעסערן די שפּראַך־פּראָדוקציע.

פֿאָרױסװײַז פֿאָרױסװײַז

XTTS/XTTS-v2 (Coqui's CPML — ניט־קאָמערציעלע), F5-TTS (CC-BY-NC — ניט־קאָמערציעלע), און Higgs-v2 (Boson License — רעסטריקטיווע) זײַנען אײַנגעװײַזט געוואָרן. יעדער מודל אויף TTS.ai איז װערטאַפיצירט װי זיכער פֿאַר קאָמערציעלע ניצן.

יאָ. די רוב מאָדעלן אַרײַננעמען קעמפֿער־פֿאַרבינדונגען װײַזנדיק GitHub. איר קענט אַרײַנשרײַבן טעות־רעדאַקטירן, שפּראַך־אַרײַנשרײַבונגען פֿאַר נײַע שפּראַכן, קאָד־פֿאַרבינדונגען, און דאָקומענטאַציע. װײַז יעדער מאָדעל ס GitHub אַרײַנשרײַב־פֿאַרבינדונג װײַזנדיק פֿאַרבינדונג־רעפֿערענצן און אַקטיווע פּראָבלעמען.

אַרײַנשטעלן מאָדעלס אױף פֿאַרלאַנג און אױסשטעלן ווען ניט־אינאַקטיוו צו טיילן GPU זכּרון. אונזערע GPU סערװערס לײענען 20+ מאָדעלס אױף 4x Tesla P40 (96GB גאַנץ VRAM) ניצנדיק דינאַמיש אַרײַנשטעלן. פֿאַר זיך־האָסטינג, קען אײנער 24GB GPU באַװײַזן 3-5 מאָדעלס אין דער זעלבער צײַט

װיפֿל מאָדעלן װײַזן אופֿיציעלע דאָקער בילדער אָדער דאָק־טעקעס. צו לײענען װיפֿל מאָדעלן, קענט איר שאַפֿן אַ צוגעפּאַסטע דאָקער אַרײַנשטעל מיט NVIDIA קאַנטיינער־טאָאָלקיט פֿאַר GPU־צוטריט. אונדזער API־סערװירער־אַרקיטעקטור קען דינען װי אַ רעפֿערענץ־אימפּלימענטאַציע

רוב מאָדעלן דאַרפן פּײַטאָן 3.10-3.12. Coqui TTS (VITS) דאַרף פּײַטאָן 3.11. מיר רעקאָמענדירן פּײַטאָן 3.12 פֿאַר רוב מאָדעלן. קאָנטראָליר יעדער מאָדעל'ס requirements.txt צו זען צי די װערסיע איז צופֿרידן.

יאָ. MIT און Apache 2.0 לייסאַנסעס דערלױבן אױסגעפֿירטע קאָממערציעלע ניצן. דו קענסט שאַפֿן SaaS פּראָדוקטן, מאָבילע אַפּליקאַציעס, שפּילערײַן, און באַדינונגען ניצנדיק די מאָדעלן אָן לייסאַנס־צאָלן, רעװאָלוציעס, אָדער צושטימען־דערװײַזונגען (כאָטש צושטימען־דערװײַזונגען זײַנען באַגריסט).
5.0/5 (1)

פֿאָרשלאָגן אַ אָפֿן־קאָד TTS הײַנט

24+ אָפֿן־קאָד מאָדעלס, אַלע קאָמערציאַל־ליסענשירט. ניצן אונדזער API אָדער זיך־האָסטן — די ברירה איז אייער.