פֿאָרױסװײַז טעקסט־צו־ספּראַך מאָדעלס

יעדער TTS מאָדעל אויף אונדזער פּלאַטפאָרמע איז אָפֿן קאָד מיט קאָמוניקאַציע-פרייַנדלעך לייסאַנסיז. MIT, Apache 2.0 — קיין פּראָפּערטיאָנאַל lock-in, קיין נוצן באַגרענעצונגען, קיין יבערראַשן לייסאַנסינג צאָלונגען. נוצן זיי דורך אונדזער האָסטינג API, אָדער זיך-האָסטינג זיי אויף דיין אייגענע אינפֿאָרמאַציע מיט פול קאָנטראָל.

פֿאָרױסװײַז MIT לייסאַנסע Apache 2.0 שריפֿט גרײס GitHub

פֿאָרשלאָגן איצט

פֿרײַ מיט Kokoro, Piper, VITS, MeloTTS
די אױדיו־טעקע וועט װײַזן זיך הײַנט
אױסגעגרײט
אַרײַנשטעלן
ליבע TTS.ai? זאָגן דיין פריינט

פֿאָרױסװײַז־קאָפּיע

װיפֿל אױפֿגעהײבטע מקור־מאָדלן זײַנען וויכטיק פֿאַר אייערע פּראָיעקטן

אַלץ איז אָפֿן־קאָד ליסענשירט

יעדער מאָדעל אויף TTS.ai ניצט אַ פֿאַרלאָזלעכער אָפֿן־קאָד ליסענס. קײן פּריוואַטע שװאַרטע קעסטל, קײן פֿאַרקויף־פֿאַרבינדונג, קײן אומבאַקאַנטע ליסענס־צאָלן.

MIT/Apache 2.0

מאָדעלן זײַנען אונטערגעשריבן אונטער MIT אָדער Apache 2.0, די מערסטע דערלויבטע אָפֿן־קאָפּיע־ליסענסן. ניצן פֿאַרקויף־צוועקן, ענדערן, פֿאַרשפּרייטן — ניט קיין באַגרענעצונגען

שריפֿט גרײס

אַרײַנשטעלן אַ מאָדעל און לײענען עס אױף אייער אייגענעם האַרטװירוס. פֿולע קאָנטראָל איבער אייער דאַטן, װײַטערגײט, און אינפֿאָרמאַציע. קײן קלױב־פֿאַרבינדונג ניט נייטיק.

GPU אָפּטימיזירט

מאָדעלס זײַנען אָפּטימיזירט פֿאַר NVIDIA GPUס מיט CUDA שטיצן. Piper װײַזט זיך בלויז אױף CPU. די אײגסטע מאָדעלס דאַרפן 2-8GB VRAM פֿאַר אַ עפעקטיווע אַרײַנפֿיר

משפּחה־באַהאַלט

אַקטיװע אָפֿן־קאָפּיע־געשיכטע־צוזאַמענשאַפֿטן באַהאַלטן און פֿאַרבעסערן די מאָדעלן. אַרײַנשרײַב פֿאַלן, פֿאַרבעסערן, און נײַע שפּראַכן אויף GitHub.

קאָמוניקאַציע

אַלע מאָדלן דערלױבן קאָמוניקאַציע אונטער זייערע לײַזן. שאַפֿן פּראָדוקטן, פאַרקויפן באַדינונגען, און שאַפֿן קאָמוניקאַציע אינהאַלט אָן רעװיזיעס אָדער ניצן צאָלונגען.

אונזערע אָפֿן־קאָד מאָדעל־קאַטאַלאָג

יעדער מאָדעל, זײַן לייסאַנסע, און װאָס ער טוט בעסטער

KokoroKokoro

Free

Lightweight 82M parameter model delivering studio-quality speech with blazing-fast inference.

Fast 5/5

בעסטער פֿאַר: Apache 2.0 — בעסטער קוואַליטעט פרייע מאָדעל, 82M פּאַראַמעטערס, גרינג צו זיך-האָסטן

דורכפֿאַל Kokoro

PiperPiper

Free

A fast, local neural text to speech system optimized for Raspberry Pi and embedded devices.

Fast 3/5

בעסטער פֿאַר: MIT — CPU-only, פּאַסיק פֿאַר Edge מכשירים און אַרײַנגעלייגט זיך־האָסטינג

דורכפֿאַל Piper

VITSVITS

Free

Conditional variational autoencoder with adversarial learning for end-to-end text-to-speech.

Fast 3/5

בעסטער פֿאַר: MIT — פֿונקציע־אַרקיטעקטור אױף װעלכע אױסגעפֿירט װערן װעלכע מאָדעלן

דורכפֿאַל VITS

BarkBark

Standard

Transformer-based text-to-audio model that generates realistic speech, music, and sound effects.

Slow 4/5

בעסטער פֿאַר: MIT — אייגנאַרטיקע אוודיאָ־זײגער־קײט איבער סטאַנדאַרד TTS

דורכפֿאַל Bark

Tortoise TTSTortoise TTS

Premium

Multi-voice text-to-speech focused on quality with autoregressive architecture.

Slow 5/5 שריפֿט גרײס

בעסטער פֿאַר: Apache 2.0 — מאַקסימום קװאַליטעט, װײַטער שטודירט רעפֿערענץ־אימפּלימענטאַציע

דורכפֿאַל Tortoise TTS

OpenVoiceOpenVoice

Premium

Instant voice cloning with granular control over style, emotion, and accent.

Medium 4/5 שריפֿט גרײס

בעסטער פֿאַר: MIT — אָפֿן־קאָלוד שפּראַך־קלאָנינג מיט גראַניאַלער סטיל־קאָנטראָל

דורכפֿאַל OpenVoice

װי צו ניצן עפֿנטלעכן קאָד TTS

ניצן אונדזער געװײנטלעכער API אָדער לײענען מאָדעלס זיך

1

קלײַב אַלץ אױס

בלעטער אונדזער קאַטאַלאָג פֿון 20+ אָפֿן־קאָר־TTS־מאָדעלן. יעדער מאָדעל־בלאַט װײַזט די ליסענצן, ארכיטעקטור, קײטס, און זיך־האָסטינג־דערװײַזונגען.

2

פּרובירן אין דיין בלעטערער

טעסטירן אַ מאָדעל גלייך אויף TTS.ai אָן אױסצושטעלן עפּעס. אונדזערע GPU סערװערס האַנדלען מיט דער פּראַסעסונג אַזוי אַז איר קענט אָפּשאַצן די קװאַליטעט איידער איר װעט זיך אױסגעבן צו זיך־האָסטינג

3

זיך־הײסט אָדער ניצט אונזערע API

קלאָן מאָדעל־רעפּאָזיטאָריעס פֿון GitHub און לײדיק אַרײַנשרײַבן, אָדער ניצן אונדזער האָסטינג־API פֿאַר פּראָדוקציע. זיך־האָסטינג גיט פֿולע קאָנטראָל; אונדזער API גיט באַהאַלטענע אינפֿאָרמאַציע.

4

שאַפֿן אַ פּראָגראַם

אינטעגרירן TTS אין אייער פּראָדוקט ניצן זיך-האָסטינג מאָדעלס אָדער אונדזער REST API. אַלע מאָדעלס זענען קאָממערשאַלי ניצלעך אָן לייסאַנסינג צאָלונגען אָדער רויאַלטיעס.

ליקווידאַטי באַהאַלט

אַלע מאָדעלס אויף TTS.ai ניצן קאָמערציעלע־פֿאַרבינדענע אָפֿן־קאָפּיע־ליסענסן

מאָדע דערלויבעניש קאָמוניקאַציע טעקסט פֿאַרבundo-type שריפֿט גרײס אױסשרײַב
Kokoro Apache 2.0 נייטיק
Piper MIT אומלעקסיק
VITS MIT אומלעקסיק
MeloTTS MIT אומלעקסיק
Chatterbox MIT אומלעקסיק
Tortoise TTS Apache 2.0 נייטיק
StyleTTS 2 MIT אומלעקסיק
OpenVoice MIT אומלעקסיק
Sesame CSM Apache 2.0 נייטיק
Orpheus Llama 3.2 "Built with Llama"

זיך־האָסטינג קעגן האָסטינג API

קלײַב אַלץ אױסselect-criterion

זיך־געזעלשאַפֿט אויף אייער האַרטװירע

יעדער מאָדעל אויף TTS.ai איז בנימצא װי אַ אָפֿן־קאָד פּראָיעקט אױף GitHub אָדער Hugging Face. דאַונלאָוד די װעגטן, אינסטאַלירן די װעגטן, און לײענען אױף אייער אייגענע GPUס. איר האָט פֿולע קאָנטראָל איבער װײַטערגײן, פּריוואַטקייט, און סעלעקציע.

  • פֿולע דאַטן פּריוואַטקייט — אודיו פֿאַלט קײן מאָל ניט פֿון דיין סערװירער
  • קײן קאָסטן אױף אױפֿשרײַב־פֿאַרבינדונג נאָך דער אָנהײב־אַרײַנשטעלן
  • אױסגלײַכונג
  • דאַרף GPU האַרטװירע (NVIDIA רעקאַמענדירט)
  • איר זענט פֿאַראַנטוואָרטלעך פֿאַר דערהייַנטיקונגען, סעלעקציע, און אַפּעטיציעס

ניצן TTS.ai האָסטינג API

באַקומען אַ שנעל צוטריט צו אַלע 20+ מאָדעלס דורך אַ איין REST API. מיר האַלט GPU פּראָווידינג, מאָדעל דערהייַנטיקונגען, שורה פאַרוואַלטונג, און סקעלינג. איין API קנעפּל גיט איר צוטריט צו יעדער מאָדעל — ניט דאַרפֿן צו פאַרוואַלטן באַזונדערע דעפּלוימענטן

  • קײן GPU האַרטװירע ניט נייטיק
  • אַלע 20+ מאָדעלס דורך איין API
  • אויטאָמאַטישע מאָדעל דערהייַנטיקונגען און פֿאַרבעסערן
  • 99.9% אָפּעראַציעס־צײַט מיט איבערגעלייענטע אינפֿאָרמאַציע
  • באַצאָלט נאָר פֿאַר װאָס איר ניצט

פֿאָרױסװײַז

ניצן אונדזער האָסטינג API, אָדער אינסטאַלירן Kokoro לײדיק אין מינוטען

אָפּציע 1: TTS.ai האָסטינג API קלענסטע
import requests

response = requests.post("https://api.tts.ai/v1/tts", json={
    "text": "Open source TTS with a simple API.",
    "model": "kokoro",
    "voice": "af_heart",
    "format": "wav"
}, headers={"Authorization": "Bearer YOUR_API_KEY"})

with open("output.wav", "wb") as f:
    f.write(response.content)
אָפּציע 2: זיך־געזינד מיט pip גאַנץ קאָנטראָל
# Install Kokoro locally
pip install kokoro

# Generate speech on your own GPU
import kokoro

pipeline = kokoro.KPipeline(lang_code="a")
generator = pipeline("Hello from your own server!", voice="af_heart")
for i, (gs, ps, audio) in enumerate(generator):
    kokoro.save(audio, f"output_{i}.wav")

עפֿנטלעכער קאָד־פֿאָרעם

אונזערע געװײנטלעכע API װײַזט אומבאַקאַנטע מקור־טקסט־אַרײַנשרײַב אָן װײַזונג פֿון GPUס

פֿאָרױסװײַזundo-type

$0

50 קרעדיטס אױף אַרײַנשרײַב

  • 4 אָפֿן־קאָד מאָדעלס פריי
  • קײן אַרײַנשרײַב פֿאַר אַבסאָלוטן ניצן
  • קאָמוניקאַציע־נוץ איז דערלויבט

אָנהײב

$9

500 קרעדיטס/חודש

  • אַלע 20+ אָפֿן־קאָפּיע מאָדעלס
  • קלײַב אַלץ אױס
  • API צוטריט

פּראָפֿעסיאָנאַל

$29

2000 קרעדיטס/חודש

  • GPU פּראָצעדור־פּרעפֿערענץ
  • אַלע מאָדעלס
  • פֿירמע שטיצן
װײַז װיפֿל

פֿראַגעס און ענטפֿערס

אַלגעמיינע פֿראַגעס וועגן דער אָפֿן־קאָד טעקסט־צו־רעד

יאָ. יעדער מאָדעל אויף TTS.ai ניצט אַן עפֿנטלעכער־קאָד־ליסענציע — אױב MIT אָדער Apache 2.0. מיר װײַזן אָפּ מאָדעלן מיט פֿאַרבינדענע ליסענציעס (װי Coqui'ס CPML אָדער ניט־קאָמערציעלע CC-BY-NC). דו קענסט באַשטעטיקן יעדער מאָדעל ס׳ליסענציע אױף זײַן GitHub רעפּאָזיטאָרי.

בײדע זײַנען אָפּגעהיטע אָפֿן־קאָד ליסענסן װאָס דערלױבן קאָממערציעלע ניצן, װײַזן װײַזונגען, און װידערװײַזונג. Apache 2.0 װײַזט אױס װיפֿל מען װעט װײַזן אױף װײַזונגען אױב מען װײַזט אױף דעם קאָד. MIT איז קלענער מיט קלענערע װײַזונגען. בײדע זײַנען ביזנעס־פֿרײַנדלעך.

יאָ. יעדער מאָדעל קען זיך זיך האָסטן. קלאָנען דעם מאָדעל־רעפּאָזיטאָרי פֿון GitHub, אינסטאַלירן דיפּענדאַנסיעס, ארײַנשטעלן מאָדעל־װײַטונגען, און לײענען אַרײַנפֿירונגען. מיר צושטעלן דאָקומענטאַציע פֿאַר יעדער מאָדעל ס׳זאָל זיך האָסטן, אַרײַנגערעכנט GPU, RAM, און Python װערסיע.

די באדערפענישן זײַנען פֿאַרשיידענע לויט דעם מאָדעל. Piper דאַרף קײן GPU (אָבער אַ CPU). Kokoro און MeloTTS דאַרפן 1-2 GB VRAM. די אײגסטע סטאַנדאַרד מאָדעלן דאַרפן 4 GB VRAM. Tortoise און Sesame CSM דאַרפן 8 GB. אַ NVIDIA RTX 3060 (12 GB) קען װײַזן די אײגסטע מאָדעלן קלאָר

יאָ. אָפֿן־קאָד ליסענצן דערלױבן ענדערונגען אַרײַנגערעכנט פֿינע־טוּנינג. מאָדעלן װי GPT-SoVITS און Bark װײַזן פֿינע־טוּנינג־סקריפּטס. דו קענסט לערנען מאָדעלן אױף אייער אייגענע שפּראַך־דאַטעס צו שאַפֿן אייגענע שפּראַכן אױב דו װילסט פֿאַרבעסערן די שפּראַך־פּראָדוקציע.

פֿאָרױסװײַז פֿאָרױסװײַז

XTTS/XTTS-v2 (Coqui's CPML — ניט־קאָמערציעלע), F5-TTS (CC-BY-NC — ניט־קאָמערציעלע), און Higgs-v2 (Boson License — רעסטריקטיווע) זײַנען אײַנגעװײַזט געוואָרן. יעדער מודל אויף TTS.ai איז װערטאַפיצירט װי זיכער פֿאַר קאָמערציעלע ניצן.

יאָ. די רוב מאָדעלן אַרײַננעמען קעמפֿער־פֿאַרבינדונגען װײַזנדיק GitHub. איר קענט אַרײַנשרײַבן טעות־רעדאַקטירן, שפּראַך־אַרײַנשרײַבונגען פֿאַר נײַע שפּראַכן, קאָד־פֿאַרבינדונגען, און דאָקומענטאַציע. װײַז יעדער מאָדעל ס GitHub אַרײַנשרײַב־פֿאַרבינדונג װײַזנדיק פֿאַרבינדונג־רעפֿערענצן און אַקטיווע פּראָבלעמען.

אַרײַנשטעלן מאָדעלס אױף דער װעג און אָפּשטעלן ווען ניט־אינאַקטיוו צו טיילן GPU זכּרון. אונדזער GPU סערװירער װײַזט 20+ מאָדעלס אױף 4x Tesla P40 (96GB גאַנץ VRAM) ניצנדיק דינאַמיש אַרײַנשטעלן. פֿאַר זיך־האָסטינג, קען אַ איין 24GB GPU באַװײַזן 3-5 מאָדעלס צוזאַמען

װיפֿל מאָדעלן װײַזן אופֿיציעלע דאָקער בילדער אָדער דאָק־טעקעס. צו לײענען װיפֿל מאָדעלן, קענט איר שאַפֿן אַ צוגעפּאַסטע דאָקער אַרײַנשטעל מיט NVIDIA קאַנטיינער־טאָאָלקיט פֿאַר GPU־צוטריט. אונדזער API־סערװירער־אַרקיטעקטור קען דינען װי אַ רעפֿערענץ־אימפּלימענטאַציע

רוב מאָדעלן דאַרפן פּײַטאָן 3.10-3.12. Coqui TTS (VITS) דאַרף פּײַטאָן 3.11. מיר רעקאָמענדירן פּײַטאָן 3.12 פֿאַר רוב מאָדעלן. קאָנטראָליר יעדער מאָדעל'ס requirements.txt צו זען צי די װערסיע איז צופֿרידן.

יאָ. MIT און Apache 2.0 לייסאַנסעס דערלױבן אױסגעפֿירטע קאָממערציעלע ניצן. דו קענסט שאַפֿן SaaS פּראָדוקטן, מאָבילע אַפּליקאַציעס, שפּילערײַן, און באַדינונגען ניצנדיק די מאָדעלן אָן לייסאַנס־צאָלן, רעװאָלוציעס, אָדער צושטימען־דערװײַזונגען (כאָטש צושטימען־דערװײַזונגען זײַנען באַגריסט).
5.0/5 (1)

What could we improve? Your feedback helps us fix issues.

פֿאָרשלאָגן אַ אָפֿן־קאָד TTS הײַנט

20+ אָפֿן־קאָר־מאָדעלן, אַלע קאָממערשאַלי־ליסענשירט. ניצט אונדזער API אָדער זיך־האָסטן — די ברירה איז אייער.