ღია კოდის ტექსტიდან საუბრის მოდელებიName

ყველა TTS მოდელი ჩვენს პლატფორმაზე არის ღია კოდი კომერციულად მეგობრული ლიცენზიებით. MIT, Apache 2. 0 — არანაირი საკუთრების დაბლოკვა, არანაირი გამოყენების შეზღუდვა, არანაირი მოულოდნელი ლიცენზირების საფასური. გამოიყენეთ ისინი ჩვენი ჰოსტინგის API- ით, ან თვითონ ჰოსტინგით თქვენი საკუთარი ინფრასტრუქტურის სრული კონტროლით.

ღია კოდიName MIT ლიცენზია აპაჩიComment თვითდასაქმება GitHub- ის პორტალი

გამოსცადე ახლა

თავისუფალი Kokoro, Piper, VITS, MeloTTS- ით
თქვენი შექმნილი აუდიო აქ გამოჩნდება
შექმნილია
ჩამოტვირთვა
ჟაკაქ TTS.ai? კაზთ თმ ნა ოპთ£არვლთრვ ჟთ!

ღია კოდის TTS უპირატესობები

რატომ არის ღია კოდის მოდელები მნიშვნელოვანი თქვენი პროექტებისთვის

ყველა ღია კოდის ლიცენზია

გჟთფკთ მჲევლთ ნა TTS.ai თჱოჲლჱგარ ჲრგჲპვნ ჟჲპჟ ლთუვნჱთწ. ბვჱ ოაპრნვპჟკთ ფვპნთ კსრთთ, ბვჱ ოპვეაგაფჟკთ ჱარგჲპვნთწ, ბვჱ ნვჲფვკგანთ ლთუვნჱთჲნნთ ოაპრთთ.

MIT / Apache 2. 0

მოდელი ლიცენზირებულია MIT ან Apache 2.0-ის ქვეშ, ყველაზე ნებადართული ღია კოდის ლიცენზიები. გამოიყენეთ კომერციულად, შეცვალეთ, გადააქვეყნეთ - არანაირი შეზღუდვა.

თვითდასაქმება

ჩამოტვირთეთ ნებისმიერი მოდელი და ჩაატარეთ იგი თქვენს საკუთარ აპარატურაზე. სრული კონტროლი თქვენი მონაცემების, დაგვიანებისა და ინფრასტრუქტურის მიმართ. აბრაამის დამოკიდებულება არ არის საჭირო.

ოპტიმიზირებული GPU

მოდელი ოპტიმიზებულია NVIDIA GPU- ებისთვის CUDA მხარდაჭერით. Piper მხოლოდ CPU- ზე მუშაობს. უმეტეს მოდელს სჭირდება 2-8GB VRAM ეფექტური დასკვნების გასაკეთებლად.

წევრი

აქტიური ღია კოდის საზოგადოებები აკონტროლებენ და აუმჯობესებენ ამ მოდელებს. მონაწილეობა სასურველია — შეცდომების, გაუმჯობესებების და ახალი ხმების გაგზავნა GitHub- ზე.

კომერციული გამოყენება

ყველა მოდელი საშუალებას იძლევა კომერციული გამოყენება მათი ლიცენზიის მიხედვით. შექმნა პროდუქტები, გაყიდვა მომსახურება და შექმნა კომერციული შინაარსი უფასოდ ან გამოყენების საფასური.

ჩვენი ღია კოდის მოდელის კატალოგი

გჟვკთ მჲევლ, ნვდჲგარა ლთუვნჱთწ თ კაკგჲ ოპაგთ ნაი-ეჲბპვ.

KokoroKokoro

Free

Lightweight 82M parameter model delivering studio-quality speech with blazing-fast inference.

Fast 5/5

საუკეთესო: Apache 2.0 — უმაღლესი ხარისხის თავისუფალი მოდელი, 82 მლნ პარამეტრით, მარტივი თვითშენახვა

ოპჲბა£რვ. Kokoro

PiperPiper

Free

A fast, local neural text to speech system optimized for Raspberry Pi and embedded devices.

Fast 3/5

საუკეთესო: MIT — მხოლოდ CPU, იდეალურია საზღვაო მოწყობილობებისთვის და ჩაშენებული თვით- ჰოსტინგისთვის

ოპჲბა£რვ. Piper

VITSVITS

Free

Conditional variational autoencoder with adversarial learning for end-to-end text-to-speech.

Fast 3/5

საუკეთესო: MIT — ფუნდამენტური არქიტექტურა, რომელსაც იყენებენ მრავალი ქვემო მოდელი

ოპჲბა£რვ. VITS

BarkBark

Standard

Transformer-based text-to-audio model that generates realistic speech, music, and sound effects.

Slow 4/5

საუკეთესო: MIT — უნიკალური აუდიო გენერაციის შესაძლებლობები სტანდარტული TTS-ის გარდა

ოპჲბა£რვ. Bark

Tortoise TTSTortoise TTS

Premium

Multi-voice text-to-speech focused on quality with autoregressive architecture.

Slow 5/5 ხმის კლონირებაName

საუკეთესო: Apache 2. 0 — მაქსიმალური ხარისხი, ფართოდ შესწავლილი რეფერენტული განხორციელება

ოპჲბა£რვ. Tortoise TTS

OpenVoiceOpenVoice

Premium

Instant voice cloning with granular control over style, emotion, and accent.

Medium 4/5 ხმის კლონირებაName

საუკეთესო: MIT - ღია კოდის ხმათა კლონირება სტრუქტურირებული სტილის კონტროლით

ოპჲბა£რვ. OpenVoice

როგორ გამოვიყენოთ ღია კოდის TTS

გამოვიყენოთ ჩვენი ჰოსტინგის API ან თვითონ ჩავატაროთ მოდელი

1

გახსნილი კოდის მოდელების დათვალიერება

გადაამოწმეთ ჩვენი 20+ ღია კოდის TTS მოდელის კატალოგი. თითოეული მოდელის გვერდი აჩვენებს ლიცენზიას, არქიტექტურას, შესაძლებლობებს და თვით- ჰოსტინგის მოთხოვნებს.

2

სცადეთ თქვენს ბრაუზერში

ნებისმიერი მოდელის ტესტირება პირდაპირ TTS.ai-ზე, არაფრის დაყენების გარეშე. ჩვენი GPU სერვერები ახორციელებენ პროცესირებას, ასე რომ თქვენ შეგიძლიათ შეაფასოთ ხარისხი თვით-ჰოსტინგის დაწყებამდე.

3

თვით- ჰოსტინგი ან ჩვენი API- ს გამოყენება

მოდელის რეპოს კლონირება GitHub- დან და ლოკალურად გაშვება, ან ჩვენი ჰოსტირებული API- ს გამოყენება პროდუქციისთვის. თვით- ჰოსტინგი სრულ კონტროლს იძლევა; ჩვენი API უზრუნველყოფს მართვის ინფრასტრუქტურას.

4

პროგრამის შექმნაName

TTS- ის ინტეგრირება თქვენს პროდუქტში თვით- ჰოსტინგის მოდელის ან ჩვენი REST API- ს გამოყენებით. ყველა მოდელი კომერციულად გამოიყენება ლიცენზიის ან ქონების გადასახადის გარეშე.

ლიცენზიის შედარება

TTS.ai-ის ყველა მოდელი იყენებს კომერციულად ხელმისაწვდომ ღია კოდის ლიცენზიას

მოდელი ლიცენზია კომერციული გამოყენება მოდიფიკაცია თვით- ჰოსტი მინიჭება
Kokoro Apache 2.0 საჭირო
Piper MIT დამატებითი
VITS MIT დამატებითი
MeloTTS MIT დამატებითი
Chatterbox MIT დამატებითი
Tortoise TTS Apache 2.0 საჭირო
StyleTTS 2 MIT დამატებითი
OpenVoice MIT დამატებითი
Sesame CSM Apache 2.0 საჭირო
Orpheus Llama 3.2 "Built with Llama"

თვით- ჰოსტინგი vs ჰოსტინგის API

თჱოყლნწგაირვ ჟამთ მჲევლთრვ თლთ ჲჟრაგვრვ ნაჟ ეა ჟვ ჲოთრგამვ ჟ თნტპაჟრპსკრყპა

საკუთარი ჰოსტი თქვენს აპარატურაზეName

ყველა მოდელი TTS.ai-ზე ხელმისაწვდომია როგორც ღია კოდის პროექტი GitHub-ზე ან Hugging Face-ზე. ჩამოტვირთეთ წონა, დააყენეთ დამოკიდებულებები და განახორციელეთ დასკვნა თქვენს გრაფიკულ პროცესორზე. თქვენ გაქვთ სრული კონტროლი ლოდინის, პირადი ცხოვრების და მასშტაბის შესახებ.

  • სრული მონაცემთა კონფიდენციალურობა - აუდიო არასდროს ტოვებს თქვენს სერვერს
  • დაწყებითი კონფიგურაციის შემდეგ მოთხოვნაზე ფასის დაწესება არ ხდება
  • თქვენი მონაცემების ინდივიდუალური დახვეწა
  • საჭიროებს გრაფიკული პროცესორის აპარატურას (NVIDIA რეკომენდებულია)
  • თქვენ მართავთ განახლებებს, მასშტაბურობას და დამოკიდებულებებს

TTS.ai- ის ჰოსტირებული API- ს გამოყენება

მიიღეთ მყისიერი წვდომა ყველა 20+ მოდელს ერთ REST API- ს საშუალებით. ჩვენ ვმართავთ GPU- ს მიწოდებას, მოდელის განახლებას, რიგის მართვას და მასშტაბურობას. ერთი API ღილაკი გაძლევთ წვდომას ყველა მოდელში - არ არის საჭირო განსხვავებული განლაგების მართვა.

  • გრაფიკული პროცესორის აპარატურა არ არის საჭირო
  • ყველა 20+ მოდელი ერთი API- ს საშუალებით
  • ავტომატური მოდელის განახლება და გაუმჯობესება
  • 99.9% მუშაობის დრო დამატებითი ინფრასტრუქტურით
  • ოლართ ჟამჲ ჱა რჲა ქრჲ დჲ ოჲრპვბსგაქ.

სწრაფი დაწყება: API ან თვით- ჰოსტი

გამოიყენეთ ჩვენი ჰოსტირებული API ან Kokoro-ს ლოკალურად დაყენება წუთებში

ვარიანტი 1: TTS.ai ჰოსტინგის API ოჲ-ლვჟნჲ.
import requests

response = requests.post("https://api.tts.ai/v1/tts", json={
    "text": "Open source TTS with a simple API.",
    "model": "kokoro",
    "voice": "af_heart",
    "format": "wav"
}, headers={"Authorization": "Bearer YOUR_API_KEY"})

with open("output.wav", "wb") as f:
    f.write(response.content)
ვარიანტი 2: თვით- ჰოსტი pip- ით სრული კონტროლი
# Install Kokoro locally
pip install kokoro

# Generate speech on your own GPU
import kokoro

pipeline = kokoro.KPipeline(lang_code="a")
generator = pipeline("Hello from your own server!", voice="af_heart")
for i, (gs, ps, audio) in enumerate(generator):
    kokoro.save(audio, f"output_{i}.wav")

ღია კოდი, ხელმისაწვდომი ფასი

1999 წელს აშშ-ის მთავრობამ ოფიციალურად დაამტკიცა ტერმინი „გარემოს დაცვის ეროვნული ცენტრი“, მაგრამ არ განიხილა მისი ოფიციალური ტერმინოლოგია.

თავისუფალი დონე

$0

50 კპვრთნა ოპთ ჱაოთჟსგაŒვ

  • 4 თავისუფალი ღია კოდის მოდელი
  • ძირითადი გამოყენებისთვის რეგისტრაცია არ არის საჭირო
  • კომერციული გამოყენება დაშვებულია

წარმართვა

$9

500,000 სიმბოლო/თვე

  • ყველა 20+ ღია კოდის მოდელი
  • ხმა
  • API წვდომა

პროფესიული

$29

2,000,000 სიმბოლო/თვე

  • GPU- ს პროცესორის პრიორიტეტი
  • ყველა პრემიუმ მოდელი
  • კომპანიის მხარდაჭერა
სრული ფასის ჩვენება

ხშირად დასმული კითხვები

კითხვები ღია კოდის ტექსტიდან საუბრის გადამუშავების შესახებ

დიახ. ყველა მოდელი TTS.ai-ზე იყენებს ნებაყოფლობით ღია კოდის ლიცენზიას — MIT ან Apache 2.0. ჩვენ განსაკუთრებით გამოვრიცხავთ მოდელს შეზღუდული ლიცენზიით (როგორიცაა Coqui's CPML ან არაკომერციული CC-BY-NC). შეგიძლიათ შეამოწმოთ ყველა მოდელის ლიცენზია მის GitHub საცავში.

ორივე ლიცენზია საშუალებას იძლევა თავისუფალი კოდის კომერციული გამოყენება, ცვლილებები და გადანაწილება. Apache 2. 0 ამატებს ნათელ პატენტის უფლებას და მოითხოვს ცვლილებების განცხადებას თუ თქვენ კოდის ცვლილებას. MIT უფრო მარტივია ნაკლები მოთხოვნებით. ორივე ბიზნესის მეგობრულია.

დიახ. ყველა მოდელი შეიძლება იყოს თვით- ჰოსტირებული. კლონირება მოდელის რეპოდან GitHub- დან, დამოკიდებულებების დაყენება, მოდელის წონის ჩამოტვირთვა და დასკვნების გამოშვება. ჩვენ ვთავაზობთ დოკუმენტაციას თითოეული მოდელის თვით- ჰოსტინგის მოთხოვნებისათვის, მათ შორის GPU, RAM და Python ვერსიისთვის.

მოთხოვნები მოდელის მიხედვით იცვლება. Piper-ს არ სჭირდება GPU (მხოლოდ CPU). Kokoro-სა და MeloTTS-ს სჭირდება 1-2GB VRAM. სტანდარტული მოდელების უმეტესობას სჭირდება 4GB VRAM. Tortoise-სა და Sesame CSM-ს სჭირდება 8GB. NVIDIA RTX 3060 (12GB) შეუძლია უმეტესობის მოდელების კომფორტული მუშაობა.

დიახ. თავისუფალი კოდის ლიცენზიები საშუალებას გაძლევთ შეცვალოთ, მათ შორის დააკონფიგურიროთ. ისეთი მოდელები, როგორიცაა GPT-SoVITS და Bark უზრუნველყოფენ დააკონფიგურიროთ სკრიპტები. თქვენ შეგიძლიათ მოდელების შესწავლა თქვენი საკუთარი ხმის მონაცემებზე, რათა შექმნათ ინდივიდუალური ხმები ან გააუმჯობესოთ მუშაობა სპეციფიკური ენებისთვის.

უმაღლესი ღია კოდის მოდელები (Kokoro, StyleTTS 2, Chatterbox) ახლა შეესაბამება ან აღემატება კომერციულ სერვისებს, როგორიცაა ElevenLabs და Google TTS ხარისხის ბერკეტებში. კომერციული სერვისების მთავარი უპირატესობაა მართვადი ინფრასტრუქტურა და მხარდაჭერა, არა აუდიოს ხარისხი.

ჩვენ უკვე გამოვრიცხეთ ისინი. XTTS/XTTS-v2 (Coqui's CPML — არაკომერციული), F5-TTS (CC-BY-NC — არაკომერციული) და Higgs-v2 (ბოზონის ლიცენზია — შეზღუდული) ყველა ამოღებულია. ყველა მოდელი TTS.ai-ზე დადასტურებულია კომერციული გამოყენებისთვის უსაფრთხო.

დიახ. მოდელის უმეტესობა იღებს საზოგადოების წვლილს GitHub-ის საშუალებით. შეგიძლიათ შეცდომის პატაკის, ახალი ენის ხმოვანი ჩანაწერების, კოდის გაუმჯობესების და დოკუმენტაციის გაგზავნა. შეამოწმეთ თითოეული მოდელის GitHub საცავი წვლილის მიცემის წესებისა და აქტიური პრობლემების შესახებ.

მოდელების ჩატვირთვა მოთხოვნის მიხედვით და გადმოტვირთვა უშედეგოდ GPU მეხსიერების გასაზიარებლად. ჩვენი GPU სერვერი მუშაობს 20+ მოდელზე 4x Tesla P40 (96GB საერთო VRAM) დინამიური ჩატვირთვის გამოყენებით. თვით- ჰოსტინგისთვის, ერთი 24GB GPU შეიძლება ერთდროულად მოემსახურება 3-5 მოდელებს.

ბევრი მოდელი უზრუნველყოფს Docker- ის ოფიციალურ გამოსახულებებს ან Dockerfiles- ს. მრავალი მოდელის მუშაობისთვის შეგიძლიათ შექმნათ Docker- ის ინდივიდუალური კონფიგურაცია NVIDIA Container Toolkit- ით GPU- ს წვდომისთვის. ჩვენი API სერვერის არქიტექტურა შეიძლება იყოს რეფერენტული განხორციელება.

უმეტესობა მოდელის საჭიროებს Python 3.10-3.12. Coqui TTS (VITS)-ს განსაკუთრებით სჭირდება Python 3.11. ჩვენ გირჩევთ Python 3.12-ს უმეტესობის მოდელისთვის. შეამოწმეთ ყველა მოდელის requirements.txt სწორი ვერსიის შესაფერილობისთვის.

დიახ. MIT და Apache 2.0 ლიცენზიები ნათლად ითვალისწინებს კომერციულ გამოყენებას. თქვენ შეგიძლიათ შექმნათ SaaS პროდუქტები, მობილური პროგრამები, თამაში და სერვისები ამ მოდელების გამოყენებით, ლიცენზიის საფასურის, უფლებამოსილების ან მითითების გარეშე (თუმცა მითითება ფასდება).
5.0/5 (1)

ჲბპარნარა ჟთ ჲბაგვჟრ ნთ ოჲმადა ეა ჟოპაგთმ ოპჲბლვმთრვ.

გამოსცადეთ TTS დღეს

20+ ღია კოდის მოდელი, ყველა კომერციულად ლიცენზირებული. გამოიყენეთ ჩვენი API ან თვით-ჰოსტი - არჩევანი თქვენია.