თავისუფალი AI ტექსტიდან საუბარიName
27+ ჲრგჲპვნთ მჲევლთ, 219+ დლაჟჲგვ, 33+ ენა. ანგარიში არ არის საჭირო.
ყველაფერი რაც გჭირდებათ ხმოვანი AI- ისთვისName
30+ ინსტრუმენტი ღია კოდის ხელოვნური ინტელექტის მოდელებით
27+ AI ხმის მოდელები
ყველაზე სრულყოფილი ღია კოდის TTS მოდელის კოლექცია ერთ პლატფორმაზე
Kokoro Free
Kokoro არის 82 მილიონი პარამეტრის ტექსტიდან საუბრის მოდელირება, რომელიც მაღლა დგას თავისი წონის კლასში. მიუხედავად მისი მცირე ზომისა, ის წარმოქმნის შესანიშნავად ბუნებრივ და გამოხატულ საუბარს. Kokoro მხარს უჭერს მრავალ ენას, მათ შორის ინგლისურს, იაპონურს, ჩინურსა და კორეულს, სხვადასხვა გამოხატული ხმით. ის მუშაობს მართლაც სწრაფად - აუდიოს წარმოქმნა 100-ჯერ სწრაფად ხდება ვიდრე რეალურ დროში GPU- ზე.
საუკეთესო: მაღალი ხარისხის TTS მინიმალური დაგვიანებით, სტრიმინგის პროგრამები
უფასო
Piper Free
Piper არის მცირე ზომის ტექსტიდან საუბრის მოდული, რომელიც Rhasspy- მ შექმნა და რომელიც VITS და larynx არქიტექტურას იყენებს. ის სრულად მუშაობს CPU- ზე, რაც მას იდეალურს ხდის edge მოწყობილობებისთვის, სახლის ავტომატიზაციისთვის და პროგრამებისთვის, რომლებსაც სჭირდებათ ონლაინ TTS. 100- ზე მეტი ხმით 30+ ენაზე, Piper აწვდის ბუნებრივად ჟღერილ საუბარს რეალურ დროში, Raspberry Pi 4- ზეც კი.
საუკეთესო: სწრაფი წინასწარ ნახვა, ხელმისაწვდომობა და ჩაშენებული პროგრამებიName
უფასო
VITS Free
VITS (Variation Inference with adversarial learning for end- to- end Text- to- Speech) არის პარალელური end- to- end TTS მეთოდი, რომელიც უფრო ბუნებრივ ხმებს ქმნის, ვიდრე მიმდინარე ორპროცენტიანი მოდელები. იგი იყენებს ვარიაციულ დასკვნას, რომელიც გაძლიერებულია ნორმალიზებული ნაკადებით და წინააღმდეგობრივი სწავლების პროცესით, რაც ბუნებრივობის მნიშვნელოვან გაუმჯობესებას იძლევა.
საუკეთესო: ტერმინალის პარამეტრებიName
უფასო
MeloTTS Free
MeloTTS by MyShell. ai არის მრავალენოვანი TTS ბიბლიოთეკა, რომელიც მხარს უჭერს ინგლისურს (ამერიკულს, ბრიტანულს, ინდოურს, ავსტრალიურს), ესპანურს, ფრანგულს, ჩინურს, იაპონურს და კორეულს. ის ძალიან სწრაფია, ტექსტი რეალურ დროში თითქმის რეალურ სიჩქარეზე მუშავდება მხოლოდ პროცესორზე. MeloTTS შექმნილია პროდუქციული გამოყენებისთვის და მხარს უჭერს როგორც CPU, ასევე GPU- ს დასკვნას.
საუკეთესო: პროდუქციული პროგრამები, რომლებსაც სჭირდებათ სწრაფი, მრავალენოვანი TTS
უფასო
OuteTTS Free
OuteTTS ზრდის დიდი ენის მოდელს ტექსტიდან საუბრის შესაძლებლობებით, მაგრამ ქმნის ორიგინალურ არქიტექტურას. ის მხარს უჭერს მრავალ უკანელებს, მათ შორის llama.cpp (CPU/GPU), Hugging Face Transformers, ExLlamaV2, VLLM და ბრაუზერის დასკვნას Transformers.js-ის საშუალებით. აქვს ნულოვანი გასროლის ხმათა კლონირება JSON-ის სახით შენახული საუბრის პროფილების საშუალებით.
საუკეთესო: Edge განთავსება, ბრაუზერის დაფუძნებული TTS, დაბალი რესურსების გარემო
უფასო
Pocket TTS Free
Pocket TTS Kyutai- ს მიერ (Moshi- ს შემქმნელები) არის კომპაქტური 100M პარამეტრის ტექსტიდან საუბრის მოდელი, რომელიც ძლიერია თავისი წონის მიხედვით. ის ეფექტურად მუშაობს CPU- ზე, უჭერს მხარს ნულოვანი გასროლის ხმათა კლონირებას ერთი აუდიოს ნიმუშიდან და წარმოქმნის ბუნებრივად ჟღერებულ საუბარს. პატარა მოდელის ზომა იდეალურია საზღვაო განლაგებისთვის და დაბალი რესურსების მქონე გარემოებისთვის.
საუკეთესო: ადვილი განთავსება, მხოლოდ პროცესორით მუშაობა, სწრაფი ხმის კლონირება
უფასო
Kitten TTS Free
Kitten TTS by KittenML is an ultra-lightweight text-to-speech model built on ONNX. With variants from 15M to 80M parameters (25-80 MB on disk), it delivers high-quality voice synthesis on CPU without requiring a GPU. Features 8 built-in voices, adjustable speech speed, and built-in text preprocessing for numbers, currencies, and units. Ideal for edge deployment and low-latency applications.
საუკეთესო: Fast lightweight TTS, edge deployment, low-latency applications
უფასო
Bark Standard
ტრანსფორმატორზე დაფუძნებული ტექსტი-აუდიო მოდელი, რომელიც ქმნის რეალისტურ საუბარს, მუსიკას და ხმაურიან ეფექტებს.
პროგრამისტი: Suno · ლიცენზია: MIT
ჲოთრაი.
Bark Small Standard
Bark- ის მსუბუქი ვერსია სწრაფი დასკვნით და მცირე მეხსიერების გამოყენებით. Name
პროგრამისტი: Suno · ლიცენზია: MIT
ჲოთრაი.
CosyVoice 2 Standard
Alibaba-ს მასშტაბური სტრიმინგი TTS ადამიანის-პარიტეტის ბუნებრივობით და ახლოს ნულოვანი ლოდინით.
პროგრამისტი: Alibaba (Tongyi Lab) · ლიცენზია: Apache 2.0
ჲოთრაი.
Dia TTS Standard
Multi-სიმღერალი დიალოგის გენერაციის მოდელი, რომელიც ქმნის ბუნებრივ საუბარს საუბრის დროს.
პროგრამისტი: Nari Labs · ლიცენზია: Apache 2.0
ჲოთრაი.
Parler TTS Standard
ოპთკაზთ დლაჟა კჲ£ ჟაკაქ ნა ბთჲლჲზთფვნ ჱბჲპ თ ოაპლვპ ვ დჲ ჟჲჱეაევ ჟჲგპქვნთჲრ დლაჟ.
პროგრამისტი: Hugging Face · ლიცენზია: Apache 2.0
ჲოთრაი.
GLM-TTS Standard
იღებს ყველაზე დაბალ სიმბოლოების შეცდომის მაჩვენებელს ღია კოდის TTS მოდელებში.
პროგრამისტი: Zhipu AI · ლიცენზია: GLM-4 License
ჲოთრაი.
IndexTTS-2 Standard
ნვპჲ-ჟრპვლკა ჟ ჟთლვნ ვმჲუთჲნალვნ კჲნრპჲლ თ გთჟჲკა თჱპაჱნჲჟრ.
პროგრამისტი: Index Team · ლიცენზია: Bilibili Model License
ჲოთრაი.
Spark TTS Standard
TTS-ის ხმის კლონირება კონტროლირებადი ემოციებითა და საუბრის სტილითა და მითითებებით.
პროგრამისტი: SparkAudio · ლიცენზია: CC BY-NC-SA 4.0
ჲოთრაი.
GPT-SoVITS Standard
ნწკჲლკჲ ჟნთმკთ ჱა დლაჟჲგჲ კლჲნთპანვ ნა ჟთლთკჲნჲგთ ოპთვმაფთ, კჲთრჲ ოპვგყპქგარ გჟთფკთ დლაჟჲგთ ჟყჲბღვნთწ ჟამჲ ჲრ 5 ჟვკსნეთ ჱგსკ.
პროგრამისტი: RVC-Boss · ლიცენზია: MIT
ჲოთრაი.
Orpheus Standard
ჟვმვ£ჟრგჲრჲ ჟთ ჟვ ჲბსფთლჲ ნა 100 000 ფაჟა დჲგჲპვნთ ეანჲგთ.
პროგრამისტი: Canopy Labs · ლიცენზია: Llama 3.2 Community
ჲოთრაი.
Qwen3 TTS Standard
Alibaba-ს მრავალენოვანი TTS ხმათა კლონირებასთან, წინასწარ დაყენებული ხმაებით და ხმათა დიზაინით ტექსტიდან.
პროგრამისტი: Alibaba (Qwen) · ლიცენზია: Apache 2.0
ჲოთრაი.
Chatterbox Turbo Standard
2000 წელს ფილმმა მიიღო ოქროს მედალი ოსკარზე, ოსკარის 200-ე დაჯილდოების ცერემონიალზე.
პროგრამისტი: Resemble AI · ლიცენზია: MIT
ჲოთრაი.
VoxCPM Standard
2001 წლის აღწერის მონაცემებით სოფელში ცხოვრობს 441 ადამიანი. ↑ Численность населения по населённым пунктам Республики Башкортостан
პროგრამისტი: OpenBMB · ლიცენზია: Apache 2.0
ჲოთრაი.
VibeVoice Standard
Microsoft-ის მოდელი ხანგრძლივი ფორმის multi-speaker შინაარსისთვის, როგორიცაა podcasts და audiobooks.
პროგრამისტი: Microsoft · ლიცენზია: MIT
ჲოთრაი.
CosyVoice3 Standard
Next-generation multilingual TTS with bi-streaming, emotion control, and zero-shot voice cloning.
პროგრამისტი: Alibaba (FunAudioLLM) · ლიცენზია: Apache 2.0
ჲოთრაი.
CosyVoice 2
Alibaba-ს მასშტაბური სტრიმინგი TTS ადამიანის-პარიტეტის ბუნებრივობით და ახლოს ნულოვანი ლოდინით.
ენა: en, zh, ja, ko, fr, de, it, es
ხმა
GLM-TTS
იღებს ყველაზე დაბალ სიმბოლოების შეცდომის მაჩვენებელს ღია კოდის TTS მოდელებში.
ენა: en, zh
ხმა
Spark TTS
TTS-ის ხმის კლონირება კონტროლირებადი ემოციებითა და საუბრის სტილითა და მითითებებით.
ენა: en, zh
ხმა
GPT-SoVITS
ნწკჲლკჲ ჟნთმკთ ჱა დლაჟჲგჲ კლჲნთპანვ ნა ჟთლთკჲნჲგთ ოპთვმაფთ, კჲთრჲ ოპვგყპქგარ გჟთფკთ დლაჟჲგთ ჟყჲბღვნთწ ჟამჲ ჲრ 5 ჟვკსნეთ ჱგსკ.
ენა: en, zh, ja, ko
ხმა
Tortoise TTS
Multi-voice text-to-speech-ი, რომელიც ფოკუსირებულია ხარისხზე ავტორეგრესული არქიტექტურის გამოყენებით.
ენა: en
ხმა
OpenVoice
მყისიერი ხმის კლონირება სტილის, ემოციისა და აქცენტის კონტროლით.
ენა: en, zh, ja, ko, fr, de, es, it
ხმა
Qwen3 TTS
Alibaba-ს მრავალენოვანი TTS ხმათა კლონირებასთან, წინასწარ დაყენებული ხმაებით და ხმათა დიზაინით ტექსტიდან.
ენა: en, zh, ja, ko, de, fr, ru, pt, es, it
ხმა
Chatterbox Turbo
2000 წელს ფილმმა მიიღო ოქროს მედალი ოსკარზე, ოსკარის 200-ე დაჯილდოების ცერემონიალზე.
ენა: en
ხმა
VoxCPM
2001 წლის აღწერის მონაცემებით სოფელში ცხოვრობს 441 ადამიანი. ↑ Численность населения по населённым пунктам Республики Башкортостан
ენა: en, zh
ხმა
OuteTTS
LLM-ზე დაფუძნებული TTS, რომელიც მუშაობს CPU, GPU, ან ბრაუზერის მეშვეობით llama.cpp და Transformers.js.
ენა: en
ხმა
CosyVoice3
Next-generation multilingual TTS with bi-streaming, emotion control, and zero-shot voice cloning.
ენა: en, zh, ja, ko, de, es, fr, it, ru
ხმაპროგრამისტების API
OpenAI- სთან თავსებადი REST API. ერთი დასასრული, 22+ მოდელი. რეალურ დროში პროგრამების მხარდაჭერა.
- OpenAI- სთან თავსებადი ფორმატი
- რეალურ დროში TTS-ის გადაცემა პროგრამებისთვის
- დიდი დავალებებიName
- შეტყობინებები
pip install ttsai
npm install @ttsainpm/ttsai
from tts_ai import TTSClient
client = TTSClient(api_key="sk-tts-xxx")
audio = client.generate(
text="Hello from TTS.ai!",
model="kokoro",
voice="af_bella",
)
client.save(audio, "output.mp3")
მარტივი, გამჭვირვალე ფასი
ჱაოჲფგამვ ჟგჲბჲენჲ.
თავისუფალი
15 ქულა
- Kokoro, Piper, VITS, MeloTTS
- სიმბოლოების საზღვარი
- 3 გენ/საათი (ანგარიშის გარეშე)
პროფესიონალი
2000 კრედიტი/თვე
- ყველაფერი დამწყებთათვის
- API წვდომა
- მიმდინარე პროცესი
ბიზნესი
10,000 კრედიტი/თვე
- გჟთფკჲ ვ ოპჲტვჟთჲნალნჲ
- მასობრივი API
- პრიორიტეტის რიგი
ხშირად დასმული კითხვები
ჲბპარნარა ჟთ ჲბაგვჟრ ნთ ოჲმადა ეა ჟოპაგთმ ოპჲბლვმთრვ.
AI ხმა დღესვე დაიწყეთ
TTS.ai-ის გამოყენებით შექმნილთა, განვითარებლებისა და ბიზნესების გაერთიანება