ინფორმაცია

20+ მჲევლა, 100+ დლაჟჲგვ, გჟთფკჲ ნა ვეთნჲ მწჟრჲ.

შექმნილია

TTS.ai-ს შექმნა John Nader (nadermx), თავისუფალი პროგრამისტი, რომელიც ქმნის ღია კოდის ხელოვნური ინტელექტის ინსტრუმენტებს. TTS.ai არის მისიის ნაწილი, რომ ყველასთვის ხელმისაწვდომი გახადოს საუკეთესო ხელოვნური ინტელექტის ხმის ტექნოლოგია — არანაირი მყიდველის დამოკიდებულება, არანაირი მონაცემების შეგროვება, მხოლოდ ძლიერი ხმის ტექნოლოგია ღირსეულ ფასად.

ნაქარა მთჟთწ

TTS.ai იყო აგებული მარტივ რწმენაზე: საუკეთესო AI ტექნოლოგია უნდა იყოს ხელმისაწვდომი ყველასთვის.. Text-to-Speech-ის ძირითადი სერვისების ფასები მაღალია, მაგრამ ღია კოდის საზოგადოებამ შექმნა მოდელები, რომლებიც შეესაბამება ან აღემატება კომერციულ ხარისხს.

ჟყბთპამვ ნაი-ეჲბპთრვ ჲრგჲპვნთ დლაჟჲგთ თჱმთჟლვნთ მჲევლთ გ ვეთნჟრგვნა, ლვჟნა ჱა ოჲლჱგანვ ოლარტჲპმა. ბვჱ ოპჲეაგაფთ, ბვჱ ჟყბთპანვ ნა ეანნთ. ჟამჲ მჲღნა დლაჟჲგა რვჳნჲლჲდთწ ჟ ფვჟრნთ უვნთ.

ქრჲ ოპჲოჲნსამვ

ტექსტიდან საუბარიName

20+ მოდელი, მათ შორის Kokoro, Chatterbox, Bark და სხვა. სწრაფი და მსუბუქი სინთეზიდან სტუდიის ხარისხის გამონატანამდე.

საუბრის ტექსტად გადამუშავებაName

Whisper- ის, Faster- Whisper- ის და SenseVoice- ის მხარდაჭერით. აუდიოს ტრანსკრიფცია 100+ ენაზე დროის ნიშნებითა და საუბრის აღქმით. Name

ხმის კლონირებაName

ნებისმიერი ხმის კლონირება 5 წამიანი ნიმუშიდან. Chatterbox, GPT-SoVITS, CosyVoice 2 და სხვა. საკუთარი ხმის შექმნა თქვენი პროექტებისთვის.

აუდიოს დამუშავებაName

აუდიოს გაუმჯობესება, ვოკალების წაშლა, სტრიმების გაყოფა, ხმაურის/რევერბრის წაშლა, კლავიშების/BPM-ის აღმოჩენა და ფორმატების გადაყვანა. ყველა ეს კეთდება ხელოვნური ინტელექტით.

ხმაურიანი ჩატიName

რეალურ დროში ხმაურიანი საუბრები ხელოვნური ინტელექტით. აირჩიეთ თქვენი მოდელი და ხმა ინტერაქტიული საუბრის გამოცდილებისთვის.

პროგრამისტების API

OpenAI- სთან თავსებადი REST API. Python SDK, კოდის მაგალითები და სრული დოკუმენტაცია. თქვენი პროგრამების ხმის ფუნქციების შემუშავება.

პირველი ღია კოდი

გჟთფკთ მჲევლთ ნა TTS.ai ჟა ჲრგჲპვნ ჟჲპჟ, ლთუვნჱთპანთ ჲრ MIT თლთ Apache 2.0. გწპგამვ გ ოპჲჱპაფნჲჟრრა თ თნჲგაუთთრვ ნა ჲბღვჟრგჲრჲ.

ნვ ჟმვ.

Kokoro
Chatterbox
CosyVoice 2
Bark
Orpheus
Piper
VITS
MeloTTS
StyleTTS2
Tortoise
GLM-TTS
Dia
Sesame CSM
Spark
Qwen3-TTS
Whisper
Demucs
თ ჲღვ...

ყველა მოდელის წონა მათი ოფიციალური საცავებიდან არის ჩამოტვირთული. ჩვენ არანაირ საკუთარ ცვლილებას არ ვამატებთ.

ინფრასტრუქტურაName

TTS.ai მუშაობს განკუთვნილ გრაფიკული პროცესორის სერვერებზე NVIDIA Tesla P40 გრაფიკული პროცესორებით (96GB VRAM საერთო). ჩვენი ინფრასტრუქტურა შექმნილია დაბალი ლოდინისა და მაღალი სიჩქარისთვის:

  • განკუთვნილი GPU კლასტერები დასკვნისათვის - საერთო რესურსების არარსებობა
  • დინამიური გრაფიკული პროცესორის განლაგება მოდელის VRAM მოთხოვნების მიხედვით
  • ოპტიმალური გამტარობისთვის 5- რიგის პრიორიტეტული სისტემა
  • მოდელები წინასწარ ჩატვირთულია VRAM- ში მყისიერი დასკვნების გასაკეთებლად
  • CDN-ით მხარდაჭერილი აუდიო გადაცემა სწრაფი ჩამოტვირთვისთვის

პირადი და უსაფრთხოებაName

  • მონაცემთა ტრენინგის გარეშე: ნთკჲდა ნვ თჱოჲლჱგამვ ჱგსკ თლთ რვკჟრ, ჱა ეა რპვნთპამვ მჲევლთ.
  • ავტომატური წაშლა: აუდიო 24 საათის შემდეგ ავტომატურად წაიშლება
  • დაშიფვრა: ყველა მონაცემი შიფრირებულია ტრანსპორტირებისას (TLS 1. 2+) და შენახვისას
  • უგულებელყოფა: ნვ ჟმვ.
  • GDPR თავსებადი: ნებისმიერ დროს მონაცემების მოთხოვნა ან წაშლა

TTS.ai-ის შესახებ

TTS.ai შექმნა ჯონ ნაიდერმა (nadermx), დამოუკიდებელმა პროგრამისტმა, რომელიც ყველასთვის ხელმისაწვდომი AI ხმის ტექნოლოგიის შექმნას ცდილობს. ჩვენ გვინდა, რომ საზოგადოების საუკეთესო ღია კოდის მოდელებს მივმართოთ, ვიდრე პატრონიკურ მოდელებს.

ჩვენი ინფრასტრუქტურა მუშაობს განკუთვნილ სერვერებზე NVIDIA Tesla P40 გრაფიკული პროცესორებით, რომლებიც 96GB VRAM- ს უზრუნველყოფენ. ვებ ინტერფეისი და გრაფიკული პროცესორის ინფერენციის სერვერები დაცულ მონაცემთა ცენტრებს უმასპინძლდებიან დაბალი ლოდინის კავშირით.

ჩვენ მონაცემთა შენახვას მინიმუმამდე ვამცირებთ. ტექსტი რეალურ დროში მუშავდება და არ ინახება მუდმივად. ყველა ჩატვირთული და შექმნილი აუდიო ფაილი ავტომატურად იშლება 24 საათის განმავლობაში. ჩვენ არასდროს არ ვიყენებთ თქვენს მონაცემებს ხელოვნური ინტელექტის მოდელების შესასწავლად.

TTS.ai-ი ოჲეეყპზა ოპჲგრვჟთპაღა ჟყჲბღვჟრგვნჲჟრ ნა ოპჲგრვჟთპარვლთ, ჟყდლაჟნთ ჟყჱეაგაღთ თ ბთჱნვჟთ გჟწკაევ ოჲ ჟგვრა. ნაქარა ოლარტჲპა ჟვ ჲოპაგწ ჟ ჳთლწეთ ჱაოთჟკთ ჱა დლაჟჲგჲ დვნვპთპანვ გყპჳს 20+ თნრვლვკრსალნთ მჲევლა.

ჩვენ ვცდილობთ მივაღწიოთ მაღალი ხელმისაწვდომობას ჩვენი განკუთვნილი GPU ინფრასტრუქტურით და 5- რიგის პრიორიტეტული სისტემით. მიუხედავად იმისა, რომ ჩვენ არ ვთავაზობთ ფორმალს SLA- ს უფასო მომხმარებლებისთვის, გადახდილი გეგმები სარგებლობენ პრიორიტეტული დამუშავებისა და უფრო მაღალი საიმედოობისგან.

ეა, გჟთფკთ მჲევლთ ნა TTS.ai ჟა ჲრგჲპვნთ, ლთუთნჱთპანთ ოჲ ჟყდლაჟთვ ნა MIT თლთ აპაფვ 2.0. აკრთგნჲ ოჲეეპზამვ ჲრგჲპვნთრვ ჟყჲბღვჟრგა ჱა დლაჟჲგთ თნრვლვკრსალნთ ჟთჟრვმთ თ ეაგამვ ჟთ ოპთნჲჟ ჱა ჲოვრთმთჱთპანვ თ თნრვდპთპანვ გ ვკჲჟთჟრვმარა.

ჩვენი გეგმა მოიცავს ახალი მოდელის დამატებას, როგორც კი ის გამოვა, ენის მხარდაჭერის გაფართოებას, რეალურ დროში საუბრის შესაძლებლობების გაუმჯობესებას და აუდიოს პროცესირების ინსტრუმენტების გაზრდას. ჩვენ მუდმივად ინტეგრირებთ ბოლოდროინდელ ღია კოდის ხმოვანი AI-ის განვითარებას.

TTS.ai-ს აშენებს და არეგულირებს ერთი პროგრამისტი, ამიტომ არ არსებობს თავისუფალი პოზიციები. თუმცა, ღია კოდის წვლილი ყოველთვის სასიამოვნოა — დაგვიკავშირდით კონტაქტების გვერდზე ან GitHub-ზე.

დიახ, ჩვენ მივესალმებით პარტნიორობას დეველოპერებთან, ბიზნესებთან და ორგანიზაციებთან, რომლებიც ეძებენ ხმის AI- ს ინტეგრირებას თავიანთ პროდუქტებში. დაგვიკავშირდით API ინტეგრაციის, მოცულობის ფასების ან ინდივიდუალური მოდელის განთავსების შესახებ.

ჩვენ რეგულარულად ვატარებთ უსაფრთხოების შემოწმებას ჩვენს ინფრასტრუქტურაზე. ყველა მონაცემი გადაცემისას შიფრირებულია TLS 1. 2+- ით, პაროლები ჰეშირებულია ინდუსტრიული სტანდარტული ალგორითმებით, და API გასაღები იყენებს ერთმხრივ ჰეშს. სერვერის წვდომა შეზღუდულია უფლებამოსილი პერსონალისთვის SSH გასაღების საშუალებით.

TTS.ai არის GDPR- ის თავსებადი და მიჰყვება მონაცემთა მინიმალიზაციის პრინციპებს. ჩვენ არ ვინახავთ პირად აუდიო მონაცემებს 24 საათზე მეტხანს, არ ვიყენებთ კლიენტის მონაცემებს ტრენინგისთვის და უზრუნველვყოფთ სრულ მონაცემთა წვდომას, კორექციას და წაშლის უფლებას მოთხოვნის შემთხვევაში.

ჩვენ მუდმივად ვაკონტროლებთ ღია წყაროს ხმოვანი AI-ის გარემოს და ვამატებთ ახალ მოდელს, როდესაც ისინი ხელმისაწვდომი ხდება და მათი ხარისხის დადასტურება ხდება. ძირითადი მოდელის განახლებები ჩვეულებრივ ხორციელდება ყოველთვიურად, მცირე ოპტიმიზაციებით, რომლებიც მიმდინარეობს.