& Бұл туралы

Ең кең ауқымды ашық кодты дауыс AI платформасы. 20+ модель, 100+ дауыс, бәрі бір жерде.

Құрған

TTS.ai құрастырған John Nader (nadermx), TTS.ai - бұл ашық көзді ДЖ құралдарын құрушы тәуелсіз бағдарлама. TTS.ai - бұл ең жақсы ДЖ дауыс технологиясын әркімге қолжетімді ету миссиясының бір бөлігі - сатушыға тәуелділік жоқ, деректерді жинау жоқ, тек күшті дауыс технологиясы әділ бағамен.

Біздің миссиямыз

TTS.ai қарапайым сенімге негізделген: ең жақсы ДЖ дыбыс технологиясы әркімге қолжетімді болуы керек. Пропионерлік қызметтер текст-то-слов үшін премиум бағаны талап етсе, ашық көздер қауымдастығы коммерциялық сапаға тең немесе одан да жоғары үлгілерді жасады.

Біз ең жақсы ашық көзді дыбыс ДЖ моделдерін бірыңғай, қолдануға оңай платформаға біріктіреміз. Өндірушіге тәуелділік жоқ. Деректерді жинау жоқ. Тек күшті дыбыс технологиясы және әділ баға.

Біз не ұсынамыз

Мәтінді сөйлеуге

Kokoro, Chatterbox, Bark және т.б. 20+ үлгісі. Жедел жеңіл синтездеуден студиялық сапалы шығаруға дейін.

Сөйлемді мәтінге

Whisper, Faster-Whisper және SenseVoice-пен жұмыс істейді. Аудио 100-ден астам тілде уақыт белгісімен және сөйлеушіні анықтаумен транскрипциялаңыз. Name

Дыбысты көшіру

5 секундтық үлгіден кез келген дауысты клондау. Chatterbox, GPT- SoVITS, CosyVoice 2 және басқалары. Жобаларыңыз үшін жеке дауыстарды құру. Name

Дыбыс өңдеуName

Дыбысты жақсарту, вокалдарды өшіру, стемдерді бөлу, ехо/реверберацияны өшіру, клавиш/БПМ-ді анықтау және пішімдерді аудару. Барлығы ДНҚ-мен қамтамасыз етілген.

Дыбыс төңкерісіName

ДНҚ-мен тікелей сөйлесу. Интерактивті әңгімелесу үшін өзіңіздің модельді және дауысты таңдаңыз.

Жасаушылар API

OpenAI-ге үйлесімді REST API. Python SDK, код мысалдары және толық құжаттама. Қолданбаңызға дыбыс мүмкіндіктерін құрыңыз. Name

Бастапқы коды ашық

TTS.ai-дегі әрбір модель ашық кодты, MIT немесе Apache 2.0 лицензиясымен лицензияланған. Біз ашықтыққа және қауымдастықпен басқарылатын инновацияларға сенеміз.

Біз жасаймыз

Kokoro
Chatterbox
CosyVoice 2
Bark
Orpheus
Piper
VITS
MeloTTS
StyleTTS2
Tortoise
GLM-TTS
Dia
Sesame CSM
Spark
Qwen3-TTS
Whisper
Demucs
және тағы басқа...

Барлық үлгі салмақтары олардың ресми репозиторияларынан жүктеліп алынады. Біз ешбір заңды өзгерістерді қоспаймыз.

Инфрақұрылымы

TTS.ai NVIDIA Tesla P40 графикалық процессорлары бар арнайы графикалық процессор серверлерінде жұмыс істейді (жалпы 96 ГБ VRAM). Біздің инфрақұрылымымыз төмен кешіктіру және жоғары өткізгіштік үшін жасалған:

  • Индукция үшін арнайы графикалық процессор кластері - ортақ ресурстар жоқ
  • Модельдің VRAM талаптарына негізделген динамикалық GPU бөлу
  • Оптимальды өткізгіштік үшін 5- кезекті артықшылық жүйесі
  • VRAM- ға алдын- ала жүктелген модельдер бірден есептеу үшін
  • CDN қолдауымен жылдам жүктеп алу үшін аудио жеткізу

Дербестік пен қауіпсіздік

  • Деректерді үйретуі жоқ: Модельдерді үйрету үшін аудио не мәтініңізді ешқашан қолданбаймыз
  • Автоөшіру: Жасалған аудио 24 сағаттан кейін автоматты түрде өшіріледі
  • Шифрлау: Барлық деректер тасымалдау (TLS 1. 2+) және сақтау кезінде шифрланады
  • Бақылаусыз: Біз жасаймыз
  • GDPR сәйкесті: Қай уақытта да деректеріңізді сұрау немесе өшіру

TTS.ai туралы жиі қойылатын сұрақтар

TTS.ai-ді Джон Надер (nadermx) жасады, ол әркімге қолжетімді AI дауыс технологиясын жасауға ұмтылған тәуелсіз бағдарламашы. Біз меншік иелерімен жұмыс істеуден гөрі, қоғамдастықтан ең жақсы ашық көз моделдерін құрастырып, қызмет көрсетеміз.

Біздің инфрақұрылымымыз NVIDIA Tesla P40 графикалық процессорлары мен 96 ГБ VRAM-мен жабдықталған арнайы серверлерде жұмыс істейді. Веб-фронтенд пен графикалық процессордың индукциялық серверлері қауіпсіз деректер орталықтарында орналасады.

Біз деректерді сақтауды азайтамыз. Мәтін енгізілімдер нақты уақытта өңделеді, тұрақты түрде сақталмайды. Барлық жүктеп алынған және құрылған аудио файлдар 24 сағат ішінде автоматты түрде өшіріледі. Біз деректеріңізді ДНҚ модельдерін үйрету үшін ешқашан қолданбаймыз.

TTS.ai әлем бойынша дамып келе жатқан бағдарламашылар, контент жасаушылар және бизнес қауымдастығына қызмет көрсетеді. Біздің платформамыз күн сайын 20-дан астам ЖІ моделі арқылы мыңдаған дауыс генерациялау сұраныстарын өңдейді.

Біз өзінің арнайы GPU инфрақұрылымы мен 5- кезекті артықшылық жүйесімен жоғары қолжетімділікке ұмтыламыз. Біз тегін деңгейдегі пайдаланушыларға ресми SLA ұсынбағанымен, төлемді жоспарлар артықшылықты өңдеуден және жоғары сенімділіктен пайда табады.

Иә. TTS.ai- дің әрбір моделі ашық кодты, MIT немесе Apache 2. 0 лицензиясымен. Біз ашық кодты дыбыс ДЖ қауымдастығын белсенді түрде қолдаймыз және экожүйеге оптимизациялау мен интеграциялауды қосамыз.

Біздің жол картамызға жаңа заманауи модельдерді шығару, тілдерді қолдауды кеңейту, шынайы уақыттағы дауыс чат мүмкіндіктерін жақсарту және аудио өңдеу құралдарын құру кіреді. Біз ашық көздердегі дауыс ДЖ-нің соңғы жетістіктерін үнемі интеграциялаймыз.

TTS.ai-ді бір-ақ адам құрып, жетілдіріп отыр, сондықтан бос жұмыс орындары жоқ. Бірақ ашық кодқа үлес қосу әрқашан да құпия — қатынас беті немесе GitHub арқылы хабарласыңыз.

Иә, біз сөздік ДЖ-ны өз өнімдеріне енгізгісі келетін бағдарламашылар, бизнес және ұйымдармен ынтымақтастықты қолдаймыз. API интеграциясы, көлемді бағалау немесе жеке модельді енгізу туралы әңгімелесу үшін бізге хабарласыңыз.

Біз өзіміздегі инфрақұрылымды үнемі тексереміз. Барлық деректерді тасымалдау кезінде TLS 1. 2+ шифрлауымен шифрлайды, парольдер өнеркәсіптік стандартты алгоритмге сәйкес хештеледі, API кілттер біржақты хешті қолданады. Серверге тек рұқсат етілген адамдар ғана SSH кілттер арқылы кіре алады.

TTS.ai GDPR-ға сәйкес келеді және деректерді азайтудың принциптерін ұстанады. Біз жеке аудио деректерді 24 сағаттан артық сақтамаймыз, клиенттердің деректерін оқыту үшін қолданбаймыз және сұраныс бойынша деректерге толық қол жеткізу, түзету және өшіру құқығын ұсынамыз.

Біз ашық дереккөздегі дауысты ДЖ-ны үнемі қадағалап отырамыз және олар қолжетімді болып, сапасын дәлелдеген сайын жаңа модельдерді қосамыз. Үлкен модельдер әдетте айына бір рет жаңартылып, кішігірім оптимизациялар тұрақты түрде енгізіледі.