Free AIName Мәтінді сөйлеугеName

20+ ашық кодты модельдер, 107+ дауыстар, 32+ тілдер. Тіркелгі керек емес.

1K+
жасаушылары
2K+
генерациялар
20+
AI үлгілері
107+
дауыс
0/500 таңбалар Бос
5,000 chars per generation 15000 бос таңба Кредиттік карта жоқ Коммерциялық пайдалануға рұқсат
Sign up free
0:00 / 0:00
Аудио жүктеп алу Сілтеменің мерзімі 24 сағаттан кейін аяқталады
TTS.ai сізге ұнады ма? Достарыңызға хабарлаңыз!

Дыбыстық жасанды интеллект үшін қажет барлық нәрсеName

30+ құрал ашық-көздерінде жасанды интеллект моделдеріне негізделген

20+ AI дауыс үлгілері

Бір платформадағы ашық кодты TTS модельдерінің ең толық жинағыName

KokoroKokoro Free

Kokoro - 82 миллион параметрлі мәтіннен сөйлеуге көшіру моделі, ол өзінің салмақ дәрежесінен әлдеқайда артық жұмыс істейді. Шағын өлшеміне қарамастан, ол таңқаларлықтай табиғи және эмоционалды сөйлеуді шығарады. Kokoro ағылшын, жапон, қытай және корей сияқты бірнеше тілдерді қолдайды және әртүрлі эмоционалды дауыстарды шығарады. Ол өте жылдам жұмыс істейді - графикалық процессордағы нақты уақыттағыдан 100 есе жылдам дыбыс шығарады.

Келесіге ең қолайлы: Жоғары сапалы, минималды кешіктіруі бар TTS, ағындық қолданбаларName

Тегін сынау

PiperPiper Free

Piper - Rhasspy жасаған, VITS және larynx архитектураларын қолданатын жеңіл мәтін- дыбыс аудару тетігі. Ол тек процессорда жұмыс істейді, сондықтан Edge құрылғылары, үй автоматтандыруы және офлайн TTS қажет қолданбалар үшін өте қолайлы. 30- дан астам тілдегі 100- ден астам дауысымен Piper Raspberry Pi 4- те де шынайы дыбыстарды шын уақыт режимінде жеткізеді.

Келесіге ең қолайлы: Жедел нобайлау, қолжетімділік және ендірілген қолданбаларName

Тегін сынау

VITSVITS Free

VITS (Variation Inference with adversarial learning for end- to- end Text- to- Speech) - қазіргі екі сатылы үлгілерге қарағанда табиғи естілетін дыбыстарды шығаратын параллельді, аясынан аяғына дейінгі TTS әдісі. Ол табиғилықты едәуір жақсартуға мүмкіндік беретін, қалыпқа келтіру ағымдары мен қарсылас оқыту процесімен толықтырылған вариациялық инференцияны қолданады.

Келесіге ең қолайлы: Табиғи интонациясы бар жалпы мақсаттағы мәтін- дыбыс аударғышName

Тегін сынау

MeloTTSMeloTTS Free

MyShell. ai жасаған MeloTTS - ағылшын (американдық, британдық, үнді, австралиялық), испан, француз, қытай, жапон және корей тілдерін қолдайтын көп тілді TTS жиыны. Оның жылдамдығы өте жоғары, тек процессордың жылдамдығымен мәтіндерді өңдейді. MeloTTS өндірістік қолдануға арналған және процессор мен графикалық процессордың қосындысын қолдайды.

Келесіге ең қолайлы: Жедел, көп тілді TTS қажет ететін өндірістік қолданбаларName

Тегін сынау

BarkBark Standard

Трансформаторға негізделген мәтіннен дыбыс шығару моделі, реалистік сөйлеу, музыка және дыбыс эффекттерін шығарады.

Жасаушы: Suno · Лицензиясы: MIT

Сынап көру

Bark SmallBark Small Standard

Bark- тің жеңіл нұсқасы, тезірек есептеу және аз жады жұмсау. Name

Жасаушы: Suno · Лицензиясы: MIT

Сынап көру

CosyVoice 2CosyVoice 2 Standard

Алғашқы нұсқасы 1999 жылы шығарылды, ол адам-паритеттік табиғилықпен және нөлге жақын кешіктірумен Alibaba's scalable streaming TTS.

Жасаушы: Alibaba (Tongyi Lab) · Лицензиясы: Apache 2.0

Сынап көру

Dia TTSDia TTS Standard

Multi-speaker dialog generation model) — сөйлеушілер арасындағы табиғи диалогты құру үшін қолданылатын модель.

Жасаушы: Nari Labs · Лицензиясы: Apache 2.0

Сынап көру

Parler TTSParler TTS Standard

Сіз тілегіңізді табиғи тілде сипаттап, Parler сәйкесті дыбыстарды құрастырады.

Жасаушы: Hugging Face · Лицензиясы: Apache 2.0

Сынап көру

GLM-TTSGLM-TTS Standard

Ашық кодты ТДС үлгілерінің ішіндегі ең төменгі таңба қателігіне қол жеткізеді.

Жасаушы: Zhipu AI · Лицензиясы: GLM-4 License

Сынап көру

IndexTTS-2IndexTTS-2 Standard

Ұзындығы 100 шақырымнан асатын ірі өзендер мен өзендер жүйесі бар.

Жасаушы: Index Team · Лицензиясы: Bilibili Model License

Сынап көру

Spark TTSSpark TTS Standard

Аудио клондау TTS контролирленетін эмоциялармен және сұраулар арқылы сөйлеу стилімен.

Жасаушы: SparkAudio · Лицензиясы: CC BY-NC-SA 4.0

Сынап көру

GPT-SoVITSGPT-SoVITS Standard

Аудио файлдың 5 секундынан кез келген дыбысты клондау үшін бірнеше реттік дауысты клондау.

Жасаушы: RVC-Boss · Лицензиясы: MIT

Сынап көру

OrpheusOrpheus Standard

100-ден астам ғылыми еңбектің, оның ішінде 10 монографияның авторы.

Жасаушы: Canopy Labs · Лицензиясы: Llama 3.2 Community

Сынап көру

Qwen3 TTSQwen3 TTS Standard

Alibaba-ның көп тілдік TTS дыбыс клондауымен, алдын-ала орнатылған дауыстармен, мәтіннен дыбыс дизайнымен.

Жасаушы: Alibaba (Qwen) · Лицензиясы: Apache 2.0

Сынап көру

ChatterboxChatterbox Premium

Рефлекторлық клондау — клондау әдісі арқылы гендік кодты клондау.

Сапа:

Сынап көру

Tortoise TTSTortoise TTS Premium

Компьютерлік графика — компьютерлік графиканың бір саласы болып табылады.

Сапа:

Сынап көру

StyleTTS 2StyleTTS 2 Premium

Қазақ тілі грамматикасы, грамматикалық стильдер, грамматикалық стильдер.

Сапа:

Сынап көру

OpenVoiceOpenVoice Premium

Стиль, эмоция және акцентті егжей-тегжейлі басқару арқылы дауысты дереу клондау.

Сапа:

Сынап көру

Sesame CSMSesame CSM Premium

Диалогтық оқытуда диалогтық сөйлеудің негізгі мақсаты - сөйлеудің табиғи, эмоционалды және коммуникативтік қасиеттерін дамыту.

Сапа:

Сынап көру

CosyVoice 2CosyVoice 2

Алғашқы нұсқасы 1999 жылы шығарылды, ол адам-паритеттік табиғилықпен және нөлге жақын кешіктірумен Alibaba's scalable streaming TTS.

Тілдер: en, zh, ja, ko, fr, de, it, es

Дыбысты көшіру

GLM-TTSGLM-TTS

Ашық кодты ТДС үлгілерінің ішіндегі ең төменгі таңба қателігіне қол жеткізеді.

Тілдер: en, zh

Дыбысты көшіру

IndexTTS-2IndexTTS-2

Ұзындығы 100 шақырымнан асатын ірі өзендер мен өзендер жүйесі бар.

Тілдер: en, zh

Дыбысты көшіру

Spark TTSSpark TTS

Аудио клондау TTS контролирленетін эмоциялармен және сұраулар арқылы сөйлеу стилімен.

Тілдер: en, zh

Дыбысты көшіру

GPT-SoVITSGPT-SoVITS

Аудио файлдың 5 секундынан кез келген дыбысты клондау үшін бірнеше реттік дауысты клондау.

Тілдер: en, zh, ja, ko

Дыбысты көшіру

ChatterboxChatterbox

Рефлекторлық клондау — клондау әдісі арқылы гендік кодты клондау.

Тілдер: en

Дыбысты көшіру

Tortoise TTSTortoise TTS

Компьютерлік графика — компьютерлік графиканың бір саласы болып табылады.

Тілдер: en

Дыбысты көшіру

OpenVoiceOpenVoice

Стиль, эмоция және акцентті егжей-тегжейлі басқару арқылы дауысты дереу клондау.

Тілдер: en, zh, ja, ko, fr, de, es, it

Дыбысты көшіру

Qwen3 TTSQwen3 TTS

Alibaba-ның көп тілдік TTS дыбыс клондауымен, алдын-ала орнатылған дауыстармен, мәтіннен дыбыс дизайнымен.

Тілдер: en, zh, ja, ko, de, fr, ru, pt, es, it

Дыбысты көшіру

Жасаушылар үшін API

OpenAI-ге үйлесімді REST API. Бір консоль, 22+ үлгісі. Реал уақыт қолданбаларын тасымалдауды қолдау.

  • OpenAI үйлесімді пішімі
  • TTS-ті тікелей қолданбалар үшін тасымалдау
  • Үлкен тапсырмаларды дестелеу
  • Webhook құлақтандырулары
API құжаттамасын қарау
pip install ttsai npm install @ttsainpm/ttsai
Python
from tts_ai import TTSClient

client = TTSClient(api_key="sk-tts-xxx")
audio = client.generate(
    text="Hello from TTS.ai!",
    model="kokoro",
    voice="af_bella",
)
client.save(audio, "output.mp3")

Қарапайым, түсінікті бағалау

Еркін бастаңыз. Өсе келе масштабтаңыз.

Бос

$0

15 кредит

  • Kokoro, Piper, VITS, MeloTTS
  • 500 таңба шегі
  • 3 күн/ сағат (тізімсіз)
Тегін тіркелу

Бастауыш

$9/ай

500 кредит/ ай

  • Барлық 22+ үлгілері
  • 100,000 chars per generation
  • Дыбысты көшіру
Бастау
Ең танымалы

Про

$29/ай

2000 кредит/ ай

  • Бастауыштағы барлығы
  • API қатынау
  • Артықшылықты өңдеу
Профессионал болу

Бизнес

$99/ай

10 000 кредит/ ай

  • Pro- дағы барлығы
  • Жалпы API
  • Артықшылық кезек
Іс- әрекетті алу

Барлық жоспарларды, соның ішінде таңба жиындарын көрсету →

Жиі қойылатын сұрақтар

TTS.ai - бұл ең толық AI дауыс платформасы, ол 22+ мәтін-сөз моделін, дауыс клондауын, сөз-мәтін және аудио құралдарын ұсынады. Барлық модельдер ашық кодты және өндірушіге тәуелді емес.

Иә! TTS.ai Kokoro, Piper, VITS және MeloTTS үлгілерімен мәтіннен сөйлеуге тегін қызмет көрсетеді. Тіркелгі қажет емес. 15 000 тегін таңбаны алуға және барлық үлгілерге қол жеткізуге тіркеліңіз. Ақылы жоспарлар айына $9-дан басталады.

Жылдамдық үшін Kokoro не Piper қолданыңыз. Сапа үшін CosyVoice 2 не StyleTTS 2 қолданыңыз. Дыбысты клондау үшін Chatterbox не GPT- SoVITS қолданыңыз. Диалог үшін Dia TTS қолданыңыз. Бір мәтіннің бірнеше үлгісін салыстыру үшін қолданыңыз.

Иә. OpenAI-мен үйлесімді TTS, STT, дауысты клондау және аудио құралдары үшін REST API. Pro ($29/mo) және Enterprise ($99/mo) жоспарларында қол жетімді. Құжаттаманы tts.ai/api/ сайтында қараңыз.

Дауыс сапасы модельге байланысты өзгереді. CosyVoice 2, StyleTTS 2, Chatterbox сияқты премиум модельдер табиғи интонация мен эмоциямен адамға ұқсас дыбыс шығарады. Kokoro сияқты тегін модельдер көп жағдайда өте жақсы дыбыс шығарады.

TTS.ai 30-нан астам тілдерді қолдайды. Ағылшын тілінің қолдауы ең кең, бірақ CosyVoice 2 сияқты модельдер қытай, жапон және корей тілдерін қолдайды; GPT-SoVITS қытай, жапон, корей және ағылшын тілдерін қолдайды; ал MeloTTS ағылшын, испан, француз, қытай, жапон және корей тілдерін қолдайды.

Иә. Барлық өңдеу біздің арнайы графикалық процессор серверлерінде жүргізіледі. Біз енгізген мәтін не жасалған аудионы сақтамаймыз. Клондау үшін жүктеген дыбыс үлгілері тек ағымдағы сеанста ғана қолданылады, сақталмайды. Біз деректеріңізді үшінші тараппен бөліспейміз, модельдерді оқыту үшін де қолданбаймыз.

Иә. TTS.ai-де жасалған барлық аудио файлдар сіздің коммерциялық мақсатта, YouTube видеолары, подкасттар, аудиокітаптар, қолданбалар, жарнама және өнімдер үшін қолданылуы мүмкін. Біздің модельдеріміз ашық коды бар, рұқсат етілген лицензиялармен (MIT, Apache 2.0) шығарылады. Авторлық ақы немесе авторлық құқық талап етілмейді.

TTS.ai әдетті түрде ең жоғары сапа үшін WAV пішімінде дыбыс шығарады. MP3, FLAC, OGG, немесе M4A пішіміне аудару үшін тегін Аудио конвертер құралын пайдалануға болады. API сіздің таңдаған шығыс пішіміңізді тікелей сұрауында келтіруге мүмкіндік береді.

Клондайтын дауыстың қысқа (5 секундқа дейін) аудио үлгісін жүктеп беріңіз, содан кейін осы дауысты шығару үшін мәтін енгізіңіз. Chatterbox, GPT- SoVITS және CosyVoice 2 сияқты үлгілер дауысты клондауды қолдайды. Клондалған дауыс тонын, акцентін және сөйлеу стилін сақтайды.

Тегін үлгілер (Kokoro, Piper, VITS, MeloTTS) тіркелгі қажет етпейді және нөл таңбаға бағаланады. Стандартты үлгілер (2000 таңба/1K кірістіру) Bark, CosyVoice 2, F5-TTS, және Dia. Премиум үлгілер (4000 таңба/1K кірістіру) OpenVoice, Chatterbox, StyleTTS 2, және Tortoise. Ақылы үлгілер көбіне жоғары сапалы, көбірек дауыстарды және дауыстарды клондау сияқты қосымша мүмкіндіктерді ұсынады.

Иә. API үлкен көлемдегі мәтіндерді сөйлеуге айналдыру үшін пакеттік өңдеуді қолдайды. Бірнеше сұраныстарды жіберіп, тапсырма UUID- терін пайдаланып нәтижелерді асинхронды түрде алу. Enterprise жоспары ($99/ ай) пакеттік өңдеуді жеделдету үшін кезекке артықшылықты қатынауды қамтиды. Аудиокітаптарды шығару, курс мазмұнын жасау және кең көлемді дыбыс жобалары үшін өте қолайлы.
4.0/5 (8)

AI Voice-ті бүгін қолдана бастаңыз

TTS.ai-ді қолданатын құрушылар, әзірлеуші және бизнес өкілдерімен бірлесіп жұмыс істеу