Free AIName Матн ба талаффузComment

22+ намунаҳои манбаи кушод, 100+ овозҳо, 32+ забонҳо. Ҳисоб талаб карда намешавад.

0/500 Аломатҳо Озод
Корти кредитӣ нест 50 кредити озод 32+ забонҳо Истифодаи тиҷоратӣ
0:00 / 0:00
Download Audio Мӯҳлати пайванд баъди 24 соат ба итмом мерасад
Шумо TTS.ai-ро дӯст медоред? Ба дӯстонатон бигӯед!

Ҳама чизе, ки ба шумо барои овози AI лозим аст

26 асбоб, ки аз ҷониби 24+ моделҳои AI-и манбаи кушода кор мекунанд

22+ намунаҳои овози AI

Ҷамъоварии пурраи моделҳои TTS-и манбаи кушод дар як платформа

KokoroKokoro Free

Kokoro is an 82 million parameter text-to-speech model that punches well above its weight class. Despite its tiny size, it produces remarkably natural and expressive speech. Kokoro supports multiple languages including English, Japanese, Chinese, and Korean with a variety of expressive voices. It runs incredibly fast — generating audio nearly 100x faster than real-time on a GPU.

Беҳтарин барои: High-quality TTS with minimal latency, streaming applications

Санҷиши ройгон

PiperPiper Free

Piper is a lightweight text-to-speech engine developed by Rhasspy that uses VITS and larynx architectures. It runs entirely on CPU, making it ideal for edge devices, home automation, and applications requiring offline TTS. With over 100 voices across 30+ languages, Piper delivers natural-sounding speech at real-time speeds even on a Raspberry Pi 4.

Беҳтарин барои: Quick previews, accessibility, and embedded applications

Санҷиши ройгон

VITSVITS Free

VITS (Variational Inference with adversarial learning for end-to-end Text-to-Speech) is a parallel end-to-end TTS method that generates more natural sounding audio than current two-stage models. It adopts variational inference augmented with normalizing flows and an adversarial training process, achieving a significant improvement in naturalness.

Беҳтарин барои: General-purpose text-to-speech with natural prosody

Санҷиши ройгон

MeloTTSMeloTTS Free

MeloTTS by MyShell.ai is a multilingual TTS library supporting English (American, British, Indian, Australian), Spanish, French, Chinese, Japanese, and Korean. It is extremely fast, processing text at near real-time speed on CPU alone. MeloTTS is designed for production use and supports both CPU and GPU inference.

Беҳтарин барои: Барномаҳои истеҳсолӣ, ки ба TTS-и тез ва бисёрзабон ниёз доранд

Санҷиши ройгон

BarkBark Standard

Transformer-based text-to-audio model that generates realistic speech, music, and sound effects.

Тайёркунанда: Suno · Иҷозатнома: MIT

Кӯшиш кунед

Bark SmallBark Small Standard

Lighter version of Bark with faster inference and lower memory usage.

Тайёркунанда: Suno · Иҷозатнома: MIT

Кӯшиш кунед

CosyVoice 2CosyVoice 2 Standard

Alibaba's scalable streaming TTS with human-parity naturalness and near-zero latency.

Тайёркунанда: Alibaba (Tongyi Lab) · Иҷозатнома: Apache 2.0

Кӯшиш кунед

Dia TTSDia TTS Standard

Мувофиқи ин назария, раванди эҷодкорӣ равандест, ки дар натиҷаи мубодилаи иттилоот ба вуҷуд меояд.

Тайёркунанда: Nari Labs · Иҷозатнома: Apache 2.0

Кӯшиш кунед

Parler TTSParler TTS Standard

Describe the voice you want in natural language and Parler generates matching speech.

Тайёркунанда: Hugging Face · Иҷозатнома: Apache 2.0

Кӯшиш кунед

IndexTTS-2IndexTTS-2 Standard

Zero-shot TTS with fine-grained emotion control and high expressiveness.

Тайёркунанда: Index Team · Иҷозатнома: Apache 2.0

Кӯшиш кунед

Spark TTSSpark TTS Standard

Voice cloning TTS with controllable emotion and speaking style via prompts.

Тайёркунанда: SparkAudio · Иҷозатнома: Apache 2.0

Кӯшиш кунед

GPT-SoVITSGPT-SoVITS Standard

Few-shot voice cloning TTS that replicates any voice from just 5 seconds of audio.

Тайёркунанда: RVC-Boss · Иҷозатнома: MIT

Кӯшиш кунед

OrpheusOrpheus Standard

Human-level emotional TTS model trained on 100K hours of speech data.

Тайёркунанда: Canopy Labs · Иҷозатнома: Llama 3.2 Community

Кӯшиш кунед

Qwen3 TTSQwen3 TTS Standard

Alibaba's multilingual TTS with voice cloning, preset voices, and voice design from text.

Тайёркунанда: Alibaba (Qwen) · Иҷозатнома: Apache 2.0

Кӯшиш кунед

ChatterboxChatterbox Premium

Aérospatiale Alouette III (англ. Alouette III) — як ҳавогарди сохтаи Aérospatiale аст.

Сифати:

Кӯшиш кунед

Tortoise TTSTortoise TTS Premium

Маҷмӯаи асарҳои ӯ бо унвони «Архитектура» ба табъ расидааст.

Сифати:

Кӯшиш кунед

StyleTTS 2StyleTTS 2 Premium

Human-level text-to-speech through style diffusion and adversarial training.

Сифати:

Кӯшиш кунед

OpenVoiceOpenVoice Premium

Instant voice cloning with granular control over style, emotion, and accent.

Сифати:

Кӯшиш кунед

CosyVoice 2CosyVoice 2

Alibaba's scalable streaming TTS with human-parity naturalness and near-zero latency.

Забонҳо: en, zh, ja, ko, fr, de, it, es

Намунаи овоз

IndexTTS-2IndexTTS-2

Zero-shot TTS with fine-grained emotion control and high expressiveness.

Забонҳо: en, zh

Намунаи овоз

Spark TTSSpark TTS

Voice cloning TTS with controllable emotion and speaking style via prompts.

Забонҳо: en, zh

Намунаи овоз

GPT-SoVITSGPT-SoVITS

Few-shot voice cloning TTS that replicates any voice from just 5 seconds of audio.

Забонҳо: en, zh, ja, ko

Намунаи овоз

ChatterboxChatterbox

Aérospatiale Alouette III (англ. Alouette III) — як ҳавогарди сохтаи Aérospatiale аст.

Забонҳо: en

Намунаи овоз

Tortoise TTSTortoise TTS

Маҷмӯаи асарҳои ӯ бо унвони «Архитектура» ба табъ расидааст.

Забонҳо: en

Намунаи овоз

OpenVoiceOpenVoice

Instant voice cloning with granular control over style, emotion, and accent.

Забонҳо: en, zh, ja, ko, fr, de, es, it

Намунаи овоз

Qwen3 TTSQwen3 TTS

Alibaba's multilingual TTS with voice cloning, preset voices, and voice design from text.

Забонҳо: en, zh, ja, ko, de, fr, ru, pt, es, it

Намунаи овоз

Барномасозон

OpenAI-совместимый REST API. Одна конечная точка, 22+ моделей. Поддержка потока для приложений реального времени.

  • Андозаи мувофиқи OpenAI
  • Stream TTS барои барномаҳои вақти воқеӣ
  • Обработка пакетов для больших заданий
  • Огоҳиномаҳои Webhook
Намоиши ҳуҷҷатҳои API
Python
import requests

response = requests.post(
    "https://api.tts.ai/v1/tts/",
    headers={"Authorization": "Bearer sk-tts-xxx"},
    json={
        "model": "kokoro",
        "text": "Hello from TTS.ai!",
        "voice": "af_bella",
    }
)

with open("output.mp3", "wb") as f:
    f.write(response.content)

Нархгузории оддӣ ва шаффоф

Бепул оғоз кунед. Ҳангоми афзоиш андоза кунед.

Озод

$0

50 кредит

  • Kokoro, Piper, VITS, MeloTTS
  • Маҳдудияти аломат:
  • 3 ген/ соат (бе ҳисоб)
Бақайдгирии ройгон

Оғозкунанда

$9/% 1 дақиқа

500 кредит/моҳ

  • Ҳамаи 22+ моделҳо
  • Маҳдудияти 5000 аломат
  • Тасвири овоз
Оғоз кардан
Беҳтарин

Про

$29/% 1 дақиқа

2,000 кредит/моҳ

  • Ҳама чиз дар оғозкунанда
  • Дастрасии API
  • Аҳамиятдиҳии коркард
Гирифтани Pro

Корхона

$99/% 1 дақиқа

10,000 кредит/моҳа

  • Ҳама чиз дар Pro
  • API- и маҷмӯӣ
  • Навбати пешрафта
Муносибат бо фурӯшандагон

View all plans including credit packs →

Саволҳои пурсидашаванда

TTS.ai платформаи пурраи овозии AI мебошад, ки 22+ моделҳои матн-ба-сӯҳбат, клонинги овоз, сухан-ба-матн ва асбобҳои аудиоиро пешниҳод мекунад. Ҳамаи моделҳо дорои манбаъҳои кушода мебошанд, ки аз ҷониби ягон истеҳсолкунанда баста нашудаанд.

Бале! TTS.ai матни озодро ба сухан бо моделҳои Kokoro, Piper, VITS ва MeloTTS пешниҳод мекунад. Ҳисоб талаб карда намешавад. Барои гирифтани 50 кредити ройгон ва дастрасӣ ба ҳамаи моделҳо сабти ном кунед. Нақшаҳои пардохтшуда аз $ 9 / моҳ оғоз меёбанд.

Барои суръат, Kokoro ё Piper- ро истифода баред. Барои сифати баланд, CosyVoice 2 ё StyleTTS 2- ро истифода баред. Барои нусхабардории овоз, Chatterbox ё GPT- SoVITS- ро истифода баред. Барои диалог, Dia TTS- ро истифода баред. Барои муқоиса, якчанд намунаи як матнро истифода баред.

Бале. OpenAI-совместимый REST API для TTS, STT, клонирования голоса, и аудио инструментов. Доступно на Pro ($29/mo) и Enterprise ($99/mo) планах. Посмотрите документацию на tts.ai/api/.

Сифати овоз вобаста ба намуна фарқ мекунад. Намунаҳои Premium ба монанди CosyVoice 2, StyleTTS 2 ва Chatterbox садои сифати инсониро бо интонатсияи табиӣ ва эҳсосот истеҳсол мекунанд. Намунаҳои ройгон ба монанди Kokoro барои аксари ҳолатҳои истифода сифати олӣ пешниҳод мекунанд.

TTS.ai 30+ забонро дар китобхонаи моделҳои худ дастгирӣ мекунад. Англисӣ дастгирии васеътарини моделро дорад, аммо моделҳои монанди CosyVoice 2 хитоӣ, японӣ ва корейсро дар бар мегирад; GPT-SoVITS хитоӣ, японӣ, корейс ва англисиро дастгирӣ мекунад; ва MeloTTS англисӣ, испанӣ, франсузӣ, хитоӣ, японӣ ва корейсро дастгирӣ мекунад.

Да, все обработка происходит на наших специализированных серверах GPU. Мы не храним вводимый вами текст или генерируемое аудио после доставки. Перегруженные образцы голоса для клонирования используются только для текущего сеанса и не сохраняются. Мы никогда не делимся вашими данными с третьими лицами или не используем их для обучения моделей.

Yes. All audio generated on TTS.ai is yours to use commercially, including for YouTube videos, podcasts, audiobooks, apps, advertisements, and products. Our models are open source under permissive licenses (MIT, Apache 2.0). No royalties or attribution required.

TTS.ai аудиоро бо пешфарз дар формати WAV барои сифати максималӣ эҷод мекунад. Шумо метавонед онро ба MP3, FLAC, OGG ё M4A бо истифода аз асбоби озоди Мубодилакунандаи аудиоӣ табдил диҳед. API муайян кардани формати бароришро бевосита дар дархост дастгирӣ мекунад.

Upload a short audio sample (as little as 5 seconds) of the voice you want to clone, then type any text to generate speech in that voice. Models like Chatterbox, GPT-SoVITS, and CosyVoice 2 support voice cloning. The cloned voice captures tone, accent, and speaking style.

Намунаҳои ройгон (Kokoro, Piper, VITS, MeloTTS) ба ҳисоби корбарӣ ниёз надоранд ва барои онҳо кредитҳои сифр лозим аст. Намунаҳои стандартӣ (2 кредит/1K аломат) Bark, CosyVoice 2, F5-TTS ва Dia-ро дар бар мегиранд. Намунаҳои Premium (4 кредит/1K аломат) OpenVoice, Chatterbox, StyleTTS 2 ва Tortoise-ро дар бар мегиранд. Намунаҳои пардохташаванда одатан сифати баландтар, овозҳои бештар ва хусусиятҳои иловагӣ, ба монанди дубора сохтани овозро пешниҳод мекунанд.

Бале. API коркардҳои гурӯҳиро барои табдилдиҳии ҳаҷми калони матн ба сухан дастгирӣ мекунад. Дархостҳои зиёдро фиристед ва натиҷаҳоро бо истифодаи UUID-и корҳо асинхронӣ барқарор кунед. Нақшаҳои Enterprise ($99/моҳа) дастрасии навбатиро барои коркардҳои гурӯҳии тезтар дар бар мегиранд. Барои истеҳсоли китобҳои аудиоӣ, мундариҷаи курсҳо ва лоиҳаҳои калони овоздиҳӣ беҳтарин аст.
5.0/5 (1)

Имрӯз истифода бурдани овози AI- ро оғоз кунед

Ба эҷодкорон, таҳиягарон ва тиҷорат бо истифода аз TTS.ai ҳамроҳ шавед