Вільний комп' ютер Текст для мовлення

22+ моделі з відкритим кодом, 100+ голосів, 32+ Не потрібен рахунок.

0/500 символи Вільно
Немає кредитної картки 50 безкоштовних кредитів 32+ мови Комерційне використання Гаразд
0:00 / 0:00
Звантажити аудіо Зв' язок закінчується через 24h
Як TTS.ai?

Усе, що потрібно для голосу

26 інструментів, що працюють 24+ з відкритим кодом

22+ Моделі комп' ютерного гравця

Найрозширеніша збірка моделей TTS з відкритим кодом на одній платформі

KokoroKokoro Free

Kokoro is an 82 million parameter text-to-speech model that punches well above its weight class. Despite its tiny size, it produces remarkably natural and expressive speech. Kokoro supports multiple languages including English, Japanese, Chinese, and Korean with a variety of expressive voices. It runs incredibly fast — generating audio nearly 100x faster than real-time on a GPU.

Найкраще для: High-quality TTS with minimal latency, streaming applications

Спробувати вільно

PiperPiper Free

Piper is a lightweight text-to-speech engine developed by Rhasspy that uses VITS and larynx architectures. It runs entirely on CPU, making it ideal for edge devices, home automation, and applications requiring offline TTS. With over 100 voices across 30+ languages, Piper delivers natural-sounding speech at real-time speeds even on a Raspberry Pi 4.

Найкраще для: Quick previews, accessibility, and embedded applications

Спробувати вільно

VITSVITS Free

VITS (Variational Inference with adversarial learning for end-to-end Text-to-Speech) is a parallel end-to-end TTS method that generates more natural sounding audio than current two-stage models. It adopts variational inference augmented with normalizing flows and an adversarial training process, achieving a significant improvement in naturalness.

Найкраще для: General-purpose text-to-speech with natural prosody

Спробувати вільно

MeloTTSMeloTTS Free

MeloTTS by MyShell.ai is a multilingual TTS library supporting English (American, British, Indian, Australian), Spanish, French, Chinese, Japanese, and Korean. It is extremely fast, processing text at near real-time speed on CPU alone. MeloTTS is designed for production use and supports both CPU and GPU inference.

Найкраще для: Програми для виробництва, які потребують швидкого, багатомовного TTS

Спробувати вільно

BarkBark Standard

Transformer-based text-to-audio model that generates realistic speech, music, and sound effects.

Розробник: Suno · Ліцензія: MIT

Спробуй.

Bark SmallBark Small Standard

Lighter version of Bark with faster inference and lower memory usage.

Розробник: Suno · Ліцензія: MIT

Спробуй.

CosyVoice 2CosyVoice 2 Standard

Alibaba's scalable streaming TTS with human-parity naturalness and near-zero latency.

Розробник: Alibaba (Tongyi Lab) · Ліцензія: Apache 2.0

Спробуй.

Dia TTSDia TTS Standard

Модель створення діалогового вікна синтезу мовлення, яка створює натуральні розмови між промовцями.

Розробник: Nari Labs · Ліцензія: Apache 2.0

Спробуй.

Parler TTSParler TTS Standard

Describe the voice you want in natural language and Parler generates matching speech.

Розробник: Hugging Face · Ліцензія: Apache 2.0

Спробуй.

IndexTTS-2IndexTTS-2 Standard

Zero-shot TTS with fine-grained emotion control and high expressiveness.

Розробник: Index Team · Ліцензія: Apache 2.0

Спробуй.

Spark TTSSpark TTS Standard

Voice cloning TTS with controllable emotion and speaking style via prompts.

Розробник: SparkAudio · Ліцензія: Apache 2.0

Спробуй.

GPT-SoVITSGPT-SoVITS Standard

Few-shot voice cloning TTS that replicates any voice from just 5 seconds of audio.

Розробник: RVC-Boss · Ліцензія: MIT

Спробуй.

OrpheusOrpheus Standard

Human-level emotional TTS model trained on 100K hours of speech data.

Розробник: Canopy Labs · Ліцензія: Llama 3.2 Community

Спробуй.

Qwen3 TTSQwen3 TTS Standard

Alibaba's multilingual TTS with voice cloning, preset voices, and voice design from text.

Розробник: Alibaba (Qwen) · Ліцензія: Apache 2.0

Спробуй.

ChatterboxChatterbox Premium

Державне непродуктивне клонування голосу з емоційною контролею Resemble AI.

Якість:

Спробуй.

Tortoise TTSTortoise TTS Premium

Багатоголосовий текстовий синтез фокусувався на якості з автоматичною архітектурою.

Якість:

Спробуй.

StyleTTS 2StyleTTS 2 Premium

Human-level text-to-speech through style diffusion and adversarial training.

Якість:

Спробуй.

OpenVoiceOpenVoice Premium

Миттєве клонування голосу з гранулярним контролем над стилем, емоціями та акцентом.

Якість:

Спробуй.

CosyVoice 2CosyVoice 2

Alibaba's scalable streaming TTS with human-parity naturalness and near-zero latency.

Мови: en, zh, ja, ko, fr, de, it, es

Клонувати голос

IndexTTS-2IndexTTS-2

Zero-shot TTS with fine-grained emotion control and high expressiveness.

Мови: en, zh

Клонувати голос

Spark TTSSpark TTS

Voice cloning TTS with controllable emotion and speaking style via prompts.

Мови: en, zh

Клонувати голос

GPT-SoVITSGPT-SoVITS

Few-shot voice cloning TTS that replicates any voice from just 5 seconds of audio.

Мови: en, zh, ja, ko

Клонувати голос

ChatterboxChatterbox

Державне непродуктивне клонування голосу з емоційною контролею Resemble AI.

Мови: en

Клонувати голос

Tortoise TTSTortoise TTS

Багатоголосовий текстовий синтез фокусувався на якості з автоматичною архітектурою.

Мови: en

Клонувати голос

OpenVoiceOpenVoice

Миттєве клонування голосу з гранулярним контролем над стилем, емоціями та акцентом.

Мови: en, zh, ja, ko, fr, de, es, it

Клонувати голос

Qwen3 TTSQwen3 TTS

Alibaba's multilingual TTS with voice cloning, preset voices, and voice design from text.

Мови: en, zh, ja, ko, de, fr, ru, pt, es, it

Клонувати голос

Розробник- перший API

Сумісний з OpenAI API REST. Одна точка кінця, 22 моделі. Підтримка потоку для програм у режимі реального часу.

  • Сумісний з OpenAI формат
  • Потік TTS для програм у режимі реального часу
  • Пакетна обробка для великих завдань
  • Сповіщення веб- сторінокComment
Перегляд Дописи API
Python
import requests

response = requests.post(
    "https://api.tts.ai/v1/tts/",
    headers={"Authorization": "Bearer sk-tts-xxx"},
    json={
        "model": "kokoro",
        "text": "Hello from TTS.ai!",
        "voice": "af_bella",
    }
)

with open("output.mp3", "wb") as f:
    f.write(response.content)

Просте, прозоре розташування

Почніть вільно. Масштабуйте зі зростанням.

Вільно

$0

50 кредитів

  • Kokoro, Piper, VITS, MeloTTS
  • 500 меж символів
  • 3 gen/година (без облікового запису)
Вільний підпис

Започаткування

$9/моunit description in lists

500 кредитів/ місяців

  • Всі моделі 22+
  • 5 000 символів обмеження
  • Клонування голосу
Розпочати
Найпоширеніша

Pro

$29/моunit description in lists

2000 кредитів/ місяців

  • Все в старті
  • Доступ до API
  • Обробка пріоритету
Отримати профі

Підприємство

$99/моunit description in lists

10 000 кредитів на місяць

  • Все в Pro
  • Місткий API
  • Черга пріоритету
Контактні продажі

View all plans including credit packs →

Часті запитання

TTS.ai - це найбільш об' ємна голосова платформа AI, яка пропонує 22+концентрацію мовлення, клонування голосів, текст мовлення і аудіо. Всі моделі є відкритими кодами без блокування виробників.

Так! TTS.ai пропонує безкоштовні текстові повідомлення з Kokro, Piper, VITS і Melotts. Не потрібен обліковий запис. Підпишіться, щоб отримати 50 безкоштовних кредитів і отримати доступ до всіх моделей. Плани Paid починаються з 9/ місячних $.

Для пришвидшення скористайтеся Koro або Piper. Для того, щоб дізнатися про якість, спробуйте скористатися командою CosyTTS 2 або StyleTTS 2. Для клонування голосів скористайтеся пунктом Chatterbox або GPT- SoVITS. У діалоговому вікні скористайтеся пунктом Dia TTS. Спробуйте скористатися декількома моделями для порівняння одного тексту.

Так. Сумісний з OpenAI REST API для TTS, STT, клонування голосів і звукових інструментів. Доступні на планах Pro ($29/mo) і Explace (99/mo). Переглянути документацію за адресою tts. ai/api /.

Якість голосу залежить від моделі. Моделі Premium на зразок CosyTTS 2, StyleTTS 2, і Chatterbox створюють майже людську якість мовлення з природною інтонацією та емоціями. Вільні моделі на зразок Kokro надають чудову якість для більшості випадків використання.

TTS.ai підтримує 30+номерів по всій своїй моделі. Англійська має найширшу підтримку з моделей, але такі моделі, як CosyTore 2 покривають китайську, японську та корейську мови; GPT- SoviTS працюють з китайською, японською, корейською та англійською мовами; і MloTTS підтримують англійську, іспанську, французьку, французьку, китайську, японську та корейську мови.

Так. Всі обробки відбуваються на наших відмінних серверах GPU. Ми не зберігаємо ваші текстові дані і не створюємо звукові дані після доставки. Вивантажені зразки голосів для клонування використовуються лише для поточного сеансу і не зберігаються. Ми ніколи не ділимося вашими даними з третьою стороною і не використовуємо їх для вправних моделей.

Yes. All audio generated on TTS.ai is yours to use commercially, including for YouTube videos, podcasts, audiobooks, apps, advertisements, and products. Our models are open source under permissive licenses (MIT, Apache 2.0). No royalties or attribution required.

TTS.ai створює звукові дані у форматі WAV типово для максимальної якості. Ви можете перетворити їх у MP3, FLAC, OGG або M4A за допомогою нашого вільного інструменту перетворювача звуку. У API передбачено підтримку визначення ваших форматів виводу напряму за запитом.

Upload a short audio sample (as little as 5 seconds) of the voice you want to clone, then type any text to generate speech in that voice. Models like Chatterbox, GPT-SoVITS, and CosyVoice 2 support voice cloning. The cloned voice captures tone, accent, and speaking style.

Вільні моделі (Kokoro, Piper, VITS, MelotTS) не потребують жодних рахунків і не потребують нульових кредитів. Серед стандартних моделей (2 символи Certifes/ 1K) є Backk, CosyTX 2, F5- TTS і Dia. Моделі Premium (4 кредити/ 1K) належать до OpenTorride, Chatterbox, StyleTTS 2, і Tortoise. Моделі Paid зазвичай пропонують вищу якість, більше голосів і додаткові можливості, зокрема клонування голосів.

Так. У API передбачено підтримку пакетної обробки для перетворення великих томів тексту на мовлення. Надсилати декілька запитів і отримувати результати синхронно з використанням завдань UUID. У бізнес- планах ($99/mo) передбачено доступ до черги пріоритетів для пришвидшеної пакетної обробки. Ідеально для розробки аудіокнижної книги, вмісту майданчика та широкомасштабних проектів з керування голосами.
5.0/5 (1)

Почати використання комп' ютерного голосу сьогодні

Приєднуйтеся до творців, розробників і підприємств за допомогою TTS.ai