Вільний комп' ютер Текст для мовлення
20+ моделі з відкритим кодом, 107+ голоси, 32+ Не потрібен рахунок.
Усе, що потрібно для голосу
30+ інструменти, якими керують моделі AI з відкритим кодом
20+ Моделі голосу комп' ютерного гравця
Найрозширеніша збірка моделей TTS з відкритим кодом на одній платформі
Kokoro Free
Kokro - це модель параметра text- to- special, що має 82 мільйони параметрів, яка значно перевищує його вазі. Незважаючи на його крихітний розмір, він видає надзвичайно природну і виразну мову. Kokro підтримує декілька мов, зокрема англійську, японську, китайську та корейську з різноманітною кількістю голосів. Програма виконується неймовірно швидко, майже у 100x швидше за реальний час у GPU.
Найкраще для: Високої якості TTS з мінімальною пізнотою, поточною програмою
Спробувати вільно
Piper Free
Piper - це невибагливий рушій синтезу мовлення з тексту, розроблений Raspy, який використовує архітектуру VITS і гортань. Він працює повністю на процесорі, робить його ідеальним для пристроїв ребер, домашніх автоматизації і програм, які потребують автономного синтезу мовлення. З понад 100 голосів на 30+ мовах, Piper виголошує натуральну звукову мову з реальною швидкістю навіть на Raspberry Pi 4.
Найкраще для: Швидкий перегляд, доступність та вбудовані програми
Спробувати вільно
VITS Free
VITS (Variational Inference with adersial learn for end- to- end Text- Speech) - паралельний метод TTS, який створює природніший звук, ніж поточні двостулкові моделі. Він приймає варіативні підсумки, збільшені зі нормалізуючими потоками та адвернаційним процесом тренування, що значно покращує природність.
Найкраще для: Загальні текстові повідомлення з природними просодіями
Спробувати вільно
MeloTTS Free
MeloTTS MySell.ai - це багатомовна бібліотека TTS, яка підтримує англійську (American, British, India, Australia), іспанська, французька, китайська, японська, і корейська. Текст дуже швидко обробляється на процесорі з майже реальною швидкістю. MloTTS розроблено для використання і підтримує як процесора, так і GPUCTS.
Найкраще для: Програми для виробництва, які потребують швидкого, багатомовного TTS
Спробувати вільно
Bark Standard
Transformer-based text-to-audio model that generates realistic speech, music, and sound effects.
Розробник: Suno · Ліцензія: MIT
Спробуй.
Bark Small Standard
Легша версія Bark з швидшим використанням об' єму і нижнім використанням пам' яті.
Розробник: Suno · Ліцензія: MIT
Спробуй.
CosyVoice 2 Standard
Широкий потік TTS Алібаби з властивістю людини і майже нульовою пізнотою.
Розробник: Alibaba (Tongyi Lab) · Ліцензія: Apache 2.0
Спробуй.
Dia TTS Standard
Модель створення діалогового вікна синтезу мовлення, яка створює натуральні розмови між промовцями.
Розробник: Nari Labs · Ліцензія: Apache 2.0
Спробуй.
Parler TTS Standard
Опиши голос, який ви хочете почути рідною мовою, і Parler створює відповідну мову.
Розробник: Hugging Face · Ліцензія: Apache 2.0
Спробуй.
GLM-TTS Standard
Оцінює найнижчий рівень помилок у кодах моделей TTS з відкритим кодом.
Розробник: Zhipu AI · Ліцензія: GLM-4 License
Спробуй.
IndexTTS-2 Standard
Нульовий TTS з акуратним контролем емоцій і високою експресивністю.
Розробник: Index Team · Ліцензія: Bilibili Model License
Спробуй.
Spark TTS Standard
Голосове клонування TTS з контрольованими емоційами та манерою мовлення за допомогою запитів.
Розробник: SparkAudio · Ліцензія: CC BY-NC-SA 4.0
Спробуй.
GPT-SoVITS Standard
Небагато голосових клонувань TTS, які відтворюють будь-який голос лише з 5 секунд аудіо.
Розробник: RVC-Boss · Ліцензія: MIT
Спробуй.
Orpheus Standard
Емоційна модель TTS людського рівня тренувалася за 100K годин мовних даних.
Розробник: Canopy Labs · Ліцензія: Llama 3.2 Community
Спробуй.
Qwen3 TTS Standard
Багатомовне TTS Алібаби з клонуванням голосу, конфігурацією голосів та дизайном голосу з тексту.
Розробник: Alibaba (Qwen) · Ліцензія: Apache 2.0
Спробуй.
CosyVoice 2
Широкий потік TTS Алібаби з властивістю людини і майже нульовою пізнотою.
Мови: en, zh, ja, ko, fr, de, it, es
Клонувати голос
GLM-TTS
Оцінює найнижчий рівень помилок у кодах моделей TTS з відкритим кодом.
Мови: en, zh
Клонувати голос
IndexTTS-2
Нульовий TTS з акуратним контролем емоцій і високою експресивністю.
Мови: en, zh
Клонувати голос
Spark TTS
Голосове клонування TTS з контрольованими емоційами та манерою мовлення за допомогою запитів.
Мови: en, zh
Клонувати голос
GPT-SoVITS
Небагато голосових клонувань TTS, які відтворюють будь-який голос лише з 5 секунд аудіо.
Мови: en, zh, ja, ko
Клонувати голос
Chatterbox
Державне непродуктивне клонування голосу з емоційною контролею Resemble AI.
Мови: en
Клонувати голос
Tortoise TTS
Багатоголосовий текстовий синтез фокусувався на якості з автоматичною архітектурою.
Мови: en
Клонувати голос
OpenVoice
Миттєве клонування голосу з гранулярним контролем над стилем, емоціями та акцентом.
Мови: en, zh, ja, ko, fr, de, es, it
Клонувати голос
Qwen3 TTS
Багатомовне TTS Алібаби з клонуванням голосу, конфігурацією голосів та дизайном голосу з тексту.
Мови: en, zh, ja, ko, de, fr, ru, pt, es, it
Клонувати голосРозробник- перший API
Сумісний з OpenAI API REST. Одна точка кінця, 22 моделі. Підтримка потоку для програм у режимі реального часу.
- Сумісний з OpenAI формат
- Потік TTS для програм у режимі реального часу
- Пакетна обробка для великих завдань
- Сповіщення веб- сторінокComment
pip install ttsai
npm install @ttsainpm/ttsai
from tts_ai import TTSClient
client = TTSClient(api_key="sk-tts-xxx")
audio = client.generate(
text="Hello from TTS.ai!",
model="kokoro",
voice="af_bella",
)
client.save(audio, "output.mp3")
Просте, прозоре розташування
Почніть вільно. Масштабуйте зі зростанням.
Вільно
15 кредитів
- Kokoro, Piper, VITS, MeloTTS
- 500 меж символів
- 3 gen/година (без облікового запису)
Започаткування
500 кредитів/ місяців
- Всі моделі 22+
- 100,000 chars per generation
- Клонування голосу
Pro
2000 кредитів/ місяців
- Все в старті
- Доступ до API
- Обробка пріоритету
Бізнес
10 000 кредитів на місяць
- Все в Pro
- Місткий API
- Черга пріоритету
Часті запитання
Почати використання комп' ютерного голосу сьогодні
Приєднуйтеся до розробників, розробників і підприємств, використовуючи TTS.ai