Свабодны AI Пераклад тэксту на мовуName

22+ мадэлі з адкрытым кодам, 100+ галасоў, 32+ Мовы. Не патрэбны рахунак.

0/500 сімвалы Свабодны
Няма крэдытнай карты 50 бясплатных крэдыт 32+ Мовы Камерцыйнае выкарыстанне
0:00 / 0:00
Сцягнуць гук Тэрмін дзеяння спасылкі скончыцца праз 24 гадзіны
Як TTS.ai? Раскажыце сваім сябрам!

Усё, што вам трэба для штучнага голасу

26 інструмэнтаў, якія працуюць на 24+ мадэлях штучнага інтэлекту з адкрытым зыходным кодам

22+ мадэлі галасоў AI

Самая поўная калекцыя мадэляў TTS з адкрытым зыходным кодам на адной платформе

KokoroKokoro Free

Kokoro - гэта 82- мільённая мадэль пераўтварэння тэксту ў мову, якая пераўзыходзіць свае магчымасці. Нягледзячы на невялікі памер, яна дазваляе атрымліваць натуральную і выразную мову. Kokoro падтрымлівае некалькі моў, у тым ліку англійскую, японскую, кітайскую і карэйскую, з рознымі выразнымі голасамі. Яна працуе неверагодна хутка - генеруе гук амаль у 100 разоў хутчэй, чым у рэальным часе на GPU.

Лепшы для: Высокаякасны TTS з мінімальнай задержкай, стрымінгавыя праграмы

Спроба бясплатна

PiperPiper Free

Piper - гэта лёгкі рухавік пераўтварэння тэксту ў мову, распрацаваны Rhasspy, які выкарыстоўвае архітэктуры VITS і larynx. Ён працуе цалкам на працэсары, што робіць яго ідэальным для перыферычных прылад, хатняй аўтаматызацыі і прыкладанняў, якія патрабуюць аўтаномнага пераўтварэння тэксту ў мову. З больш чым 100 галасамі на больш чым 30 мовах, Piper дае натуральна гучную мову з хуткасцю рэальнага часу нават на Raspberry Pi 4.

Лепшы для: Хуткі прагляд, даступнасьць і ўбудаваныя праграмы

Спроба бясплатна

VITSVITS Free

VITS (Variation Inference with adversarial learning for end- to- end Text- to- Speech) - гэта паралельны метад перакладу тэксту на мову, які генеруе больш натуральны гук, чым цяперашнія двухступеністыя мадэлі. Ён выкарыстоўвае варыяцыйную інферэнцыю, падмацаваную нармалізуючымі патокамі і канкурэнтным працэсам навучання, што дазваляе дасягнуць значнага паляпшэння натуральнасці.

Лепшы для: Агульная функцыя пераўтварэньня тэксту ў мову з натуральнай празодыяй

Спроба бясплатна

MeloTTSMeloTTS Free

MeloTTS ад MyShell. ai - гэта шматмоўная бібліятэка TTS, якая падтрымлівае англійскую (амерыканскую, брытанскую, індыйскую, аўстралійскую), іспанскую, французскую, кітайскую, японскую і карэйскую мовы. Яна вельмі хуткая, апрацоўвае тэкст амаль у рэальным часе толькі на працэсары. MeloTTS распрацавана для выкарыстання ў прамысловасці і падтрымлівае як працэсар, так і графічны працэсар.

Лепшы для: Праектныя праграмы, якія патрабуюць хуткага, шматмоўнага TTS

Спроба бясплатна

BarkBark Standard

Праграмнае забеспячэнне для пераўтварэння тэксту ў аўдыё, якое генеруе рэалістычную мову, музыку і гукавыя эфекты.

Распрацоўшчык: Suno · Ліцэнзія: MIT

Паспрабуйце

Bark SmallBark Small Standard

Гэтая версія была больш хуткай і мела больш магутны працэсар і памяць.

Распрацоўшчык: Suno · Ліцэнзія: MIT

Паспрабуйце

CosyVoice 2CosyVoice 2 Standard

Нацыянальны гімн Рэспублікі Беларусь — гімн Рэспублікі Беларусь і дзяржаўны гімн Рэспублікі Беларусь.

Распрацоўшчык: Alibaba (Tongyi Lab) · Ліцэнзія: Apache 2.0

Паспрабуйце

Dia TTSDia TTS Standard

Інфармацыйна-камунікацыйныя тэхналогіі (ІКТ) — комплекс тэхналогій, якія дазваляюць арганізаваць камунікацыю паміж людзьмі.

Распрацоўшчык: Nari Labs · Ліцэнзія: Apache 2.0

Паспрабуйце

Parler TTSParler TTS Standard

Апішыце патрэбны вам голас на натуральнай мове, і Parler створыць адпаведны голас.

Распрацоўшчык: Hugging Face · Ліцэнзія: Apache 2.0

Паспрабуйце

IndexTTS-2IndexTTS-2 Standard

Сістэма лічбавага тэлебачання мае высокую эфектыўнасць і высокую дакладнасць.

Распрацоўшчык: Index Team · Ліцэнзія: Apache 2.0

Паспрабуйце

Spark TTSSpark TTS Standard

Гісторыя тэорыі лічбаў і матэматыкі ў кантэксце лічбавых тэхналогій.

Распрацоўшчык: SparkAudio · Ліцэнзія: Apache 2.0

Паспрабуйце

GPT-SoVITSGPT-SoVITS Standard

Усяго было выпушчана каля 5000 экзэмпляраў кнігі, што складае каля 50 % усяго накладу часопіса.

Распрацоўшчык: RVC-Boss · Ліцэнзія: MIT

Паспрабуйце

OrpheusOrpheus Standard

У 100-гадовым юбілеі гімназіі было выдадзена 100-тысячнае выданне кнігі.

Распрацоўшчык: Canopy Labs · Ліцэнзія: Llama 3.2 Community

Паспрабуйце

Qwen3 TTSQwen3 TTS Standard

Мультымоўны TTS Alibaba з клонаваннем голасу, прадвызначанымі голасамі і дызайнам голасу з тэксту.

Распрацоўшчык: Alibaba (Qwen) · Ліцэнзія: Apache 2.0

Паспрабуйце

ChatterboxChatterbox Premium

Сістэма лічбавага тэлевізійнага вяшчання ўключае ў сябе лічбавае тэлебачанне і лічбавую радыёвяшчанне.

Якасць:

Паспрабуйце

Tortoise TTSTortoise TTS Premium

Большасць тэкстаў напісана ў стылі класіцызму з элементамі рэнесансу.

Якасць:

Паспрабуйце

StyleTTS 2StyleTTS 2 Premium

Працаваў у галіне тэарэтычнай геаграфіі і геаграфічнай геаграфіі.

Якасць:

Паспрабуйце

OpenVoiceOpenVoice Premium

Неадкладнае кланаванне голасу з дэталёвым кантролем над стылем, эмоцыямі і акцэнтам.

Якасць:

Паспрабуйце

CosyVoice 2CosyVoice 2

Нацыянальны гімн Рэспублікі Беларусь — гімн Рэспублікі Беларусь і дзяржаўны гімн Рэспублікі Беларусь.

Мовы: en, zh, ja, ko, fr, de, it, es

Клонаваць голас

IndexTTS-2IndexTTS-2

Сістэма лічбавага тэлебачання мае высокую эфектыўнасць і высокую дакладнасць.

Мовы: en, zh

Клонаваць голас

Spark TTSSpark TTS

Гісторыя тэорыі лічбаў і матэматыкі ў кантэксце лічбавых тэхналогій.

Мовы: en, zh

Клонаваць голас

GPT-SoVITSGPT-SoVITS

Усяго было выпушчана каля 5000 экзэмпляраў кнігі, што складае каля 50 % усяго накладу часопіса.

Мовы: en, zh, ja, ko

Клонаваць голас

ChatterboxChatterbox

Сістэма лічбавага тэлевізійнага вяшчання ўключае ў сябе лічбавае тэлебачанне і лічбавую радыёвяшчанне.

Мовы: en

Клонаваць голас

Tortoise TTSTortoise TTS

Большасць тэкстаў напісана ў стылі класіцызму з элементамі рэнесансу.

Мовы: en

Клонаваць голас

OpenVoiceOpenVoice

Неадкладнае кланаванне голасу з дэталёвым кантролем над стылем, эмоцыямі і акцэнтам.

Мовы: en, zh, ja, ko, fr, de, es, it

Клонаваць голас

Qwen3 TTSQwen3 TTS

Мультымоўны TTS Alibaba з клонаваннем голасу, прадвызначанымі голасамі і дызайнам голасу з тэксту.

Мовы: en, zh, ja, ko, de, fr, ru, pt, es, it

Клонаваць голас

API для распрацоўшчыкаў

OpenAI-сумяшчальны REST API. Адзін канец, 22+ мадэлі. Падтрымка стрымінгу для прыкладанняў рэальнага часу.

  • Фармат, сумяшчальны з OpenAI
  • Трансляцыя TTS для праграмаў рэальнага часу
  • Пакетная апрацоўка вялікіх заданняў
  • Абвяшчэнні Webhook
Прагляд дакументацыі API
Python
import requests

response = requests.post(
    "https://api.tts.ai/v1/tts/",
    headers={"Authorization": "Bearer sk-tts-xxx"},
    json={
        "model": "kokoro",
        "text": "Hello from TTS.ai!",
        "voice": "af_bella",
    }
)

with open("output.mp3", "wb") as f:
    f.write(response.content)

Простая, празрыстая цана

Пачынайце бясплатна. Змяняйце памер па меры росту.

Свабодны

$0

Крэдыты

  • Kokoro, Piper, VITS, MeloTTS
  • Абмежаванне на 500 знакаў
  • 3 гадзіны (без рахунку)
Падпісацца бясплатна

Старт

$9/месяц( аў)

500 кредитов/ месяц

  • Усе 22+ мадэлі
  • Абмежаванне на 5000 знакаў
  • Клонаванне голасу
Пачаць
Самыя папулярныя

Прафесійны

$29/месяц( аў)

2, 000 крэдыт/ месяц

  • Усё ў запуску
  • Даступ да API
  • Прыярытэтная апрацоўка
Атрымаць Pro

Кампанія

$99/месяц( аў)

10, 000 крэдыт/ месяц

  • Усё ў Pro
  • Масавае API
  • Чарга прыярытэтаў
Звязацца з прадаўцом

Прагляд усіх планаў, уключаючы крэдытныя пакеты →

Частыя пытанні

TTS.ai - гэта самая поўная галасавая платформа штучнага інтэлекту, якая прапануе больш за 22 мадэляў пераўтварэння тэксту ў мову, кланаваньне голасу, пераўтварэньне тэксту ў мову і аўдыёінструмэнты. Усе мадэлі маюць адкрыты зыходны код і не залежаць ад вытворцы.

Так! TTS.ai прапануе бясплатнае пераўтварэнне тэксту ў мову з мадэлямі Kokoro, Piper, VITS і MeloTTS. Не патрабуецца рахунак. Зарэгіструйцеся, каб атрымаць 50 бясплатных крэдытных балаў і атрымаць доступ да ўсіх мадэляў. Плацежныя планы пачынаюцца ад $ 9 / месяц.

Для хуткасці, выкарыстоўвайце Kokoro або Piper. Для якасці, паспрабуйце CosyVoice 2 або StyleTTS 2. Для клонавання голасу, выкарыстоўвайце Chatterbox або GPT- SoVITS. Для дыялогу, выкарыстоўвайце Dia TTS. Паспрабуйце некалькі мадэляў для аднаго і таго ж тэксту, каб параўнаць.

Так. OpenAI-сумяшчальны REST API для TTS, STT, клонавання голасу і аўдыё інструментаў. Даступны на Pro ($29/месяц) і Enterprise ($99/месяц) планах. Праглядзець дакументацыю на tts.ai/api/.

Якасць голасу адрозніваецца ў залежнасці ад мадэлі. Прафесійныя мадэлі, такія як CosyVoice 2, StyleTTS 2 і Chatterbox, выпрацоўваюць голас, які нагадвае голас чалавека з натуральнай інтанацыяй і эмоцыямі. Бясплатныя мадэлі, такія як Kokoro, забяспечваюць выдатную якасць для большасці выпадкаў выкарыстання.

TTS.ai падтрымлівае больш за 30 моў у сваёй бібліятэцы мадэляў. Англійская мае найбольш шырокую падтрымку мадэляў, але такія мадэлі, як CosyVoice 2, падтрымліваюць кітайскую, японскую і карэйскую; GPT-SoVITS падтрымлівае кітайскую, японскую, карэйскую і англійскую; і MeloTTS падтрымлівае англійскую, іспанскую, французскую, кітайскую, японскую і карэйскую.

Так. Уся апрацоўка адбываецца на нашых выдзеленых серверах GPU. Мы не захоўваем ваш тэкставы ўвод або створаны гук пасля дастаўкі. Загружаныя прыклады голасу для клонавання выкарыстоўваюцца толькі для бягучай сесіі і не захоўваюцца. Мы ніколі не падзяляем вашыя дадзеныя з трэцімі асобамі і не выкарыстоўваем іх для трэніроўкі мадэляў.

Так. Усё аўдыё, створанае на TTS.ai, можа быць выкарыстана ў камерцыйных мэтах, у тым ліку для відэа YouTube, падкастаў, аўдыёкніг, праграм, рэкламы і прадуктаў. Нашы мадэлі маюць адкрыты зыходны код з дазволенымі ліцэнзіямі (MIT, Apache 2.0). Не патрабуецца аплаціць аўтарскія правы.

Па змаўчанні TTS.ai генеруе аўдыё ў фармаце WAV для максімальнай якасці. Вы можаце пераўтварыць яго ў MP3, FLAC, OGG або M4A з дапамогай нашага бясплатнага інструмента для пераўтварэння аўдыё. API падтрымлівае вызначэнне вашага выхаднога фармату прама ў запыце.

Загрузіце кароткі аўдыёзапіс (не больш за 5 секунд) галасу, які вы хочаце клануць, а затым увядзіце любы тэкст, каб стварыць размову ў гэтым голасе. Такія мадэлі, як Chatterbox, GPT- SoVITS і CosyVoice 2 падтрымліваюць кланаваньне голасу. Клонаваны голас захоплівае тон, акцэнт і стыль гаворкі.

Бясплатныя мадэлі (Kokoro, Piper, VITS, MeloTTS) не патрабуюць уліковага запісу і каштуюць нуля крэдытных пунктаў. Стандартныя мадэлі (2 крэдытных пункта / 1К знакаў) уключаюць Bark, CosyVoice 2, F5-TTS і Dia. Прэміум-мадэлі (4 крэдытных пункта / 1К знакаў) уключаюць OpenVoice, Chatterbox, StyleTTS 2 і Tortoise. Плацежныя мадэлі звычайна прапануюць больш якасныя, больш галасоў і дадатковыя магчымасці, такія як клонаванне голасу.

Так. API падтрымлівае пакетную апрацоўку для пераўтварэння вялікіх аб'ёмаў тэксту ў мову. Адпраўляйце некалькі запытаў і атрымлівайце вынікі асінхронна, выкарыстоўваючы UUID заданняў. Планы для прадпрыемстваў ($99/месяц) уключаюць прыярытэтны доступ да чаргі для хутчэйшай пакетнай апрацоўкі. Ідэальна падыходзіць для вытворчасці аўдыякніг, зместу курсаў і буйных праектаў дыялогу.
5.0/5 (1)

Пачаць карыстацца AI Voice сёньня

Далучайцеся да стваральнікаў, распрацоўшчыкаў і кампаній, якія карыстаюцца TTS.ai