Bezmaksas AI Teksts uz runu

22+ atvērtā avota modeļi, 100+ balsis, 32+ valodas. Konts nav nepieciešams.

0/500 rakstzīmes Bezmaksas
Nav kredītkartes 50 bezmaksas kredīti 32+ valodas Komerciālai lietošanai
0:00 / 0:00
Download Audio Saite beidzas 24h
Izstāsti draugiem!

22+ AI balss modeļi

Visplašākā atvērtā avota TTS modeļu kolekcija vienā platformā

KokoroKokoro Free

Kokoro is an 82 million parameter text-to-speech model that punches well above its weight class. Despite its tiny size, it produces remarkably natural and expressive speech. Kokoro supports multiple languages including English, Japanese, Chinese, and Korean with a variety of expressive voices. It runs incredibly fast — generating audio nearly 100x faster than real-time on a GPU.

Labākais par: High-quality TTS with minimal latency, streaming applications

Mēģināt atbrīvot

PiperPiper Free

Piper is a lightweight text-to-speech engine developed by Rhasspy that uses VITS and larynx architectures. It runs entirely on CPU, making it ideal for edge devices, home automation, and applications requiring offline TTS. With over 100 voices across 30+ languages, Piper delivers natural-sounding speech at real-time speeds even on a Raspberry Pi 4.

Labākais par: Quick previews, accessibility, and embedded applications

Mēģināt atbrīvot

VITSVITS Free

VITS (Variational Inference with adversarial learning for end-to-end Text-to-Speech) is a parallel end-to-end TTS method that generates more natural sounding audio than current two-stage models. It adopts variational inference augmented with normalizing flows and an adversarial training process, achieving a significant improvement in naturalness.

Labākais par: General-purpose text-to-speech with natural prosody

Mēģināt atbrīvot

MeloTTSMeloTTS Free

MeloTTS by MyShell.ai is a multilingual TTS library supporting English (American, British, Indian, Australian), Spanish, French, Chinese, Japanese, and Korean. It is extremely fast, processing text at near real-time speed on CPU alone. MeloTTS is designed for production use and supports both CPU and GPU inference.

Labākais par: Ražošanas lietojumprogrammas, kurām nepieciešama ātra, daudzvalodu TTS

Mēģināt atbrīvot

BarkBark Standard

Transformer-based text-to-audio model that generates realistic speech, music, and sound effects.

Izstrādātājs: Suno · Licence: MIT

Pamēģini to

Bark SmallBark Small Standard

Lighter version of Bark with faster inference and lower memory usage.

Izstrādātājs: Suno · Licence: MIT

Pamēģini to

CosyVoice 2CosyVoice 2 Standard

Alibaba's scalable streaming TTS with human-parity naturalness and near-zero latency.

Izstrādātājs: Alibaba (Tongyi Lab) · Licence: Apache 2.0

Pamēģini to

Dia TTSDia TTS Standard

Vairāku runātāju dialoga paaudzes modelis, kas rada dabiskas sarunas starp runātājiem.

Izstrādātājs: Nari Labs · Licence: Apache 2.0

Pamēģini to

Parler TTSParler TTS Standard

Describe the voice you want in natural language and Parler generates matching speech.

Izstrādātājs: Hugging Face · Licence: Apache 2.0

Pamēģini to

IndexTTS-2IndexTTS-2 Standard

Zero-shot TTS with fine-grained emotion control and high expressiveness.

Izstrādātājs: Index Team · Licence: Apache 2.0

Pamēģini to

Spark TTSSpark TTS Standard

Voice cloning TTS with controllable emotion and speaking style via prompts.

Izstrādātājs: SparkAudio · Licence: Apache 2.0

Pamēģini to

GPT-SoVITSGPT-SoVITS Standard

Few-shot voice cloning TTS that replicates any voice from just 5 seconds of audio.

Izstrādātājs: RVC-Boss · Licence: MIT

Pamēģini to

OrpheusOrpheus Standard

Human-level emotional TTS model trained on 100K hours of speech data.

Izstrādātājs: Canopy Labs · Licence: Llama 3.2 Community

Pamēģini to

Qwen3 TTSQwen3 TTS Standard

Alibaba's multilingual TTS with voice cloning, preset voices, and voice design from text.

Izstrādātājs: Alibaba (Qwen) · Licence: Apache 2.0

Pamēģini to

ChatterboxChatterbox Premium

Mūsdienu nulles-shot balss klonēšana ar emociju kontroli no Reemble AI.

Kvalitāte:

Pamēģini to

Tortoise TTSTortoise TTS Premium

Daudzbalsu teksts-to-speech koncentrējas uz kvalitāti ar autoregesīvu arhitektūru.

Kvalitāte:

Pamēģini to

StyleTTS 2StyleTTS 2 Premium

Human-level text-to-speech through style diffusion and adversarial training.

Kvalitāte:

Pamēģini to

OpenVoiceOpenVoice Premium

Instant balss klonēšana ar granulu kontroli pār stilu, emocijām un akcentu.

Kvalitāte:

Pamēģini to

CosyVoice 2CosyVoice 2

Alibaba's scalable streaming TTS with human-parity naturalness and near-zero latency.

Valodas: en, zh, ja, ko, fr, de, it, es

Clone Balss

IndexTTS-2IndexTTS-2

Zero-shot TTS with fine-grained emotion control and high expressiveness.

Valodas: en, zh

Clone Balss

Spark TTSSpark TTS

Voice cloning TTS with controllable emotion and speaking style via prompts.

Valodas: en, zh

Clone Balss

GPT-SoVITSGPT-SoVITS

Few-shot voice cloning TTS that replicates any voice from just 5 seconds of audio.

Valodas: en, zh, ja, ko

Clone Balss

ChatterboxChatterbox

Mūsdienu nulles-shot balss klonēšana ar emociju kontroli no Reemble AI.

Valodas: en

Clone Balss

Tortoise TTSTortoise TTS

Daudzbalsu teksts-to-speech koncentrējas uz kvalitāti ar autoregesīvu arhitektūru.

Valodas: en

Clone Balss

OpenVoiceOpenVoice

Instant balss klonēšana ar granulu kontroli pār stilu, emocijām un akcentu.

Valodas: en, zh, ja, ko, fr, de, es, it

Clone Balss

Qwen3 TTSQwen3 TTS

Alibaba's multilingual TTS with voice cloning, preset voices, and voice design from text.

Valodas: en, zh, ja, ko, de, fr, ru, pt, es, it

Clone Balss

Izstrādātājs- pirmais API

Ar OpenAI saderīgu REST API. Viens mērķa kritērijs, 22+ modeļi. Streaming atbalsts reālā laika lietojumprogrammām.

  • Ar OpenAI savietojams formāts
  • TTS plūsmas reāllaika lietojumprogrammām
  • Partijas apstrāde lielām darbavietām
  • Webhook paziņojumi
Skatīt API dokumentus
Python
import requests

response = requests.post(
    "https://api.tts.ai/v1/tts/",
    headers={"Authorization": "Bearer sk-tts-xxx"},
    json={
        "model": "kokoro",
        "text": "Hello from TTS.ai!",
        "voice": "af_bella",
    }
)

with open("output.mp3", "wb") as f:
    f.write(response.content)

Vienkārša, pārredzama cenu noteikšana

Sākt bez maksas. Scale kā jūs augt.

Bezmaksas

$0

50 kredīti

  • Kokoro, Piper, VITS, MeloTTS
  • 500 rakstzīmju limits
  • 3 g/stundā (nav konta)
Pierakstīties brīvībā

Palaist

$9/s ta

500 kredīti/mēnesis

  • Visi 22+ modeļi
  • 5 000 rakstzīmju limits
  • Balss klonēšana
Palaist
Populārākais

Pro

$29/s ta

2 000 kredīti/mēnesis

  • Viss iesākumā
  • API piekļuve
  • Prioritārā apstrāde
Iegūst Pro

Uzņēmums

$99/s ta

10 000 kredīti/mēnesis

  • Viss Pro
  • Neiesaiņots API
  • Prioritātes rinda
Kontaktu tirdzniecība

View all plans including credit packs →

Bieži uzdoti jautājumi

TTS.ai ir visaptverošākā AI balss platforma, kas piedāvā 22+ text-to-speech modeļus, balss klonēšanu, runas-teksta un audio rīkus. Visi modeļi ir atvērts avots bez pārdevēja bloķēšanas.

Jā! TTS.ai piedāvā bezmaksas tekstu-to-speech ar Kokoro, Piper, VITS, un MeloTTS modeļiem. Nav nepieciešams konts. Pieteikties, lai saņemtu 50 bezmaksas kredītus un piekļūtu visiem modeļiem. Maksājamie plāni sākas ar $9/mēnesi.

Ātrumam, lietot Kokoro vai Piper. Kvalitātei, izmēģiniet CosyVoice 2 vai StyleTTS 2. Balss klonēšanai, izmantojiet Chatterbox vai GPT-SoVITS. Dialogam, izmantojiet Dia TTS. Mēģiniet vairākus modeļus tajā pašā tekstā, lai salīdzinātu.

Jā. OpenAI-saderīgs REST API TTS, STT, balss klonēšana, un audio rīki. Pieejams uz Pro ($29/mo) un Enterprise ($ 99/mo) plāniem. Skatīt dokumentāciju at tts.ai/api/.

Balss kvalitāte atšķiras pēc modeļa.Premium modeļi, piemēram, CosyVoice 2, StyleTTS 2, un Chatterbox ražo gandrīz cilvēka kvalitātes runu ar dabisku intonāciju un emocijām. Bezmaksas modeļi, piemēram, Kokoro piedāvā lielisku kvalitāti lielākajai daļai lietošanas gadījumu.

TTS.ai atbalsta 30+ valodas visā tās modeļa bibliotēka. Angļu ir plašāks modelis atbalsts, bet modeļi, piemēram, CosyVoice 2 aptver ķīniešu, japāņu, un korejiešu; GPT-SoVITS apstrādā ķīniešu, japāņu, korejiešu, un angļu; un MeloTTTS atbalsta angļu, spāņu, franču, ķīniešu, japāņu, un korejiešu.

Jā. Visa apstrāde notiek uz mūsu atvēlētajiem GPU serveriem. Mēs neglabājam jūsu teksta ievadi vai neražojam audio pēc piegādes. Ielādētie balss paraugi klonēšanai tiek izmantoti tikai pašreizējā sesijā un netiek saglabāti. Mēs nekad nedalām jūsu datus ar trešām personām un neizmantojam tos modeļu apmācīšanai.

Yes. All audio generated on TTS.ai is yours to use commercially, including for YouTube videos, podcasts, audiobooks, apps, advertisements, and products. Our models are open source under permissive licenses (MIT, Apache 2.0). No royalties or attribution required.

TTS.ai ģenerē audio WAV formātā pēc noklusējuma maksimālai kvalitātei. Jūs varat konvertēt uz MP3, FLAC, OGG, vai M4A, izmantojot mūsu bezmaksas Audio Converter rīks. API atbalsta norādot savu vēlamo izejas formātu tieši pieprasījumā.

Upload a short audio sample (as little as 5 seconds) of the voice you want to clone, then type any text to generate speech in that voice. Models like Chatterbox, GPT-SoVITS, and CosyVoice 2 support voice cloning. The cloned voice captures tone, accent, and speaking style.

Bezmaksas modeļi (Kokoro, Piper, VITS, MeloTTS) neprasa konta un izmaksu nulles kredītus. Standarta modeļi (2 kredītpunkti/1K rakstzīmes) ietver mīklu, cosyVoice 2, F5-TTS un Dia. Premium modeļi (4 kredītpunkti/1K rakstzīmes) ietver OpenVoice, Chatterbox, StyleTTS 2 un Tortoise. Apmaksāti modeļi parasti piedāvā augstāku kvalitāti, vairāk balsis un papildu funkcijas, piemēram, balss klonēšanu.

Jā. API atbalsta partijas apstrādi pārveidot lielus apjomus teksta uz runu. Iesniegt vairākus pieprasījumus un iegūt rezultātus asinchroniski, izmantojot darbu UUID. Uzņēmējdarbības plāni ($ 99/mo) ietver prioritāro rindu piekļuvi ātrākai partijas apstrādi. Ideāli piemērots audiogrāmatu ražošanai, protams, saturu, un liela mēroga skaļrunis projekti.
5.0/5 (1)

Sākt izmantojot AI balsi šodien

Pievienojies radītāji, izstrādātāji, un uzņēmumi, kas izmanto TTS.ai