Tẹ́ètị̀ ka ọ̀sụ̀sụ̀ nà ámóòdù

Nweta okwu na ngosipụta ezi uche dị na ya - ụtọ, njọ, na-echegbu onwe ya, na-echegbu onwe ya, na ihe ndị ọzọ. Modelsdị AI anyị na-aga n'ihu n'ihu n'ihu n'ihu n'ihu n'ihu n'ihu n'ihu n'ihu n'ihu n'ihu n'ihu.

Nnọọ Sọnde N'enyo enyo N'anụ ọhịa Kpụghaa

Jiri ya ugbua

Free na Kokoro, Piper, VITS, MeloTTS
Ọdịdị gị ga-egosipụta ebe a
E mepụtara
Bubata
Ị hụrụ TTS.ai? Kpọtụrụ enyi gị!

Emotional TTS Features

Asụsụ AI nke na-egosi mmetụta uche na nuance

Nhazi

Kewapụta okwu na ụda ndị dị iche iche - obi ụtọ, ọmịiko, ọdachi, ọdachi, asị, achọghị, na nke na-adịghị. Ọnụnọ ọ bụla na-agbanwe agbanwe, ọsọ, na ụda.

Nhazi ụda

Nhazi n'ụdị n'ụdị n'ụdị n'ụdị n'ụdị n'ụdị n'ụdị n'ụdị n'ụdị n'ụdị n'ụdị n'ụdị n'ụdị n'ụdị n'ụdị n'ụdị n'ụdị n'ụdị n'ụdị n'ụdị n'ụdị n'ụdị n'ụdị n'ụdị n'ụdị n'ụdị n'ụdị n'ụdị n'ụdị n'ụdị n'ụdị n'ụdị n'ụdị n'ụdị n'ụdị n'ụdị n'ụdị n'ụdị n'ụdị n'ụdị n'ụdị n'ụdị n'ụdị n'ụdị n'ụdị n'ụdị n'ụdị n'ụdị n'ụdị n'ụdị n'ụdị n'ụdị n'ụdị n'ụdị n'ụdị n'ụdị n'ụdị n'ụdị n'ụdị n'ụdị n'ụdị n'ụdị n'ụdị n'ụdị n'ụdị n'ụdị n'ụdị n'ụdị n'ụdị n'ụdị n'ụdị n'ụdị n'ụdị n'ụdị n'ụdị n'ụdị n'ụdị n'ụdị n'ụdị n'ụdị n'ụdị n'ụdị n'ụdị n'ụdị n'ụdị n'ụdị n'ụdị n'ụdị n'ụdị n'ụdị n'ụdị n'ụdị n'ụdị n'ụdị n'ụdị n'ụdị n'ụdị n'ụdị n'ụdị n'ụdị n'ụdị n'ụdị n'ụdị n'ụdị n'ụdị n'ụdị n'ụdị n'ụdị n'ụdị n'ụdị n'ụdị n'ụdị n'ụdị n'ụdị n'ụdị n'ụdị n'ụdị n'ụdị n'ụdị n'ụdị n'ụdị n'ụdị n'ụdị n'ụdị n'ụdị n'ụdị n'ụdị n

Nhazi ụghasị

Ndụmọdụ na-emetụta ụkpụrụokwu niile, ọ bụghị naanị ụda. Ndụmọdụ na-atọ ụtọ dị n'okpuru n'okpuru ụda. Ndụmọdụ na-atọ ụtọ dị n'okpuru ụda. Ndụmọdụ na-atọ ụtọ dị n'okpuru ụda.

Nsọ na-asị

N'ebe dị anya n'ihe na-eme, mepụta okwu na-asị okwu maka ihe ndị dị n'ime ma ọ bụ ASMR, nakwa ịnyefe nke ọma maka oge na-atọ ụtọ na nkwupụta.

Nkọwa ngwe-ahụhụ

Otú ọ dị, ụfọdụ móòdù na-ahụ́ n'onwe ya n'ihe gbasara n'obi site na ngwe. Ajụjụ na-enweta n'ịga n'ihu, okwu na-asị na-enweta n'ịga n'ihu, na ndesịta na-enwetakwa n'ịga n'ihu.

Nhazi Fine-Grained

Advanced parameters let you control pitch range, speaking rate, energy level, and breathiness independently for custom emotional profiles beyond presets.

Models kacha mma maka okwu emotional

Models ndị na-apụta n'ịgwa ihe na-akọwapụta

ChatterboxChatterbox

Premium

State-of-the-art zero-shot voice cloning with emotion control from Resemble AI.

Medium 5/5 Klọnsị ụda

Ọkachasị maka: Nhazi mmetụta kacha mma - mmetụta na-agbanwe agbanwe na-ebido na ụda

Nwapụta Chatterbox

BarkBark

Standard

Transformer-based text-to-audio model that generates realistic speech, music, and sound effects.

Slow 4/5

Ọkachasị maka: Nnụnụ na-adịghị agwụ agwụ, nkụda mmụọ, ịkpọasị, na ụda ndị na-adịghị asị okwu

Nwapụta Bark

OrpheusOrpheus

Standard

Human-level emotional TTS model trained on 100K hours of speech data.

Medium 5/5

Ọkachasị maka: Human-level emotional range trained on 100K hours of expressive speech

Nwapụta Orpheus

Dia TTSDia TTS

Standard

Multi-speaker dialog generation model that creates natural conversations between speakers.

Medium 5/5

Ọkachasị maka: Ndụmọdụ n'etiti akara na-atụgharị n'ụzọ na-adịghị agwụ agwụ

Nwapụta Dia TTS

Parler TTSParler TTS

Standard

Describe the voice you want in natural language and Parler generates matching speech.

Medium 4/5

Ọkachasị maka: Depụtapụta mmeri emotional na English dị mfe maka nlekọta nghọta

Nwapụta Parler TTS

CosyVoice 2CosyVoice 2

Standard

Alibaba's scalable streaming TTS with human-parity naturalness and near-zero latency.

Medium 5/5 Klọnsị ụda

Ọkachasị maka: Nhazi mmetụta n'ime onwe nke dị n'ime na-ebido maka usoroiheomume oge-ọdịnihu

Nwapụta CosyVoice 2

Olee otú a ga-esi mepụta okwu na-atọ ụtọ

Tinye émòjì kà ikwú AI nà sekọnd

1

Bipụta ngwe gị

Tinye ngwe ịchọrọ ka a kọwaa ya n'ụzọ na-akpali akpali. Ihenhọrọ ahụ onwe ya nwere ike imetụta n'ụzọ na-akpali akpali - ajụjụ, na ngwe na-akpali akpali na-eduga n'ụzọ na-akpali akpali.

2

Họrọ Emóòdù

Họrọ n'etiti obi ụtọ, ọmịiko, ihere, ihere, ihere, ihere, ma ọ bụ nkịtị. Otú ọ dị, ụfọdụ móòdù na-enyekwa mmetụta ndị ọzọ dị ka nkụda mmụọ, obi ụtọ, ma ọ bụ ikike.

3

Nhazi ụda

Fine-tune ka esi egosi mmetụta dị ike. Nnukwu ike dị ala na-eweta agba dị nro. Nnukwu ike dị elu na-eweta ihe dị egwu, ngosipụta mmetụta na-enweghị atụ.

4

Kewapụta na wepụ

Kewapụta okwu ma ṅụọ. Kwụsị ụdị mmetụta, ike, mọọbụ móòdù ruo mgbe ọ ga-abịa n'ụzọ gị. Bubata ụda nke ikpeazụ na MP3 mọọbụ WAV.

Nhazi TTS

Olee otú móòdù dị iche iche si arụ ọrụ n'ihe ndị na-eme n'obi

Bark - Nhazi ụda na-akọwapụta

Bark nwere ike ịmepụta ụda ndị na-abụghị nke okwu n'akụkụ okwu. Jiri ngwe ndị dị ka [laughs], [sighs], [gasps], mọọbụ [clears throat] n'ụzọ ziri ezi n'ime ngwe gị iji maliteghachi mmeghachi omume nke uche. Bark nwekwara ike ịgụ, ịgwa, ma ọ bụ mepụta okwu na mmegharị uche siri ike.

  • Nri:
  • Ochie:
  • N'anụ ọhịa: \
  • Ọgụgụ: Ụdị ụda na ụda

Orpheus - Emóòyì Táàbụ̀

Orpheus (nke e mepụtara na Llama 3.2) na-akwado nchịkwa mmem n'ime táàbụ̀. Kpọchie ngwe n'ime akara mmem iji chịkwaa ntụgharị: , , , , . Kpọchie mmem n'ime otu nsụgharị maka ntụgharị, gbanwere ụda.

  • maka ọbụna, n'omume n'omume
  • maka melancholic, somber tone
  • maka okwu na-akpụzi, na-akpụzi
  • maka ihenhọrọ ndị ahụ na-adọta uche, na-adọta uche

Dia - Mọlti-Speịkaịr Dàilọ́ọ̀gụ̀

Dia na-ahụ maka okwu na-ekwu okwu na ndị na-ekwu okwu abụọ. Ọ na-elekọta ntụgharị, nkwụsịtụ, na ntụgharị uche nke ntụgharị uche nke eziokwu. Ọ dị mma maka ịmepụta ntụgharị okwu, ntụgharị okwu, ma ọ bụ ọdịnaya ụdị podcast ebe ntụgharị uche dị mkpa.

  • Nhazi okwukwe
  • Ụdị ụda abụọ na ụda dị iche iche
  • Nhazi n'etiti ndị na-ekwu okwu
  • Ụda ndị na-abụghị nke a na-asị (nnụnụ, nkụda mmụọ)

Sesame CSM - Nkọwa okwu

Sesame CSM (Conversational Speech Model) e mepụtara iji mepụta okwu na-atọ ka okwu na-atọ, ọ bụghị ịgụ n'olu. Ọ na-elekọta ihe ndị dị n'obi nke okwu - nkwụsị maka echiche, n'akụkọ ihe mere eme na okwu ndị dị mkpa, na-arịwanye elu maka ajụjụ, nakwa n'ịna-enwe obi ụtọ n'ime ọnọdụ enyi.

  • Nkọwa-aghọta-ihe na-abịanụ
  • Ndụmọdụ nkịtị
  • Nkọwa dị mma na paịsịịng
  • Warm, quality-like-human

Mgbe Emotion Matters

Jiri ihenhọrọ ebe emotional TTS na-eme mgbanwe zuru ezu

Egwuregwu dayalọ́ọ̀gụ̀

NPC nke na-asị na ọ na-echegbu onwe ya, onye na-emebi ihe na-emebi ihe, onye na-ejere ibe ya ozi na-enwe obi ụtọ. Emotional TTS na-eme ka egwuregwu ndị ahụ dị n'ime na-atọ ụtọ.

Agụgụ akwụkwọ ụda

Onye na-ekwu okwu nke na-ekwu okwu n'oge na-adịghị mma, na-asị okwu n'oge ọrụ, nakwa na-ekwu okwu n'ụzọ dị mfe n'oge na-atọ ụtọ. Emotional range na-atụgharị ngwe n'ime akụkọ ụda na-atọ ụtọ.

Marketing & Ads

Ndị na-anụ ọkụ n'obi maka ịmalite ngwaahịa, ndị na-anụ ọkụ n'obi maka ndị na-ekwu okwu, ndị na-anụ ọkụ n'obi maka ndị na-enye oge oge.

Asụsụ Emotional site na API

Kewapụta okwu na nlekọta émó̀ìọ̀tụ̀tụ̀

Python - Emotional TTS na Bark REST API
import requests

# Bark supports inline emotion cues
emotions = {
    "happy": "This is absolutely wonderful! [laughs] I love it!",
    "sad": "[sighs] I wish things could have been different...",
    "angry": "I told you not to do that! This is unacceptable!",
    "whisper": "[whispers] Can you keep a secret?",
    "excited": "Oh my gosh! [gasps] We won! We actually won!"
}

for emotion, text in emotions.items():
    response = requests.post("https://api.tts.ai/v1/tts", json={
        "text": text,
        "model": "bark",
        "voice": "v2/en_speaker_6",
        "format": "wav"
    }, headers={"Authorization": "Bearer YOUR_API_KEY"})

    with open(f"emotion_{emotion}.wav", "wb") as f:
        f.write(response.content)

Ogo ndị ahụ na-emetụ n'obi n'ụdị ọbụla

Ọbụna ụdị ndị dị n'efu dị ka Kokoro na-enye nghọta nke uche site na punctuation na context.

Nhazi

$0

15,000 characters on signup

  • Kokoro ngwe-ekwenyeghi-ekwenyeghi
  • Nhazi nke na-adabere na pọntọ́ọ̀tụ̀ọ̀
  • Nhazi ajụjụ na akara ekwuru

Òtù

$9

500,000 characters/month

  • Ọnụ na ụda na-anụ ọkụ n'obi
  • Táàbụ̀ émòyì Orpheus
  • Dia conversational emotions

Pro

$29

2,000,000 characters/month

  • Sesame CSM conversational
  • Móòdù ndị na-egosi ihe niile
  • Klọnsị ụda na émòshìǹ
Gosi ọnụọgụgụ zuru ezu

Ajụjụ ndị a na-ajụkarị

Ajụjụ ndị a na-ajụkarị banyere ngwe na-atụgharị uche ka ọsụsọ

Chatterbox, Bark, Orpheus, Dia, Parler, CosyVoice 2, na IndexTTS-2 niile na-enyere aka n'ịkọwapụta ahụmịhe. Chatterbox na-enye nchịkwa n'ụdị n'ụdị n'ụdị. Bark na-emepụta ụda ndị na-abụghị nke a na-asị n'asụsụ dị ka ịnụ ọkụ n'obi na ịsị.

Models na-eji emotions embeddings mọọbụ conditioning signals iji megharịa okwu a haziri. Ha na-emetụta pitch contour, ikwu ọsọ, ogo ike, nakwa ụda. Ihe a ga-enweta bụ okwu nke na-eweta n'ụzọ na-emeghị n'ụzọ n'ihe a haziri n'ihe edere n'akwụkwọ.

Ee. Bark na Chatterbox na-akwado whispering. Bark na-ebipụta okwu whispered site na ngwe cues dị ka "[whispers]" n'ime init. Chatterbox na-enye ohere ịchịkwa whisper site n'ime parameters ya. Ogo whispered na-atọ ụtọ nakwa n'ime onwe ya.

Ee. Bark bụ móòdù kasị mma maka nsụgharị okwu na-enweghị okwu. O nwere ike ịmepụta ụda na-anụ ọkụ n'obi, na-asị, na-asị, nakwa ụda ndị ọzọ site n'ịgụnye ụda n'ime ngwe ahụ. Ụda ndị a na-ejikọta ha n'ụzọ dị mfe na okwu ndị a na-ekwu.

N'ụzọ dị mfe na model dị n'aka nri. Orpheus a zụlitere na 100K awa nke okwu na-akọwapụta na-abịarute n'ihe na-akọwapụta mmetụta uche nke mmadụ. Chatterbox na-emepụta ihe na-akọwapụta mmetụta uche na-akọwapụta na ndị na-ege ntị na-agaghị achọ ịkọwapụta site na ntọhapụ mmadụ.

Ya. Chatterbox na CosyVoice 2 na-enye n'ozuzu ya n'ozuzu ya sliders. Hazie emotion ka 20% maka agba dị n'ime ma ọ bụ 100% maka ngosipụta dị egwu. Nhazi a na-enye gị ohere ịhazi ụda emotion zuru ezu nke ihenhọrọ gị chọrọ.

Nnọọ n'ụdị ahụ na-agụnye obi ụtọ, ọnwụnwa, ọdachi, ọdachi, ịtụnanya, ịdachi, na nke na-adịghị. Otú ụfọdụ si dị na-agbakwunye ịgwa, ịgwa, ịgwa n'asụsụ dị iche iche, ịgwa n'asụsụ dị iche iche, na ịgwa n'asụsụ dị iche iche. Parler na-enye gị ohere ịkọwapụta ọbụna ụda ọ bụla n'asụsụ dị iche iche.

Ee. Jiri Dia TTS maka okwu okwu emo-ọbjektị abụọ, mọọbụ mepụta ihenhọrọ ọbụla n'otu n'otu na nhazi mmetụta dị iche iche. Hazie obi ụtọ na ihenhọrọ otu na nkụda mmụọ na nke ọzọ maka ntụgharị uche dị ukwuu.

N'ezie. Emotional TTS na-agbanwe agbanwe n'ime akụkọ na-atọ ụtọ. N'ihi na ihe omume na-eme ka ihe omume dị mma - n'ihi na n'ihi na n'ihi na n'ihi na n'ihi na n'ihi na n'ihi na n'ihi na n'ihi na n'ihi na n'ihi na n'ihi na n'ihi na n'ihi na n'ihi na n'ihi na n'ihi na n'ihi na n'ihi na n'ihi na n'ihi na n'ihi na n'ihi na n'ihi na n'ihi na n'ihi na n'ihi na n'ihi na n'ihi na n'ihi na n'ihi na n'ihi na n'ihi na n'ihi na n'ihi na n'ihi na n'ihi na n'ihi na n'ihi na n'ihi na n'ihi na n'ihi na n'ihi na n'ihi na n'ihi na n'ihi na n'ihi na n'ihi na n'ihi na n'ihi na n'ihi na n'ihi na n'ihi na n'ihi na n'ihi na n'ihi na n'ihi na n'ihi na n'ihi na n'ihi na n'ihi na n'ihi na n'ihi na n'ihi na n'ihi na n'ihi na n'ihi na n'ihi na n'ihi na n'ihi na n'ihi na n'ihi na n'ihi na n'ihi na n'ihi na n'ihi na n'ihi na n'ihi na n'ihi na n'ihi na n'ihi na n'ihi na n'ihi na n'ihi na n'ihi na n'ihi na n'ihi na n'ihi na n'ihi na n'ihi na n'ihi na n'ihi na n'ihi na n'ihi na n'ihi na n'ihi na n'ihi na n'ihi na n'ihi na n'ihi na n'ihi na n'ihi na n'ihi na n'ihi na n'ihi na n'ihi na n'ihi na n'ihi na n'ihi na n'ihi na n'ihi na n'ihi na n'ihi na n'ihi na n'ihi na n'ihi na n'ihi na n'ihi na n

Ee. CosyVoice 2 na Sesame CSM a haziri maka AI na-ekwurịta okwu na-enye nzaghachi ezi uche dị na ya. Onye enyemaka olu nke na-enye nzaghachi n'ụzọ na-atọ ụtọ n'ịhụnanya onye ọrụ ma ọ bụ n'ụzọ na-atọ ụtọ na ozi ọma na-eme ka ahụmịhe onye ọrụ dị mma.

Ee. Ndụmọdụ na-agbanwe n'ụzọ nkịtị paramita okwu dịgasị iche iche. Ndụmọdụ na-enwe obi ụtọ na-aga n'ihu n'ihi ụda dị elu. Ndụmọdụ na-enwe obi ụtọ na-aga n'ihu n'ihi ụda dị ala. Ndụmọdụ na-enwe obi ụtọ na-abawanye ike na n'ihi ụda dị elu. Ngbanwe ndị a na-egosi otú mmadụ si egosi n'ụzọ nkịtị n'ihi ụda.

Models ndị kasị ukwuu na-eji otu emo na-apụta n'otu oge. Maka emo ndị a na-apụta n'otu oge, mepụta segments n'otu oge na ntọala emo dị iche iche ma jikọta ha. dịka ọmụmaatụ, malite okwu n'ụzọ na-enweghị isi ma kwụsị ya n'ụzọ na-asị na-apụta n'ime oge abụọ.
5.0/5 (1)

Gịnị ka anyị ga-eme ka ọ dịrị mma? Ntụziaka gị na-enyere anyị aka idozi nsogbu.

Kewapụta ụda AI gị n'ụdị ọfụụ

Na-enwe obi ụtọ, na-aṅụrịa ọṅụ, na-aṅụrịa ọṅụ, na-asị okwu - mepụta okwu nke na-eweta mmetụta n'ụzọ ziri ezi. Chọọ ụdị TTS na-akpali akpali n'efu.