VibeVoice

Speaker 1 (Chinese)

Əsas Çin dili Neutral VibeVoice

Speaker 1 (Chinese) VibeVoice mətn-söz modelinə əsaslanan neutral AI səsidir. Bu standart-level səs Çin dili danışır və studiya-keyfiyyətli söz sintezini təmin edir. yaxın-an yaradılma sürəti və 5/5 keyfiyyət qiyməti ilə Speaker 1 (Chinese) podcasts, dialogues, long-form narration, multi-speaker content üçün çox uyğundur. Bu sistemin əsas məqsədi, sənaye istehsalı üçün istifadə olunan maşınların istehsalı üçün lazım olan mühərriklərin istehsalı idi. Əsas məqalə: multi-speaker, long-form (90 min), podcast generation, dialogue, low latency.

Heç bir qiymət yoxdur

VibeVoiceModel Məlumatı

Model VibeVoice
Yaradıcı Microsoft
Keyfiyyət
Sür'ət Dəyişdir
Lisenziya MIT
_Klonla İmkanı yoxdur
Dəyişdir Standart (2 kredit/1K xarakter)
Parametrlər 1.5B
Mifologiya LLM + DAC
Təlim Məlumatı 100000 saat
İl 2025

Ən Yaxşı İstifadə Halı Speaker 1 (Chinese)

Bu səsin xüsusiyyətlərinə əsaslanan tövsiyə olunan proqramlar

Audio Kitablar və Söhbət

Speaker 1 (Chinese) adını uzun formalı məzmunu təbii prozodiya və ifadə ilə danışmaq üçün istifadə et.

Video səsləndirmə

YouTube videolarına, reklamlara və sosial media məzmununa peşəkar danışıq əlavə edin.

Proqramlar və Yetişilə Bilənlik

Tez yaradılması bu səsi real vaxt tətbiqləri, ekran oxuyucuları və əlçatanlıq alətləri üçün ideal edir.

Podcastlar və Yayım

Podcastlar, radio və peşəkar yayım üçün uyğun olan studiya keyfiyyətli çıxış.

Daha çox VibeVoice Səslər

Aynı TTS modelinin digər səsləri

Speaker 1

İngiliscə Neutral

Speaker 2

İngiliscə Neutral

Speaker 2 (Chinese)

Çin dili Neutral

Speaker 3

İngiliscə Neutral

Speaker 4

İngiliscə Neutral

Tez-tez Sorulan Sual

Microsoft VibeVoice iki variantda gəlir: uzun formatlı məzmun üçün 1.5B modeli (90 dəqiqəyə qədər, 4 səsləndirici) və ~200ms ilk səsləndirici gecikməsi ilə axın üçün Rəsmi 0.5B modeli. 1.5B variantı uzun keçidlərdə səsləndirici konzistensiyası ilə podcast və audiokitablarda üstünlük təşkil edir. Xatırlatma: Microsoft TTS kodunu repozitoriyadan çıxardıb və yaradılan səs səsləndirici AI-nin səsləndirilən cavabdehliyini də ehtiva edir.

VibeVoice Microsoft tərəfindən hazırlanmışdır və MIT (təkcə tədqiqat məqsədi) lisenziyası altında buraxılır, bu da yaradılan audionun kommersiya istifadəsinə icazə verir.

VibeVoice 1 dil dəstəkləyir: İngilis.

VibeVoice Premium səviyyəsindədir - 1000 xarakter üçün 4 kredit. VibeVoice səsini tam səs yaratmazdan əvvəl pulsuz olaraq əvvəlcədən izləmək olar.

VibeVoice orta sürətli yaradılma sürətinə malikdir. Yaradılış mətn uzunluğuna görə bir neçə saniyə çəkir.

VibeVoice TTS.ai-də səs keyfiyyəti üçün 5/5 qiymətləndirilmişdir. O, studiya səviyyəli, insan kimi səs verir.

Xeyr, VibeVoice daxili səslərin sabit bir dəstəsini istifadə edir. Sesi klonlaşdırmaq üçün CosyVoice 2, GPT-SoVITS, ya da Chatterbox kimi modelləri sınayın.

Bəli, VibeVoice xüsusi olaraq podcastlar, audiokitablar, uzun formalı çoxlu səsləndirici məzmunu üçün tövsiyə olunur. Onun çoxlu səsləndirici, 90 dəqiqəyə qədər, podcast yaratma qabiliyyəti bu istifadə halları üçün mükəmməl seçim edir.

Bəli, VibeVoice MIT lisenziyasına malikdir (yalnız tədqiqat məqsədilə), bu da kommersiya istifadəsinə icazə verir. VibeVoice səsləri ilə yaradılan səs videolarda, podcastlarda, proqramlarda, oyunlarda və digər kommersiya layihələrində istifadə edilə bilər.

Bəli, TTS.ai-də bütün səslər kommersiya lisenziyalı açıq mənbə modelləri (MIT, Apache 2.0) istifadə edir. Yaranmış səs videolarda, podcastlarda, proqramlarda, oyunlarda və digər kommersiya tətbiqlərində istifadə üçün sizindir.

/api/v1/tts/ ünvanına model adı və səs identifikatoru ilə POST istəyini göndərin. Python, JavaScript, Go və cURL-də kod nümunələri üçün API sənədləşdirmə səhifəsinə baxın.

Bəli, nümunə eşitmək üçün bu səhifədəki oynat düyməsini basın. Mətndən Söhbətə səhifəsində öz mətninizi yaza və istənilən səslə pulsuz bir nümunə yarada bilərsiniz.

_Yoxla Speaker 1 (Chinese) İndi

Hər hansı bir mətni yazın və onu dinləyin Speaker 1 (Chinese). İstifadəsi pulsuzdur.