VibeVoice

Speaker 2

Standart İngilizce Neutral VibeVoice

Speaker 2 VibeVoice metin-sözlüğe modeli tarafından desteklenen bir neutral yapay zeka sesi. Bu standart-level sesi İngilizce konuşur ve stüdyo- kaliteli konuşma sentezi sağlar. neredeyse-anlık üretim hızı ve 5/5 kalite puanı ile Speaker 2 podcasts, dialogues, long-form narration, multi-speaker content için uygundur. VibeVoice motoru Microsoft under the MIT license tarafından geliştirilmiştir, bu da ticari kullanım için güvenlidir. Ana beceriler şunlardır: multi-speaker, long-form (90 min), podcast generation, dialogue, low latency.

Henüz puan yok

VibeVoiceModel Bilgisi

Model VibeVoice
Geliştirici Microsoft
Kalite
Hız Hızlı
Lisans MIT
Klonlama Ulaşılamaz
Hayvan Standart (2 kredi/1K karakter)
Parametreler 1.5B
Mimari LLM + DAC
Eğitim Verisi 100000 saat
Yıl 2025

En İyi Kullanım Durumları Speaker 2

Bu sesin özelliklerine dayalı önerilen uygulamalar

Sesli Kitaplar ve Konuşmalar

Speaker 2'i uzun biçimli içeriği doğal bir prozodi ve ifade ile anlatmak için kullanın.

Video Seslendirmeler

YouTube videolarına, reklamlara ve sosyal medya içeriğine profesyonel anlatım ekleyin.

Uygulama ve Erişim

Hızlı üretim bu sesi gerçek zamanlı uygulamalar, ekran okuyucuları ve erişim araçları için ideal hale getirir.

Podcastler ve Yayın

Podcast, radyo ve profesyonel yayın için uygun stüdyo kaliteli çıkışlar.

Daha fazla VibeVoice Sesler

Aynı TTS modelinden diğer sesler

Speaker 1

İngilizce Neutral

Speaker 1 (Chinese)

Çince Neutral

Speaker 2 (Chinese)

Çince Neutral

Speaker 3

İngilizce Neutral

Speaker 4

İngilizce Neutral

Sıkça Sorulan Sorular

Microsoft tarafından VibeVoice iki çeşitte gelir: uzun form içeriği için 1.5B modeli (90 dakikaya kadar, 4 hoparlör) ve ~200ms ilk ses gecikmesi ile akış için bir Gerçek Zamanlı 0.5B modeli. 1.5B varyantı uzun bölümler boyunca hoparlör tutarlılığı ile podcast ve sesli kitaplarda üstündür. Not: Microsoft depodan TTS kodunu kaldırdı ve üretilen ses duyulan AI sorumluluk sınırlamalarını içerir.

VibeVoice Microsoft tarafından geliştirildi ve MIT (tek araştırma amacı) lisansı altında yayınlanmıştır, bu da üretilen seslerin ticari kullanımına izin verir.

VibeVoice 1 dil destekler: İngilizce.

VibeVoice Premium seviyesindedir — 1000 karakter başına 4 kredi. Herhangi bir VibeVoice sesini tam ses oluşturmadan önce ücretsiz olarak önizleyebilirsiniz.

VibeVoice ortalama bir üretim hızına sahiptir. Üretim genellikle metin uzunluğuna bağlı olarak birkaç saniye sürer.

VibeVoice TTS.ai'de ses kalitesi için 5/5 puan aldı.

Hayır, VibeVoice sabit bir ses seti kullanır. Ses klonlaması için, CosyVoice 2, GPT-SoVITS veya Chatterbox gibi modelleri deneyin.

Evet, VibeVoice özellikle podcastler, sesli kitaplar, uzun biçimli çoklu- hoparlör içerikleri için tavsiye edilir. Çoklu- hoparlör, 90 dakikaya kadar, podcast üretme yetenekleri onu bu kullanım için mükemmel bir seçim yapar.

Evet, VibeVoice MIT (yalnızca araştırma amaçlı) lisansı altındadır, bu da ticari kullanıma izin verir. VibeVoice sesleriyle üretilen ses, videolarda, podcastlerde, uygulamalarda, oyunlarda ve diğer ticari projelerde kullanılabilir.

Evet, TTS.ai'deki tüm sesler ticari lisanslı açık kaynak modelleri (MIT, Apache 2.0) kullanıyor. Üretilmiş ses, videolarda, podcast'lerde, uygulamalarda, oyunlarda ve diğer ticari uygulamalarda kullanmak için sizindir.

Model adı ve ses ID ile /api/v1/tts/ adresine bir POST isteği gönderin. Python, JavaScript, Go ve cURL kod örnekleri için API belgeleme sayfamızı ziyaret edin.

Evet, bir örnek duymak için bu sayfadaki oynat düğmesine tıklayın. Ayrıca Metin- Konuşmaya sayfasına özel metin yazarak herhangi bir sesle ücretsiz bir önizleme oluşturabilirsiniz.

Dene. Speaker 2 Şimdi

Herhangi bir metni yazın ve onu dinleyinName Speaker 2. Kullanımı ücretsizdir..