VibeVoice

Speaker 4

መደበኛ እንግሊዝኛ Neutral VibeVoice

Speaker 4 በVibeVoice ጽሑፍ-ወደ-ንግግር ሞዴል የተደገፈ የ neutral AI ድምፅ ነው. ይህ መደበኛ-ደረጃ ድምፅ እንግሊዝኛ ይናገራል እና ስታዲየም-quality የንግግር ማቀነባበሪያን ይሰጣል. በ ቅርበት-ጊዜ የፍጥነት ፍጥነት እና በ 5/5 ጥራት ደረጃ Speaker 4 ለ podcasts, dialogues, long-form narration, multi-speaker content ተስማሚ ነው የ VibeVoice ማሽን በ Microsoft under the MIT license የተገነባ ሲሆን ለኮሜርሺያል ጥቅም ደህንነቱ የተጠበቀ ነው። የዋና ችሎታዎችን ያካትታል: multi-speaker, long-form (90 min), podcast generation, dialogue, low latency.

ደረጃ አልተሰጠም

VibeVoiceየሞዴል መረጃ

ሞዴል VibeVoice
አዘጋጅ Microsoft
ጥራት
ፍጥነት ቀጥ ያለ
ፈቃድ MIT
መተላለፊያ አልተገኘም
ዐምድ መደበኛ (2 ክሬዲቶች/1K ፊደላት)
መለኪያዎች 1.5B
አርክቴክቸር LLM + DAC
የቀን መቁጠሪያ ዕይታ 100000 ሰዓቶች
ዓመት 2025

ምርጥ የጠቀሙበት ሁኔታዎች Speaker 4

የድምፅ ባህሪያትን በመመርኮዝ የተመረጡ ፕሮግራሞች

የድምፅ መጽሐፍት

Speaker 4ን በመጠቀም ረዥም የሆኑትን ይዘቶች በነፃነት ለመግለጽ ይጠቀሙ

የቪዲዮ ድምፅ

የዩቲዩብ ቪዲዮዎች፣ ማስታወቂያዎች እና ማህበራዊ ሚዲያ ይዘት ላይ የሙያ መዝገበ ቃላትን ጨምር።

አቅላይነት

የፍጥነት ማምጣት ይህ ድምፅ ለጊዜው ፕሮግራሞች፣ ለስክሪን አንባቢዎች፣ እና ለሚቻልባቸው መሣሪያዎች ተስማሚ ያደርገዋል

ብሮድካስት

የስታዲዮ ጥራት ምርት ለፖድካስት, ሬዲዮ, እና ሙያ ብሮድካስቲንግ ተስማሚ ነው.

ተጨማሪ VibeVoice ድምጾች

ሌሎች ድምጾች ከአንድ TTS ሞዴል

Speaker 1

እንግሊዝኛ Neutral

Speaker 1 (Chinese)

ቻይንኛ Neutral

Speaker 2

እንግሊዝኛ Neutral

Speaker 2 (Chinese)

ቻይንኛ Neutral

Speaker 3

እንግሊዝኛ Neutral

ብዙ ጊዜ የሚጠየቁ ጥያቄዎች

ቪብቮይች በማይክሮሶፍት በሁለት ዓይነት ይመጣል: ለረጅም-ቅርጽ ይዘት (90 ደቂቃዎች, 4 ተናጋሪዎች) 1.5B ሞዴል እና ለ ~ 200ms የመጀመሪያው ድምፅ latency ጋር 0.5B ሞዴል. 1.5B ልዩነት በፖድካስት እና ድምፅ መጽሐፍት ላይ ረጅም passages ላይ ተናጋሪ konzistency ጋር ይሻላል. ማስታወሻ: ማይክሮሶፍት TTS ኮድ ከ መዝገብ ቤት ያስወገዱ እና የተፈጠረው ድምፅ ጆሮአዊ AI disclaimers ያካትታል.

ቫይብቮይስ በማይክሮሶፍት የተሰራ ሲሆን በኤም.አይ.ቲ (research-only intent) ፈቃድ ስር ይወጣል፣ ይህም የፈጠረውን ድምፅ ለኮሜርሺያል ጥቅም የሚፈቅድ ነው።

ቪብቮይስ 1 ቋንቋን ይደግፋል፦ እንግሊዝኛ

ቪብቮይሲ በፕሪሚየም ደረጃ ላይ ነው - ለ1,000 አሃዞች 4 ክሬዲቶች. ማንኛውንም ቪብቮይሲ ድምፅ በነፃ ከመፍጠርዎ በፊት ማየት ይችላሉ።

ቪብቮይሲ መካከለኛ የፍጥነት ፍጥነት አለው. ፍጥነት በጽሑፉ ርዝመት ላይ በመመርኮዝ ብዙ ሰከንዶች ይወስዳል

ቪብቮይስ በTTS.ai ላይ ለድምፅ ጥራት 5/5 ተቆጥሯል። ስቱዲዮ-ደረጃ፣ ሰው-እንደ-ንግግር ይሰጣል

አይደለም፣ ቪብቮይስ የውስጥ ድምፆችን ቀጥተኛ ስብስብ ይጠቀማል። የድምፅ ክሎኒንግን ለመጠቀም እንደ ኮሲቮይስ 2፣ ጂፒቲ-ሶቪትስ ወይም ቻተርቦክስ ያሉ ሞዴሎችን ይሞክሩ።

አዎ, VibeVoice ለ podcasts, audiobooks, long-form multi-speaker contents የተሻለ ነው. የብዙ-ተናጋሪው, እስከ 90 ደቂቃዎች ድረስ, podcast generation capabilities ለዚህ የፍለጋ ሁኔታ ጥሩ ምርጫ ያደርገዋል.

አዎ፣ ቪብቮይስ በ MIT (የምርምር-እንደ-እቅድ) ስር ነው የተፈቀደው፣ ይህም የኮሜርሺያል ጥቅም ያስችላል። በቪብቮይስ ድምጾች የተፈጠረው ድምፅ በቪዲዮዎች፣ በፖድካስቶች፣ በአፕሊኬሽኖች፣ በጨዋታዎች፣ እና በሌላ የኮሜርሺያል ፕሮጀክት ሊጠቀም ይችላል።

አዎ፣ በTTS.ai ላይ ያሉት ድምጾች ሁሉ የኮሜርሺያል-ላይሴንስ የተሰጣቸውን የኦፕን-ሶርስ ሞዴሎችን (MIT, Apache 2.0) ይጠቀማሉ፡፡ የተፈጠረው ድምፅ በቪዲዮዎች፣ በፖድካስቶች፣ በአፕሊኬሽኖች፣ በጨዋታዎችና በሌሎችም የኮሜርሺያል ፕሮግራሞች ውስጥ ለመጠቀም የእርስዎ ነው

የ POST ጥያቄን ወደ /api/v1/tts/ በሞዴል ስም እና የድምፅ ID ይላኩ. በፒታውን፣ ጃቫስክሪፕት፣ ጎ፣ እና በኩርል የኮድ ምሳሌዎች የ API ማስረጃ ገጽን ይመልከቱ።

አዎ፣ ምሳሌ ለማዳመጥ በእነዚህ ገጾች ላይ ያለውን መጫን ቁልፍ ጠቅ ያድርጉ። በጽሑፍ ወደ ንግግር ገጽ ላይ የግል ጽሑፍን መጻፍ እና በየትኛውም ድምፅ ነፃ ቅድመ ዕይታን ማምጣት ይችላሉ።

መሞከር Speaker 4 አሁን

ማንኛውንም ጽሑፍ ይጻፉ እና ይናገሩት Speaker 4. ለመጠቀም ነጻ.