Speaker 2
Speaker 2 በVibeVoice ጽሑፍ-ወደ-ንግግር ሞዴል የተደገፈ የ neutral AI ድምፅ ነው. ይህ መደበኛ-ደረጃ ድምፅ እንግሊዝኛ ይናገራል እና ስታዲየም-quality የንግግር ማቀነባበሪያን ይሰጣል. በ ቅርበት-ጊዜ የፍጥነት ፍጥነት እና በ 5/5 ጥራት ደረጃ Speaker 2 ለ podcasts, dialogues, long-form narration, multi-speaker content ተስማሚ ነው የ VibeVoice ማሽን በ Microsoft under the MIT license የተገነባ ሲሆን ለኮሜርሺያል ጥቅም ደህንነቱ የተጠበቀ ነው። የዋና ችሎታዎችን ያካትታል: multi-speaker, long-form (90 min), podcast generation, dialogue, low latency.
የሞዴል መረጃ
| ሞዴል | VibeVoice |
| አዘጋጅ | Microsoft |
| ጥራት | |
| ፍጥነት | ቀጥ ያለ |
| ፈቃድ | MIT |
| መተላለፊያ | አልተገኘም |
| ዐምድ | መደበኛ (2 ክሬዲቶች/1K ፊደላት) |
| መለኪያዎች | 1.5B |
| አርክቴክቸር | LLM + DAC |
| የቀን መቁጠሪያ ዕይታ | 100000 ሰዓቶች |
| ዓመት | 2025 |
ምርጥ የጠቀሙበት ሁኔታዎች Speaker 2
የድምፅ ባህሪያትን በመመርኮዝ የተመረጡ ፕሮግራሞች
የድምፅ መጽሐፍት
Speaker 2ን በመጠቀም ረዥም የሆኑትን ይዘቶች በነፃነት ለመግለጽ ይጠቀሙ
የቪዲዮ ድምፅ
የዩቲዩብ ቪዲዮዎች፣ ማስታወቂያዎች እና ማህበራዊ ሚዲያ ይዘት ላይ የሙያ መዝገበ ቃላትን ጨምር።
አቅላይነት
የፍጥነት ማምጣት ይህ ድምፅ ለጊዜው ፕሮግራሞች፣ ለስክሪን አንባቢዎች፣ እና ለሚቻልባቸው መሣሪያዎች ተስማሚ ያደርገዋል
ብሮድካስት
የስታዲዮ ጥራት ምርት ለፖድካስት, ሬዲዮ, እና ሙያ ብሮድካስቲንግ ተስማሚ ነው.
ተጨማሪ VibeVoice ድምጾች
ሌሎች ድምጾች ከአንድ TTS ሞዴል