Speaker 2
Speaker 2 በDia TTS ጽሑፍ-ወደ-ንግግር ሞዴል የተደገፈ የ neutral AI ድምፅ ነው. ይህ መደበኛ-ደረጃ ድምፅ እንግሊዝኛ ይናገራል እና ስታዲየም-quality የንግግር ማቀነባበሪያን ይሰጣል. በ መካከለኛ የፍጥነት ፍጥነት እና በ 5/5 ጥራት ደረጃ Speaker 2 ለ podcasts, audiobook dialogues, conversational content ተስማሚ ነው የ Dia TTS ማሽን በ Nari Labs under the Apache 2.0 license የተገነባ ሲሆን ለኮሜርሺያል ጥቅም ደህንነቱ የተጠበቀ ነው። የዋና ችሎታዎችን ያካትታል: multi-speaker, dialog generation, natural turn-taking, emotional expression, 1.6b parameters.
የሞዴል መረጃ
| ሞዴል | Dia TTS |
| አዘጋጅ | Nari Labs |
| ጥራት | |
| ፍጥነት | መሀከል |
| ፈቃድ | Apache 2.0 |
| መተላለፊያ | አልተገኘም |
| ዐምድ | መደበኛ (2 ክሬዲቶች/1K ፊደላት) |
| መለኪያዎች | 1.6B |
| አርክቴክቸር | Transformer Autoregressive + DAC |
| ዓመት | 2024 |
ምርጥ የጠቀሙበት ሁኔታዎች Speaker 2
የድምፅ ባህሪያትን በመመርኮዝ የተመረጡ ፕሮግራሞች
የድምፅ መጽሐፍት
Speaker 2ን በመጠቀም ረዥም የሆኑትን ይዘቶች በነፃነት ለመግለጽ ይጠቀሙ
የቪዲዮ ድምፅ
የዩቲዩብ ቪዲዮዎች፣ ማስታወቂያዎች እና ማህበራዊ ሚዲያ ይዘት ላይ የሙያ መዝገበ ቃላትን ጨምር።
ብሮድካስት
የስታዲዮ ጥራት ምርት ለፖድካስት, ሬዲዮ, እና ሙያ ብሮድካስቲንግ ተስማሚ ነው.
የኤሌክትሮኒክ መማርና ስልጠና
የጥናት መሣሪያዎችን፣ ኮርሶችን እና የሥልጠና ይዘቶችን በግልጽ AI ታሪክ ውስጥ ያድርጉ።