Speaker 2

መደበኛ እንግሊዝኛ Neutral

VibeVoice

Speaker 2 በVibeVoice ጽሑፍ-ወደ-ንግግር ሞዴል የተደገፈ የ neutral AI ድምፅ ነው. ይህ መደበኛ-ደረጃ ድምፅ እንግሊዝኛ ይናገራል እና ስታዲየም-quality የንግግር ማቀነባበሪያን ይሰጣል. በ ቅርበት-ጊዜ የፍጥነት ፍጥነት እና በ 5/5 ጥራት ደረጃ Speaker 2 ለ podcasts, dialogues, long-form narration, multi-speaker content ተስማሚ ነው የ VibeVoice ማሽን በ Microsoft under the MIT license የተገነባ ሲሆን ለኮሜርሺያል ጥቅም ደህንነቱ የተጠበቀ ነው። የዋና ችሎታዎችን ያካትታል: multi-speaker, long-form (90 min), podcast generation, dialogue, low latency.

ደረጃ አልተሰጠም

ይህንን ድምፅ ይሞክሩ ሁሉንም VibeVoice ድምጾች

የሞዴል መረጃ

ሞዴል	VibeVoice
አዘጋጅ	Microsoft
ጥራት
ፍጥነት	ቀጥ ያለ
ፈቃድ	MIT
መተላለፊያ	አልተገኘም
ዐምድ	መደበኛ (2 ክሬዲቶች/1K ፊደላት)
መለኪያዎች	1.5B
አርክቴክቸር	LLM + DAC
የቀን መቁጠሪያ ዕይታ	100000 ሰዓቶች
ዓመት	2025

ምርጥ የጠቀሙበት ሁኔታዎች Speaker 2

የድምፅ ባህሪያትን በመመርኮዝ የተመረጡ ፕሮግራሞች

የድምፅ መጽሐፍት

Speaker 2ን በመጠቀም ረዥም የሆኑትን ይዘቶች በነፃነት ለመግለጽ ይጠቀሙ

የቪዲዮ ድምፅ

የዩቲዩብ ቪዲዮዎች፣ ማስታወቂያዎች እና ማህበራዊ ሚዲያ ይዘት ላይ የሙያ መዝገበ ቃላትን ጨምር።

አቅላይነት

የፍጥነት ማምጣት ይህ ድምፅ ለጊዜው ፕሮግራሞች፣ ለስክሪን አንባቢዎች፣ እና ለሚቻልባቸው መሣሪያዎች ተስማሚ ያደርገዋል

ብሮድካስት

የስታዲዮ ጥራት ምርት ለፖድካስት, ሬዲዮ, እና ሙያ ብሮድካስቲንግ ተስማሚ ነው.

ተጨማሪ VibeVoice ድምጾች

ሌሎች ድምጾች ከአንድ TTS ሞዴል

Speaker 1

እንግሊዝኛ Neutral

Speaker 1 (Chinese)

ቻይንኛ Neutral

Speaker 2 (Chinese)

ቻይንኛ Neutral

Speaker 3

እንግሊዝኛ Neutral

Speaker 4

እንግሊዝኛ Neutral

ሁሉንም አሳይ VibeVoice ድምጾች

ብዙ ጊዜ የሚጠየቁ ጥያቄዎች

ቪብቮይች በማይክሮሶፍት በሁለት ዓይነት ይመጣል: ለረጅም-ቅርጽ ይዘት (90 ደቂቃዎች, 4 ተናጋሪዎች) 1.5B ሞዴል እና ለ ~ 200ms የመጀመሪያው ድምፅ latency ጋር 0.5B ሞዴል. 1.5B ልዩነት በፖድካስት እና ድምፅ መጽሐፍት ላይ ረጅም passages ላይ ተናጋሪ konzistency ጋር ይሻላል. ማስታወሻ: ማይክሮሶፍት TTS ኮድ ከ መዝገብ ቤት ያስወገዱ እና የተፈጠረው ድምፅ ጆሮአዊ AI disclaimers ያካትታል.

ቫይብቮይስ በማይክሮሶፍት የተሰራ ሲሆን በኤም.አይ.ቲ (research-only intent) ፈቃድ ስር ይወጣል፣ ይህም የፈጠረውን ድምፅ ለኮሜርሺያል ጥቅም የሚፈቅድ ነው።

ቪብቮይስ 1 ቋንቋን ይደግፋል፦ እንግሊዝኛ

ቪብቮይሲ በፕሪሚየም ደረጃ ላይ ነው - ለ1,000 አሃዞች 4 ክሬዲቶች. ማንኛውንም ቪብቮይሲ ድምፅ በነፃ ከመፍጠርዎ በፊት ማየት ይችላሉ።

ቪብቮይሲ መካከለኛ የፍጥነት ፍጥነት አለው. ፍጥነት በጽሑፉ ርዝመት ላይ በመመርኮዝ ብዙ ሰከንዶች ይወስዳል

ቪብቮይስ በTTS.ai ላይ ለድምፅ ጥራት 5/5 ተቆጥሯል። ስቱዲዮ-ደረጃ፣ ሰው-እንደ-ንግግር ይሰጣል

አይደለም፣ ቪብቮይስ የውስጥ ድምፆችን ቀጥተኛ ስብስብ ይጠቀማል። የድምፅ ክሎኒንግን ለመጠቀም እንደ ኮሲቮይስ 2፣ ጂፒቲ-ሶቪትስ ወይም ቻተርቦክስ ያሉ ሞዴሎችን ይሞክሩ።

አዎ, VibeVoice ለ podcasts, audiobooks, long-form multi-speaker contents የተሻለ ነው. የብዙ-ተናጋሪው, እስከ 90 ደቂቃዎች ድረስ, podcast generation capabilities ለዚህ የፍለጋ ሁኔታ ጥሩ ምርጫ ያደርገዋል.

አዎ፣ ቪብቮይስ በ MIT (የምርምር-እንደ-እቅድ) ስር ነው የተፈቀደው፣ ይህም የኮሜርሺያል ጥቅም ያስችላል። በቪብቮይስ ድምጾች የተፈጠረው ድምፅ በቪዲዮዎች፣ በፖድካስቶች፣ በአፕሊኬሽኖች፣ በጨዋታዎች፣ እና በሌላ የኮሜርሺያል ፕሮጀክት ሊጠቀም ይችላል።

አዎ፣ በTTS.ai ላይ ያሉት ድምጾች ሁሉ የኮሜርሺያል-ላይሴንስ የተሰጣቸውን የኦፕን-ሶርስ ሞዴሎችን (MIT, Apache 2.0) ይጠቀማሉ፡፡ የተፈጠረው ድምፅ በቪዲዮዎች፣ በፖድካስቶች፣ በአፕሊኬሽኖች፣ በጨዋታዎችና በሌሎችም የኮሜርሺያል ፕሮግራሞች ውስጥ ለመጠቀም የእርስዎ ነው

የ POST ጥያቄን ወደ /api/v1/tts/ በሞዴል ስም እና የድምፅ ID ይላኩ. በፒታውን፣ ጃቫስክሪፕት፣ ጎ፣ እና በኩርል የኮድ ምሳሌዎች የ API ማስረጃ ገጽን ይመልከቱ።

አዎ፣ ምሳሌ ለማዳመጥ በእነዚህ ገጾች ላይ ያለውን መጫን ቁልፍ ጠቅ ያድርጉ። በጽሑፍ ወደ ንግግር ገጽ ላይ የግል ጽሑፍን መጻፍ እና በየትኛውም ድምፅ ነፃ ቅድመ ዕይታን ማምጣት ይችላሉ።

መሞከር Speaker 2 አሁን

ማንኛውንም ጽሑፍ ይጻፉ እና ይናገሩት Speaker 2. ለመጠቀም ነጻ.

ንግግር ነጻ

Speaker 2

የሞዴል መረጃ

ምርጥ የጠቀሙበት ሁኔታዎች Speaker 2

የድምፅ መጽሐፍት

የቪዲዮ ድምፅ

አቅላይነት

ብሮድካስት

ተጨማሪ VibeVoice ድምጾች

Speaker 1

Speaker 1 (Chinese)

Speaker 2 (Chinese)

Speaker 3

Speaker 4

ብዙ ጊዜ የሚጠየቁ ጥያቄዎች

ቪብቮይስ TTS ምንድን ነው?

ቫይብቮይስን ማን ፈጠረ?

ቪብቮይስ ምን ቋንቋዎችን ይደግፋል?

የቪብቮይሲን ድምጾች ለመጠቀም ምን ያህል ዋጋ አለው?

ቪብቮይሲ ምን ያህል ፈጣን ነው?

የቪብቮይስ የድምፅ ጥራት ምንድነው?

በቪብቮይስ ድምጽን ልጠቅልል እችላለሁን?

ቪብቮይስ ለፖድካስቶች ተስማሚ ነውን?

ቪብቮይሲን በኮሜርሺያልነት መጠቀም እችላለሁን?

ይህች ድምፅ ለኮሜርሺያል ፕሮጀክቶች ሊጠቀም ይቻላል?

እንዴት ይህን ድምፅ በAPI ውስጥ መጠቀም እችላለሁ?

የድምፅ ፋይል

መሞከር Speaker 2 አሁን