Dia 2

Default

መደበኛ እንግሊዝኛ Neutral Dia 2

Default በDia 2 ጽሑፍ-ወደ-ንግግር ሞዴል የተደገፈ የ neutral AI ድምፅ ነው. ይህ መደበኛ-ደረጃ ድምፅ እንግሊዝኛ ይናገራል እና ከፍተኛ-quality የንግግር ማቀነባበሪያን ይሰጣል. በ ቅርበት-ጊዜ የፍጥነት ፍጥነት እና በ 4/5 ጥራት ደረጃ Default ለ real-time voice agents, dialogue generation, streaming applications ተስማሚ ነው የ Dia 2 ማሽን በ Nari Labs under the Apache 2.0 license የተገነባ ሲሆን ለኮሜርሺያል ጥቅም ደህንነቱ የተጠበቀ ነው። የዋና ችሎታዎችን ያካትታል: streaming output, multi-speaker, low latency, paralinguistic cues, up to 2 min output.

ደረጃ አልተሰጠም

Dia 2የሞዴል መረጃ

ሞዴል Dia 2
አዘጋጅ Nari Labs
ጥራት
ፍጥነት ቀጥ ያለ
ፈቃድ Apache 2.0
መተላለፊያ አልተገኘም
ዐምድ መደበኛ (2 ክሬዲቶች/1K ፊደላት)
መለኪያዎች 2B
አርክቴክቸር Streaming Transformer
ዓመት 2025

ምርጥ የጠቀሙበት ሁኔታዎች Default

የድምፅ ባህሪያትን በመመርኮዝ የተመረጡ ፕሮግራሞች

የድምፅ መጽሐፍት

Defaultን በመጠቀም ረዥም የሆኑትን ይዘቶች በነፃነት ለመግለጽ ይጠቀሙ

የቪዲዮ ድምፅ

የዩቲዩብ ቪዲዮዎች፣ ማስታወቂያዎች እና ማህበራዊ ሚዲያ ይዘት ላይ የሙያ መዝገበ ቃላትን ጨምር።

አቅላይነት

የፍጥነት ማምጣት ይህ ድምፅ ለጊዜው ፕሮግራሞች፣ ለስክሪን አንባቢዎች፣ እና ለሚቻልባቸው መሣሪያዎች ተስማሚ ያደርገዋል

የኤሌክትሮኒክ መማርና ስልጠና

የጥናት መሣሪያዎችን፣ ኮርሶችን እና የሥልጠና ይዘቶችን በግልጽ AI ታሪክ ውስጥ ያድርጉ።

ብዙ ጊዜ የሚጠየቁ ጥያቄዎች

Dia2 በ Nari Labs ወደ Dia የሚለቀቅ የመጀመሪያው ማሻሻያ ነው፣ በ 1B እና 2B ፓራሜትር ልዩነቶች ውስጥ ይገኛል። ከመጀመሪያዎቹ ጥቂት ቶኬኖች ድምፅን ማቀነባበር ይጀምራል፣ ለነፃ ጊዜ የድምፅ አጋሮች እና ለንግግር-ወደ-ንግግር ቧንቧዎች ተስማሚ ያደርገዋል። በ [S1] / [S2] መለያዎች እና እንደ (ለቅሶዎች) ፣ (ለቅሶዎች) ያሉ የፓራሊንግቪስት ዱሎችን የብዙ-ተናጋሪ ውይይት ይደግፋል ፡፡

ዲያ 2 በናሪ ላብስ የተሰራ ሲሆን በአፓቺ 2.0 ፈቃድ ስር ይወጣል፣ ይህም የቀረበውን ድምፅ ለኮሜርሺያል ጥቅም የሚፈቅድ ነው።

Dia 2 1 ቋንቋን ይደግፋል: እንግሊዝኛ.

Dia 2 በስታንዳርድ ደረጃ ላይ ነው - ለ 1,000 አሃዞች 2 ክሬዲቶች. የ Dia 2 ድምፅን ነፃ ሆነው ከመፍጠርዎ በፊት ማየት ይችላሉ።

Dia 2 በጣም ፈጣን የፈጠራ ፍጥነት አለው. በቅርብ ጊዜ ውስጥ ይሠራል፣ ለቀጥታ እና ለተግባራዊ ፕሮግራሞች ተስማሚ ያደርገዋል.

Dia 2 በ TTS.ai ላይ ለድምፅ ጥራት 4/5 ተቆጥሯል. ከፍተኛ ጥራት ያለው፣ ተፈጥሯዊ-ድምፅ ያለው ንግግር ያወጣል ፡፡

አይደለም፣ Dia 2 የውስጥ ድምፆችን ቀጥተኛ ስብስብ ይጠቀማል። ለድምፅ ክሎኒንግ፣ እንደ CosyVoice 2፣ GPT-SoVITS ወይም Chatterbox ያሉ ሞዴሎችን ይሞክሩ።

አዎ, Dia 2 ለነጻ-ጊዜ የድምፅ አጋሮች, የዳያሎግ ማምረት, የዥረት ፕሮግራሞች ልዩ ልዩ ጠቃሚ ነው. የዥረት ውጤቱ, ብዙ-ተናጋሪ, ዝቅተኛ latency ችሎታዎች ለዚህ ጥቅም ሁኔታ ምርጥ ምርጫ ያደርገዋል.

አዎ፣ ዲያ 2 በአፓቺ 2.0 ስር ነው የተፈቀደው፣ ይህም የኮሜርሺያል ጥቅም ያስችላል። በዲያ 2 ድምጾች የተፈጠረው ድምፅ በቪዲዮዎች፣ በፖድካስቶች፣ በአፕሊኬሽኖች፣ በጨዋታዎች፣ እና በሌላ የኮሜርሺያል ፕሮጀክት ሊጠቀም ይችላል።

አዎ፣ በTTS.ai ላይ ያሉት ድምጾች ሁሉ የኮሜርሺያል-ላይሴንስ የተሰጣቸውን የኦፕን-ሶርስ ሞዴሎችን (MIT, Apache 2.0) ይጠቀማሉ፡፡ የተፈጠረው ድምፅ በቪዲዮዎች፣ በፖድካስቶች፣ በአፕሊኬሽኖች፣ በጨዋታዎችና በሌሎችም የኮሜርሺያል ፕሮግራሞች ውስጥ ለመጠቀም የእርስዎ ነው

የ POST ጥያቄን ወደ /api/v1/tts/ በሞዴል ስም እና የድምፅ ID ይላኩ. በፒታውን፣ ጃቫስክሪፕት፣ ጎ፣ እና በኩርል የኮድ ምሳሌዎች የ API ማስረጃ ገጽን ይመልከቱ።

አዎ፣ ምሳሌ ለማዳመጥ በእነዚህ ገጾች ላይ ያለውን መጫን ቁልፍ ጠቅ ያድርጉ። በጽሑፍ ወደ ንግግር ገጽ ላይ የግል ጽሑፍን መጻፍ እና በየትኛውም ድምፅ ነፃ ቅድመ ዕይታን ማምጣት ይችላሉ።

መሞከር Default አሁን

ማንኛውንም ጽሑፍ ይጻፉ እና ይናገሩት Default. ለመጠቀም ነጻ.