多种语文的发言稿——30+语文
以30多种语言用本地发音生成自然声音。 从印地语和日语到阿拉伯语和西班牙语,我们的人工智能模型提供了真正的多语言语音合成。 适合本地化、语言学习、国际内容和跨语言语音克隆。
多语言 TTTS 多语言 TTS 特征
语言和口音世界级演讲合成
30+语文
以30多种语文发表演讲,包括英文、印地文、日文、西班牙文、中文、阿拉伯文、韩文、法文、德文、俄文、葡萄牙文等。
土著发音
每个模型都接受关于母语录音的培训,确保每种辅助语言的真实发音、读音和节奏。
跨语言克隆
CosyVoice 2为全球内容保留了8种语言的语音身份。
RTL 语文支助
全面支持阿拉伯语、希伯来语、乌尔都语和波斯语等右对左语言,提供正确文本处理和自然语音输出。
语言检测
自动语言检测可识别输入文本语言以及达到最佳读音质量的适当模式和声音的路径。
精选变式
各种语言——美国、英国、印度和澳大利亚英语;欧洲和拉丁美洲西班牙语;以及更多的区域变体。
多语种TTTS最佳模式
具有最广泛语言支持和最佳跨语文质量的模型
CosyVoice 2
Standard
Alibaba's scalable streaming TTS with human-parity naturalness and near-zero latency.
最佳用于: 最佳多语言模式——8种语言,具有跨语言语音克隆
尝试 CosyVoice 2
MeloTTS
Free
High-quality multilingual text-to-speech that runs on CPU with minimal latency.
最佳用于: 免费多种多种语言TTS,每种语言多口音变异
尝试 MeloTTS
GPT-SoVITS
Standard
Few-shot voice cloning TTS that replicates any voice from just 5 seconds of audio.
最佳用于: 英文、中文、日文和韩文的少量克隆
尝试 GPT-SoVITS
Bark
Standard
Transformer-based text-to-audio model that generates realistic speech, music, and sound effects.
最佳用于: 13+语言,具有情感表达和声音效果
尝试 Bark
Kokoro
Free
Lightweight 82M parameter model delivering studio-quality speech with blazing-fast inference.
最佳用于: 具有演播室质量的9种语言的超快生产
尝试 Kokoro如何生成多语种语言语言
以任何语言进行自然语言的自然言语(秒以内)
选择您的语言
从 30+ 支持的语言中选择。 系统也可以自动检测输入文本的语言, 方便 。
以任何语言输入文本
目标语言的文字类型或粘贴文本。 完整 Unicode 支持处理所有脚本, 包括 CJK、 Devanagari、 阿拉伯语、 西里尔语等等 。
选择本地声音
选择您语言中最优化的声音。 每种语言都提供多种语音选项, 只要有区域口音变量 。
生成和下载
以 MP3 或 WAV 生成本地发音并下载为 MP3 或 WAV。 使用 API 进行多种语言的批量生成 。
辅助语言
我们的多语种TTS模式中可用的语言
美洲和欧洲
- 英语( 美国、 联合王国、 非盟)
- 西班牙语(ES, MX)
- (BR、PT)
- 法语( FR, CA)
- 德语 德语
- 意大利 意大利 意大利 意大利 意大利 意大利 意大利 意大利 意大利语
- 荷兰语荷兰语Name荷兰语Name
- 波兰语Name
东亚东亚
- 中文( 普通中文)
- 中文( 州)
- 日语日语日语
- 韩文韩文
- 越南语越南语Name
- 泰语 泰语
- 印度尼西亚语印度尼西亚语Name
- 马来语
南亚和中东
- 印地语
- 阿拉伯文 阿拉伯文 阿拉伯文 阿拉伯文
- 土耳其语土耳其语Name
- 孟加拉语Name
- 泰米尔泰米尔
- 乌尔都
- 波斯语
- 希伯来语
更多语言
- 俄文 俄文 俄文
- 乌克兰语乌克兰语Name
- 捷克捷克语Name
- 罗马尼亚语罗马尼亚语Name 罗马尼亚语Name
- 希腊语希腊语Name
- 瑞典语 瑞典语 瑞典语 _ 瑞典语
- 芬兰语芬兰语芬兰语芬兰语芬兰语芬兰语芬兰语芬兰语芬兰语
- 匈牙利语匈牙利语Name
跨语言语音克隆
用自己的声音说任何语言
克隆你的声音,说任何语言
人工智能保存你独特的声音特征 — — 字、音、发音风格 — — 同时用目标语言制作本地发声发音。对于内容创作者来说,适合接触全球受众。
- 10秒声音样本就是你需要的全部
- 您的语音特性被保存在各种语言之间
- 土著发音和点音
- 模型:CosyVoice2, OpenVoice, 鱼类演讲
内容本地化
将视频、课程和播客本地化为多种语言,同时保留同一个发言者的声音。 YouTube创作者可以用英语、西班牙语、印地语和日语(所有语言都有自己的声音,每个语言都有自然的声音)出版同样的视频,不需要调音工作室。
- 将内容本地化而不重记录
- 所有语文版本的同声
- 大型项目的批次处理
- 自动输油管的API一体化
多种语文 APIP 融合
以单一API调用的任何语言生成语音
import requests
languages = {
"en": "Hello, welcome to our service!",
"es": "Hola, bienvenido a nuestro servicio!",
"ja": "こんにちは、サービスへようこそ!",
"hi": "नमस्ते, हमारी सेवा में आपका स्वागत है!",
"ar": "مرحبا، مرحبا بكم في خدمتنا!"
}
for lang, text in languages.items():
response = requests.post("https://api.tts.ai/v1/tts", json={
"text": text,
"model": "cosyvoice2",
"language": lang,
"format": "mp3"
}, headers={"Authorization": "Bearer YOUR_API_KEY"})
with open(f"welcome_{lang}.mp3", "wb") as f:
f.write(response.content)
无人均语言定价
所有30+种语文都列入每个计划,不收取非英语的额外费用。
自由级
$0
注册时 15 000 个字符
- 多语种(免费)
- 6+语言免费
- 不需要注册
启动启动器
$9
500 000个字符/月/月
- 所有30+语言
- 跨语言语音克隆
- 所有多种语文模式
职业
$29
2 000 000个字符/月/月
- 优先多语文优先处理
- 批次本地化
- 企业进入API
常问问题
关于多语种文本的共同问题
我们能改进什么?您的反馈帮助我们解决问题。