报告错误/功能要求

多种语文的发言稿——30+语文

以30多种语言用本地发音生成自然声音。从印地语和日语到阿拉伯语和西班牙语,我们的人工智能模型提供了真正的多语言语音合成。适合本地化、语言学习、国际内容和跨语言语音克隆。

30+语文印地语日语西班牙语阿拉伯文

Full TTS Editor API 文件

现在试试

0/500

与Kokoro、Piper、VITS、Melotts免费

您生成的音频将在此显示

打开完整的 TTS 编辑器

Multilingual TTS Features

语言和口音世界级演讲合成

30+语文

以30多种语文发表演讲,包括英文、印地文、日文、西班牙文、中文、阿拉伯文、韩文、法文、德文、俄文、葡萄牙文等。

土著发音

每个模型都接受关于母语录音的培训,确保每种辅助语言的真实发音、读音和节奏。

跨语言克隆

CosyVoice 2为全球内容保留了8种语言的语音身份。

RTL 语文支助

全面支持阿拉伯语、希伯来语、乌尔都语和波斯语等右对左语言,提供正确文本处理和自然语音输出。

语言检测

自动语言检测可识别输入文本语言以及达到最佳读音质量的适当模式和声音的路径。

精选变式

各种语言——美国、英国、印度和澳大利亚英语;欧洲和拉丁美洲西班牙语;以及更多的区域变体。

Best Models for Multilingual TTS

具有最广泛语言支持和最佳跨语文质量的模型

CosyVoice 2

Standard

Alibaba's scalable streaming TTS with human-parity naturalness and near-zero latency.

中 5/5 语音克隆

最佳用于: 最佳多语言模式——8种语言,具有跨语言语音克隆

尝试 CosyVoice 2

MeloTTS

Free

High-quality multilingual text-to-speech that runs on CPU with minimal latency.

快速 4/5

最佳用于: 免费多种语言TTS,每种语言多口音变异

尝试 MeloTTS

GPT-SoVITS

Standard

Few-shot voice cloning TTS that replicates any voice from just 5 seconds of audio.

慢 5/5 语音克隆

最佳用于: 英文、中文、日文和韩文的少量克隆

尝试 GPT-SoVITS

Bark

Standard

Transformer-based text-to-audio model that generates realistic speech, music, and sound effects.

慢 4/5

最佳用于: 13+语言,具有情感表达和声音效果

尝试 Bark

Kokoro

Free

Lightweight 82M parameter model delivering studio-quality speech with blazing-fast inference.

快速 5/5

最佳用于: 具有演播室质量的9种语言的超快生产

尝试 Kokoro

如何生成多语种语言

以任何语言进行自然语言的自然言语(秒以内)

选择您的语言

从 30+ 支持的语言中选择。系统也可以自动检测输入文本的语言, 方便。

以任何语言输入文本

目标语言的文字类型或粘贴文本。完整 Unicode 支持处理所有脚本, 包括 CJK、 Devanagari、阿拉伯语、西里尔语等等。

选择本地声音

选择您语言中最优化的声音。每种语言都提供多种语音选项, 只要有区域口音变量。

生成和下载

以 MP3 或 WAV 生成本地发音并下载为 MP3 或 WAV。使用 API 进行多种语言的批量生成。

辅助语言

我们的多语种TTS模式中可用的语言

美洲和欧洲

英语( 美国、联合王国、非盟)
西班牙语(ES, MX)
(BR、PT)
法语( FR, CA)
德语
意大利语
荷兰语Name
波兰语Name

东亚

中文( 普通中文)
中文( 州)
日语
韩文
越南语Name
泰语
印度尼西亚语Name
马来语

南亚和中东

印地语
阿拉伯文
土耳其语Name
孟加拉语Name
泰米尔
乌尔都
波斯语
希伯来语

跨语言语音克隆

用自己的声音说任何语言

克隆你的声音,说任何语言

人工智能保存你独特的声音特征 — — 字、音、发音风格 — — 同时用目标语言制作本地发声发音。对于内容创作者来说,适合接触全球受众。

10秒声音样本就是你需要的全部
您的语音特性被保存在各种语言之间
土著发音和点音
模型:CosyVoice2, OpenVoice, 鱼类演讲

内容本地化

将视频、课程和播客本地化为多种语言,同时保留同一个发言者的声音。 YouTube创作者可以用英语、西班牙语、印地语和日语(所有语言都有自己的声音,每个语言都有自然的声音)出版同样的视频,不需要调音工作室。

将内容本地化而不重记录
所有语文版本的同声
大型项目的批次处理
自动输油管的API一体化

尝试语音克隆

多种语文 APIP 融合

以单一API调用的任何语言生成语音

Python - 多语言代言人 REST API

import requests

languages = {
    "en": "Hello, welcome to our service!",
    "es": "Hola, bienvenido a nuestro servicio!",
    "ja": "こんにちは、サービスへようこそ！",
    "hi": "नमस्ते, हमारी सेवा में आपका स्वागत है!",
    "ar": "مرحبا، مرحبا بكم في خدمتنا!"
}

for lang, text in languages.items():
    response = requests.post("https://api.tts.ai/v1/tts", json={
        "text": text,
        "model": "cosyvoice2",
        "language": lang,
        "format": "mp3"
    }, headers={"Authorization": "Bearer YOUR_API_KEY"})

    with open(f"welcome_{lang}.mp3", "wb") as f:
        f.write(response.content)

查看 API 文件

无人均语言定价

所有30+种语文都列入每个计划,不收取非英语的额外费用。

自由级

注册时 15 000 个字符

多语种(免费)
6+语言免费
不需要注册

启动器

500 000个字符/月/月

所有30+语言
跨语言语音克隆
所有多种语文模式

职业

$29

2 000 000个字符/月/月

优先多语文优先处理
批次本地化
企业进入API

查看完整定价

常问问题

关于多语种文本的共同问题

TTS.ai人支持30+种语言,包括英语、印地语、日语、西班牙语、中文(普通话)、阿拉伯语、韩语、法语、德语、俄语、葡萄牙语、意大利语、土耳其语、波兰语、荷兰语、瑞典语等。

巴克支持印地语,其发音质量优异。对于印地语语音克隆,科西维切2提供跨语言合成。笛手还提供印地语声音,这些声音在CPU上有效运行,用于生产应用。

是。 Kokoro、Melotts、CosyVoice 2、GPT-SOVITS和VITS都支持日本语的本地发音。 Kokoro和CosyVoice 2 提供了高质量的日本TTS, 配有适当的音调和内向模式。

在母语数据方面受过培训的模型为其所支持的语言提供准确的读音。Kokoro和CosyVoice 2 在其所支持的语言中实现了近本地质量,准确性因模式和语言而异——检查每个模型的语言清单以取得最佳结果。

是的,这叫做跨语言语音克隆。 CosyVoice 2可以克隆英语样本的声音,并用中文、日文、韩文和其他五种语言发表演讲,同时保留发言者的语音特征和特征。

是的,我们的文本处理管道正确处理RTL脚本,阿拉伯文、希伯来文、乌尔都文和波斯文文本经过适当处理,并转换为有适当读音的语音,包括处理diacritics和相关的字母表。

有些模型自然会处理编码转换(混合语言)问题。 CosyVoice 2 和 GPT-SOVITS 可以处理双语文本,每个语言段都有适当的发音。为了取得最佳效果,将每一代都保留在单一语言中。

MelotTS提供美国、英国、印度和澳大利亚英语口音。其他模式则通过不同的语音选择提供各种英语口音选项。 Piper在其100+语音目录中拥有最广泛的英语口音。

是。免费模式支持多种语言:Kokoro(9种语言)、Piper(30+)、MelotTS(6)和VITS(4)。你可以以零费用制作多语种语言演讲。

多模型支持中文中文:Kokoro、CosyVoice 2、MelotTS、GPT-SOVITS、鱼言语和BARK。 CosyVoice 2和GPT-SOVITS提供了最好的普通话质量,有适当的语调处理。简单地粘贴中文文本并选择中文声音。

是的,Kokoro, CosyVoice 2, MoloTTS, GPT-SOVITS, 和VITS 支持韩国。 Kokoro为韩国 TTS提供了最佳的速度和质量平衡。 CosyVoice 2增加了韩国内容的语音克隆能力。

我们的文本处理管道根据每种语言的公约,使数字、日期、货币和通用缩写标准化。例如,英语和德语的“ 1 000” 表示方式不同。该系统自动处理基于所选语言的这些转换。

5.0/5 (1)

使用 AI 使用 AI 说每一语言

以30+种语言产生自然语言,免费包括多种语言模式,不需要注册。

签署自由视图定价

多种语文的发言稿——30+语文

现在试试

喜欢TTS.ai吗？告诉你的朋友吧！