超拟人音色、专业克隆、音色设计模型大升级，支持40种语言、19种语气标签

2026-02-15 20:01:56

现在，TransDuck对于超拟人音色更新了新一代语音模型，精准还原真实语气细节，全面提升音色相似度。

新引擎特色

支持40种语言（包括：中文、粤语、英语、西班牙语、法语、俄语、德语、葡萄牙语、阿拉伯语、意大利语、日语、韩语、印尼语、越南语、土耳其语、荷兰语、乌克兰语、泰语、波兰语、罗马尼亚语、希腊语、捷克语、芬兰语、印地语、保加利亚语、丹麦语、希伯来语、马来语、波斯语、斯洛伐克语、瑞典语、克罗地亚语、菲律宾语、匈牙利语、挪威语、斯洛文尼亚语、加泰罗尼亚语、尼诺斯克语、泰米尔语、阿非利卡语），可以实现跨语言文本转语音
支持19种语气词标签：(laughs)笑声、(sighs)叹气、(coughs)咳嗽、(chuckle)轻笑、(breath)换气、(inhale)吸气、(exhale)呼气、(gasps)倒吸气、(pant)喘气、(sniffs)吸鼻子、(clear-throat)清嗓子、(snorts)喷鼻息、(groans)呻吟、(burps)打嗝、(sneezes)喷嚏、(lip-smacking)咂嘴、(humming)哼唱、(hissing)嘶嘶声、(emm)嗯，可以更精细的控制音频生成内容
支持停顿控制。使用方式：在文本中增加 <#x#> 标记，x 为停顿时长（单位：秒），范围 [0.01, 99.99]，最多保留两位小数。文本间隔时间需设置在两个可以语音发音的文本之间，不可连续使用多个停顿标记

本次引擎升级涵盖的功能包括：