返回列表

超拟人音色、专业克隆、音色设计模型大升级,支持40种语言、19种语气标签

2026-02-15 20:01:56

现在,TransDuck对于超拟人音色更新了新一代语音模型,精准还原真实语气细节,全面提升音色相似度。

新引擎特色

  • 支持40种语言(包括:中文、粤语、英语、西班牙语、法语、俄语、德语、葡萄牙语、阿拉伯语、意大利语、日语、韩语、印尼语、越南语、土耳其语、荷兰语、乌克兰语、泰语、波兰语、罗马尼亚语、希腊语、捷克语、芬兰语、印地语、保加利亚语、丹麦语、希伯来语、马来语、波斯语、斯洛伐克语、瑞典语、克罗地亚语、菲律宾语、匈牙利语、挪威语、斯洛文尼亚语、加泰罗尼亚语、尼诺斯克语、泰米尔语、阿非利卡语),可以实现跨语言文本转语音

  • 支持19种语气词标签:(laughs)笑声、(sighs)叹气、(coughs)咳嗽、(chuckle)轻笑、(breath)换气、(inhale)吸气、(exhale)呼气、(gasps)倒吸气、(pant)喘气、(sniffs)吸鼻子、(clear-throat)清嗓子、(snorts)喷鼻息、(groans)呻吟、(burps)打嗝、(sneezes)喷嚏、(lip-smacking)咂嘴、(humming)哼唱、(hissing)嘶嘶声、(emm)嗯 ,可以更精细的控制音频生成内容

  • 支持停顿控制。使用方式:在文本中增加 <#x#> 标记,x 为停顿时长(单位:秒),范围 [0.01, 99.99],最多保留两位小数。文本间隔时间需设置在两个可以语音发音的文本之间,不可连续使用多个停顿标记

涉及功能

本次引擎升级涵盖的功能包括:

  • 系统音色中的“超拟人音色”
  • 声音克隆(专业版)创建的音色
  • 音色设计创建的音色