关键发现:同一个 tianmei 音色既能做中文 VO(已上线)又能做日语 VO——两种语言听起来像同一个人在说话。换音色=重生全部,所以这是最优雅的方案。
语速候选(同一句,三个速度对比)
原 Aspeed 0.9(慢,原版)
模型 Minimax-speech-2.8-turbo · 音色 female-tianmei (timbre −15)
あたたかいぎゅうにゅうをひとつ、おねがい。あと、いりぐちのとうめいのかさも。
……一罐热牛奶,拜托了。还有,门口那把透明伞。
候选 1speed 1.0(自然)
模型 Minimax-speech-2.8-turbo · 音色 female-tianmei (timbre −15)
あたたかいぎゅうにゅうをひとつ、おねがい。あと、いりぐちのとうめいのかさも。
……一罐热牛奶,拜托了。还有,门口那把透明伞。
候选 2speed 1.1(明快·母语节奏)
模型 Minimax-speech-2.8-turbo · 音色 female-tianmei (timbre −15)
あたたかいぎゅうにゅうをひとつ、おねがい。あと、いりぐちのとうめいのかさも。
……一罐热牛奶,拜托了。还有,门口那把透明伞。
失败对照(HD 模型,留作参考)
B ✗ 不行
模型 Minimax-speech-2.8-hd · 音色 female-shaonv
こんばんは、コンビニのあかりが、あたたかかったの。
晚上好,便利店的灯光,很温暖呢。
C ✗ 不是人类发音
模型 Minimax-speech-2.8-hd · 音色 female-chengshu
……ねむれないの。よるのさんじに、いつもおきる。
……睡不着呢。夜里三点,总是会醒。