本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。
语音视位和 Amazon Polly
语音视位代表说一个词时的面部和口腔位置。它是一个音素的视觉等价物,是形成单词的基本声学单元。语音视位是语音的基本可视构建基块。
每种语言都有一组与其特定音素相对应的 viseme。在语言中,每个音素都有相应的代表口腔发音时的形状的语音视位。然而,并非所有语音视位都能映射到特定的音素,因为许多音素虽然听上去不一样,但发音时的形状相同。例如,在英语中,单词“pet”(宠物)和“bet”(打赌)声音上是不同的。但是,在目视观察中(无声音),它们看起来完全相同。
下图显示了部分国际语音字母 (IPA) 音素和扩展语音评估方法语音字母 (X-SAMPA) 符号及其对应的美式英语配音的发音模组。
如需获得完整列表和所有可用语音的表格,请参阅 亚马逊 Polly 中的语言。
IPA |
X-SAMPA |
描述 |
示例 |
语音视位 |
---|---|---|---|---|
辅音 |
||||
b |
b |
浊双唇塞音 |
bed |
p |
d |
d |
浊齿龈塞音 |
dig |
t |
d͡ʒ |
dZ |
浊龈后塞擦音 |
jump |
S |
ð |
D |
浊齿擦音 |
then |
T |
f |
f |
清唇齿擦音 |
five |
f |
g |
g |
浊软颚塞音 |
game |
k |
h |
h |
清喉擦音 |
house |
k |
... |
... |
... |
... |
... |