美章网 资料文库 汉语三音节韵律词时长特征研究范文

汉语三音节韵律词时长特征研究范文

本站小编为你精心准备了汉语三音节韵律词时长特征研究参考范文,愿这些范文能点燃您思维的火花,激发您的写作灵感。欢迎深入阅读并收藏。

汉语三音节韵律词时长特征研究

《当代外语研究杂志》2016年第5期

摘要:

本文采用基于自然话语语料库,从实验语音学角度对汉语普通话自然话语三音节韵律词的时长分布特征进行了分析研究。研究发现结构性位置因素会对三音节韵律词的时长产生重要的影响。韵律词内前字和末字的时长易受到结构性位置因素影响,而中字时长比较稳定;韵律词内音节时长特征与停延和音高重设关系密切。同时本文发现自然话语中韵律词音节时长特征与朗读话语中音节时长特征的不同点。

关键词:

韵律词,语法组合类型,时长,停延

1.引言

在当今信息社会,语音合成技术发展迅速。在汉语普通话的语音合成过程中,声学基元是拼接的基本单位,它可能是音节、词语、语句等。在基元组合的过程中,韵律的变化是非常复杂的,因此韵律对语音合成后的效果影响很大。其中,自然语流中的抑扬顿挫、轻重转换、节奏分明等特征,主要是通过音高、时长和音强等方面的变化所表现出来的声学特征。在汉语普通话自然语流中,话语的韵律结构特征会受到多种因素的影响,这些因素包括音高、时长、音强和停延等。

1.1 文献综述

1.1.1 英语韵律结构研究

韵律词这个概念是从西方引进来的,它是从韵律学的角度来规定的“词”的概念,指“最小的能够自由运用的语言单位”。关于英语韵律结构层级,Selkirk(1982,1984,1986)提出了很多重要的发现。特别是以英语为例,提出了韵律层级概念,并且论述了音节、音步、韵律词、音系短语、语调短语和话语等各结构层级的相关性。Nespor和Vogel(1986)受到Selkirk的影响,开拓了韵律音系学研究领域,指出韵律音系学与节律音系学、自主音段音系学相互作用。Hayes(1989)提出了在韵律词和音系短语之间存在黏附组这一韵律层级单位。McCarthy和Prince(1995)提出韵律形态学,主要研究韵律结构如何影响形态模板的构建和分界。

1.1.2 英语和汉语韵律结构的异同

英语是重音记时节拍语言,汉语是声调语言。英语的韵律结构层次主要有莫拉(mora)、音节、音步、韵律词、音系短语、语调短语和话语。综合王洪君(2008)、李凤杰(2012)和王丽娟(2015)的主要观点,可论证汉语同样存在韵律形态。汉语和英语共同的韵律结构层次是音节、韵律词、韵律短语、语调短语和话语。莫拉、音步、黏附组是英语中重要的韵律单位,但是在汉语韵律形态中不是凸显单位,这是因为汉语中无长元音、多辅音丛,所以最好将它们从汉语韵律形态结构中排除。

1.1.3 汉语韵律单位与时长研究

本文关注汉语韵律形态,在韵律形态中的语言单位是韵律单位,韵律词是以语言中的韵律单位为基础。言语的韵律组织是一个相当复杂的过程,语句韵律层级就可以看成是这样一个过程,首先将语句划分成一定的层次结构。其次是根据语义和表达的需求协调各个层次内结构之间的整体关系,同时在每个层次的内部还需要分配其子单元之间的节奏和轻重快慢。与言语韵律实现相关的主要声学参数就是每个语音单元的音高和时长。时长是语音的重要声学特征之一,对语音的可理解度和自然度都有一定的影响。尽管国内外学者从实验语音学的角度对汉语韵律结构的时长特征已经做了很多卓有成效的研究,但是总体看来先前的研究及其形成的结论还是存在一些值得商榷的地方。主要表现在四个方面:首先,多数实验设计语料是实验句,全部实验词都放在固定的负载句中,对实际生活中的自然语言的研究不够深入(林茂灿等1984;冯隆1985;王晶、王理嘉1993;曹文2010)。其次,一些学者(杨玉芳1997;李爱军1998;曹剑芬1998,2005;王蓓等2004;叶军2008;邓丹2010;殷治纲2011)用朗读语料库对汉语韵律结构的时长特征进行分析,但是必须承认朗读语料和自然独白口语之间存在着很大的结构性差异(刘亚斌、李爱军2002:18)。此外,一些学者在研究汉语普通话语调结构时只是重视功能性因素对汉语语调的影响,忽视了结构位置因素对连续语流中音节时长的影响。最后,一些学者(王洪君2008;李凤杰2012;洪爽2015;王丽娟2015)只是从抽象理论建构上探讨了汉语韵律结构,并未对自然语流中音节时长特征进行大规模的定量和定性分析,因此,为了能够从多维度对汉语韵律形态特征进行研究,本文将重点关注结构性位置因素对汉语自然独白话语韵律结构中音节时长特征的影响。

1.2 研究目标和问题

1.2.1 目标

基于前文分析,本文主要研究汉语普通话自然独白话语的韵律结构特征与言语结构位置之间的交互性,探讨结构性位置因素对汉语普通话自然独白话语中三音节韵律词的时长声学特征的影响。本文所考虑的结构性位置因素主要包括音节自身的声调类型、韵律词内相邻声调的类型、所在的韵律层级边界、所在的语调短语位置等。

1.2.2 研究假设

自然独白话语更加接近人们日常生活口语的表达,包含了丰富的韵律结构信息,有助于我们深入了解实际话语的连读语流的特点,因此自然独白话语中韵律词的时长分布特征应受韵律结构位置因素的影响,且会有某种特点区别于朗读话语中音节时长分布特征。本文研究的韵律词不是传统语法分析中的语法词,特别是注重从感知和语音的角度来界定汉语普通话自然话语的韵律单元,比如韵律词。此外,本文关注的是汉语语调的基本模式,即自然焦点条件下的自然话语的陈述语句的语调模式。这是语调模型构建的基础和语调研究的起点(王萍、石锋2011)。

2.研究方法

2.1 被试

我们共邀请了四位发音人(两男两女),年龄在23~32岁之间,他们通过了普通话水平测试,获得了普通话水平二级甲等证书,其中一位发音人获得了普通话水平一级乙等证书。四位发音人均没有播音专业背景,也没有受过播音的专业训练。为了获得自然话语独白语料,我们选择了普通话水平测试的第四项“说话”为测试内容。题目内容涉及学习、体育、朋友和业余爱好等多项与普通人生活密切相关的题型。该语料库的句子均是陈述句。每位发音人都以自然的方式独白,没有特别的强调和感情色彩,语速适中。录音环境为隔音效果良好的录音室。每个人的独白时间大约15~18分钟。声音文件采用16KHz采样,16位数据,单声道WAV格式存储。采用praat脚本对所有的韵律词音节的时长数据进行提取。

2.2 研究设计

本文采用的韵律层级模式基本沿用了目前主流的“音节———韵律词———韵律短语———语调短语———语句”的层级结构模式。从韵律词最基本的声学特征时长入手,运用统计手段对音节的时长值进行了归整化处理,重点研究结构性位置因素对三音节韵律词时长的影响,分析其分布特点。

2.2.1 语音学标注介绍

基于已有的研究成果(邓丹2010;殷治纲2011),本文的语音标注信息主要是以C-ToBI系统为基础。标注层级为四层:声韵母层、拼音层、韵律结构间断指数层和相对重音层。韵律结构间断指数层标记汉语的韵律结构。间断指数代表感知到的音节之间以及音节和无声段之间的音联程度。话语的韵律结构就是层级组织结构,根据英语和汉语韵律形态的共性,被从小到大依次划分为音节、音步、韵律词、韵律短语和语调单位。韵律结构和句法结构不一定一一对应。本研究对韵律层级边界的间断指数层进行了如表1所示的界定: 所有语音标注均由五位经过了长时间韵律标注培训的听音人完成,她们均具有相关的语音学专业知识,在标注标准和数据一致性等问题上可以得到科学的保证。通过听觉感知判断对语料进行了韵律层级结构的标注,例如从语料库中切分得到了研究需要使用的三音节韵律词。本研究所使用的全部韵律词均不含有明显的强调重音。五位听音人每人都要独立完成所有语料的韵律标注。接着在各自完成全部的工作之后,再对五位听音人的结果进行比较,获得最终的一致性标注结论,从而确保标注的可靠性和科学性。此外,本研究标注的各类标准基于已有的研究成果,并且已经和相关语音学专家进行多次讨论,因此本语料库使用的标注标准可以反映自然话语独白语料的真实规律,其可靠性符合研究需要。经过数据统计分析,样本数据中各类韵律词的具体数目列举如下:(1)单音节韵律词616个;(2)双音节韵律词2,371个(不含轻声的2,080个);(3)三音节韵律词861个(不含轻声的456个);(4)四音节韵律词47个;(5)五音节韵律词一个。由此可知,样本数据中的韵律词共有3,896个,其中两音节韵律词比重最多,占比60.86%,其次是三音节韵律词,占比22.10%,再次是单音节韵律词,占比15.81%,最后是四音节和五音节的韵律词,分别占比1.21%和0.26%。两音节和三音节的韵律词共有3,232个,占韵律词总数的82.957%。这就证明了在汉语普通话的自然独白语流中,发音人的韵律词内的音节数量分布规律符合王洪君(2008)提出的“二常规、三可容、一四受限”的韵律词内音节数量规则。

2.2.2 时长数据的测量与分析方法

在数据统计中,为消除不同维度数据之间的差异,一般运用Z-score对样本数据值进行归整。即:Z=(x-μ)/σ。但是在语音学研究中,当以音节为统计单元进行时长的归整时,音节的声母、韵母、声调类别都有可能影响音节时长。因此本文以音节为统计单元测量其时长,并采用基于R软件的混合线性模型预测的方法对时长数据进行归整,排除不相关的声母和韵母等固定因素的影响,得出音节的归整化时长作为数据处理单位。具体处理步骤如下:

(1)首先用已经标注好的各种分类信息(声母、韵母等)的数据输入训练模型,得到预测模型;

(2)将各个语音单元要归整掉的分类信息作为输入值,输入预测模型,预测出参考值;

(3)将语音单元的实际值和参考值相比,求残差值(以δ表示);

(4)残差值与标准值的差异即可认为是排除掉输入的影响类型因素后,其余未考察或未知因素对该单元的影响。这些未考察或者未知因素的影响包括本研究要考察的声调、音节在所在的语调短语位置、音节所在的韵律层级边界和语法组合类型等因素,以及其他未知或不能解释的影响。本研究使用的残差值(以δ表示)是指实际值与参考值之间的差。我们对残差值进行了标准化分析,公式为(δ-残差的均值)/残差的标准差,得到标准化残差值(以δ*表示)。δ*遵从标准正态分布N(0,1)。然后将δ*转换为T数值(余建英、何旭宏2003:87),公式为T=10δ*+50。此外,本文参考已有的研究成果(冯隆1985;曹文2010),对塞音和塞擦音的时长测量方法如下:当塞音或者塞擦音声母音节处在句首时,该音节的时长的测量不包括所谓的无声段间隙(gap)。当塞音或者塞擦音声母音节不在句首,而且听感上也没有停顿时,一般以前音节的末尾作为塞音或者塞擦音无声段的开始,此段间隙计入塞音/塞擦音声母音节的时长。当这样的音节不在句首,而且听感上音节间还有停顿时,这段时长不计入任何音节。

3.三音节韵律词时长的多因素分析

本文主要对不包括轻声的三音节韵律词内音节的归整化时长进行分析。考察音节本身的声调类型、所在韵律层级边界、所在语调短语位置和韵律词的语法组合类型等结构性位置因素是否对前字、中字和末字音节的归整化时长产生影响。

3.1 三音节韵律词的前字归整化时长

为了消除声母和韵母等单元对音节时长的影响,我们首先对音节的绝对时长进行了归整处理。具体方法是用声母和韵母这些条件做输入条件,输入训练好的基于R软件的混合线性模型预测参考时长值。公式为Duration~Shengmu+Yunmu。上述公式中没有输入声调类型、音节所在的语调短语位置、韵律层级边界和语法组合类型,这是因为它们是本文研究焦点,所以要在结果中保留这些参数。然后计算出观测值与预测值之间的残差δ。最后我们对残差值δ进行标准化分析,得出的标准化残差δ*,可以被认为是排除掉声母和韵母影响后音节的归整化时长。接下来对归整化时长进行多因素方差分析(4x4x3x2)。因变量是前字的归整化时长,自变量是前字本身的声调类型(阴平、阳平、上声和去声)、所在的韵律层级边界(韵律词边界、韵律短语边界、语调短语边界和语句边界)、所在的语调短语位置(语调短语首、语调短语中和语调短语末)和韵律词的语法组合类型(1+2类型和2+1类型)。显著性水平为0.05,置信区间为95.0%。方差分析的结果表明,在α=0.05的水平上,前字音节的自身声调类型对前字音节归整化时长值的主效应是显著的(F(3,456)=3.261,p<0.05);韵律词的语法组合类型对前字音节归整化时长值的主效应也是显著的(F(1,456)=11.473,p<0.01)。音节所在的语调短语位置和韵律层级边界对前字音节归整化时长值的主效应不显著(p值均大于0.05)。另外,影响前字音节归整化时长的各因素之间交互效应不显著(p>0.05)。

3.2 三音节韵律词的中字归整化时长

然后,对排除掉了声母和韵母影响的中字的归整化时长进行多因素方差分析(4x4x3x2)。因变量是中字的归整化时长,自变量是中字本身的声调类型、所在的韵律层级边界、所在的语调短语位置和韵律词的语法组合类型。显著性水平为0.05,置信区间为95.0%。方差分析的结果表明,中字音节的自身声调类型、韵律词的语法组合类型、音节所在的语调短语位置和韵律层级边界对中字的归整化时长值的主效应不显著(p值均大于0.05)。而且,在α=0.05的水平上,影响中字音节归整化时长的各因素之间交互效应也不显著(p>0.05)。

3.3 三音节韵律词的末字归整化时长

最后,对排除掉声母和韵母影响的末字的归整化时长进行多因素方差分析(4x4x3x2)。因变量是末字的归整化时长,自变量是末字本身的声调类型、所在的韵律层级边界、所在的语调短语位置和韵律词的语法组合类型。方差分析的结果表明,末字音节的自身声调类型对末字归整化时长值的主效应不显著(F(3,456)=0.598,p=0.617)。但是在ɑ=0.1的水平上,韵律词的语法组合类型对末字的归整化时长值的主效应显著(F(1,456)=3.336,p=0.0691)。在ɑ=0.05的水平上,末字音节所在的语调短语位置对末字的归整化时长值的主效应显著(F(3,456)=2.696,p=0.046)。韵律层级边界对末字的归整化时长值的主效应显著(F(3,456)=9.382,p<0.001)。另外,在α=0.05的水平上,影响末字音节归整化时长的各因素之间的交互效应显著(p=0.036)。综合以上的多变量分析结果可知,和邓丹(2010:108)对朗读语料韵律词时长研究发现不同,在普通话独白类型的自然话语连续语流中,排除声母和韵母对音节时长的影响后,前字自身的声调和语法组合类型会对前字的时长有影响。中字时长比较稳定,不会受到其自身的声调类型、语法组合类型、音节所在的语调短语位置和韵律层级边界的影响。末字的时长最不稳定,排除掉声母和韵母对音节时长的影响后,语法组合类型、末字音节所在的语调短语位置和韵律层级边界都会对末字音节的时长产生影响。此外,根据主效应分析结果,语法组合类型、末字声调类型、末字音节所在的语调短语位置和末字音节所在的韵律层级边界———这四个影响末字音节归整化时长因素之间也会产生交互作用,这表明三音节韵律词中末字音节的时长最易受到结构性位置因素的影响。

4.讨论

4.1 声调对三音节韵律词内音节归整化时长的影响

根据多因素方差分析研究结果可知,韵律词内音节自身的声调类型会对音节的时长产生影响。排除掉声母和韵母对音节时长的影响,取各个音节归整化时长,为统计方便,先将标准化残差值线性转换为T数值,公式为T=10δ*+50;再取各个声调的线性转换后的T值的均值;最后对归整化时长的T值均值(下文简称为归整化时长)进行排列:由表2可知排除掉声母和韵母对音节时长的影响,前字四个声调的归整化时长特征分布特点为:阳平的时长最长,阴平和去声次之,上声最短。但对于中字和末字来说,四个声调归整化时长分布特点相同。阴平的时长最长,阳平和去声次之,上声的时长最短。无论是前字、中字还是后字,上声的时长都为最短。

4.2 韵律层级边界对三音节韵律词内音节归整化时长的影响

根据多因素方差分析研究结果可知,韵律词内音节所在的韵律层级边界会对音节的时长产生影响。

4.2.1 不同韵律层级边界前的音节归整化时长的方差分析

排除掉声母和韵母因素对音节时长的影响,对在韵律词边界、韵律短语边界、语调短语边界和语句边界前的前字、中字和末字音节的归整化时长进行了单向方差分析。根据方差分析的结果可知,在α=0.05的水平上,韵律词边界前、韵律短语边界前、语调短语边界前和语句边界前的三音节韵律词的前字音节(F(3,456)=4.717,p=0.003)、中字音节(F(3,456)=21.392,p<0.001)和末字音节(F(3,456)=80.494,p<0.001)的归整化时长之间存在显著差异。

4.2.2 不同韵律层级边界前音节归整化时长的分布特点

基于前文方差分析结果可知,三音节韵律词内音节所处的韵律层级边界会影响音节归整化时长。因此本小节关注前字、中字和末字音节归整化时长的均值在不同韵律层级边界前的分布特点。韵律层级边界与停延和音高重设密切相关。在排除掉声母和韵母对音节时长的影响后,无论是在韵律词边界前、韵律短语边界前、语调短语边界前和语句边界前,末字的归整化时长是最长的、中字次之、前字最短。这表明无论是否在停延前还是在音高重设前,前字的归整化时长都是最短的,后字的归整化时长都是最长的。此外,随着韵律边界层级的增加,后字的归整化时长会变长,但是前字和中字的归整化时长增加的幅度不大。

4.3 语法组合类型对音节的归整化时长的影响

基于多因素方差分析可知,语法组合类型会影响三音节韵律词内的音节归整化时长。因此本节关注不同语法组合类型下韵律词内音节归整化时长均值的分布特点。根据图2可以发现,在排除掉声母和韵母对音节时长的影响之后,无论是哪种语法类型,前字的归整化时长是最短的,中字次之,末字的归整化时长是最长的。1+2类型的三音节韵律词由一个单音节词加上一个两音节词构成,即前字是单音节词,中字是两音节词的词首,末字是两音节词的词末。2+1类型的三音节韵律词是一个两音节词加上一个单音节词构成,即前字是两音节词的词首,中字是两音节词的词末,末字是单音节词。在1+2类型中,中字时长短于末字,在2+1类型中,前字时长短于中字,因此在底层,处在双音节词首位置的音节时长都要短于处在双音节词末位置的音节时长,这一点和朗读话语的研究结果(邓丹2010:111-112)完全不同。

4.4 语调短语不同位置对音节的归整化时长的影响

基于多因素方差分析可知,三音节韵律词内音节所处的语调短语位置会影响音节归整化时长。因此本节将会关注前字、中字和末字音节归整化时长的均值在语调短语不同位置的分布特点。排除声母和韵母对音节时长的影响后,前字、中字和末字的归整化时长分布特点如下:

(1)在语调短语的首、中、末位置,末字的归整化时长比前字和中字的归整化时长都要长。在语调短语首和语调短语末时,前字的归整化时长最短,中字次之。

(2)在语调短语中时,中字的归整化时长最短,前字次之。语调短语末后会出现停延,出现在停延前的末字的归整化时长会变长。

(3)在语调短语末时,末字的归整化时长明显比处在语调短语首和语调短语中的末字归整化时长要长很多。

5.主要结论

通过研究汉语自然语流中三音节韵律词时长分布情况,发现结构性位置因素会对韵律词内部时长特征产生显著影响。具体而言,语法组合类型、韵律词内音节所在的语调短语位置和韵律层级边界都会对末字音节的时长产生影响。本文得到的主要发现如下:

(1)三音节韵律词内前字和末字的时长容易受到结构性位置因素影响,而中字时长比较稳定。具体而言,和朗读语料的研究发现不同,在自然独白话语中前字自身的声调和韵律词的语法组合类型会对三音节韵律词的前字时长有影响。末字时长受韵律词的语法组合类型、所在的语调短语位置和韵律层级边界的影响。

(2)三音节韵律词内音节时长特征与停延和音高重设关系密切。前字时长最短,后字时长最长。随着韵律边界层级的增加,后字时长会变长,但是前字和中字时长增加的幅度不大。

(3)韵律词的语法组合类型会对三音节韵律词内音节时长造成影响。在三音节韵律词的语法结构底层,处在双音节词首位置的音节时长都要小于处在双音节词末位置的音节时长,这一点也和朗读语料的研究发现不同。总之,本研究在一定程度上揭示了汉语自然话语三音节韵律词内音节时长分布规律,可为研究者进一步了解汉语韵律形态结构提供帮助,具有一定的理论意义和实际意义。

参考文献:

曹剑芬.1998.汉语普通话语音节奏的初步研究[J/OL].中国社会科学院语言研究所语音研究报告.[2006-10-12].

曹剑芬.2005.音段延长的不同类型及其韵律价值[J].南京师范大学文学院学报(4):160-167.

曹文.2010.汉语焦点重音的韵律实现[M].北京:北京语言文化大学出版社.邓丹.2010.汉语韵律词研究[M].北京:北京大学出版社.

冯隆.1985.北京话语流中声韵调的时长[A].北京语音实验录(林焘、王理嘉等编).[C].北京:北京大学出版社,131-195.

洪爽.2015.汉语的最小词[M].北京:北京语言大学出版社.

李爱军.1998.普通话韵律短语的时长特性分析[J/OL].中国社会科学院语音研究室语音研究报告.[2006-10-12].

李凤杰.2012.韵律结构层次:理论与应用[M].天津:天津大学出版社.

林茂灿、颜景助、孙国华.1984.北京话两字组正常重音的初步实验[J].方言(1):56-73.

刘亚斌、李爱军.2002.朗读语料与自然口语的差异分析[J].中文信息学报(1):13-18,51.

王蓓、吕士楠、杨玉芳.2004.汉语韵律层级边界结构边界的声学分析[J].声学学报(1):29-36.

王洪君.2008.汉语非线性音系学———汉语的音系格局与单字音[M].北京:北京大学出版社.

王晶、王理嘉.1993.普通话多音节词音节时长分布模式[J].中国语文(2):112-116.

王丽娟.2015.汉语的韵律形态[M].北京:北京语言大学出版社.

王萍、石锋.2011.汉语语调的基本模式[J].南开语言学刊(2):1-13.

杨玉芳.1997.句法边界的韵律学表现[J].声学学报(5):414-421.

叶军.2008.现代汉语节奏研究[M].上海:上海世纪出版集团.

殷治纲.2011.汉语普通话朗读语篇节奏研究[D].中国社会科学院研究生院博士论文.

余建英、何旭宏.2003.数据统计分析与SPSS应用[M].北京:人民邮电出版社.

作者:郭中子 单位:天津外国语大学