![中国语音学报(第11辑)](https://wfqqreader-1252317822.image.myqcloud.com/cover/438/34866438/b_34866438.jpg)
2.语料设计和语音数据标注
目标句的设计考虑了句法结构、句长和焦点个数等因素。将以往语音实验中采用的主谓宾结构拓展到双宾句结构,增加宾语修饰语来改变句子长度和结构,将焦点个数从一个扩展到三个焦点情况;控制句子的对比焦点置于语句最左侧,具体考察焦点与焦点重音的实现及其韵律特征,跟韵律结构、句法结构之间的相互影响。
2.1 语料设计
目标句设计。语料的设计第一点考虑因素为多焦点的承载。考虑到焦点分布的复杂情况,要确保焦点有足够多的分布位置,实验目标句需要具备一定的句子长度。第二点考虑因素为确保将对比重音控制在句子的最左边。为避免在简单句中,由于过长的修饰成分而造成的语料不自然,再结合句法结构的特殊性,我们特意选取了汉语中的双宾语句结构进行研究。汉语的双宾句这个概念最先在黎锦熙先生的《新著国语文法》[56]中提出。双宾句可以通过在两个不同宾语前增加和删减修饰成分起到调节句子长短和结构的效果,且不同句法成分均可承载焦点并通过句法位置间的排列组合形成多焦的语料环境。基于汉语双宾语句句法结构的多样性和复杂性,在此我们只选取其中的一种基本句式。在接下来的文章中,我们将采用缩写的形式进行描述,即主语(S),谓语动词(V),第一修饰语(M1),间接宾语(O1),第二修饰语(M2),直接宾语(O2)。
主语+谓语动词+(第一修饰语)+间接宾语+(第二修饰语)+直接宾语
S+V+[M1]+O1+[M2]+O2
这里,方括号表示两个修饰成分为可选择成分,实验目标句的句子长度,通过宾语前的这两个修饰语来进行调节。我们这里选取了四类句型结构:
(1)主语+谓语动词+间接宾语+直接宾语(S+V+O1+O2)
(2)主语+谓语动词+第一修饰语+间接宾语+直接宾语(S+V+M1+O1+O2)
(3)主语+谓语动词+间接宾语+第二修饰语+直接宾语(S+V+O1+M2+O2)
(4)主语+谓语动词+第一修饰语+间接宾语+第二修饰语+直接宾语(S+V+M1+O1+M2+O2)
引导句设计。引导句为特指疑问句,通过对四种句子进行不同信息的疑问,得到各种的信息结构(焦点结构)。这里,除了谓语动词外,其他的句子成分均可获得焦点。为保证实验设计中核心重音控制在句子左侧,我们采用纠正焦点(corrective focus),确保在任何焦点情况下,都将其控制在主语位置上。其余部分的焦点,由不同的特指问句进行引导。焦点情况的设计为:宽焦点(以下简称BF)、单焦点(设置在主语上,表示为NF或者F-S)、双焦点(标明焦点位置,如焦点在主语和间接宾语上表示为F-S-O1)、三焦点(如焦点在主语和两个修饰成分上表示为F-SU-M1-M2)。宽焦点环境下,使用引导句“发生了什么事?”对负载句进行提问;而单焦点以及多焦点环境下,则依据焦点词位置使用不同位置疑问词的特殊疑问句对负载句进行提问。
声调因素。在语料声调的设计上,目标句中焦点成分音节涵盖了阴平(HH)、阳平(LH)、上声(LL)和去声(HL)四种。除去谓语动词为固定的“N+给(LL)”结构,其余所有音节声调均保持一致,分别称为阴平句、阳平句、上声句和去声句。
表1 焦点句设计举例
以SVM1O1M2O2结构的阴平句为例进行说明(见表1)。目标句“张咪扔给窗边的八哥三根香蕉”。通过分别对“窗边”(哪里的),“八哥”(什么动物),“三根”(多少),“香蕉”(什么吃的)进行提问,同时始终保证主语作为修正焦点,从而分别形成四种双焦点情况:F-S-M1、F-S-O1、F-S-M2、F-S-O2。通过对两个成分的提问得到三焦句句(始终让主语作为修正焦点),有四种情况:F-S-M1-M2、F-S+O1+O2、F-S-M1-O2、F-S-O1-M2,再加上宽焦点BF和窄焦点NF(F-S)的情况。当设计语料达到最大长度时,各种焦点句共有10种(见表1)。最终设计语料总计96句,其中80句目标句涵盖四种声调和各焦点组合情况,另又设计了16个干扰句,防止朗读惯性的产生。
综合以上三种因素:句子结构×信息结构×声调组合,最终实验目标句的组合如下,目标句总数为96句:
(1)SVO1O2:4种信息结构×4种声调组合=16个目标句
(2)SVM1O1O2:5种信息结构×4种声调组合=20个目标句
(3)SVO1M2O2:5种信息结构×4种声调组合=20个目标句
(4)SVM1O1M2O2:10种信息结构×4种声调组合=40个目标句
2.2 发音人和录音
本实验共有10名发音人,5名女生,5名男生。10人均为北京本地人,日常生活中熟练使用北京话,年龄21—22岁,主要来自北京第二外国语学院,视力以及发音正常,听力无障碍。
实验录音在中国社会科学院语言研究所的消声室中进行,采样率为16kHz,精度16bit,单声道。录音时,发音人以自然状态坐在电脑前。本次实验语料通过录音软件随机呈现给发音人,要求发音人先念出引导句,再根据文本回答出相应的目标句。每次材料呈现一次,发音人以正常语速朗读,朗读错误时重新录制。最终录制10人发音共960个目标句对和160个干扰句对的朗读语音。
2.3 录音语料处理与标注
首先将960个句对的问句和答句切分开,并且答句中的“不是××”部分与后半句切开,实验语料只采取答句的后半部分作为分析目标句。然后进行语料的音段自动切分,得到音节和声韵母边界,再用Praat软件手工校准音节边界和声韵母边界。
2.4 语音参数提取
语音参数包括基频和时长。首先,使用Praat提取基频数据,并对基频数据进行手工校正,然后提取每个音节的时长,以及韵母对应的基频数据(按照10个点插值),最后进行基频的规整。规整方法是,按照每个发音人的音高下限Fmin将每个人的音高数据赫兹值(F0)转换为对应的半音值(F0st):F0st=12×lg(F0/Fmin)/lg2。为了消除不同发音人之间的差异,获得具有语言学意义的可比信息,再对每一位发音人的半音基频值进行Z-score规整,公式如下:
其中,F0z为某个发音人基频目标值,μ为此发音人的基频平均值,σ为此发音人的基频标准差。
归一化处理后的F0z值再使用Excel,MATLAB和SPSS软件做进一步的统计分析。对所提取数据进行样本内的ANOVA单因素方差检验,主要观察在α因素方差检验水平上的显著性,结果受到Benforroni的修正,当P大于0.05时接受H0假设,即差异性不显著。