语音自动断句及外语视听教学资源的同步整合
算(granular computing)方法等。由于音视频样本中声音信号的复杂性,尽管语音断句的研究工作已有较长历史,并取得了很大成绩,但仍面临许多困难,如:算法的适应性较差、强背景噪音下分段困难、一些能量较低的爆破音和鼻音难以判断等。要克服这些困难,需对现有方法进行详细研究和比较,再辅以其他手段并施加一定的人工干预(比如,人工判断背景噪音等情况并设置相关语音参数)。笔者在编程实践中,自动断句的语音参数主要采用背景噪音、句间停顿、最短句长、允许杂音数等四个。通过改变它们的设定值,可灵活寻找句间停顿,并收集断点信息,能有效提高断句的精度。这四个参数的意义如下(如图1所示)。⑴ 背景噪音:小于该值的样本算做静音,设定值越大,切分出的句段越多。⑵ 句间停顿:大于该值的停顿才算句段,设定值越大,切分出的句段越少。⑶ 最短句长:大于该值的非静音采样才被认定为句段,设定值越大,切分出的句段越少。⑷ 允许杂音数:句间停顿允许存在的
<<上一页 下一页>>
广州市越秀区图书馆版权所有。
联系电话:020-87673002
本站访问人数: