《表3:p、t、k音段边界切分结果统计》
最终的检测性能和参数区分性有关。本研究使用的参数都是基于自动切分边界提取的,边界切分的准确度将影响提取参数的区分性,尤其是VOT参数和基于曲线拟合与基于landmark的两种方法提取的MFCC参数。为考察检测性能的改善空间,表3给出了人工标注方式和计算机自动对齐方式下送气辅音p、t、k的正确及其偏误发音样本的时长均值、标准差,以及两种切分方法在音段左右边界的平均时长偏差。观察表3可知,p、t、k正确发音及送气不足发音时长存在明显差异,这也说明了为什么VOT特征有助于送气不足偏误的检测。此外,自动对齐和人工标注方式边界切分存在明显差异(其中左边界偏差甚至超过了样本时长均值),最终会影响VOT特征提取的准确性,右边界的切分也会影响landmark位置的确定和曲线拟合方法中曲线形状。实验中进一步对比观察两种边界切分结果,发现自动对齐方式往往会把音节前静音段归为p、t、k音段部分。尽管基于自动聚类方法通过舍弃聚类结果的第一类减弱静音段的影响,但此方法没有从根本上解决问题。不难推测,如果能提升边界自动切分的准确度,将进一步提高系统的检测性能。
图表编号 | XD0027977800 严禁用于非法目的 |
---|---|
绘制时间 | 2016.12.01 |
作者 | 屈乐园、解焱陆、高迎明、魏星、张劲松 |
绘制单位 | 北京语言大学信息科学学院 |
更多格式 | 高清、无水印(增值服务) |