基于静音时长和文本特征融合的韵律边界自动标注

CORC > 自动化研究所 > 中国科学院自动化研究所 > 模式识别国家重点实验室 > 智能交互

	基于静音时长和文本特征融合的韵律边界自动标注
	傅睿博 1,2; 李雅 2; 温正棋 2; 陶建华 1,2,3
	2017-10
会议日期	2017-10
会议地点	江苏连云港
英文摘要	韵律边界标注对于语料库建设和语音合成有着至关重要的作用，而自动韵律标注可以克服人工标注中的不一致、耗时的缺点。仿照人工标注流程，本文运用循环神经网络分别对文本和音频两个通道训练子模型，对子模型的输出采用模型融合，从而获得最优标注。我们以词为单位提取了静音时长，与传统以帧为单位的声学特征相比更加具有明确的物理意义，与韵律边界的联系更加紧密。实验结果表明，本文所采用的静音时长特征相比于传统声学特征对自动韵律标注的性能有所提高，决策融合方法相比于直接特征层面融合更好地结合了声学和文本的特征，进一步提高了标注的性能。
会议录出版者	NCMMSC2017
语种	中文
内容类型	会议论文
源URL	[http://ir.ia.ac.cn/handle/173211/39599]
专题	模式识别国家重点实验室_智能交互
通讯作者	傅睿博
作者单位	1.中国科学院自动化研究所中国科学院脑科学与智能技术研究中心 2.中国科学院自动化研究所模式识别国家重点实验室 3.中国科学院大学人工智能技术学院
推荐引用方式 GB/T 7714	傅睿博,李雅,温正棋,等. 基于静音时长和文本特征融合的韵律边界自动标注[C]. 见:. 江苏连云港. 2017-10.

个性服务

查看访问统计

相关权益政策

暂无数据

收藏/分享

所有评论 (0)

[发表评论/异议/意见]

暂无评论

评论
权益异议
反馈意见

评注功能仅针对注册用户开放，请您登录

您对该条目有什么异议，请向管理员反馈。
内容：
Email：	*
单位:
验证码：	刷新

您在知识库使用过程中有什么好的想法或者建议可以反馈给我们。
标题：	*
内容：
Email：	*
验证码：	刷新

相关链接

CORC

联系我们