大连理工大学主页平台管理系统 Frank Chen 基于动态贝叶斯网络的音视频联合说话人跟踪 Home

Current position: Home >> Scientific Research >> Paper Publications

基于动态贝叶斯网络的音视频联合说话人跟踪

Release Time:2019-03-10 Hits:

Indexed by: Journal Article

Date of Publication: 2008-09-15

Journal: 自动化学报

Included Journals: CSCD、ISTIC、PKU、EI、Scopus

Volume: 34

Issue: 9

Page Number: 1083-1089

ISSN: 0254-4156

Key Words: 说话人跟踪;动态贝叶斯网络;粒子滤波;麦克风阵列

Abstract: 将多传感器信息融合技术用于说话人跟踪问题,提出了一种基于动态贝叶斯网络的音视频联合说话人跟踪方法.在动态贝叶斯网络中,该方法分别采用麦克风阵列声源定位、人脸肤色检测以及音视频互信息最大化三种感知方式获取与说话人位置相关的量测信息;然后采用粒子滤波对这些信息进行融合,通过贝叶斯推理实现说话人的有效跟踪;并运用信息熵理论对三种感知方式进行动态管理,以提高跟踪系统的整体性能.实验结果验证了奉文方法的有效性.

Prev One:麦克风阵列时延估计的Cramér-Rao界限

Next One:基于加权子空间拟合的声源定位与跟踪方法

Home

Scientific Research

Teaching Research

Awards and Honours

Enrollment Information

Student Information

My Album

Blog

基于动态贝叶斯网络的音视频联合说话人跟踪