×
验证码:
换一张
忘记密码?
记住我
CORC
首页
科研机构
检索
知识图谱
申请加入
托管服务
登录
注册
在结果中检索
科研机构
自动化研究所 [21]
兰州理工大学 [5]
半导体研究所 [3]
深圳先进技术研究院 [2]
声学研究所 [2]
清华大学 [1]
更多...
内容类型
会议论文 [14]
学位论文 [12]
期刊论文 [8]
发表日期
2024 [1]
2023 [1]
2022 [1]
2021 [2]
2020 [2]
2019 [1]
更多...
学科主题
人工智能 [2]
×
知识图谱
CORC
开始提交
已提交作品
待认领作品
已认领作品
未提交全文
收藏管理
QQ客服
官方微博
反馈留言
浏览/检索结果:
共34条,第1-10条
帮助
已选(
0
)
清除
条数/页:
5
10
15
20
25
30
35
40
45
50
55
60
65
70
75
80
85
90
95
100
排序方式:
请选择
作者升序
作者降序
题名升序
题名降序
发表日期升序
发表日期降序
提交时间升序
提交时间降序
Multi-Cue Guided Semi-Supervised Learning Toward Target Speaker Separation in Real Environments
期刊论文
IEEE-ACM TRANSACTIONS ON AUDIO SPEECH AND LANGUAGE PROCESSING, 2024, 卷号: 32, 页码: 151-163
作者:
Xu, Jiaming
;
Cui, Jian
;
Hao, Yunzhe
;
Xu, Bo
收藏
  |  
浏览/下载:1/0
  |  
提交时间:2024/02/22
Cocktail party problem
target speaker separation
multi-cue guided separation
semi-supervised learning
Enhancing Dimensional Emotion Recognition from Speech through Modulation-Filtered Cochleagram and Parallel Attention Recurrent Network
期刊论文
ELECTRONICS, 2023, 卷号: 12, 期号: 22, 页码: 15
作者:
Peng, Zhichao
;
Zeng, Hua
;
Li, Yongwei
;
Du, Yegang
;
Dang, Jianwu
收藏
  |  
浏览/下载:0/0
  |  
提交时间:2024/02/22
modulation-filtered cochleagram
parallel attention recurrent neural network
dimensional emotion recognition
auditory signal processing
noise-robust
Train from scratch: Single-stage joint training of speech separation and recognition
期刊论文
COMPUTER SPEECH AND LANGUAGE, 2022, 卷号: 76, 页码: 15
作者:
Shi, Jing
;
Chang, Xuankai
;
Watanabe, Shinji
;
Xu, Bo
收藏
  |  
浏览/下载:33/0
  |  
提交时间:2022/07/25
Cocktail party problem
Speech separation
Multi-speaker speech recognition
End-to-end
Joint-training
Exploring wav2vec 2.0 on speaker verification and language identification
会议论文
线上会议, 2021-8-30
作者:
Fan ZY(范志赟)
;
Li M(李蒙)
;
Zhou SY(周世玉)
;
Xu B(徐波)
收藏
  |  
浏览/下载:23/0
  |  
提交时间:2022/09/17
self-supervised
speaker verification
language identification
multi-task learning
wav2vec 2.0
CTNet: Conversational Transformer Network for Emotion Recognition
期刊论文
IEEE-ACM TRANSACTIONS ON AUDIO SPEECH AND LANGUAGE PROCESSING, 2021, 期号: 29, 页码: 985-1000
作者:
Lian, Zheng
;
Liu, Bin
;
Tao, Jianhua
收藏
  |  
浏览/下载:33/0
  |  
提交时间:2021/05/06
Emotion recognition
Context modeling
Feature extraction
Fuses
Speech processing
Data models
Bidirectional control
Context-sensitive modeling
conversational transformer network (CTNet)
conversational emotion recognition
multimodal fusion
speaker-sensitive modeling
A Unified Framework for Low-Latency Speaker Extraction in Cocktail Party Environments
会议论文
Shanghai, China, October 25–29, 2020
作者:
Yunzhe Hao
;
Jiaming Xu
;
Jing Shi
;
Peng Zhang
;
Lei Qin
收藏
  |  
浏览/下载:2/0
  |  
提交时间:2022/06/23
Deep Neural Network-Based Generalized Sidelobe Canceller for Robust Multi-channel Speech Recognition
会议论文
shanghai, 2020-10
作者:
Li GJ(李冠君)
;
Liang S(梁山)
;
Nie S(聂帅)
;
Liu WJ(刘文举)
收藏
  |  
浏览/下载:6/0
  |  
提交时间:2021/06/23
Phoneme dependent speaker embedding and model factorization for multi-speaker speech synthesis and adaptation
会议论文
Brighton,UK, MAY 12-17,2019
作者:
Fu, Ruibo
;
Tao, Jianhua
;
Wen, Zhengqi
;
Zheng, Yibin
收藏
  |  
浏览/下载:7/0
  |  
提交时间:2020/06/24
speech synthesis
speaker adaptation
speaker embedding
phoneme representation
CHEAVD: a Chinese natural emotional audio-visual database
期刊论文
JOURNAL OF AMBIENT INTELLIGENCE AND HUMANIZED COMPUTING, 2017, 卷号: 8, 期号: 6, 页码: 913-924
作者:
Li, Ya
;
Tao, Jianhua
;
Chao, Linlin
;
Bao, Wei
;
Liu, Yazhu
收藏
  |  
浏览/下载:10/0
  |  
提交时间:2020/10/27
Audio-visual Database
Natural Emotion
Corpus Annotation
Lstm
Multimodal Emotion Recognition
结合发音知识的声学模型深度学习建模方法研究
学位论文
工学博士, 北京: 中国科学院研究生院, 2016
作者:
郑昊
收藏
  |  
浏览/下载:142/0
  |  
提交时间:2016/06/28
深度学习
语音识别
发音知识
统计量建模
递归神经网络
©版权所有 ©2017 CSpace - Powered by
CSpace