×
验证码:
换一张
忘记密码?
记住我
CORC
首页
科研机构
检索
知识图谱
申请加入
托管服务
登录
注册
在结果中检索
科研机构
自动化研究所 [126]
清华大学 [76]
北京大学 [66]
声学研究所 [65]
厦门大学 [55]
重庆大学 [30]
更多...
内容类型
期刊论文 [286]
会议论文 [187]
学位论文 [119]
其他 [35]
影音 [14]
会议 [3]
更多...
发表日期
2021 [11]
2019 [20]
2018 [21]
2017 [25]
2016 [42]
2015 [38]
更多...
学科主题
人工智能 [10]
心理语言学 [2]
计算机工程 [2]
Animal Sci... [1]
acoustic d... [1]
computer s... [1]
更多...
×
知识图谱
CORC
开始提交
已提交作品
待认领作品
已认领作品
未提交全文
收藏管理
QQ客服
官方微博
反馈留言
浏览/检索结果:
共647条,第1-10条
帮助
已选(
0
)
清除
条数/页:
5
10
15
20
25
30
35
40
45
50
55
60
65
70
75
80
85
90
95
100
排序方式:
请选择
作者升序
作者降序
题名升序
题名降序
发表日期升序
发表日期降序
提交时间升序
提交时间降序
Multi-Cue Guided Semi-Supervised Learning Toward Target Speaker Separation in Real Environments
期刊论文
IEEE-ACM TRANSACTIONS ON AUDIO SPEECH AND LANGUAGE PROCESSING, 2024, 卷号: 32, 页码: 151-163
作者:
Xu, Jiaming
;
Cui, Jian
;
Hao, Yunzhe
;
Xu, Bo
收藏
  |  
浏览/下载:1/0
  |  
提交时间:2024/02/22
Cocktail party problem
target speaker separation
multi-cue guided separation
semi-supervised learning
Enhancing Dimensional Emotion Recognition from Speech through Modulation-Filtered Cochleagram and Parallel Attention Recurrent Network
期刊论文
ELECTRONICS, 2023, 卷号: 12, 期号: 22, 页码: 15
作者:
Peng, Zhichao
;
Zeng, Hua
;
Li, Yongwei
;
Du, Yegang
;
Dang, Jianwu
收藏
  |  
浏览/下载:0/0
  |  
提交时间:2024/02/22
modulation-filtered cochleagram
parallel attention recurrent neural network
dimensional emotion recognition
auditory signal processing
noise-robust
GCNet: Graph Completion Network for Incomplete Multimodal Learning in Conversation
期刊论文
IEEE TRANSACTIONS ON PATTERN ANALYSIS AND MACHINE INTELLIGENCE, 2023, 卷号: 45, 期号: 7, 页码: 8419-8432
作者:
Lian, Zheng
;
Chen, Lan
;
Sun, Licai
;
Liu, Bin
;
Tao, Jianhua
收藏
  |  
浏览/下载:6/0
  |  
提交时间:2023/11/17
Oral communication
Correlation
Data models
Task analysis
Feature extraction
Tensors
Benchmark testing
Conversational data
graph complete network (GCNet)
incomplete multimodal learning
speaker-sensitive modeling
temporal-sensitive modeling
Train from scratch: Single-stage joint training of speech separation and recognition
期刊论文
COMPUTER SPEECH AND LANGUAGE, 2022, 卷号: 76, 页码: 15
作者:
Shi, Jing
;
Chang, Xuankai
;
Watanabe, Shinji
;
Xu, Bo
收藏
  |  
浏览/下载:33/0
  |  
提交时间:2022/07/25
Cocktail party problem
Speech separation
Multi-speaker speech recognition
End-to-end
Joint-training
Audio-driven Dubbing for User Generated Contents via Style-aware Semi-parametric Synthesis
期刊论文
IEEE Transactions on Circuits and Systems for Video Technology, 2022, 卷号: 33, 期号: 3, 页码: 1247 - 1261
作者:
Song LS(宋林森)
;
Wu WY(吴文岩)
;
Fu CY(傅朝友)
;
Loy, Chen Change
;
He R(赫然)
收藏
  |  
浏览/下载:6/0
  |  
提交时间:2023/06/29
Talking Face Generation
Video Generation
GAN
Thin-plate Spline
面向低功耗的语音增强与分离算法研究
学位论文
中国科学院自动化研究所: 中国科学院自动化研究所, 2022
作者:
黄雅婷
收藏
  |  
浏览/下载:16/0
  |  
提交时间:2022/09/14
语音增强与分离
脉冲神经网络
模型压缩
听觉感知恢复
感知线索辅助的语音分离技术研究
学位论文
中国科学院自动化研究所: 中国科学院自动化研究所, 2022
作者:
郝云喆
收藏
  |  
浏览/下载:17/0
  |  
提交时间:2022/06/23
鸡尾酒会问题
语音分离
声纹线索
起止线索
多感知线索
Compressing Speaker Extraction Model with Ultra-low Precision Quantization and Knowledge Distillation
期刊论文
Neural Networks, 2022, 卷号: 154, 页码: 13-21
作者:
Yating Huang
;
Yunzhe Hao
;
Jiaming Xu
;
Bo Xu
收藏
  |  
浏览/下载:26/0
  |  
提交时间:2022/09/17
CampNet: Context-Aware Mask Prediction for End-to-End Text-Based Speech Editing
期刊论文
IEEE-ACM TRANSACTIONS ON AUDIO SPEECH AND LANGUAGE PROCESSING, 2022, 卷号: 30, 页码: 2241-2254
作者:
Wang, Tao
;
Yi, Jiangyan
;
Fu, Ruibo
;
Tao, Jianhua
;
Wen, Zhengqi
收藏
  |  
浏览/下载:35/0
  |  
提交时间:2022/09/19
Speech processing
Decoding
Predictive models
Acoustics
Transfer learning
Training
Task analysis
Coarse-to-fine decoding
mask prediction
one-shot learning
text-based speech editing
text-to-speech
Sequence-level Speaker Change Detection with Difference-based Continuous Integrate-and-fire
期刊论文
Signal Processing Letters, 2022, 页码: 1551-1554
作者:
Fan ZY(范志赟)
;
Dong LH(董林昊)
;
Cai M(蔡猛)
;
Ma ZJ(马泽君)
;
Xu B(徐波)
收藏
  |  
浏览/下载:34/0
  |  
提交时间:2022/09/17
©版权所有 ©2017 CSpace - Powered by
CSpace