基于全局交互的图像语义理解方法
库涛3,4; 熊艳彬1,3,4; 杨楠1,3,4; 林乐新3,4; 朱珠2
刊名控制与决策
2020
卷号35期号:9页码:2013-2111
关键词卷积神经网络 循环神经网络 图像语义理解 全局交互机制 数据正则化 门控循环单元GRU
ISSN号1001-0920
其他题名Image Semantic Understanding Method Based on Global Interaction
产权排序1
英文摘要

本文针对图像语义生成过程中图像信息易模糊的问题,研究了基于全局交互的图像语义理解方法。提出了基于双向门控循环单元(Gated Recurrent Unit,GRU)和图像信息全局交互相结合的图像语义生成模型,并在模型中提出了将图像和文本数据进行正则化处理以及采用文本向量映射表示文本信息的方法用于指导语义生成。实验结果表明,所提出的模型提高了图像语义描述的内容丰富度、准确性和逻辑性;将数据正则化处理、采用文本向量映射方式可以较大程度的解决数据稀疏和偏态问题;采用GUR单元可以进一步降低模型参数规模加快算法收敛速度,结合正则化及Dropout率可以有效抑制模型过拟合。

语种中文
CSCD记录号CSCD:6815694
资助机构国家重点研发计划(2017YFB0306401) ; 国家自然科学基金(61803367)
内容类型期刊论文
源URL[http://ir.sia.cn/handle/173321/25452]  
专题沈阳自动化研究所_数字工厂研究室
通讯作者库涛
作者单位1.中国科学院大学
2.辽宁大学
3.中国科学院沈阳自动化研究所
4.中国科学院机器人与智能制造创新研究院
推荐引用方式
GB/T 7714
库涛,熊艳彬,杨楠,等. 基于全局交互的图像语义理解方法[J]. 控制与决策,2020,35(9):2013-2111.
APA 库涛,熊艳彬,杨楠,林乐新,&朱珠.(2020).基于全局交互的图像语义理解方法.控制与决策,35(9),2013-2111.
MLA 库涛,et al."基于全局交互的图像语义理解方法".控制与决策 35.9(2020):2013-2111.
个性服务
查看访问统计
相关权益政策
暂无数据
收藏/分享
所有评论 (0)
暂无评论
 

除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。


©版权所有 ©2017 CSpace - Powered by CSpace