陈杰,戴欣宜,周兴,孙庚,邓敏.2021.双LSTM驱动的高分遥感影像地物目标空间关系语义描述.遥感学报,25(5):1085-1094.[DOI:10.11834/jrs.20210340]
发布时间:2021-06-18
点击次数:
摘要:高分辨率遥感影像中的地物目标具有清晰的类别属性与空间关系语义。在人工智能技术支撑下,用计算机自动认知其空间关系具备了可行性。目前,遥感影像场景的语义理解主要依托图像描述任务(image caption),基于影像的全局特征生成描述语句。但是,这种粗粒度特征容易导致地物目标的类别属性在描述语句生成过程中被错误预测。事实上,以地物目标作为空间关系语义理解的基本单元,更符合人们认知地理空间的习惯。为得到更准确的描述语句,本文构建了基于地物目标的遥感影像语义理解数据集,并提出双LSTM驱动的地物目标空间关系语义理解方法。该方法用目标检测模型识别影像中的显著目标,将这些目标特征输入到语言模型,以缓解描述语句中类别被错误预测的问题。进而,为利用遥感影像场景信息,将影像全局特征与目标区域特征进行融合,并用双LSTM预测目标的注意力分布,提高描述语句生成质量。对比实验结果表明,该方法能生成更准确的图像描述。
论文类型:期刊论文
是否译文:否
收录刊物:EI
发布期刊链接:http://www.jors.cn/jrs/ch/reader/view_abstract.aspx?file_no=202105005&flag=1
上一条: Chen J, Zhou X, Zhang Y, et al. Message-Passing-Driven Triplet Representation for Geo-Object Relational Inference in HRSI[J]. IEEE Geoscience and Remote Sensing Letters, 2021.[DOI: 10.1109/LGRS.2020.3038569]
下一条: Chen J, Yuan Z, Peng J, et al. DASNet: Dual attentive fully convolutional siamese networks for change detection of high resolution satellite images[J]. IEEE Journal of Selected Topics in Applied Earth Observations and Remote Sensing, 2021, 14: 1194-1205.[DOI:10.1109/JSTARS.2020.3037893]