研究领域1:遥感数据视觉表征学习
“如何建立鲁棒的遥感数据表征模型”是实现高分辨率遥感影像智能精准解译的关键科学问题,其核心可归结为以下两个基本问题:1)遥感视觉表征的可分性问题;2)遥感视觉表征的不变性问题;
课题组自2015年开始瞄准这一关键科学问题开展研究工作,主要学术贡献包括:1)率先提出数据驱动的遥感空谱特征联合学习方法,推动了遥感视觉表征范式从人工构筑特征到数据驱动特征学习的转变;2) 创建了广义学习信号驱动的遥感视觉表征自学习框架,突破了现有方法特征学习质量标签依赖的瓶颈问题,使得利用海量遥感数据进行特征学习成为可能;3) 建立数据驱动和知识驱动的信息耦合机制,提出了遥感数据-先验知识协同表征方法,解决了干扰条件下仅用视觉特征难以完备表征的瓶颈问题。主要代表性成果包括:
1. 陶超,齐霁,李海峰,遥感影像自监督特征学习:理论、方法与应用, 科学出版社,2025
2. Chao Tao,Ji Qi, Mingning Guo, et,al, “Self-Supervised Remote Sensing Feature Learning: Learning Paradigms, Challenges, and Future Works”, IEEE Transactions on Geoscience and Remote Sensing, 61:1-26,2023【Paper】
3. 陶超,阴紫薇,李海峰*,朱庆,高分辨率遥感影像智能解译:从监督学习到自监督学习,测绘学报, 50(8): 1122-1134, 2021 【Paper】
4. Haifeng Li,Yi Li, Guo Zhang, Qing Zhu, Chao Tao*, Global and local contrastive self-supervised learning for semantic segmentation of HR remote sensing images, IEEE Transactions on Geoscience and Remote Sensing, 60(5618014) :1-14,2022 【Paper】【Code】
5. Chao Tao, Ji Qi , HaiFeng Li*,TOV: The Original Vision Model for Optical Remote Sensing Image Understanding via Self-Supervised Learning, IEEE Journal of Selected Topics in Applied Earth Observations and Remote Sensing,16:4916 – 4930,2023【Paper】【预训练基础模型与数据】
6. WeiPeng Lu, Chao Tao*, Ji Qi., et,al,“A unified deep learning framework for urban functional zone extraction based on multi-source heterogeneous data” , Remote Sensing of Environment, 2022, 270:112830 ,【Paper】 【Code】
7. Chao Tao, Hongbo Pan, Yangsheng Li, Zhengrong Zou, Unsupervised Spectral-Spatial Feature Learning with Stacked Sparse Autoencoder for Hyperspectral Imagery Classification, IEEE Geosciences and Remote Sensing Letter , 12(12):2348-2442,2015
研究领域2:以语言大模型为中枢的遥感智能解译
构建视觉模型以建立遥感影像数据与语义标签间的映射关系是当前遥感智能解译的核心范式。尽管这一范式在实践中被广泛应用,但这种范式具有先天理论不足:有限的类别的语义标签无法提供地物及其相互关系的深层次语义,也即遥感视觉模型学习到的关于世界的知识被限制在有限语义标注的范围内,导致遥感视觉模型无法超越有限语义标注,进而涌现出理解世界知识的能力。随着大语言模型崛起,上述问题有望被克服:因为大语言模型前所未有的编码了以语言为载体的人类知识,以大语言模型引导遥感视觉模型,可以大大拓展后者学习知识的范畴,进而涌现出理解世界知识的能力。主要代表性成果包括:
1、李海峰, 郭旺, 吴梦伟, 彭程里, 朱庆, 刘瑜, 陶超*. 视觉-语言联合的遥感地物概念表达与智能解译:原理、挑战与机遇. 测绘学报, 2025, 54(5): 853-872 【Paper】
2、Chao Tao, D. Zhong, W. Mu, Z. Du, and H. Wu. A large-scale image-text dataset benchmark for farmland segmentation. Earth System Science Data, 2025, 2025: 1-29.
3、H. Wu, Z. Du, D. Zhong, Y. Wang and Chao Tao*. FSVLM: A Vision-Language Model for Remote Sensing Farmland Segmentation. IEEE Transactions on Geoscience and Remote Sensing, 63:1-13, 2025.
4、H. Wu, W. Mu, D. Zhong, Z. Du, H. Li, Chao Tao*, FarmSeg_VLM: A farmland remote sensing image segmentation method considering vision-language alignment, ISPRS Journal of Photogrammetry and Remote Sensing, 225: 423-439, 2025.
5、Guo M, Wu M, Shen Y, Chao Tao*, IFShip: Interpretable fine-grained ship classification with domain knowledge-enhanced vision-language models. Pattern Recognition, 2025: 111672.