理解和掌握农田的时空特征对于准确的农田分割至关重要。传统的深度学习范式仅依赖于标注数据,在表示农田元素与周围环境之间的空间关系方面存在局限性。它难以有效建模农田的动态时空演变和空间异质性。语言作为一种结构化的知识载体,能够明确表达农田的时空特征,如其形状、分布以及周围环境信息。因此,基于语言驱动的学习范式可有效缓解农田时空异质性带来的挑战。然而,在农田遥感影像领域,目前尚缺乏支持该研究方向的综合性基准数据集。为填补这一空白,我们引入了基于语言的农田描述,并开发了FarmSeg-VL数据集——首个专为时空农田分割设计的细粒度图像-文本数据集。首先,本文提出了一种半自动标注方法,能够准确为每张图像分配标题,确保数据质量和语义丰富性,同时提高数据集构建的效率。其次,FarmSeg-VL 具有显著的时空特征。在时间维度上,它涵盖了四季。在空间维度上,它覆盖了中国八个典型的农业地区,总面积约为 4,300 平方公里。此外,在注释方面,FarmSeg-VL涵盖了农田丰富的时空特征,包括其固有属性、物候特征、空间分布、地形地貌特征以及周边环境的分布。最后,我们对基于FarmSeg-VL训练的视觉语言模型和仅依赖标签的深度学习模型进行了性能分析,证明其作为农田分割标准基准的潜力。
采集地点 | 中国 |
---|---|
数据量 | 9.3 GB |
数据格式 | *.png |
坐标系 |
数据来源于:https://zenodo.org/records/15099885
模型计算得到。
数据质量良好。
# | 类别 | 标题 | 作者 | 年份 |
---|---|---|---|---|
1 | A large-scale image-text dataset benchmark for farmland segmentation | C,Tao,D,Zhong,W,Mu,Z,Du,H,Wu | 2025 |