基于GF-7遥感卫星的冬小麦面积精细化识别

万丛 孙智虎 梁治华 张锦水

摘要 2019年11月3日发射的GF-7号卫星是我国的第二颗亚米级、多角度民用商业卫星,其在农作物面积分布精细化识别方面潜力有待评估。依据2018年国家统计局数据,全国冬小麦播种面积占粮食作物总播种面积的19.23%,通过遥感手段准确识别冬小麦分布情况,是作物长势和作物估产等后续遥感产品准确评估的保证,对确保粮食安全具有极其重要的意义。通过支撑向量机和随机森林2种机器学习算法,分析高分七号亚米级光谱特征及其纹理特征对冬小麦的精细化识别能力。结果表明,基于影像光谱特征,SVM分类器取得了最优的分类精度,其中冬小麦识别精度为93.96%,总体精度为91.01%,Kappa系数为0.763 2,面积精度为91.46%。

关键词 GF-7;遥感;冬小麦;随机森林;支撑向量机

中图分类号 S-127  文献标识码 A

文章编号 0517-6611(2021)12-0244-04

doi:10.3969/j.issn.0517-6611.2021.12.064

开放科学(资源服务)标识码(OSID):

Refined Identification of Winter Wheat Area Based on GF-7 Satellite Remote Sensing

WAN Cong1,SUN Zhi hu2,LIANG Zhi hua3  et al (1.Data Management Center,National Bureau of Statistics of the Peoples Republic of China,Beijing 100826;2.China University of Geosciences (Beijing),Beijing 100083;3.Institute of Remote Sensing Science and Engineering,Faculty of Geographical Science,Beijing Normal University,Beijing 100875)

Abstract GF 7 satellite launched on November 3,2019,is Chinas second sub meter multi angle commercial satellite. Its potential in fine identification of crop area distribution needs to be evaluated.According to the data of the National Bureau of Statistics in 2018,the sown area of winter wheat accounts for 19.23% of the total sown area of grain crops.Accurate identification of winter wheat distribution by remote sensing means is the guarantee for accurate evaluation of crop growth and crop yield estimation and other follow up remote sensing products,which is of great significance to ensure food security.In this research,support vector machine (SVM) and random forest machine learning algorithms were used to analyze the fine recognition ability of the spectral features and texture features of GF 7 images.The results showed that the SVM classifier achieves the optimal classification accuracy based on the spectral characteristics of the image.The recognition accuracy of winter wheat was 93.96%,the overall accuracy was 91.01%,the kappa coefficient was 0.763 2,and the area accuracy was 91.46%.

Key words GF 7;Remote sensing;Winter wheat;Random forest;SVM

近年來,国产高分辨率遥感卫星的相继发射,尤其是亚米级分辨率卫星,使得影像上可以观测到更为细致的地表覆盖结构。虽然中国农业种植结构在朝着规模化种植的趋势发展,但在广大农村小农经济下作物种植结构比重仍不可忽视,其农业生产具有超小规模化和农地细碎化等特征[1]。中、低分辨率遥感影像难以准确识别农作物种植破碎情况,新发射的GF-7亚米级卫星影像为精细化识别农地种植分布提供了可能。

由于遥感数据能反映真实的地物类型特点,越来越被广泛用于农业调查,尤其是第三次农业普查首次采用遥感数据应用于农作物面积普查中[2],通过遥感进行地物测量替代了大量的人工实地测量工作。相对于人工识别具有边界不准确、地物属性目视判断错误、地物属性填报错误等误差影响,遥感影像则反映了真实的地物情况,通过研究分析高分辨率遥感影像高精度的作物识别方法,可快速识别大范围的农作物精细化分布结果。

国产高分光学遥感卫星中,相对于GF-6号和GF-7号卫星,GF-1号和GF-2号由于发射较早,已被广泛应用于农作物分布识别。王利民等[3]利用GF-1 WFV时序数据构建决策树,提取顺义区冬小麦分布,冬小麦制图精度和用户精度分别为90%、74.4%。郭文茜等[4]使用GF-1 WFV数据,基于统计数据总量约束提取冬小麦分布。覃泽林等[5]基于GF-1 PMS时序影像,结合NDVI和纹理特征对大宗作物识别精度达到了 90.08%。王东等[6]通过光谱特征和颜色特征进行油菜的提取,基于GF-1 WFV数据的面积相对误差为-14.14%,基于GF-2 PMS数据的面积相对误差为-8.33%。作为新发射卫星,GF-7号卫星在遥感作物面积分布精细化识别方面的潜力有待评估,尤其是遥感识别与人工识别在作物面积上的差异有待分析,从而用于分析遥感识别替代人工识别的可行性。该研究基于GF-7 0.7 m分辨率融合影像及其与纹理特征的组合,分析2种机器学习算法随机森林(Random Forest,RF)和支撑向量机(Support Vector Machine,SVM)对冬小麦分类识别精度的差异,评估GF-7号遥感影像识别出的冬小麦面积与人工识别面积的差异。

1 研究区概述

1.1 研究区概况

景县位于河北省衡水市东部,属暖温带季风气候,地处粮食作物的主要生产基地黄淮海平原,紧邻山东省德州市。景县地势较为平缓,适宜农作物集中种植,其耕地面积约为834 km2,占县域面积的70.2%。

野外调查发现,景县种植农作物多样,其中粮食作物主要包括冬小麦和夏玉米,其种植类型为一年两熟轮作制,即夏玉米种植在冬小麦收获之后的耕地上。棉花、油菜和向日葵是景县主要种植的经济作物,此外还种植蔬菜辣椒。

景县冬小麦通常在10月份种植,12月中旬开始停止生长,次年3月下旬至4月上旬为返青期,4月下旬至5月上旬进入乳熟期,6月上旬收获。在冬小麦乳熟期,冬小麦生长最为旺盛,其近红外反射率处于冬小麦生长过程中的高值[7],是冬小麦遥感识别的最佳时间段。

1.2 影像介绍及预处理

GF-7号卫星是我国首颗民用亚米级高分辨率、1∶10 000比例尺立体测绘卫星。研究区获取的GF-7影像为4月27日,包括前视全色影像(0.66 m×0.65 m)、后视全色影像(0.73 m×0.82 m)和后视多光谱影像(2.63 m×2.61 m)。

GF-7卫星影像标准化预处理包括正射校正、几何精纠正、影像拼接与裁剪、影像融合和特征提取等步骤。影像正射校正使用影像自带的RPC校正,随后依据景县历史GF-1号2 m分辨率的参考影像图进行地理精校准,全色影像输出分辨率均为0.7 m×0.7 m,多光谱影像输出分辨率为2.6 m×2.6 m,地理坐标系设置为CGCS200,投影坐标系设置为Albers。影像融合使用envi软件的Gram-Schmidt Spectral Sharpening方法,可保真地物的光谱信息和地物的纹理特征[8]。为减少纹理特征的提取时间,通过主成分分析的正向主成分旋转获取了融合影像第一主成分波段,其第一主成分的信息量占影像全部信息的77.69%。该研究依据灰度共生矩阵[9],提取第一主成分8种纹理特征:均值(Mean)、对比度(contrast)、方差(variance)、差异性(dissimilarity)、信息熵(entropy)、相关性(correlation)、协同性(homogeneity)、二阶矩(second moment),提取窗口为3×3。

1.3 野外数据及数字化

2020年5月22日,使用北京师范大学开发的野外信息采集系统“AW拍”,进行了景县地面信息的采集,采集信息及分布情况如图1。

野外调查共采集131个地表覆盖点位信息,调查了小麦、林地、草地、裸地、油菜、大棚蔬菜、地膜蔬菜和向日葵等地物类型。林地、草地、建筑、裸地、水域等土地覆盖类型在遥感影像上特征较明显、易区分,可通过目视识别,因此仅采集了少许点位信息。由于调查时间迟于影像时间,实际在4月27日影像上,地膜蔬菜和向日葵等地物类型呈现类似裸地的光谱信息;油菜呈现高亮红色的光谱信息,易与冬小麦混淆;草地呈现淡红色的光谱信息,且伴有一定的纹理特征。

结合野外调查采集的冬小麦点位信息和GF-7号影像信息得出,冬小麦在景县广泛种植,但由于小农经济下冬小麦的种植存在种植结构形式的不统一,即冬小麦种植存在时间相对不一致和冬小麦的种植间距不一致情况。在图1的GF-7遥感影像中,冬小麦种植区域光谱总体呈现红色,其中长势好、种植密集的区域为亮红色,而长势较差、种植间隔较大的区域偏暗红色,此外不同品种的冬小麦在影像上也存在一定的光谱差异。

为获取大面积地表覆盖的真值分布情况用于精度评估,依据野外数据和高分融合影像,在研究区耕地范围内,进行了为期3 d的冬小麦专家目视解译工作,解译结果如图1所示。图中冬小麦的分布区域为黄色矢量多边形内,其他地物类型(主要为林地、草地、裸地、油菜)的分布區域为蓝色矢量多边形内。

2 研究方法

2.1 分类体系构建

样本库是进行遥感影像解译和作物识别生产的基础,结合景县冬小麦物候特征和野外调查数据,以GF-7融合数据为基础,根据遥感影像上的光谱特征、形状和纹理特征,构建分类体系。

在分类识别中,样本的选择是分类的关键,同一区域标记样本数量选取过少不足以代表地物覆盖的局部差异,识别范围内选取区域过少或区域分布不均衡不足以代表土地覆盖的区域差异。因此依据当地土地覆盖情况复杂程度,构建13 m×13 m的方格,全图均匀选取多个样本区域,影像分辨率为0.7 m,单个方格像元数量约345个像元。

在高分辨率影像识别中,样本选取过多会造成机器学习运行缓慢。由于本次冬小麦识别所选取的样本数量和区域较多,故随机抽取0.2倍初始训练数据作为训练集。共选取冬小麦10 225个、其他作物2 594个、林地4 093个、草地4 550个、水体2 450个、建筑6 112个、裸地2 758个等地物类型样本,用于分类训练。

2.2 机器学习方法

RF和SVM作为近年来主流分类器,被广泛应用于土地覆盖识别。RF基于Bagging集成学习原理[10],通过样本随机和变量随机构建多棵独立的Cart决策树,具有不宜过拟合、需设置参数较少等优点。SVM是基于核函数进行非线性变换(常用RBF核函数),将数据投影在高维空间,求解出能正确划分训练集的几何间隔最大的分离超平面[11]。

该研究分类算法基于python实现,针对仅用光谱特征和光谱特征+纹理特征2种特征集,RF参数树的数量(ntree)均设置为300,SVM则通过LIBSVM工具[12]得到优选参数C和Gamma,分别为 32 768,8.0 和32 768,0.5。2种分类器所需设置的其余参数保持默认。

2.3 精度评价方法

精度评估是依冬小麦的数字化结果为依据,对机器学习识别出的冬小麦分布结果构建误差矩阵,评价冬小麦的制图精度(production accuracy,Pr)和用户精度(user accuracy,Ur),通过F1-SCORE综合评估冬小麦识别精度。总体精度(Overall accuracy,Oa)、Kappa系数(分类一致性精度)被用于评估遥感识别的整体精度。

F1-SCORE=2×(Pr-Ur)/(Pr+Ur)(1)

此外,面积识别精度是定量表达GF-7号卫星影像识别出的冬小麦区域面积与人工解译的冬小麦面积的差异,见公式(2)、(3):

bias=(Srs-Sg)/Sg(2)

SA=(1-|bias|)×100%(3)

式中,Srs代表遥感识别出的区域冬小麦面积,Sg代表人工解译的冬小麦结果,bias代表遥感识别面积与人工识别面积的偏差,SA代表总体的遥感识别面积精度。

3 结果与分析

3.1 分类结果分析

使用机器学习算法,基于GF-7卫星影像的2020年景县冬小麦识别结果如图2所示,左侧大图为基于光谱数据的SVM识别结果,A为近红外、红、绿波段显示的融合影像,B为真值结果,C、D分别为RF、SVM分类结果,1、2分别为基于光谱特征和光谱特征+纹理特征进行分类。

目视整体分析显示,冬小麦种植分布在景县几乎整个东部耕地范围内,未见有明显的漏分。在研究区南部和中西部区域存在密集整片的休耕地,而在研究区东北部存在大量的破碎休耕地地块,这些休耕地地块均被正确识别。在冬小麦的精细化识别方面,通过GF-7遥感影像识别冬小麦分布,可以识别到地块内部的田垄信息、土包凸起信息以及地块间的乡间道路信息,并且能准确识别到小农经济下种植面积较小的冬小麦种植分布。

野外调查发现,研究区主要冬播农作物为冬小麦和油菜(油菜光谱特征显示如图2区域1中A);此外在研究区中东部区域存在小部分林地-冬小麦混种模式(光谱特征如图2区域2中A),这种混种模式使得其光谱特征与冬小麦相似,其纹理又与林地相似,为识别带来了一定困难。

在区域1中,C2识别结果将部分油菜错分为了冬小麦,而C1、D2没有明显误分。这可能是由于冬小麦与油菜纹理特征较相似,而随机森林在划分该地物类型时过多考虑了纹理特征所造成。4种分类器结果均正确识别了林地与冬小麦,说明从光谱特征就可明显区分林地与冬小麦。

在区域2中,4种分类器均难以准确识别林地-冬小麦混种模式。尽管在研究区仅存在少量这种混种模式,但该模式的错误划分,作为冬小麦分布识别误差来源之一,在作物精细化识别方面需被考虑。4种分类器均准确识别农田地块之间的乡村道路,而人工识别考虑到时效问题忽略划分宽度较小的乡村道路,显然在纯冬小麦种植区域,遥感识别的冬小麦分布比人工识别结果更为准确。

安徽农业科学2021年

3.2 分类精度分析

依据研究区数字化结果,评价分类器识别精度(表2)。从特征角度分析,无论是RF还是SVM分类器,加入纹理特征都没有带来明显的精度提升,在高分辨率影像上,地物之间的纹理特征可能有较大相似,通过纹理特征难以区分此时的冬小麦与其他地物。

从分类器角度分析,SVM与RF 2种分类器总体精度、冬小麦识别精度相差不大,虽然SVM分类器取得了更高的冬小麦识别精度和分类总体精度,但SVM分类相对随机森林分类更加费时,带来了一定的时间成本。2种分类器都取得了略低的Kappa系数,即人工识别结果与遥感识别结果仍然有较大差异。从人工识别分析,基于高分辨率影像的人工数字化识别,会忽略部分窄的道路,地物边界处也会存在少许误差,此外人工识别不可避免会存在一些属性误差。从遥感影像分析,遥感影像获取时期是冬小麦的关键生长期,此时冬小麦的作物光譜与林地较为相似,这为识别带来了一定的误差。此外,冬小麦种植时间、种植结构、种植品种间的较大差异也为冬小麦的精准识别带来一定的难度。

统计人工数字化识别的冬小麦面积为36 512 hm2,基于GF-7光谱数据的SVM分类器取得了最高的面积精度,其识别冬小麦面积为33 394 hm2,略少于人工识别面积,通过面积精度指标公式,计算得到冬小麦识别面积偏差bias等于-0.085 4,区域面积精度SA为91.46%。遥感识别与人工识别冬小麦面积仍然存在一定的偏差,这些偏差部分是由遥感识别误差所造成的,即错误地将冬小麦地块划分为其他,此外人工矢量化结果的不够精细也对面积偏差产生了一定影像。

4 结论与讨论

该研究利用GF-7号卫星通过集成学习的方法进行景县的冬小麦分布识别,基于GF-7光谱数据和SVM分类器取得了最高的分类精度,其中冬小麦识别精度为93.96%,总体精度为91.01%,Kappa系数为0.763 2,面积精度为91.46%。SVM分类结果统计显示,在研究区内冬小麦种植面积约占总耕地面积的71.14%。基于GF-7高分辨率卫星影像识别

的冬小麦结果具有高制图精度和用户精度,可保证其识别结果比中高分辨率更准确和可靠。

虽然通过遥感识别冬小麦分布比人工识别存在一定的模型误差,即训练数据、遥感影像获取时间、遥感影像获取质量、分类器的不同,以及影像中混合像元和阴影的存在会对冬小麦识别结果造成一定影响。而该研究构建了均匀足量的训练数据,选取近年来表现出色的强分类器RF和SVM,盡可能降低了模型误差。冬小麦分类结果目视分析显示,研究区冬小麦种植区域除林地-冬小麦混种类型外,其他均被准确识别。相对于人工识别忽略地块之间的乡村道路,地块内部的土包、田垄等地物类型均被遥感准确识别,从该角度分析,基于GF-7遥感识别的冬小麦分布结果在精细化程度上可能比人工识别结果更准确。

参考文献

[1]

钱文荣,郑黎义.劳动力外出务工对农户农业生产的影响——研究现状与展望[J].中国农村观察,2011(1):31-38.

[2] 高园园,孙畅,袁如金.地理国情普查成果在第三次农业普查中的应用研究[J].测绘与空间地理信息,2019,42(1):102-105.

[3] 王利民,刘佳,杨福刚,等.基于GF-1卫星遥感的冬小麦面积早期识别[J].农业工程学报,2015,31(11):194-201.

[4] 郭文茜,任建强,刘杏认,等.统计数据总量约束下全局优化阈值的冬小麦分布制图[J].遥感学报,2018,22(6):1023-1041.

[5] 覃泽林,谢国雪,李宇翔,等.多时相高分一号影像在丘陵地区大宗农作物提取中的应用[J].南方农业学报,2017,48(1):181-188.

[6] 王东,方圣辉,王政.基于光谱特征和颜色特征的油菜提取研究[J].农业机械学报,2018,49(3):158-165.

[7] 刘剑锋,贾玉秋,张喜旺.基于时间序列MODIS-NDVI的冬小麦遥感识别[J].湖北农业科学,2017,56(8):1560-1563.

[8] 李霖,佘梦媛,罗恒.ZY-3卫星全色与多光谱影像融合方法比较[J].农业工程学报,2014,30(16):157-165.

[9] HARALICK R M.Statistical and structural approaches to texture[J].Proceedings of the IEEE,1979,67(5):786-804.

[10] BREIMAN L.Random forests[J].Machine learning,2001,45(1):5-32.

[11] 王芳,杨武年,邓晓宇,等.高分二号数据的城市生态用地分类方法探讨[J].测绘科学,2018,43(3):71-76.

[12] CHANG C C,LIN C J.LIBSVM:A library for support vector machines(Article)[J].ACM transactions on intelligent systems and technology,2011,2(3):1-27.

猜你喜欢 分类器纹理光谱 制作有纹理的纸智慧少年·故事叮当(2020年8期)2020-08-20郭守敬望远镜获取光谱数破千万科学24小时(2019年6期)2019-09-05童梦小资CHIC!ELEGANCE(2018年33期)2018-11-08示差红外光谱在土壤有机质组成研究中的应用分析化学(2018年4期)2018-11-02TEXTURE ON TEXTURE质地上的纹理Coco薇(2017年8期)2017-08-03基于AdaBoost算法的在线连续极限学习机集成算法软件导刊(2017年4期)2017-06-20一种统计分类方法的学习高中生学习·高三版(2017年6期)2017-06-12浅析光谱技术在200 nm以上和以下尺度范围内的不同光学仪器(2016年6期)2017-04-24企业财务危机预警集成预测模型比较分析研究科学与财富(2016年15期)2016-11-24消除凹凸纹理有妙招!Coco薇(2015年5期)2016-03-29 相关热词搜索: 冬小麦 遥感 精细化