基于决策树分类的水稻干旱灾损评估
0 引言
湖北是水稻种植大省,也是我国重要的商品粮生产基地.针对农业干旱灾害监测,传统的监测与调查方式,存在耗时费力、效率低下等局限,而遥感监测技术具有宏观性、经济性、时效性等特征,很大程度上弥补了传统监测方法的不足[1].农业干旱遥感监测指数多种多样,不同指数对旱情描述也不一样,包括土壤水分变化类、冠层温度变化类、植被水分变化类和作物形态及绿度变化类[2].土壤水分变化类指数比较适宜于农业旱情预警及土壤干旱型农业旱情的监测,如垂直干旱指数MPDI可以较好地反映较高植被区表层土壤水分的变化[3],适宜于时序变化监测,对于不同类型的地表植被覆盖都可适用[4].冠层温度变化类指数不仅适宜于旱情预警,更适宜于旱情监测,其中温度植被干旱指数TVDI监测效果较好;其他较适宜于农业旱灾的预警以及灾后评估[2],如归一化植被指数NDVI、全球植被水分指数GVMI等.NDVI能够有效反映植被生长状况以及植被空间分布密度[5];TVDI利用植被冠层温度和植被指数的变化特征,构造出地表温度-植被指数的特征空间,耦合温度植被干旱指数,能够对不同下垫面实现长时序监测,已在农业旱情监测方面得到广泛应用[6-7].全球植被水分指数GVMI是基于遥感影像反演植被含水量的指数,因其在构建时,依据LOPEX93地面试验波谱数据,选择波长较长、不易受到大气噪声影响的NIR和SWIR波段,因此该指数具有普适性,能有效解决农作物混淆问题[8-10].
决策树作为一种基于空间挖掘的监督分类方法,是构建决策系统的强有力技术[11].当前很多学者已在遥感影像决策树分类方面做了探索性的研究,不仅用于土地利用和土地分类研究,在城市密度信息提取和林冠密度信息提取、农作物分类方面均有研究,分类精度在80%以上[12-13],然其对农作物干旱监测方面研究较少,还未充分发挥其应用价值.
鉴于此,本研究选取随县、曾都区为研究区,利用决策树分类法结合旱情监测指数对研究区水稻旱情进行提取和评估.预选NDVI、TVDI、GVMI、MPDI为旱情监测指标,通过相关性分析对4个指数进行对比,选定最佳旱情指数,以最佳指数提取各月份水稻旱情区;然后利用水稻生长周期日历结合各月份水稻旱情区数据,采用决策树方法计算得到研究区水稻旱情区空间分布,以混淆矩阵对旱情结果进行精度评估,相关结论可对农业旱情遥感监测与评估提供重要的理论参考.
1 研究区与数据源
1.1 研究区随县和曾都区是随州市的下辖县区,两地紧紧相连,地处鄂北,素有“荆豫要冲”、“汉襄咽喉”、“鄂北重镇”之称[14],总面积6 989 km2.境内处于中纬度季风环流区域,属于亚热带季风气候,气候温和,四季分明,光照充足,无霜期较长,严寒酷暑时间较短,为其农业发展奠定了良好的基础(图1).随县和曾都区居于桐柏山与大洪山之间,地貌多样,山地、丘陵、平原多种地形兼而有之,地势由南北渐向中部倾斜,局部有岗间小平原,属封闭性流域,百川出境,无一客水过往,是湖北省出名的“鄂北旱包子”地区,历史上十年九旱[15].
图1 研究区示意图
1.2 卫星数据及预处理地表温度(LST)数据是通过美国航空航天局(National Aeronautics and space administration,NASA)官方网站的Landsat8 OLI数据计算得到,用于计算TVDI.首先,利用ENVI5.3和软件对2019年7、8、9月Landsat8 OLI数据进行辐射定标、大气校正、波段组合、镶嵌、裁剪等操作和去噪处理;其次,基于Landsat8 OLI数据计算NDVI,并用滤波方法对受云影响而造成的缺失值进行插补[16],获得研究区的NDVI数据;最后,因“TIRS/Landsat8 OLI”有第10、11两个热红外波段,能像MODIS一样采用辐射传输模型反演LST.因此利用NDVI、DEM和LST的局域回归关系模型,对空间上缺失的LST值进行插补[17],得到LST的重建数据.DEM数据,是从地理空间数据云( GDEM 30 M),主要用于对研究区LST缺失区域进行重建.
Sentinel-2A数据,由欧洲航天局(
表1 指数计算方法干旱指数公式所用数据TVDITVDI=LST-LSTmina+b×NDVI-LSTminLandsat8OLINDVINDVI=RNIR-RredRNIR+RredSentinel-2AGVMIGVMI=(RNIR+0.1)-(RSWIR+0.02)(RNIR+0.1)+(RSWIR+0.02)Sentinel-2AMPDIRNIR=MRRed+1fv=(NDVI-NDVIsNDVIv-NDVIs()2MPDI=Rred+MRNIR-fv(Rv,red+MRv,NIR)(1-fv) M2+1Sentinel-2A
1.3 辅助数据水稻种植区数据,是由湖北省农业遥感应用中心武汉分中心遥感监测提供的基础数据,监测精度在95.0%以上,使用水稻种植区范围分别对各干旱指数结果进行掩膜计算;样本数据是在研究区内进行实地调查所采集的不同干旱程度水稻分布点集数据,采用高精度GPS记录经纬度信息.采样区域包括平原和丘陵岗地,根据调查路线,均匀采样,并采访当地居民确认样点相关信息,得到最终有效样本点数据90个,其中正常生长区样本30个,受灾区45个,未种植区15个(图2),将该数据按照2∶1比例分为训练样本和验证样本.