浅谈遥感图像最大似然分类方法的 EM改进算法

(整期优先)网络出版时间:2020-04-10
/ 2

浅谈遥感图像最大似然分类方法的 EM改进算法

 许光 

 宣城中达勘测设计有限公司  安徽省宣城市  242000

摘要:参数化密度分布模型作用下的最大似然方法以及EM算法常被应用到遥感图像分类中,由于受到遥感信息统计分布影响,要在改进EM算法的基础上科学运用遥感图像分类方法。因此,本文从不同角度入手探讨了遥感图像最大似然分类方法的EM改进算法,在优势作用发挥基础上进行合理化计算以及分类,提高遥感图像分类效率以及质量。

关键词:浅谈 遥感图像 最大似然分类方法 EM改进算法

和神经网络等非参数法,参数化密度分布模型作用下的最大似然分类方法更具优势,在遥感图像分类中起到关键性作用。与此同时,随机性、复杂化、离散等是遥感信息统计分布中呈现的主要特征[1],直接影响遥感图像分类的精准性,要在应用遥感图像最大似然分类方法过程中针对实际情况,对EM算法进行科学化改进,解决遥感图像分类问题,促使遥感图像分类更加精准,提高各类遥感图像的应用价值。

一、基于遥感图像最大似然分类方法的EM改进算法

MLC是参数化密度分布模型作用下最大似然方法的英文简称,经应用到遥感图像监督以及分类中,优势作用体现在多个层面,可以利用密度分布函数解释遥感图像的分类结果,在确定参数的基础上MLC计算简单化等,但遥感图像信息分布复杂、离散且不具有规律性,MLC在应用中存在一定的缺陷,会让分类之后的遥感图像不符合地区实际情况。在此过程中,EM算法就是在不完整的信息数据中找寻局部的极大似然估计,常被应用到估计混合密度模型参数中,包括提取空间特征、挖掘空间数据、融合多源数据等层面[2]。EM算法实际上就是迭代算法,在处理完整数据的基础上有效解决不完整数据应用中呈现的问题,合理改进EM算法的同时将EM-MLC这一方法巧妙应用到遥感图像分类中。在应用EM-MLC方法过程中,针对实地调查中获取的相关经验,结合土地利用图、目视解译方法,选取有着类别标号的遥感图像,在控制好图像数量的基础上形成对应的样本数据集,根据遥感图像中地物覆盖、分布的难易程度选取没有标号的样本数据,也可以随机选取,形成对应的补充样本数据集,设置不同密度分布作用下需要估计的参数,类别不同的均值向量、比例等都包括其中,通常借助有着标号的样本数据集,明确不同参数初始值。随后,在EM迭代运算的基础上估计类别不同的最大似然函数参数,获取类别不同的最大似然参数,在遥感图像中以逐点的方式读入未知的样本,利用BAYES准则以及判别公式,明确未知样本的属性,在纠正、完善的基础上确保遥感图像分类更加科学、规范。

二、基于遥感图像最大似然分类方法的EM改进算法实例探究

1、实验区域以及数据准确

以香港岛地区为例,地势陡峭且崎岖,丘陵以及山地特别多,由北向南地形逐渐降低,近海区域是呈带状的平地。该岛山坡上覆盖的植被较多,建筑物大都是观光建筑、私家住宅,包括多中地物,草地、森林、水体、道路等。应用到实验中的遥感资料属于Land-sat-TM数据,遥感图像的大小是400行X600列,遥感图像的空间分辨率是30米左右,大约覆盖220平方千米。与此同时,应用到实验中的波段不能单一,其中的蓝色波段是CH1,绿色波段是CH2,红色波段是CH3,近似红外波段是CH4,中红波段包括1.55到1.75um的CH5以及2.08到2.35um的CH7。

2、实例具体分析

在实地调查该实验区域基础上以土地利用图为切入点,合理划分该区域内的土地覆盖,海水体、陆地水体、城区、裸露地、城市绿地、林地、稀疏植被以及沙滩依次为C1、C2、C3、C4、C5、C6、C7、C8,建筑工地、填海地等都属于裸露地,草地或者灌木为稀疏植被,城市绿地就是指公园。在该区域遥感图像上面随机选取多个训练样本以及测试样本,分别为840个、400个。利用MLC这一最大似然方法,合理分类的同时进行规范化实验,测试样本的同时获取测试的整体精准度,即82.84%,在分析基于测试误差的矩阵基础上分类该实验区域的遥感图像,获取最大似然方法作用下有着鲜明普遍性特征的图像分类结果。相应地,下表是遥感图像分类中选取训练样本以及测试样本的具体情况。

类别代号

类别名称

训练样本的个数

测试样本的个数

C1

海水体

140

50

C2

陆地水体

61

50

C3

城区

132

50

C4

裸露区

107

50

C5

城市绿地

62

50

C6

林地

141

50

C7

稀疏植被

107

50

C8

沙滩

90

50

在没有标号的遥感图像样本数据集中应用EM-MLC方法,根据一定的行列距,在该区域遥感图像上采集对应的样本数据,也可以该区域各类地物的复杂性,针对性采集所需的样本数据,确保其呈现出普遍、均匀以及多样的特点,要以改进后的EM算法为基础,以遥感图像的最大似然分类方法为导向,控制好采集的样本数量,同步提高数据计算的速度以及遥感图像分布的准确性。在此过程中,选取总共选取没有标号的样本数据1000个,进行合理化EM迭代计算,分别获取该区域内不同土地覆盖的似然函数参数集,再根据BAYES最大似然辨别准则[3],合理划分该区域内土地覆盖类别。随后,借助一样的测试样本,进行针对性测试,遥感图像分类中的整体精准度达到87.99%,和应用EM-MLC方法之前相比,精准度明显提高,即5.15%,在把握测试的误差矩阵基础上合理分类关于该区域的遥感图像。在对比、分析中发现和一般MLC方法相比,EM-MLC方法作用下的该区域内各类土地覆盖和实际情况更加吻合。在区分城市以及水体方面,利用EM-MLC方法可以准确区分香港湾仔地区的港湾水体及其附近的城市,避免将其混为一谈,精准识别较小的水库,避免将其当作城市区域。在区分水体以及沙滩方面,利用EM-MLC方法合理划分该区域内的沙滩,准确把握水体、沙滩二者间的过渡带,防止混淆沙滩以及浅水滩。在区分裸露地以及沙滩方面,该区域内很多裸露地性质相似度较高,比如,天海区、沙滩,利用EM-MLC方法科学纠正该区域内土地覆盖划分。

三、结语

总而言之,基于遥感图像最大似然分类方法的EM改进算法在实际应用中有着重要的现实意义,在具体问题具体分析的基础上科学改进EM算法,灵活应用EM-MLC方法,优化遥感图像分类各环节的同时控制好偏差,提高分类结果的精度,促使分类之后的遥感图像更好地应用到地区建设发展中。

参考文献:

[1]张军,张敏,郝小可,解鹏.基于多尺度特征融合的中分辨率遥感场景分类算法[J].河北大学学报(自然科学版),2019,39(06):666-672.

[2]谢婉婷,谷伟.基于Bootstrap中位数—方差估计方法的改进EM算法的VaR度量及实证[J].现代商业,2018(24):164-165.

[3]夏绥丹.数字图像处理技术在遥感图像分类中的应用[J].中国新通信,2019,21(15):162-162.