最新目录

土壤重金属数据异常识别方法以北京农田区样点(2)

来源:北京体育大学学报 【在线投稿】 栏目:期刊导读 时间:2021-07-08
作者:网站采编
关键词:
摘要:最终,基于相关性分析识别土壤重金属异常类型。针对不同重金属元素之间存在紧密的相关性,各重金属既作为检测指标,也作为其他数据的辅助指标。本

最终,基于相关性分析识别土壤重金属异常类型。针对不同重金属元素之间存在紧密的相关性,各重金属既作为检测指标,也作为其他数据的辅助指标。本研究以较强相关性的检测指标和辅助指标展开分析,针对两者的异常值分布判断点位存在的异常类型。

1.3.1K邻近距离的空间邻域确定方法 在异常值检测中,邻域范围标志着空间范围内样点数据的参与检测程度,这直接影响土壤重金属异常检测的结果,因此有必要确定一个合理稳定的邻域范围,从而保证异常值检测结果稳定有效。因此,本研究采用基于K临近距离的方法来确定稳定的空间邻域分布。该方法的基本原理如下:首先,K临近法设定每个点周围指定的K个临近点,根据K值的不同,生成不同大小的邻域值。通常由小到大选取K值,每个要素至少具有1个相邻要素,随着K值逐渐增大,临近要素过多会导致小尺度的空间信息减弱或丢失,此时探测稳定的邻域区间非常关键。其次,在每个重金属临近K值的探测过程中会利用局部莫兰指数产生异常值,这一过程一直持续,到产生稳定的空间邻域区间探测。最终,在生成的空间权重矩阵中,临近的K个点在矩阵中的结果为1/K。局部莫兰指数依次利用各个1/K值生成的权重矩阵对空间点分布重新定义,生成不同权重矩阵对应下的异常值分布情况。

1.3.2 空间自相关-局部莫兰指数 地理学第一定律为:任何事物都是与其他事物相关的,越相近的事物关联越紧密[16]。几乎所有空间数据都具有空间依赖性或空间自相关特征。空间自相关是空间数据中,空间单元与邻近单元之间针对同一属性值存在潜在的相互依赖的特性。空间自相关分析分为全局自相关和局部自相关分析。全局自相关度量了空间邻近的区域单元中单元属性值之间的相似程度。局部自相关进一步分析了观测值的高值或低值聚集、高低或低高异常值分布。局部莫兰指数表达式如下:

式中:I为局部空间自相关指数值;Xi是某一变量在空间单位i上的实测值;是变量的均值;S2为空间单元i属性观测值的标准化值;n是变量观测值总数,个;Wij是空间单元i与j之间的空间权重。

1.3.3 土壤重金属异常类型识别方法 不同元素含量之间的相关性分析可以反映各个元素的来源是否相同。因此,相关性分析可以识别土壤重金属来源[17-25]。在土壤重金属相关性分析中,各个重金属作为检测指标,根据土壤形成特点和土壤中重金属的来源情况,可以将植被类型、土壤类型、地貌类型等作为相关性分析中的辅助指标进行分析。若一组指标具有强相关性,说明检测数据受该辅助数据影响较大。当辅助数据的值较高时,检测数据极可能偏高;若辅助数据的值较低时,检测数据含量极可能偏低。若某一强相关性的辅助数据值较高,则其对该地块的重金属含量影响也较大,该重金属含量极可能偏高。

本研究将各重金属含量既作为检测指标,又作为其他重金属含量的辅助指标进行分析。选择具有强相关性的一组检测指标和辅助指标,如果检测指标数据的异常值检测结果与辅助指标数据的异常值检测结果相同,即均表现为高低型或者低高型,则表明该异常点位疑似真实异常类型;如果检测指标数据的异常值检测结果与辅助指标数据的异常值检测结果不同,即检测指标存在异常而辅助指标不存在异常,或者两者都存在异常但是异常点位或类型不一致,则说明该异常点位疑似数据错误异常。

2 结果与分析

2.1 数据特征分析

对各重金属指标之间进行初步的相关性分析,提取相关性较强的一组重金属指标来展开后续的异常识别和识别效果分析。如表1所示,铅(Pb)含量和铜(Cu)含量的相关性最强,因此本研究以Pb含量和Cu含量为例展开相关研究。

表1 土壤重金属含量相关性重金属相关系数Pb含量Cd含量Cu含量Cr含量Hg含量As含量Pb含量1.000Cd含量0.440??1.000Cu含量0.796??0.466??1.000Cr含量0.329??0.251?0.452??1.000Hg含量0.428????含量0.642????0.243?注:*、**分别表示在0.05、0.01水平上显著相关。

如表2所示,Pb含量与Cu含量的变异系数均为25%~75%,属于中等强度变异;且Pb和Cu含量经过对数转换后符合正态分布。

表2 Pb和Cu含量的特征分析指标PbCu最小值(mg/kg)最大值(mg/kg)均值(mg/kg)标准差(mg/kg)4.917.57变异系数(%)24.630.5正态性分布对数对数

2.2 异常识别结果分析

2.2.1 最佳邻域确定 本研究基于上述“K临近距离”的空间领域确定方法,计算和统计重金属Pb和Cu含量在不同K值时的高低(HL)和低高(LH)异常值对应的数量。根据图2-a可知,Pb含量在K值为2~5邻域范围内能识别出稳定的1个异常值,因此确定Pb含量的最佳邻域K值范围为2~5。根据2-b图可知,Cu含量在K值为2~8邻域范围内能比较稳定地识别出2个异常值,其中在2~6范围内能基本涵盖6~8区间识别出的异常点,因此确定Pb含量的最佳邻域K值范围为2~6。

文章来源:《北京体育大学学报》 网址: http://www.bjtydxxbzz.cn/qikandaodu/2021/0708/732.html



上一篇:北京市传统村落规划保护管理机制研究
下一篇:新时期奥运文化遗产在博物馆的保护与传承

北京体育大学学报投稿 | 北京体育大学学报编辑部| 北京体育大学学报版面费 | 北京体育大学学报论文发表 | 北京体育大学学报最新目录
Copyright © 2018 《北京体育大学学报》杂志社 版权所有
投稿电话: 投稿邮箱: