欢迎访问ror体育中国历史网!

空间数据挖掘认识及其思考【ror体育官网】

时间:2021-10-31 10:31作者:ror体育

本文摘要:概要:在这个大数据时代,空间数据正在从各个领域飞速总计。空间数据挖掘作为数据挖掘的一部分,现沦为人们研究空间数据的重点学科。主要讲解了空间数据挖掘的基本概念、一般步骤及其近期的挖出方法,传达了对当前空间数据挖掘的观点。 最后对未来空间数据挖掘的研究方向展开了更为了解的探究。 0章节 空间数据挖掘(SpatialDataMining,SDM)即找到开始并不知道但是却隐蔽在空间数据中潜在的、有价值的规则的过程。

ror体育官网

概要:在这个大数据时代,空间数据正在从各个领域飞速总计。空间数据挖掘作为数据挖掘的一部分,现沦为人们研究空间数据的重点学科。主要讲解了空间数据挖掘的基本概念、一般步骤及其近期的挖出方法,传达了对当前空间数据挖掘的观点。

最后对未来空间数据挖掘的研究方向展开了更为了解的探究。  0章节  空间数据挖掘(SpatialDataMining,SDM)即找到开始并不知道但是却隐蔽在空间数据中潜在的、有价值的规则的过程。

具体来说,空间数据挖掘就是在海量空间数据集中于,融合确认集、模糊集、仿生学等理论,利用人工智能、模式识别等科学技术,萃取出有令人坚信的、潜在简单的科学知识,找到空间数据集背后隐蔽的规律、联系,为空间决策获取理论技术上的依据[1]。  1空间数据挖掘的一般步骤  空间数据挖掘系统大体可以分成以下步骤:  (1)空间数据打算:自由选择适合的多种数据来源,还包括地图数据、影像数据、地形数据、属性数据等。  (2)空间数据预处理和特征提取:数据预处理目的是除去数据中的噪声,还包括对数据的清除、数据的切换、数据的构建等。特征提取是去除掉校验或不相关的特征并将特征转化成为合适数据挖掘的新特征。

  (3)空间数据挖掘和科学知识评估:使用空间数据挖掘技术对空间数据展开分析处置和预测,从而找到数据背后的某种联系。然后融合明确的领域科学知识展开评估,看否超过预期效果。  2空间数据挖掘的方法研究  空间数据挖掘是一门综合型的交叉学科,融合了计算机科学、统计学、地理学等领域的很多特性,产生了大量处置空间数据的挖出方法。  2.1空间关联规则  关联规则挖出是找寻数据项之间的联系,表达式形式是XY,其中X与Y是两种不共线的数据项集,即XY=?覫。

KOPERSKIK等人将关联规则与空间数据库结合,明确提出了空间关联规则挖出[2]。空间关联规则将数据项更换为了空间谓词,一般表达形式如下:  A1A2AnB1B2Bm(3)  令A=(A1,A2,,An),B=(B1,B2,,Bm),A和B分别回应Ai和Bj的谓词子集,A和B可以是空间谓词或非空间谓词,但是必需最少包括一个空间谓词且AB=?覫。SHEKHARS和HUANGY针对空间关联规则的特点明确提出了把关联规则的思想一般化成空间索引点集的空间同位规则的概念,在不违反空间相关性的同时用邻域更换丢弃了事务[3]。

时空关联不仅牵涉到事件在空间中的关联,还考虑到了空间方位和时间序列因素。国内的柴思跃、苏奋振和周成虎明确提出了基于周期表的时空关联规则挖出方法[4]。

ror体育

  2.2空间聚类  空间聚类分析是普通聚类分析的拓展,无法几乎按照处置普通数据的聚类分析方法来处置空间数据。由于不存在地理学第一定律,即空间对象之间都不存在一定的相关性,因此在空间聚类分析中,对于簇内的定义,要考虑到空间自涉及这一因素。通过对空间数据展开自涉及分析,可辨别对象之间否不存在空间相关性,从而可合理辨别出有对象否可以分成一簇。

  基本的聚类挖出算法有:  (1)区分聚类算法:不存在n个数据对象,对于等价k个分组(kn),将n个对象通过基于一定目标区分规则,不时递归、优化,直到将这n个对象分配到k个分组中,使得每组内部对象相近度小于组之间相近度。  (2)层次聚类算法:通过将数据不时地合并与重组,最后把数据改以一棵合乎一定标准的具备层次结构的聚类树。  (3)密度聚类算法:用低密度的区域对数据对象展开拆分,最后将数据对象聚类沦为若干高密度的区域。

  (4)图聚类算法:用空间结点回应每个数据对象,然后基于一定标准构成若干子图,最后把所有子图聚类成一个包括所有空间对象的整图,子图则代表一个个空间簇。  (5)网格聚类算法:把空间区域分割成具备多重分辨率的和有网格结构特性的若干网格单元,在网格单元上对数据展开聚类。  (6)模型聚类算法:利用一定的数学模型,用于最佳数值数据的数学模型来对数据展开聚类,每一个簇用一个概率分布回应。

  仅有使用一种算法一般来说无法超过令人满意的预期结果,王家耀、张雪萍、周海燕将遗传算法与K-均值算法融合明确提出了用作空间聚类分析的遗传K-均值算法[5]。现实空间环境中,不存在很多像道路、桥梁、河流的障碍物,张雪萍、杨腾飞等人把K-Medoids算法与量子粒子群算法融合展开具有空间障碍约束的聚类分析[6]。

  2.3空间分类  分类,非常简单地说道是通过自学获得一定的分类模型,然后把数据对象按照分类模型区分至预先等价类的过程。空间分类时,不仅考虑到数据对象的非空间属性,还要考虑到附近对象的非空间属性对其类别的影响,是一种监督式的分析方法。


本文关键词:空间,ror体育官网,数据挖掘,认识,及其,思考,【,ror,体育

本文来源:ror体育-www.gkcy005.com