重庆分公司,新征程启航
为企业提供网站建设、域名注册、服务器等服务
引言
专注于为中小企业提供网站制作、成都做网站服务,电脑端+手机端+微信端的三站合一,更高效的管理,为中小企业宿迁免费做网站提供优质的服务。我们立足成都,凝聚了一批互联网行业人才,有力地推动了成百上千家企业的稳健成长,帮助中小企业通过网站建设实现规模扩充和转变。
地理信息系统(Geographic Information System,简称GIS)是计算机科学、地理学、测量学、地图学等多门学科综合的技术[1]。GIS的基本技术是空间数据库、地图可视化及空间分析,而空间数据库是GIS的关键。空间数据挖掘技术作为当前数据库技术最活跃的分支与知识获取手段,在GIS中的应用推动着GIS朝智能化和集成化的方向发展。
1 空间数据库与空间数据挖掘技术的特点
随着数据库技术的不断发展和数据库管理系统的广泛应用,数据库中存储的数据量也在急剧增大,在这些海量数据的背后隐藏了很多具有决策意义的信息。但是,现今数据库的大多数应用仍然停留在查询、检索阶段,数据库中隐藏的丰富的知识远远没有得到充分的发掘和利用,数据库中数据的急剧增长和人们对数据库处理和理解的困难形成了强烈的反差,导致“人们被数据淹没,但却饥饿于知识”的现象。
空间数据库(数据仓库)中的空间数据除了其显式信息外,还具有丰富的隐含信息,如数字高程模型〔DEM或TIN〕,除了载荷高程信息外,还隐含了地质岩性与构造方面的信息;植物的种类是显式信息,但其中还隐含了气候的水平地带性和垂直地带性的信息,等等。这些隐含的信息只有通过数据挖掘才能显示出来。空间数据挖掘(Spatial Data Mining,简称SDM),或者称为从空间数据库中发现知识,是为了解决空间数据海量特性而扩展的一个新的数据挖掘的研究分支,是指从空间数据库中提取隐含的、用户感兴趣的空间或非空间的模式和普遍特征的过程[2]。由于SDM的对象主要是空间数据库,而空间数据库中不仅存储了空间事物或对象的几何数据、属性数据,而且存储了空间事物或对象之间的图形空间关系,因此其处理方法有别于一般的数据挖掘方法。SDM与传统的地学数据分析方法的本质区别在于SDM是在没有明确假设的前提下去挖掘信息、发现知识,挖掘出的知识应具有事先未知、有效和可实用3个特征。
空间数据挖掘技术需要综合数据挖掘技术与空间数据库技术,它可用于对空间数据的理解,对空间关系和空间与非空间关系的发现、空间知识库的构造以及空间数据库的重组和查询的优化等。
2 空间数据挖掘技术的主要方法及特点
常用的空间数据挖掘技术包括:序列分析、分类分析、预测、聚类分析、关联规则分析、时间序列分析、粗集方法及云理论等。本文从挖掘任务和挖掘方法的角度,着重介绍了分类分析、聚类分析和关联规则分析三种常用的重要的方法。
2.1、分类分析
分类在数据挖掘中是一项非常重要的任务,目前在商业上应用最多。分类的目的是学会一个分类函数或分类模型(也常常称作分类器),该模型能把数据库中的数据项映射到给定类别中的某一个。分类和我们熟知的回归方法都可用于预测,两者的目的都是从历史数据纪录中自动推导出对给定数据的推广描述,从而能对未来数据进行预测。和回归方法不同的是,分类的输出是离散的类别值,而回归的输出则是连续的数值。二者常表现为一棵决策树,根据数据值从树根开始搜索,沿着数据满足的分支往上走,走到树叶就能确定类别。空间分类的规则实质是对给定数据对象集的抽象和概括,可用宏元组表示。
要构造分类器,需要有一个训练样本数据集作为输入。训练集由一组数据库记录或元组构成,每个元组是一个由特征(又称属性)值组成的特征向量,此外,训练样本还有一个类别标记。一个具体样本的形式可为:( v1, v2, ..., vn; c );其中vi表示字段值,c表示类别。
分类器的构造方法有统计方法、机器学习方法、神经网络方法等等。统计方法包括贝叶斯法和非参数法(近邻学习或基于事例的学习),对应的知识表示是判别函数和原型事例。机器学习方法包括决策树法和规则归纳法,前者对应的表示为决策树或判别树,后者则一般为产生式规则。神经网络方法主要是反向传播(Back-Propagation,简称BP)算法,它的模型表示是前向反馈神经网络模型(由代表神经元的节点和代表联接权值的边组成的一种体系结构),BP算法本质上是一种非线性判别函数[3]。另外,最近又兴起了一种新的方法:粗糙集(rough set),其知识表示是产生式规则。
不同的分类器有不同的特点。有三种分类器评价或比较尺度:1) 预测准确度;2) 计算复杂度;3) 模型描述的简洁度。预测准确度是用得最多的一种比较尺度,特别是对于预测型分类任务,目前公认的方法是10番分层交叉验证法。计算复杂度依赖于具体的实现细节和硬件环境,在数据挖掘中,由于操作对象是海量的数据库,因此空间和时间的复杂度问题将是非常重要的一个环节。对于描述型的分类任务,模型描述越简洁越受欢迎。例如,采用规则归纳法表示的分类器构造法就很有用,而神经网络方法产生的结果就难以理解。
另外要注意的是,分类的效果一般和数据的特点有关。有的数据噪声大,有的有缺值, 有的分布稀疏,有的字段或属性间相关性强,有的属性是离散的而有的是连续值或混合式的。目前普遍认为不存在某种方法能适合于各种特点的数据。
分类技术在实际应用非常重要,比如:可以根据房屋的地理位置决定房屋的档次等。
2. 2 聚类分析
聚类是指根据“物以类聚”的原理,将本身没有类别的样本聚集成不同的组,并且对每一个这样的组进行描述的过程。它的目的是使得属于同一个组的样本之间应该彼此相似,而不同组的样本应足够不相似。与分类分析不同,进行聚类前并不知道将要划分成几个组和什么样的组,也不知道根据哪些空间区分规则来定义组。其目的旨在发现空间实体的属性间的函数关系,挖掘的知识用以属性名为变量的数学方程来表示。聚类方法包括统计方法、机器学习方法、神经网络方法和面向数据库的方法。基于聚类分析方法的空间数据挖掘算法包括均值近似算法[4]、CLARANS、BIRCH、DBSCAN等算法。目前,对空间数据聚类分析方法的研究是一个热点。
对于空间数据,利用聚类分析方法,可以根据地理位置以及障碍物的存在情况自动地进行区域划分。例如,根据分布在不同地理位置的ATM机的情况将居民进行区域划分,根据这一信息,可以有效地进行ATM机的设置规划,避免浪费,同时也避免失掉每一个商机。
2.3 关联规则分析
关联规则分析主要用于发现不同事件之间的关联性,即一事物发生时,另一事物也经常发生。关联分析的重点在于快速发现那些有实用价值的关联发生的事件。其主要依据是:事件发生的概率和条件概率应该符合一定的统计意义。空间关联规则的形式是X->Y[S%,C%],其中X、Y是空间或非空间谓词的集合,S%表示规则的支持度,C%表示规则的置信度。空间谓词的形式有3种:表示拓扑结构的谓词、表示空间方向的谓词和表示距离的谓词[5]。各种各样的空间谓词可以构成空间关联规则。如,距离信息(如Close_to(临近)、Far_away(远离))、拓扑关系(Intersect(交)、Overlap(重叠)、Disjoin(分离))和空间方位(如Right_of(右边)、West_of(西边))。实际上大多数算法都是利用空间数据的关联特性改进其分类算法,使得它适合于挖掘空间数据中的相关性,从而可以根据一个空间实体而确定另一个空间实体的地理位置,有利于进行空间位置查询和重建空间实体等。大致算法可描述如下:(1)根据查询要求查找相关的空间数据;(2)利用临近等原则描述空间属性和特定属性;(3)根据最小支持度原则过滤不重要的数据;(4)运用其它手段对数据进一步提纯(如OVERLAY);(5)生成关联规则。
关联规则通常可分为两种:布尔型的关联规则和多值关联规则。多值关联规则比较复杂,一种自然的想法是将它转换为布尔型关联规则,由于空间关联规则的挖掘需要在大量的空间对象中计算多种空间关系,因此其代价是很高的。—种逐步求精的挖掘优化方法可用于空间关联的分析,该方法首先用一种快速的算法粗略地对一个较大的数据集进行一次挖掘,然后在裁减过的数据集上用代价较高的算法进一步改进挖掘的质量。因为其代价非常高,所以空间的关联方法需要进一步的优化。
对于空间数据,利用关联规则分析,可以发现地理位置的关联性。例如,85%的靠近高速公路的大城镇与水相邻,或者发现通常与高尔夫球场相邻的对象是停车场等。
3 空间数据挖掘技术的研究方向
3.1 处理不同类型的数据
绝大多数数据库是关系型的,因此在关系数据库上有效地执行数据挖掘是至关重要的。但是在不同应用领域中存在各种数据和数据库,而且经常包含复杂的数据类型,例如结构数据、复杂对象、事务数据、历史数据等。由于数据类型的多样性和不同的数据挖掘目标,一个数据挖掘系统不可能处理各种数据。因此针对特定的数据类型,需要建立特定的数据挖掘系统。
3.2 数据挖掘算法的有效性和可测性
海量数据库通常有上百个属性和表及数百万个元组。GB数量级数据库已不鲜见,TB数量级数据库已经出现,高维大型数据库不仅增大了搜索空间,也增加了发现错误模式的可能性。因此必须利用领域知识降低维数,除去无关数据,从而提高算法效率。从一个大型空间数据库中抽取知识的算法必须高效、可测量,即数据挖掘算法的运行时间必须可预测,且可接受,指数和多项式复杂性的算法不具有实用价值。但当算法用有限数据为特定模型寻找适当参数时,有时也会导致物超所值,降低效率。
3.3 交互性用户界面
数据挖掘的结果应准确地描述数据挖掘的要求,并易于表达。从不同的角度考察发现的知识,并以不同形式表示,用高层次语言和图形界面表示数据挖掘要求和结果。目前许多知识发现系统和工具缺乏与用户的交互,难以有效利用领域知识。对此可以利用贝叶斯方法和演译数据库本身的演译能力发现知识。
3.4 在多抽象层上交互式挖掘知识
很难预测从数据库中会挖掘出什么样的知识,因此一个高层次的数据挖掘查询应作为进一步探询的线索。交互式挖掘使用户能交互地定义一个数据挖掘要求,深化数据挖掘过程,从不同角度灵活看待多抽象层上的数据挖掘结果。
3.5 从不同数据源挖掘信息
局域网、广域网以及Internet网将多个数据源联成一个大型分布、异构的数据库,从包含不同语义的格式化和非格式化数据中挖掘知识是对数据挖掘的一个挑战。数据挖掘可揭示大型异构数据库中存在的普通查询不能发现的知识。数据库的巨大规模、广泛分布及数据挖掘方法的计算复杂性,要求建立并行分布的数据挖掘。
3.6 私有性和安全性
数据挖掘能从不同角度、不同抽象层上看待数据,这将影响到数据挖掘的私有性和安全性。通过研究数据挖掘导致的数据非法侵入,可改进数据库安全方法,以避免信息泄漏。
3.7 和其它系统的集成
方法、功能单一的发现系统的适用范围必然受到一定的限制。要想在更广泛的领域发现知识,空间数据挖掘系统就应该是数据库、知识库、专家系统、决策支持系统、可视化工具、网络等技术的集成。
4 有待研究的问题
我们虽然在空间数据挖掘技术的研究和应用中取得了很大的成绩,但在一些理论及应用方面仍存在急需解决的问题。
4.1 数据访问的效率和可伸缩性
空间数据的复杂性和数据的大量性,TB数量级的数据库的出现,必然增大发现算法的搜索空间,增加了搜索的盲目性。如何有效的去除与任务无关的数据,降低问题的维数,设计出更加高效的挖掘算法对空间数据挖掘提出了巨大的挑战。
4.2 对当前一些GIS软件缺乏时间属性和静态存储的改进
由于数据挖掘的应用在很大的程度上涉及到时序关系,因此静态的数据存储严重妨碍了数据挖掘的应用。基于图层的计算模式、不同尺度空间数据之间的完全割裂也对空间数据挖掘设置了重重障碍。空间实体与属性数据之间的联系仅仅依赖于标识码,这种一维的连接方式无疑将丢失大量的连接信息,不能有效的表示多维和隐含的内在连接关系,这些都增加了数据挖掘计算的复杂度,极大地增加了数据准备阶段的工作量和人工干预的程度。
4.3 发现模式的精炼
当发现空间很大时会获得大量的结果,尽管有些是无关或没有意义的模式,这时可利用领域的知识进一步精炼发现的模式,从而得到有意义的知识。
在空间数据挖掘技术方面,重要的研究和应用的方向还包括:网络环境上的数据挖掘、栅格矢量一体化的挖掘、不确定性情况下的数据挖掘、分布式环境下的数据挖掘、数据挖掘查询语言和新的高效的挖掘算法等。
5 小结
随着GIS与数据挖掘及相关领域科学研究的不断发展,空间数据挖掘技术在广度和深度上的不断深入,在不久的将来,一个集成了挖掘技术的GIS、GPS、RS集成系统必将朝着智能化、网络化、全球化与大众化的方向发展。
我是个菜鸟GISer,个人感觉:
1、云计算;
2、LBS(持续了很多年了,但是潜力仍然很大);
3、大数据量的三维仿真。
地理信息系统是计算机科学、地理学、测量学和地图学等多门学科的交叉,它是以地理空间数据库为基础,采用地理模型分析方法实时提供多种空间的和动态的地理信息,为地理研究和地理决策服务的计算机技术系统。
从表现形式来看,GIS表现为计算机软硬件系统,其核心是管理、计算、分析地理坐标位置信息及相关位置上属性信息的数据库系统。它表达的是空间位置及所有与位置相关的信息,所以,GIS又是地球空间实体的再现和综合,其信息的基本表达形式是各种二维或三维电子地图。因此,GIS也可简单定义为“用于采集、模拟、处理、检索、分析和表达地理空间数据的计算机信息系统”。
(一)GIS发展简史
GIS最早起源于20世纪60年代“要把地图变成数字形式的地图,便于计算机处理分析”这样的目的。1963年,加拿大测量学家R.F.Tomlinson首先提出了GIS这一术语,并建成世界上第一个GIS(加拿大地理信息系统,CGIS),用于自然资源的管理和规划。那时的GIS注重于空间数据的地学处理。
20世纪70年代以后,随着计算机软、硬件水平的提高,以及政府部门在自然资源管理、规划和环境保护等方面对空间信息进行分析、处理的需求,GIS得到了巩固和发展。
进入20世纪80年代,GIS的应用领域迅速扩大,商业化的软件开始进入市场,其应用从基础信息管理与规划转向空间决策支持分析,地理信息产业的雏形开始形成。
20世纪90年代以后,伴随着计算机技术和网络技术的迅猛发展,GIS的应用也日趋深化和广泛,在国土资源、农业、气象、环境、城市规划等领域成为常备的工作系统。尤其是1998年“数字地球”的概念被提出以后,GIS在全球得到了空前迅速的发展,广泛应用于各个领域,产生了巨大的经济和社会效益。
我国GIS的发展自20世纪80年代初开始,以1980年中国科学院遥感应用研究所成立全国第一个GIS研究室为标志,经历了准备(1980~1985年)、发展(1985~1995年)、产业化(1996年以后)3个阶段。尤其是近年来,国内出现了不少优秀的GIS软件。
(二)GIS的最新发展
1.日趋与计算机信息技术融合
近年来随着计算机软、硬件技术和通信技术的高速发展,GIS技术也得到了迅速的发展和更广泛的应用,并日趋与主流IT技术融合,成为信息技术发展的一个新方向。
GIS发展的动力一方面来自于日益广泛的应用领域对GIS不断提高的要求;另一方面,计算机科学的飞速发展为GIS提供了先进的工具和手段。许多计算机领域的新技术,如面向对象技术、三维技术、图像处理和人工智能技术都可以直接应用到GIS中;同时,由于空间技术的迅猛发展,特别是遥感技术的发展,提供了地球空间环境中不同时相的数据,使GIS的作用日渐突出,GIS不断升级并能提供存储、处理和分析海量地理数据的环境。
组件式GIS技术的发展使之可以与其他计算机信息系统无缝集成、跨语言使用,并提供了无限扩展的数据可视化表达形式。
2.动态、多源、多维、网络化
最新GIS技术将逐渐摆脱先前的主要处理静态的、二维的、数字式的地图技术的约束,而从传统的静态地图、电子地图发展到能对空间信息进行可视化和动态分析、动态模拟,支持动态的、可视化的、交互的环境来处理、分析、显示多维和多源地理空间数据。其中,可视化仿真技术能使人们在三维图形世界中直接对具有形态的信息进行实时交互操作;虚拟现实技术以三维图形为主,结合网络、多媒体、立体视觉、新型传感技术,能创造一个让人身临其境的虚拟的数字地球或数字城市。
先进的对地观测技术、互操作技术、海量数据存储和压缩技术、网络技术、分布式技术、面向对象技术、空间数据仓库、数据挖掘等技术的发展都为GIS的发展和创新创造了新的手段。
(三)第四代GIS技术
随着计算机硬件性能的提高以及面向对象、网络和数据挖掘等主流IT技术的发展,在科技部有关部门的倡导下,目前国内学术界又提出了第四代GIS技术的概念。第四代GIS技术将主要有如下特点:
(1)支持“数字地球”或“数字城市”概念的实现,从二维向多维发展,从静态数据处理向动态数据处理发展,具有时序数据处理能力。
(2)基于网络的分布式数据管理及计算、WebGIS和B/S体系结构,用户可以实现远程空间数据调用、检索、查询、分析,具有联机事务管理(OLTP)和联机分析(OLAP)管理能力。
(3)面向空间实体及其相互关系的数据组织和融合,具有矢量和遥感影像数据互动等多源数据的装载与融合能力,可实现多尺度比例尺数据无缝融合与互动。
(4)具有统一的海量数据存储、查询和分析处理能力及基于空间数据的数据挖掘和强大的模型支持能力。
(5)具有与其他计算机信息系统的整体集成能力。例如与MIS、ERP、OA等各种企业信息化系统的无缝集成;微型、嵌入式GIS与各种掌上终端设备集成,如PDA、手机、GPS接收设备等。
(6)具有虚拟现实表达及自适应可视化能力,针对不同的用户出现不同的用户界面及地图和虚拟现实效果。
(四)GIS的应用
人类使用的信息中有80%与地理位置和空间分布有关,所以GIS具有非常广泛的应用。目前,GIS已经比较成熟地应用于军事、自然资源管理、土地和城市管理、电力、电信、石油和天然气、城市规划、交通运输、环境监测和保护、110和120快速反应系统等。
今后,GIS的应用将在市场分析、企业客户关系管理、银行、保险、人口统计、房地产开发、个人位置服务等领域得到广泛的应用,这些领域将是GIS产业发展的新的增长点。实际上,GIS的应用将加速度地深入人们的工作和生活的各个方面。GoogleEarth的流行就是GIS技术深入到日常生活每一个角落的明证。
由于地理信息在人类生活和国民经济中的重要作用,GIS在未来的几十年中将保持高速发展的势头,成为IT高科技领域的核心技术。
近几年来,随着移动通信技术的发展,GIS的应用范围迅速扩展到人们的日常生活中。集成GIS、GPS、GSM的技术已开始广泛应用于车辆安全防范系统和调度系统,为人们提供车辆反劫防盗、报警、道路指引、医疗救护以及在此系统平台基础上扩展各种电子商务增值服务。
以医疗救护为例,当患者向监控中心请求急救时,监控中心可以从GIS电子地图上查看到患者的具体位置,并同时搜索最近的急救车辆,让最近的车辆前去接患者。患者进入救护车后,监控中心可以通过双向通话功能,指导救护车上的医生实施救护治疗,同时通过GIS的最优路径功能,给救护车指引道路,使其以最快的速度到达医院或急救中心。而在救护车行进的过程中,患者的家属可以通过互联网立即上网查询救护车的行进位置及患者的状态信息。通过GIS,并结合GPS和GSM无线通信及网络,使患者、家属、救护车及医生之间建立了无缝沟通体系,最终使患者能得到快速、及时的治疗。
如果在车辆移动目标、家居固定点目标、重点保护单位甚至路灯上都安装了GPS、GSM或其他无线通信设备,那么我们在城市生活中,无论是开车、行走或者是在单位、在家里,都可以通过由GIS、GPS、互联网以及无线通信技术构成的综合服务系统获得急救、报警和各种商务服务,真正使我们处于立体的、全方位的数字化生活中,体验数字空间高科技价值。
GIS、RS、GPS等构成的空间信息技术将是未来发展最快的、最激动人心的领域之一,它结合通信及其他IT技术,为人类展现了一种全新的工作和生活模式(A.R.Mermut,H.Eswaran,2001)。当利用最新的GIS技术把城市、国家乃至整个地球都高度浓缩到计算机屏幕上的时候,人类对自己的命运和未来就有了更充分的把握。
(五)GIS与土地管理
GIS早已不限于地理学研究和应用的领域,目前已与各行各业和我们的日常生活产生了千丝万缕的联系,更重要的是它的应用领域还在不断扩大,甚至可触及企业信息化的过程中。
GIS应用于土壤科学的研究,它是现实世界的一个模型和模拟实现。土壤资源信息可以在GIS系统中进行存取、变换和对话式操作,作为土壤资源分类、评价、规划、管理与利用决策的依据,为土壤资源可持续利用服务。GIS应用于土壤学研究的各个方面,包括:①土壤制图技术及土壤采样技术;②土壤侵蚀预测与评价;③土壤资源污染与防治;④土壤养分流失评价;⑤土壤资源评价和管理;⑥作物生长模拟等。具体如1983年美国土壤保持局开发出农用土地评价和用地估计系统,系统中的农用土地评价包括土壤生产力的分等定级、土壤适宜性评价、土壤生产力潜力评价。1989年美国土壤保持局运用土壤信息系统保护土壤生态环境,控制土壤污染。1990年土壤侵蚀预测模型在土壤信息系统中已经能够成功运用,主要采用的分析手段有土壤侵蚀诺漠图、微机软件图、小溪河岸侵蚀诺漠图。
1.建立为农业生产服务的应用系统
如日本的农耕地土地资源信息系统,它包括了土壤信息系统、作物栽培试验信息系统、农业气象信息系统等子系统;保加利亚的计算机农业综合管理系统从20世纪80年代初开始运行。
进入20世纪90年代,GIS在土壤学研究领域的应用方面继续拓展,其作用和地位日益受到关注。从1994年开始的第15、16、17届国际土壤大会上持续讨论了土壤信息系统在持续农业和全球变化中的应用、土壤数据库的结构和联网等有关问题。同时,在应用上进一步趋向农业实际生产,直接服务于农场管理和经营,如进行农业技术咨询、牧场水源选点、作物生产管理、机械化施肥等方面。
中国的土壤工作者于20世纪80年代中期也开始进行土壤数据库建立、土壤信息系统的研制和应用工作。1986年底,北京大学遥感中心等主持了土壤侵蚀信息系统研究,建立了区域土壤侵蚀信息系统,这是我国较早关于土壤信息系统方面的研究。1989年,南京土壤研究所用两年时间研究了1∶50万东北三江平原土壤信息系统土壤图与数据库的建立;1990年,又研究了1∶5万江西红壤生态站土壤信息系统土壤侵蚀图;1991年,在“利用信息系统技术编制土壤退化图”研究中,应用从土壤土地数据库建立到土壤退化评价方法等一系列现代信息系统技术,编制出了实验区的土壤水蚀危害和风蚀评价图;1992年,又基本完成了海南岛土壤和土地利用信息库及信息系统制图工作。1991年,中国科学院沈阳应用生态研究所主持了“区域微机土壤信息系统的建立与应用”研究,在吉林省农安县的试验结果表明,这是一个简单但实用的土壤信息系统。1999年,胡月明等运用基本土壤数据库建立了红壤分类和评价的信息系统。
2.预测土壤空间变化及分布
由于GIS技术在土壤制图中的深入应用,怎样更准确地由有限的单个点位的土壤原始数据分析土壤属性的空间分布成为关注的焦点。具体来说,由于土壤数据库的信息来源于土壤分类、分色制图及制图的综合,产生了土壤空间分异类型的位移,而现代GIS技术又要求大量信息源,因此许多土壤科学家将兴趣集中到土壤空间变异性正确表达(即土壤图在GIS中的正确表达)的研究上。
(1)地形分析。Morre、Bourennane、Gessier和Oden等的研究均表明,某地区土壤属性与该地区的地形地貌特征和景观位置有明显的相关性,也就是与土壤的成土过程密切相关,可用下式表示:
中国耕地质量等级调查与评定(广东卷)
式中:
Si——土壤属性如土壤厚度、pH等;
i——由气候、母质、地貌历史、植被等因素决定的某地区海拔、坡度、坡形凹凸、水流长度和特定流域面积等原始地形数据可以通过一定精度的DEM计算出,复合地形数据,可以依经验判断或根据描述下垫面的物理发生过程的方程式进行简化。DEM可以由GIS技术生成,所以GIS的应用和地形分析可以提高土壤属性空间分布预测的精度。
(2)地质统计学与GIS的结合。GIS在存储、查询和显示地理数据方面发展得相当快,但在提供空间分析模块方面则发展得较慢。由于缺少通用的空间分析模块,使得GIS在解决某些空间问题中的应用受到很大的限制。
地质统计学是由南非矿山地质工程师D.G.Krige于1951年提出的,因此这一理论也以“克里格法”(Kriging)来命名,并由法国地质学家Dr.Matheron于1962年完善并创立。该学科在矿产储量研究方面起到了巨大作用。这是一种求最优、线形、无偏内插估计量值的方法(BLUE),在充分考虑信息样品的形状、大小及其与待估块段相互间的空间分布位置等几何特征以及品位的空间结构以后,利用变异函数(Varigram)为工具,对每一样品值分别赋予一定的权系数,加权平均来估计块段品位。
国内外土壤科学家已广泛地应用克里格法来预测非采样点的土壤属性,常用的方法有普通克里格法(OK)、泛克里格法(UK)、指示克里格法(IK)、协同克里格法(CK)、回归克里格法(RK)、点克里格法(PK)、块克里格法(BK)等。他们的研究还表明,在应用克里格法建立模型的时候,综合应用土壤和土地信息,如土壤分类、参比地区土壤属性、坡度、高程等,可以大大提高克里格法的插值精度,还可以降低由于测定大量样品而需要的成本,也可以减少由于样品点太少而带来的误差。我国从20世纪80年代开始利用克里格法研究土壤参数的空间变异性,2000年以后在这方面的报道已经越来越多。
近几年来,一些学者开始研究地质统计学和GIS之间的相互关系,并在GIS软件中提供一些空间分析功能。例如,美国圣巴巴拉NCGIA的SAN模型提供了在ArcGIS软件中计算和显示空间自相关和其他空间量的功能,二者的相互结合一方面可以大大加强GIS的分析功能,使大量数据所隐含的空间信息得以表达,发挥更大的作用;另一方面,也可以增强空间分析的能力。考虑到空间分析技术目前的发展十分迅速,新理论不断出现,空间分析模块已经成为GIS中的必选模块。
定位设备、数字化设备和数据交换。gis的数据采集新技术方法是:
1、定位设备:野外测量:大平板、全站仪、GPS、移动测绘系统特点是精度高、效率较低。适合范围是小范围GIS数据采集或局部数据更新。
2、数字化设备:数字化仪、扫描仪、摄影测量设备特点是范围大。
3、数据交换:针对GIS数据采集中属性信息采用手工调查和数据处理工作复杂等导致效率低下的问题,提出了基于AUTOCAD数字化采集GIS数据的方法。