第一章:地理信息系统概说数据与信息数据(data):是未经过加工的原始材料,是客观对象的表示。信息(information):是对数据的解释、运用与解算,是数据内涵的意义。信息的特点:客观性、适用性、传输性、共享性。数据处理:对数据进行收集、筛选、排序、归并转换、存储、检索、计算、分析、模拟和预测等操作。地理信息:是表征地理圈或地理环境固有要素或物质的数量、质量、分布特征、联系和规律等的数字、文字、图像和图形等的总称。地理信息的特征体现在区域性、多层次性和动态变化上:空间位置:通过公共地理参考来描述地物所在位置,如大地参照系、地物间的相对位置。结构:在二维空间的基础上,实现多专题的第三维的信息结构。时序特征:指地理数据采集或地理现象发生的时刻/时段。地理信息系统:由计算机硬件、软件和不同方法组成的系统,该系统设计支持空间数据的采集、管理、处理、分析、建模和显示,以便解决复杂的规划和管理问题。物理外壳:计算机化的技术系统操作(处理)对象:空间数据。技术优势:在于它的混合数据结构和有效的数据集成、独特的地理空间分析能力、快速的空间定位搜索和复杂的查询功能、强大的图形创造和可视化表达手段、以及地理过程的演化模拟和空间决策支持功能等。对GIS的三种认识:地图观点:强调GIS作为信息载体与传播媒介的地图功能。数据库观点:强调数据库系统在GIS中的重要作用。分析工具的观点:强调GIS的空间分析与模型分析功能,认为GIS是一门空间信息科学,这是其有别与其它系统的唯一特征。GIS概念框架和构成---数据库建立和数据库输入用户界面----系统和数据库管理---空间数据处理和分析---产品生成和输出地理信息系统的分类
1地理信息系统GIS的基本构成:硬件;软件;数据;人员;方法硬件:计算机是GIS硬件的核心,GIS软件可以在从服务器到桌面计算机,从单机到网络环境上运行。GIS的外部设备包括;;输入、输出设备,数据存储和传输设备,网络设备。它能影响到处理的速度,使用的便捷性和可用的输出类型。软件:GIS软件是系统的核心,它提供GIS所需的存储、分析和显示地理信息的功能和工具。主要的组分有:1输入和处理地理信息的工具2数据库管理系统(DBMS)3支持地理查询、分析和视觉化的工具4容易使用这些工具的图形化界面(GUI)软件不仅包括GIS软件,还包括各种数据库、绘图、统计、图象以及其它软件。数据GIS系统中最重要的部件就是数据,它也是GIS的操作对象。地理数据和相关的表格数据可以自己采集或者购买商业数据。GIS将把空间数据和其他数据源的数据集成在一起,而且可以使用那些被大多数公司用来组织和保存数据的数据库管理系统,来管理空间数据。数据的可用性和精确性将最终影响到分析或查询的结果。地理数据的组成要素几何位置表示地理要素与现实世界位置的联系,地理要素抽象为点、线、面。属性表示地理要素的描述性信息。行为取决于用户定义的环境,表示可以对地理要素进行某些编辑、显示、分析操作。人员这是GIS最重要的要素,人必须开发程序,定义GIS任务,人们经常会克服GIS其它要素的不足。但事实上,世界上最好的软件和硬件都有无法弥补的缺憾。GIS技术如果没有人来管理系统和制定计划应用于实际问题,将没有什么价值。GIS的用户范围包括从设计和维护系统的技术专家,到那些使用该系统并完成他们每天工作的人员。2GIS组织数据的方法GIS以专题分层的方式存贮信息,各层可以按地理特征联系起来。各层具有相同的地理范围;每层具有相似的属性。1.3GIS的基本功能数据采集(Capturedata)GIS提供多种地理数据和属性数据的输入方法,可用的数据方法越多,则GIS的通用性越广。地理数据库是昂贵和生存期最长的GIS要素。数据存储(Storedata)GIS能够用矢量和栅格两种格式存储地理数据。数据查询(Querydata)GIS必须提供根据位置或属性值确定某些特定要素的工具。数据分析(Analyzedata)GIS能够回答有关各种数据集之间空间关系的问题。最常见的两种:邻近分析(Proximityanalysis)叠加分析(Overlayanalysis)数据显示(Displaydata)GIS提供以各种颜色符号可视化显示地理要素的工具。数据输出(Outputdata)显示的结果将能够以各种格式,如地图、报表、图表的形式输出。1.4与GIS相关的科学与技术GIS是传统科学与现代技术的结合。地图学与GIS的区别:地图强调的是数据载体、符号化与显示,而GISs则注重于信息分析。同时,地图学理论与方法对GISs的发展有重要的影响,并成为GISs发展的根源之一。1.5GIS的主要应用领域世界各国的部门、商业机构、学术团体已广泛采用GIS。美国三里岛核事故中,USGS应用GIS及时作出判断与决策.加拿大应用CGIS于70年代完成全国土地资源潜力的评价。GIS可应用于任何涉及空间数据分析处理的领域,尤其是资源与环境的调查、规划和管理方面。资源调查与分析是GIS应用最广泛的领域和趋于成熟的方面•野生动植物保护、洪泛平原、湿地、农田蓄水层、森林等管理。•视域分析;•有毒或有害设施定址;•地下水模拟和有害物质跟踪;•野生动物栖息地分析、迁移路线规划。全球信息化是社会发展的必然趋势,地理信息是各种信息中最重要的基础信息,关系到经济建设、国防建设、人们的生活质量和社会可持续发展。GIS系统可广泛应用于:•土地管理、城市规划、智能化交通、精准农业•环境污染、土地荒漠化及其时空变化•海洋、河流与水资源、森林、草场等自然资源现状及变迁情况•地下矿藏的空间结构、储量,如何开采这些矿藏最有利于可持续发展3•南水北调选线方案等国家重大基础建设项目的三维仿真•军用三维电子地图、远程精确制导、打击效果评估······1.6GIS发展历史的回顾-国外六十年代:与计算机图形学的关系,应用主要针对城市和土地利用,局部的算法研究七十年代:应用的发展,软件的成熟,与遥感的结合;1969年ESRI和Intergraph成立八十年代:DBMS成熟与GIS的结合,各方面的算法完善,微机GIS九十年代:社会化阶段,3S集成应用,网络发展1.7GIS可以回答的问题位置(LOCATION):Whatisat...?要找出在某一特定的位置上存在什么。这个位置可以是地名、邮政编码、地理坐标等。条件(CONDITION):Whereisit...?要找出在什么地方有满足某些条件的东西。它是第一个问题的变换,要求通过空间分析加以回答。如:找出在某一公路100米以内,土壤条件适合建筑,面积大于2000m2的无林地。趋势(TRENDS):Whathaschangedsince...?这一问题同前两个问题都有关,它是要寻求发现某一范围在时间上的变化。第二章地理空间参照系统与地图投影2.1地理空间“空间”(Space)概念:物理学:空间是指宇宙在三个相互垂直方向上所具有的广延性。天文学:空间是指时/空连续体的一部分。地理学:空间(Geographicspace)是指物质、能量、信息的存在形式在空间形态、结构过程、功能关系上的分布、格局及其在时间上的延续。地理空间的概念GIS中的空间概念常用“地理空间”来表达。地理空间上至大气电离层、下至地幔莫霍面。它是人类活动频繁发生的区域,是人地关系最为复杂、紧密的区域,是地球上大气圈、水圈、生物圈、岩石圈和土壤圈交互作用的区域,地球上最复杂的物理过程、化学过程、生物过程和生物地球化学过程就发生在这里。地理空间既可以是具有属性描述的空间位置的集合(由一系列的空间坐标值组成);也可以是具有空间属性特征的实体的集合(由不同实体之间的空间关系构成)。地理空间的表达是地理数据组织、存储、运算、分析的理论基础。地图—传统的地理信息表达方式现实地理世界抽象模型点(位置)高程点,控制点,三角点,地形特征点水井位,水泉位,油井位,钻井位站台,车站,水文站,气象站,天文台,地震台乡镇驻地线:由点与点之间步长、方向确定交通线:铁路线,公路线,高速公路线,道路线水系:干流,支流,渠系4等值线:等高线,等温线,等压线,等径流线边界线:国界线,省界线,流域线,海岸线,岸边线临界线:区域界线,自然地带分界线,经济带分界线阈值线:植物生长阈值线……多边形:由线封闭的面积,构成地理类型或地理区域土地利用:耕地,园地,草地,林地,水域,城镇,荒地……地貌类型:高原,山地,丘岭,平原……植被类型:针叶林,阔叶林,混交林……土壤类型:棕壤,褐土,黄壤,红壤……流域面积:小流域……区域面积:行政区,经济区,自然保护区,特区……表面(场)地图描述地理信息的方式1.符号和注记2.空间关系隐含基本地图比例尺比例尺等级(有级)1:100,1:200,1:500,1:1000,1:2000,1:50001:10000,1:50000,1:100000,1:2000001:500000,1:1000000,1:2000000,1:40000001:8000000,1:10000000,1:20000000,1:500000001:100000000(全世界一览无遗)2.2地球椭球体基本要素地球的形状(大地测量学将地球表面的几何模型分四类):地球的实际表面:最自然的面。地球自然表面起伏不平、十分不规则,无法用数学公式表达和运算,不适宜数字建模,所以在量测与制图时,必须找一个规则的曲面来代替地球的自然表面。大地水准面:相对抽象的面。地球表面的72%被流体状态的海水所覆盖。假设,当海洋处于完全静止的平衡状态时,一个静止的平均海水面延伸到所有陆地下部,与地球重力方向处处正交的一个连续、闭合的水准面。大地水准面所包围的形体,叫大地球体。由于地球体内部质量分布不均,引起重力方向的变化,导致大地水准面成为一个形状十分复杂,不能用数学表达的不规则曲面。从整体来看,大地水准面起伏微小,是一个很接近于绕自转轴(短轴)旋转的椭球体,通常称地球椭球体。模型:以大地水准面为基准建立起来的地球椭球体模型,三轴椭球体模型在数学上可行,又十分接近大地水准面。椭球体的大小,通常用长/短半径a/b,或由一个半径和扁率来决定。扁率为:α=(a-b)/a。由于地球椭球体的基本元素a、b、α等的推求年代、使用方法以及测定地区不同,故地球椭球体的参数值有多种。三轴椭球体模型c—椭球体短轴半径,表示从极地到地心的距离;A和b—椭球体长轴和中轴上的半径,表示赤道面上的两个主轴。基于大地水准面建立地球三轴椭球体模型x2y2z22212abc5数学模型:数学上定义的地球是由一个椭圆绕着其短轴旋转而成的椭球体。它是一个较为接近地球形状的几何模型。用于解决其它一些大地测量学问题。地球的形状与椭球的大小地球的形状地球体、大地体、椭球体椭球的大小长半径a(赤道半径);短半径b(极半径)=(a-b)/a扁率我国的椭球中国在1952年以前采用海福特(Hayford)椭球体,从1953-1980年采用克拉索夫斯基(Krasovsky)椭球体。也采用IAG75椭球体。2.3坐标系坐标系包含两方面的内容:一是在把大地水准面上的测量成果换算到椭球体面上的计算工作中,所采用的椭球的大小;二是椭球体与大地水准面的相关位置不同,对同一点的地理坐标所计算的结果将有不同的值。选定了一个一定大小的椭球体,并确定了它与大地水准面的相关位置,就确定了一个坐标系。地理空间坐标系的建立地理坐标系:用经度和纬度表示地球表面特征的位置。笛卡儿平面直角坐标系(二维欧几里德(Euclidean)空间):用于距离、方向、面积等参数的计算。GIS中的地理空间通常是指经过投影变换后放在笛卡儿坐标系中的地球表层特征空间,它的理论基础在于旋转椭球体和地图投影变换。地理坐标地球表面空间要素的定位参照系统。由经线和纬线组成地理格网。地理坐标以经度坐标(Longitude)/纬度坐标(Latitude)表示。坐标原点为本初子午线与赤道的交点。高程绝对高程:地面点到大地水准面的高程。P0P0‘为大地水准面,地面点A和B到P0P0’的垂直距离HA和HB为A、B两点的绝对高程。相对高程:地面点到任一水准面的高程。A、B两点至任一水准面P1P1‘的垂直距离HA’和HB‘为A、B两点的相对高程。6地面点的坐标系统•大地坐标系/地理坐标系与我国的大地坐标系•1954年北京坐标系•1980年国家大地坐标系(西安大地坐标系)•高程系和中国的高程系•1956年黄海高程系:高程起算面是黄海平均海水面。•1985年国家高程基准•1956年黄海高程系比1985国家高程基准上升29毫米。地理坐标系平面直角坐标系(用于绘制地图)平面极坐标系(用于地图投影计算)地图坐标系统的建立•由投影几何特征建立平面直角坐标系;•自行规定坐标系(原点/横、纵轴).2.4地图投影由于地球是近似椭球的,故从椭球面到平面必须经过数学变换,这个数学变换称为地图投影(projection)。按变形性质可以分为三类:等角投影、等积投影和任意投影按构成方法可以分为两大类:几何投影:方位投影、圆柱投影、圆锥投影非几何投影:伪方位投影、伪圆柱投影、伪圆锥投影、多圆锥投影按照投影面与地球相割或相切分类:割投影、切投影••••7地图投影的一些概念标准线:投影面与参考椭球的切线。对于圆柱和圆锥投影,相切(割)时有一(两)条标准线。如果标准线沿(经)纬线方向,称为标准(经)纬线。标准线指明投影变形分布的模式,标准线上没有投影变形。中心线定义地图投影的中心或原点。通常它与标准线不同。横坐标(x)坐标东移,纵坐标(y)北移。用于改变地图投影原点,避免坐标出现负值。X-平移,y-平移。减少坐标读取位数。地图投影的基本问题就是利用一定的数学法则把地球表面上的经纬线网表示到平面上。在GIS中使用地图投影保证了空间信息在地域上的联系和完整性,在各类GIS的建立过程中,选择适当的地图投影系统是首先要考虑的问题。地图投影的变形1长度变形2面积变形3角度变形地图投影的选择选择制图投影主要考虑以下因素:制图区域的范围、形状和地理位置,地图的用途、出版方式及其他特殊要求等。世界地图常用正圆柱、伪圆柱和多圆锥投影。墨卡托投影绘制世界航线/交通/时区图;我国出版的世界地图多采用等差分纬线多圆锥投影。东、西半球图常选用横轴方位投影;南、北半球图常选用正轴方位投影;水、陆半球图一般选用斜轴方位投影。对于其他中、小范围的投影选择,须考虑其轮廓形状和地理位置,最好是使等变形线与制图区域的轮廓形状基本一致。圆形地区一般适于采用方位投影,在两极附近则采用正轴方位投影,以赤道为中心的地区采用横轴方位投影,在中纬度地区采用斜轴方位投影。8在东西延伸的中纬度地区,一般多采用正轴圆锥投影,如中国与美国。在赤道两侧东西延伸的地区,则宜采用正轴圆柱投影,如印度尼西亚。在南北方向延伸的地区,一般采用横轴圆柱投影和多圆锥投影,如智利与阿根廷。常用的一些地图投影各大洲地图投影亚洲地图的投影:斜轴等面积方位投影、彭纳投影。欧洲地图的投影:斜轴等面积方位投影、正轴等角圆锥投影。北美洲地图的投影:斜轴等面积方位投影、彭纳投影。南美洲地图的投影:斜轴等面积方位投影、桑逊投影。澳洲地图的投影:斜轴等面积方位投影、正轴等角圆锥投影。拉丁美洲地图的投影:斜轴等面积方位投影。中国各种地图投影全国地图投影:斜轴等面积方位投影、斜轴等角方位投影、彭纳投影、伪方位投影、正轴等面积割圆锥投影、正轴等角割圆锥投影。分省(区)地图的投影:正轴等角割圆锥投影、正轴等面积割圆锥投影、正轴等角圆柱投影、高斯-克吕格投影(宽带)。大比例尺地图的投影:多面体投影(北洋军阀时期)、等角割圆锥投影(兰勃特投影)(前)、高斯-克吕格投影(后)。高斯—克吕格投影高斯投影是一种横轴等角切椭圆柱投影,其条件为:经线和地球赤道投影成为直线且为投影的对称轴;等角投影;经线上没有长度变形。由公式可分析出高斯投影变形具有以下特点:经线上无变形同一条纬线上,离经线越远,变形越大;同一条经线上,纬度越低,变形越大;等变形线为平行于经线的直线。6度带从0度子午线起,自西向东,全球分为60带。3度带从1度30分的经线起,自西向东,全球分为120带。正轴圆锥投影Lambert投影(正轴等角割圆锥投影)。投影变换与坐标转换地图投影对大范围、小比例尺的地图,在某些部位(一般是边缘)失真很明显。9在设计GIS数据库时,依当地情况或标准来选择投影方式和坐标系。统一的坐标系统是地理信息系统建立的基础各国家的地理信息系统所采用的投影系统与该国的基本地图系列所用的投影系统一致;各比例尺的地理信息系统中的投影系统与其相应比例尺的主要信息源地图所用的投影一致;各地区的地理信息系统中的投影系统与其所在区域适用的投影系统一致;各种地理信息系统一般以一种或两种投影系统为其投影坐标系统,以保证地理定位框架的统一。地理信息系统中地图投影配置的一般原则为:所配置的投影系统应与相应比例尺的国家基本地图投影系统一致;系统一般地只考虑至多采用两种投影系统,一种服务于大比例尺的数据处理与输入输出,另一种服务于中小比例尺;所用投影以等角投影为宜;所用投影应能与网格坐标系统相适应,即所采用的网格系统在投影带中应保持完整。地图投影的设置ArcToolbox中的ProjectWizard可以设置投影和坐标系统。我国GIS中常用的地图投影配置与计算我国基本比例尺地形图(1:100万、1:50万、1:25万、1:10万、1:5万、1:2.5万、1:1万、1:5000)除1:100万外均采用高斯-克吕格投影为地理基础;我国1:100万地形图采用了Lambert投影,其分幅原则与国际地理学会规定的全球统一使用的国际百万分之一地图投影保持一致;我国大部分省区图以及大多数这一比例尺的地图也多采用Lambert投影和属于同一投影系统的Albers投影;Lambert投影中,地球表面上两点间的最短距离表现为近于直线,这有利于地理信息系统中的空间分析和信息量度的正确实施。地形图的分幅和编号国家基本比例尺地形图有1:1万、1:2.5万、1:5万、1:10万、1:20万、1:50万和1:100万七种。普通地图通常按比例尺分为大、中、小三种:大比例尺地图:≥1:10万比例尺的地图;中比例尺地图:1:10万至1:100万的地图;小比例尺地图:<1:100万的地图。对于一个国家或世界范围来讲,测制成套的各种比例尺地形图时,通常这是由国家主管部门制定统一的图幅分幅和编号系统。我国以1:100万地形图为基准,按照相同的经差和纬差定义更大比例尺地形图的分幅。百万分之一地图在纬度0o—60o之间的图幅,图幅大小按经差6o,纬差4o分幅;在60o—76o之间的图幅,其经差为12o,纬差为4o;在76o—80o之间图幅的经差为24o,纬差为4o。10比例尺图幅大小图幅间的数量关系
(万)经度纬度1:1006度4度11:503度2度41
1:201度40分36911:1030分20分144311:515分10分576144111:2.57.5分5分230457611:13分45秒2.5分9216
2304
256
16
分幅编号1:100万地图的编号例如北京所在的一幅百万分之一地图的编号为J-50。1114
1:50万、1:20万、1:10万地形图的编号1:50万地图编号为:如J-50-乙。1:20万地图表示为:如J-50-(28)。1:10万地图表示为:如J-50-28。1:5万、1:2.5万、1:1万地形图的编号以1:10万地形图的编号为基础,将一幅1:10万地图划分四幅1:5万地图,分别用甲、乙、丙、丁表示,其编号是:如J-50-32-甲。再将一幅1:5万地图划分四幅1:2.5万地形图,分别用1、2、3、4表示,其编号是:如J-50-32-甲-1。以一幅1:10万地形图划分为幅1:1万地形图,编号分别以带括号的(1)—()表示,其编号是:,如J-50-32-(10)。一幅1:1万地形图划分为4幅1:5000地形图,分别用a、b、c、d表示,其编号:如J-50-32-(10)-a。大中比例尺地形图坐标系•>1:50万为高斯-克吕格投影;•经线和赤道投影后互为垂直的直线,作为直角坐标轴;•两种坐标网格:经纬网和公里网2.5地理空间距离度量地球表面特征度量,最直截方法是用经、纬度来表示,这种方法有利于空间物理位置的精确测定,但难以进行有关空间距离、方向、面积等应用性参数的计算。这些参数计算的理想环境是笛卡儿平面直角坐标系,即二维欧几里德(Euclidean)空间。用经度、纬度表示的地球旋转椭球体(φ,λ)与平面直角坐标系(χ,у)之间的转换关系:F:(φ,λ)→(χ,у)这个空间转换关系F就是地图投影。地图投影变换必然引起地理空间立体要素在平面形态上的变化(变形),包括在长度、方向和面积上的变化。但是,平面直角坐标系(χ,у)却能建立对地理空间良好的视觉感,并易于进行距离、方向、面积等空间参数的量算,以及进一步的空间数据处理和分析。GIS中的地理空间,一般就是指经过投影变换后放在笛卡儿平面坐标系中的地球表层特征投影空间,它的理论基础在于旋转椭球体和地图投影变换。1.欧几里德距离在相对较小的地理空间中,采用笛卡儿坐标系,定义地理空间中所有点的集合,组成笛卡儿平面,记为R2。在R2中,任意两点(χi,уi)和(χj,уj)间的欧几里德距离d(i,j)如下:d(i,j)xixjyiyj22地理空间中所有点间的欧几里德距离函数组成度量空间s。度量空间具有如下特点:(1)如i和j代表不同的点,则,d(i,j)≥0的条件在欧几里德空间中总得到满足。(2)对称性,即,d(i,j)=d(j,i)。(3)三角不等性,即,给定s中的任意3个距离m,n,l,则存在如下关系式:m+n≥l122.曼哈顿距离曼哈顿距离是指两点在南北方向上的距离加上在东西方向上的距离,即:d(i,j)xixjyiyj曼哈顿距离又称为出租车距离。曼哈顿距离的度量性质与欧氏距离的性质相同,保持对称性和三角不等式成立。曼哈顿距离只适用于讨论具有规则布局的城市街道的相关问题3.时间距离时间距离(旅行时间距离)是根据从空间中一点到达另一点所需时间进行度量的。时间距离不具有前述欧几里德距离和曼哈顿距离的度量空间性质,即其对称性,三角形不等式不一定成立。第三章矢量数据模型3.1数据涵义与数据类型数据是信息的载体。其具体形式多种多样,如文本、图像、声音等。在信息系统中,数据的格式随着载荷它的物理设备的形式而改变。数据处理就是获得数据中所包含的信息的过程。在GIS中,输入、存储的各种专题地图和统计图表是数据;系统软件中所包含的代码是计算机系统中的二进制数据;用户对地理信息系统发出的各种指令也是数据。因此,GIS的建立和运行,就是信息或数据按一定的方式流动的过程。数据的类型原始数据(Primarydata)次生数据(Secondarydata)原始数据经过GISs和RSIPS(遥感影像处理系统)处理后都可以转化为次生数据。原始数据主要包括各种地图数据、表格数据和影像数据。对于大多数地理信息系统的应用来说,它们常用的是各种类型的次生数据。当原始数据经过解释、编辑和处理后,它们将转化为次生数据。常用的次生地球科学数据主要表现为诸如地图、表格以及空间信息的地学编码等形式。地理数据(空间数据)的基本特征13地理数据一般具有三个基本特征:空间特征或几何特征(定位数据):表示现象的空间位置或现在所处的地理位置。一般以坐标数据表示,例如笛卡尔坐标等。属性特征(非定位数据),表示实际现象或特征,例如变量、级别、数量特征和名称等。时间特征(时间尺度):指现象或物体随时间的变化,其变化的周期有超短期的、短期的、中期的、长期的等。空间数据的类型空间特征数据记录空间实体的位置、拓扑关系和几何特征,这是GIS区别于其他数据库管理系统的标志。空间特征指空间物体的位置、形状和大小等几何特征,以及与相邻物体的拓扑关系。这是地理信息系统所独有的。空间位置可由不同的坐标系统来描述,如经纬度、地图投影坐标或直角坐标等。拓扑关系确定某一目标与其他更熟悉的目标间的空间位置关系,如一所学校位于哪个路口或哪条街道。专题特征指地理实体所具有的各种性质,以数字、符号、文本和图像等形式表示,可被其它类型的信息系统存储和处理,如地形坡度、某地年降雨量、土地类型、人口密度、交通流量、空气污染程度等。时间属性是指地理实体的时间变化或数据采集的时间等。空间数据的表示方法类型数据:考古地点、道路线和土壤类型的分布等;面域数据:随机多边形的中心点、行政区域界线和行政单元等;网络数据:道路交点、街道和街区等;样本数据:气象站、航线和野外样方的分布区等;曲面数据:高程点、等高线和等值区域;14文本数据:地名、河流名称和区域名称;符号数据:点状符号、线状符号和面状符号(晕线)等。3.2地理空间的矢量表达矢量表达法主要表现空间实体的形状特征。0维矢量:空间中的一个点(point),在二维、三维欧氏空间中分别用(x,y)和(x,y,z)来表示。在数学上,点没有大小、方向。点包括如下几类实体:实体(Entity)点、注记(Text)点、内点(Label)、结点(Node)、角点(Vertex)或中间点。一维矢量:表示空间中的线划要素,它包括线段、边界、弧段、网络等。在二维(见(2-1)式)、三维(见(2-2)式)欧氏空间中用有序的坐标对表示:一维矢量的空间关系主要有如下几种:(1)坐标序列中的首点(x1,y1)和末点(xn,yn)统称为结点(首结点和末结点)。位于首尾结点间的点(x1,y1),(x2,y2),…,(xn-1,yn-1)为拐点或中间点或角点(见图(a));(2)首尾结点可以重合,即弧段首尾相接。相应的数学表达式为(图(b)):x1=xn,y1=yn(3)弧段不能与自身相交。如果相交,需以交点为界把弧段分为几个一维矢量(见图(c))。在图(c)中,弧段数为3,而不是1。三个弧段分别为AK,KBCDEFGHK,KIJ。一维矢量的主要参数有:长度:从起点到终点的总长。弯曲度:表示像道路拐弯时弯曲的程度。方向性:开始于首结点,结束于末结点。如河流中的水流方向,高速公路允许的车流方向等等。二维矢量(又称多边形):表示空间的一个面状要素。在二维欧氏平面上指由一组闭合弧段所包围的空间区域,见图(a)。在三维欧氏空间中二维矢量为空间曲面。目前通过二维矢量对空间曲面的表达主要有等高线和剖面法两种,见图(b)(c)。等高线通过设置等间距,把具有相同高程值的点连接起来形成等高线(一维矢量),来描述空间曲面。剖面是按一定的间距和剖面方向切割空间曲面,切割而成的多组剖面就完成了对空间曲面的描述。二维矢量的主要参数如下:面积:指封闭多边形的面积。对于三维欧式空间中的空间曲面而言,还包括其在水平面上的投影面积。周长:如果形成多边形的弧段为折线,那么,周长为各折线段长度之和;多边形由曲线组成,则计算方法较为复杂,如积分法。凹凸性:用于二维矢量的形态描述。凸多边形是指多边形内所有边之间的夹角小于15180。反之,则为凹多边形。走向、倾角和倾向:在描述地形、地层特征要素时常使用这些参数。地理空间的拓扑“拓扑”(Topology)一词源于希腊文,它的原意是“形状的研究”。拓扑学是几何学的一个重要分支,它研究在拓扑变换下能够保持不变的几何属性----拓扑属性。理解拓扑变换和拓扑属性:假设在欧氏平面中一块高质量的橡皮,表面上有由结点、弧段、多边形组成的任意图形。若只对橡皮进行拉伸、压缩,而不进行扭转和折叠,则在橡皮形状变化过程中,图形的一些属性将继续存在,一些属性将发生变化。例如,如果多边形中有一点A,那么,点A和多边形边界间的空间位置关系不会改变,但多边形的面积会发生变化。这时,称多边形内的点具有拓扑属性,而面积则不具有拓扑属性,拉伸和压缩这样的变换称为拓扑变换。拓扑属性一个点在一个弧段的端点一个弧段是一个简单弧段(弧段自身不相交)一个点在一个区域的边界上一个点在一个区域的内部一个点在一个区域的外部一个面是一个简单的面(面上没有岛)一个面的连续性(给定面上任意两点,从一点可以完全在面的内部沿任意路径走向另一点)非拓扑属性两点间的距离一个点指向另一点的方向弧段的长度区域的面积和周长弧段在结点处的相互联接关系。每个弧段都有一个起始端点和一个终止端点,从起始端点到终止端点表示了弧段的方向,而所有弧段的端点序列则定义了弧段与结点的拓扑关系,空间拓扑关系分析就是通过在端点序列中寻找弧段之间的共同结点来判断弧段与弧段之间是否存在连接性。多个弧段首尾相连构成多边形的内部域。在矢量模型中,多边形区域是由一系列弧段序列组成的。16根据弧段的方向性及其左右边来判断弧段左右多边形的邻接性。弧段的左与右的拓扑关系(Left-righttopology)表现了邻接性。一个具有方向性的弧段,沿弧段方向有左边和右边之分。空间拓扑关系分析正是依据弧段的左边与右边的关系来判断位于该弧段两边多边形的邻接性。二意性组合图问题基于结点—弧段—多边形(Node-arc-polygon)的拓扑分析,描述了空间实体之间的连接性和邻接性。但是,它对于两种不同的空间配置仍有可能给出相同的拓扑关系描述,组合图理论解决了这一空间配置的二意性组织问题。为解决组合图问题,定义由结点和弧段形成的组合图边界网络遵守如下规则:弧段具有方向性,若沿着弧段运动时,由弧段组成的多边形对象总是位于弧段的右边,弧段的这一运动方17向就是弧段的正方向;当弧段运动至某个结点时,以结点为轴按反时针方向旋转,选取尚未走过的弧段正方向离开结点的几个弧段中的第一个弧段;由上规则跟踪完所有弧段为止。空间关系地理空间实体对象之间的空间相互作用关系。空间关系分为三大类:拓扑空间关系(TopologicalSpatialRelationship):描述空间实体之间的相邻、包含和相交等空间关系。度量空间关系(MetricSpatialRelationship):描述空间实体的距离或远近等关系。距离是定量描述,而远近则是定性描述。顺序空间关系(OrderSpatialRelationship):描述空间实体之间在空间上的排列次序,如实体之间的前后、左右和东南西北等方位关系。目前对前两者的研究较成熟,算法也较简单;后者的判别方法较复杂,尤其在三维欧氏空间中。拓扑关系拓扑是研究几何对象在弯曲或拉伸等变换下仍保持不变的性质。在图论中,拓扑是指用图表或图形来研究几何对象排列及其相互关系。拓扑关系明确表达了实体/要素之间的空间相互关系。结点、弧段、多边形间的拓扑关系主要有如下三种:拓扑邻接、拓扑关联、拓扑包含。空间数据的拓扑关系拓扑邻接:存在于空间图形的同类图形实体之间的拓扑关系。如结点间的邻接关系和多边形间的邻接关系。左图中,结点N1与结点N2、N3、N4相邻,多边形P1与P2、P3相邻。拓扑关联:存在于空间图形实体中的不同类图形实体之间的拓扑关系。如弧段在结点处的联结关系和多边形与弧段的关联关系。N1结点与弧段A1、A5、A3相关联,多边形P2与弧段A3、A5、A6相关联。拓扑包含:不同级别或不同层次的多边形图形实体之间的拓扑关系。下图的a、b、c分别有2、3、4个层次。空间数据的拓扑关系在GIS数据处理和空间分析中的作用:根据拓扑关系,不需要利用坐标和距离就可以确定一种空间实体相对于另一种空间实体的空间位置关系。因为拓扑数据已经清楚地反映出空间实体间的逻辑结构关系,而且这种关系较之几何数据有更大的稳定性,即它不随地图投影而变化。利用拓扑数据有利于空间数据的查询。例如判别某区域与哪些区域邻接;某条河流能为哪183.3些居民区提供水源,某行政区域包括哪些土地利用类型等等。利用拓扑数据进行道路的选取,进行最佳路径的计算等。矢量数据模型模型:对现实世界的简化表达。一幅地图是一个符号模型,存贮数字地图的文件是一种符号模型。数据模型:根据一定的方案建立的数据逻辑组织方式。空间数据结构是对空间数据进行合理的组织,以便于计算机的处理。数据结构是数据模型和文件格式之间的中间媒介,是数据模型的具体实现。数据建模:指把反映现实世界的数据,按某种逻辑组合方式组织为有用,且能反映世界现实规律的数据集的过程。数据建模具体有三步:选择一种数据模型来对现实世界的数据进行组织;选择一种数据结构来表达该数据模型;选择一种适合于记录该数据结构的文件格式。例如,表示地表高程的空间数据可以:选用栅格模型进行组织,栅格模型选用游程编码数据结构进行表达,处理后的数据则以诸如后缀名为.COT的文件进行存储;可用矢量模型来组织,即以等高线来表示,数据以POLYVRT的拓扑结构进行安排,以DLG(DigitalLineGraph)文件格式存储;不规则三角网(TIN)模型也能很好地表达高程数据。对一种空间数据进行建模可能有几种可选的数据模型来描述,而每一种数据模型则可能有若干种数据结构来表达,而每一种数据结构又可能有多种文件格式进行存储。由此可见,只有同时理解了存储数据的数据模型和数据结构,用户才能够更好地使用数据。矢量数据模型:用点及其x,y坐标来构建空间要素。构建矢量数据模型的一般方法:用简单的几何对象(点、线和面)来表示空间要素;在GIS的一些应用中,明确地表达空间要素之间的相互关系;数据文件的逻辑结构必须恰当,使计算机能够处理空间要素及其相互关系;陆地表面数据、重叠的空间要素和路网适于用简单几何对象的组合来表示。几何对象点、线、面这三种类型的几何对象由维数和特征来区别。点是零维的,只有位置特征,线是一维的,有长度特征,面是二维的,有面积和边界特征。点及其坐标是矢量数据模型的基本单元。线要素由点定义。面要素由线定义,其边界把区域分成了内部区域和外部区域,它既可以是单独的,也可以是连续的。矢量数据的表示受比例尺制约。矢量模型非常适于表达图形对象和进行高精度制图。在矢量模型中,包围多边形面的线是由一系列相连的点或中间点(Vertices)组成,每个中间点也就是一个空间坐标对(见下图)。19在矢量模型中,空间实体的拓扑属性,如邻接性、包含关系(Containment)和连接性不会随着诸如移动、缩放、旋转和剪切等变换而改变,而空间坐标,还有一些几何属性(如面积、周长、方向等)会受到影响。矢量模型能方便地进行比例尺变换、投影变换。矢量模型数字设备:数字化仪,笔式绘图仪等。矢量数据存贮结构比栅格的复杂,且以矢量形式进行图形叠加的算法也很复杂。栅格和矢量模型最根本的不同在于它们如何表达空间概念。矢量模型用边界或表面来表达空间目标对象的面或体要素,通过记录目标的边界,同时采用标识符(Identifier)表达它的属性来描述对象实体。一般GISs都支持矢量和栅格两种模型,以充分利用两种数据结构的优点。三维矢量:用于表达三维空间中的现象和物体,是由一组或多组空间曲面所包围的空间对象,它具有体积、长度、宽度、高度、空间曲面的面积、空间曲面的周长等属性。不规则三角网的表达方法不规则三角网(TriangulatedIrregularNetwork,简称TIN)属于镶嵌模型(Tessellationmodel)中的一种类型。单个三角形的顶点就是原始数据点或其它空间信息的控制点。不规则三角网模型(TIN模型)TIN模型利用不规则三角形来描述数字高程表面。在TIN模型中,同样可以建立三角形顶点(数据点)、三角形边、三角形个体间的拓扑关系。TIN模型示意图见下图。如果建立了TIN模型图形实体(三角形顶点、三角形边、三角形)的拓扑关系,将大大加快处理三角形的速度。数字高程模型的主要优点是能够方便地进行空间分析和计算,如对地表坡度、坡向的计算等。TIN表达法有以下特点:能够表达不连续的空间变量(图A)。栅格方法很难处理逆断层、悬崖峭壁等特殊空间对象(图B(a)、(b)),而TIN的处理则相当容易。由于三角形顶点(Vertex)就是实际的控制点,所以,它对空间对象的表达精度较高。20能够精确表达河流、山脊、山谷等线性地形特征(图B(c))。TIN的空间几何特征为:三角形顶点(Vertex)。三角形边(Edge)。三角面(Triangularfacet)。三角网的一个优点是,其三角形大小随点密度变化而自动变化,当数据点密集时生成的三角形小,表示地形陡峭,数据点较稀时生成的三角形较大,表示地形平缓。TIN也能表示不连续对象,如悬崖、断层、海岸线和山谷谷底。把TIN转化为栅格,可用线性内插方法,也可用非线内插方法。矢量数据模型特别适用于表示和保存诸如建筑、管线或地类界线这样的具体特征。点是x,y坐标对;线是决定其形状的一组坐标;面是定义所包围区域界线的一组坐标。ArcGIS采用三种方式实现矢量数据模型:CoverageShapefileGeodatabase3.4矢量数据结构数据结构即数字数据文件的结构和文件之间的关系。数据结构是数据模型和文件格式之间的中间媒介,是数据模型的具体实现。数据结构的选择主要取决于数据的性质和使用方式。基于拓扑关系的矢量数据结构有利于数据文件的组织,并减少数据冗余。例如:两个多边形共享一个边界。矢量拓扑数据结构点要素可用标识号码(IDs)和成对的x,y坐标来编码。拓扑关系不适于应用点,因为点是彼此分开的。线要素由弧段-坐标表表示。弧段-节点表列出了弧段与节点之间的关系。面要素中,多边形/弧段清单显示多边形和弧段之间的关系;左/右多边形清单显示弧段及其左多边形与右多边形之间的关系。1)Spaghetti结构2)拓扑数据结构与Spaghetti结构相比,Roessel结构优点:①消除了相邻多边形之间共同边界的重复记录;②拓扑信息与空间坐标分别存储,有利于空间关系查询与分析。Roessel结构缺点:①拓扑表必须一开始时就创建,这需要一定时间和空间;②一些简单操作,如图形显示较慢,因为显示要的是坐标而非拓扑结构。TIN数据结构与编码21空间数据组织与编码空间数据组织依据地理实体之间不同特征(如因公路和铁路的建造方式不同而将它们视为不同的类)、相似特征(如因公路和铁路都具有运输功能而将它们视为一类)以及不同地理实体的组合特征(如飞机跑道、出租车道、建筑楼群和停车场共同组成飞机场)来对地理特征进行分类,以实现空间数据的组织。空间特征数据的表达方式包括各种数据结构,并表现为点、线、面等各种图形符号信息;属性特征数据的表达方式包括基于地理特征(包括空间特征和属性特征)的多种分类关系的表格。GISs正是通过建立空间特征数据的图形符号表达与属性特征数据的表格表达之间的联系,才具备了强大的空间分析能力。空间数据编码GISs中对实体(对象)的描述一般包括三种基本信息:语义信息、量度信息和关系结构信息。语义信息表明实体的类型,量度信息用于描述实体的形状和位置等几何属性,关系结构信息用于描述一个实体与其它实体的联系。空间数据的编码则主要是指语义信息的数据化,它是建立在地理特征的分类及其等级组织基础之上的空间信息数据编码,用于表明实体元素在数据分类分级中的隶属关系和属性性质。编码方式:主码+子码。其中,主码表示实体元素类别,子码则是对实体元素的标识和描述。ESRI矢量数据格式简介1.Coverage–基于拓扑的矢量数据格式Coverage是ArcInfoworkstation的原生数据格式。称之为“基于文件夹的存储”。所有信息都以文件夹的形式来存储。空间信息以二进制文件的形式存储在的文件夹中,文件夹名称即为该coverage名称,属性信息和拓扑数据则以INFO表的形式存储。Coverage将空间信息与属性信息结合起来,并存储要素间的拓扑关系。coverage二进制文件与存储属性信息的INFO文件夹中的INFO表联合表达为coverage,当使用ArcCatalog对coverage进行创建、移动、删除或重命名等操作时,ArcCatalog将自动维护他们的完整性,将coverage和INFO文件夹中的内容同步改变。所以对coverage进行操作,一定要在ArcCatalog中进行。2.Shapefile—非拓扑矢量数据格式Shapefile是ArcViewGIS3.x的原生数据格式,属于简单要素类,用点、线、多边形存储要素的形状,却不能存储拓扑关系,具有简单、快速显示的优点。一个shapefile是由若干个文件组成的,空间信息和属性信息分离存储,所以称之为“基于文件”。在windows资源管理器下,可以看见这个名为actc的shapefile是由actc.shp、actc.shx、actc.dbf三个文件组成。3.Geodatabase–基于对象的矢量数据格式Geodatabase体现了很多第三代地理数据模型的优势。带有空间信息的地理数据也利用成熟的数据库技术进行管理。ESRI推出了geodatabase数据模型,利用数据库技术高效安全地管理地理数据。22三种矢量数据模型的优点:Coverage:基于拓扑关系的数据结构,有利于数据文件的组织,减少数据冗余。(如:相邻的多边形共享边界只存储一次,减少冗余,便于修改、维护)Shapefile:1)非拓扑数据结构比拓扑数据结构能更快速地显示;2)非拓扑数据具有非专业性和互操作性,使其可以在不同软件间通用。Geodatabase:1)Geodatabase的等级结构对于数据组织和管理十分有利;2)Geodatabase是ArcObjects的一部分,具有面向对象的优势;3)Geodatabase提供了即时拓扑,适用于要素类内的要素或者两个、多个要素共同参与(如数据编辑、要素间关系等);4)在ArcObjects中有许多对象、属性、方法可供GIS用户定制应用,减少大量工作的重复性(如数据集的投影等);5)ArcObjects提供了一个可以按照各行各业需要定制对象的模型。可以将显示世界中各个对象的不同属性、行为定制到数据模型中(如交通对象等)。3.5空间数据的元数据元数据(Metadata)是描述数据的数据。在地理空间数据中,元数据是说明数据内容、质量、状况和其他有关特征的背景信息。传统的图书馆卡片、图书的版权说明、磁盘的标签等都是元数据。地图的元数据包括地图类型、地图图例,图名、空间参照系和图廓坐标、地图内容说明、比例尺和精度、编制出版单位和日期或更新日期、销售信息等。在这种形式下,用户通过它可以非常容易地确定该地图是否能够满足其应用的需要。元数据的内容包括:对数据集的描述;对数据集中各数据项、数据来源、数据所有者及数据序代(数据生产历史)等的说明;对数据质量的描述,如数据精度、数据的逻辑一致性、数据完整性、分辨率、元数据的比例尺等;对数据处理信息的说明,如量纲的转换等;对数据转换方法的描述;对数据库的更新、集成等的说明。空间数据元数据的应用帮助用户获取数据空间数据质量控制在数据集成中的应用数据集层次的元数据记录了数据格式、空间坐标体系、数据的表达形式、数据类型等信息;系统层次和应用层次的元数据则记录了数据使用软硬件环境、数据使用规范、数据标准等信息。这些信息在数据集成的一系列处理中,如数据空间匹配、属性一致化处理、数据在各平台之间的转换使用等是必要的。这些信息能够使系统有效地控制系统中的数据流。3.6空间数据质量与数据质量相关的几个概念误差(Error):反映了数据与真实性或大家公认的真值之间的差异,是一种常用的数据准确性的表达23方式;数据的准确度(Accuracy):指结果、计算值或估计值与真实值或者大家公认的真值的接近程度;数据的精密度(Resolution):指数据表示的精密程度,也即数据表示的有效位数。其实质在于它对数据准确度的影响,在很多情况下,它可通过准确度得到体现。数据的不确定性(Uncertainty):是关于空间过程和特征不能被准确确定的程度,是自然界各种空间现象自身固有的属性。在内容上,它是以真值为中心的一个范围(如误差范围),范围越大,不确定性就越大。如不同等级国家测控网中测量点的数值有严格的误差范围。空间数据质量标准空间数据质量标准是生产、使用和评价空间数据的依据,数据质量是数据整体性能的综合体现。空间数据质量标准的建立必须考虑空间过程和现象的认知、表达、处理、再现等全过程。空间数据标准要素及内容如下:数据情况的说明:要求对地理数据的来源、数据内容及其处理过程等作出准确、全面和详尽的说明;位置或定位精度:为空间实体的坐标数据与实体真实位置的接近程度,常表现为空间三维坐标数据精度。它包括数学基础精度、平面精度、高程精度、接边精度(指同类图形不同图幅的接边)、形状再现精度、像元定位精度(图象分辨率)等。平面精度和高程精度又分为相对精度和绝对精度;属性精度:指空间实体的属性值与其真值相符的程度。通常取决于地理数据的类型,常与位置精度有关。主要包括要素分类与代码的正确性、要素属性值的准确性及其名称的正确性等;时间精度:通过数据更新的时间和频度来表现;一般情况下,与交通管理、工业生产(主要指控制)有关的GIS系统的精度要求高,而与矿产资源探查、社会调查有关的GIS系统的精度要求低。逻辑一致性:指地理数据关系上的可靠性,包括数据结构、数据内容(包括空间特征、专题特征和时间特征),以及拓扑性质上的内在一致性;数据完整性:指地理数据在范围、内容及结构等方面满足所有要求的完整程度,包括数据范围、空间实体类型、空间关系分类、属性特征分类等方面的完整性;表达形式的合理性:指数据抽象、数据表达与真实地理世界的吻合性,包括空间特征、专题特征和时间特征的合理性等。数据质量微观方面的数据质量问题:位置精度:地图要素的坐标与实际物体坐标间的误差,包括:偏移的距离和偏移的分布。属性精度:人为因素和技术因素造成属性定义的误差。逻辑上的一致性:数据在输入计算机之前,因分类定义不严密而产生矛盾。分辨率:栅格型和矢量型数据都有精度问题。矢量空间数据库的比例主要由分辨率和位置精度决定。在数据库设计时应定义最小制度单位。宏观方面的数据质量问题:完整性:包括地图或地图所表示的空间范围内各种信息是否遗漏或重复,分类是否重复或缺损,有无可能核实与检验等等。时间性:GIS收集的数据在时间上要有可比性。收集与处理过程的记录:以判断数据的准确性。24使用方面的数据质量问题:保密与公开:为平衡二者间的矛盾产生的误差。费用:误差来源第四章•••••4.2栅格数据模型栅格数据:用一个规则格网来描述与每一个格网单元位置相对应的空间现象特征。栅格数据模型适合表示连续现象。空间现象的变化由格网单元值的变化来反映。栅格数据以域为基础来描述,而矢量数据以对象为基础来描述。栅格结构是最简单最直接的空间数据结构,是指将地球表面划分为大小均匀紧密相邻的网格阵列,每个网格作为一个象元或象素由行、列定义,并包含一个代码表示该象素的属性类型或量值,或仅仅包括指向其属性记录的指针。栅格结构表示的地表是不连续的,是量化和近似离散的数据。每一个单元格对应一个相应的地块。栅格数据模型(rastermodel)•栅格数据模型也称格网、栅格地图、表面覆盖(surfacecover)或影像。•栅格模型直接采用面域或空域枚举来直接描述空间目标对象。用栅格描述事物的地理位置;•格网由行、列、格网单元组成。行、列由格网左上角起始,行为y坐标,列为x坐标。格网单元由其行、列位置定义。所以,每个格网单元的空间坐标不一定要直接记录,因为单元记录的顺序已经隐含了空间坐标。栅格表达法在栅格表达中,对空间实体的最小表达单位为单元或像元(Cell或Pixel),每一像元的大小是一致的(一般是正方形)。在栅格模型中,空间事物按其在网格中的行、列和编码值表示;每一个栅格像元以一定的数值(如颜色、灰度级)记录着不同的属性,如:环境污染程度、植被覆盖类型等空间地理现象。网格基本单元的大小,对地图的分辨率和计算精度起关键的作用;计算机的储存量和分辨率成反比。25栅格数据的形状、尺寸及相关问题•栅格数据单元格经常是矩形(主要是正方形)的,但并不是必须如此。其单元格形状可以随应用的需要进行具体设定,比如设置为三角形。•栅格数据的比例尺就是栅格大小与地表相应单元大小之比。•栅格尺寸越小,其分辨率越高,数据量也越大。•由于栅格结构对地表的离散,在计算面积、长度、距离、形状等空间指标时,若栅格尺寸较大,则造成较大的误差。•由于栅格单元中存在多种地物,而数据中常常只记录一个属性值,这会导致属性误差。比如,遥感数据中的“混合像元”问题。•像元很大,则无法表示空间要素的精确位置,即增加了混合要素/像元的机会;像元较小,位置相对精确,但却增加了数据量和数据处理时间。栅格数据结构的特点n属性明显–数据中直接记录了数据属性或指向数据属性的指针,因而我们可以直接得到地物的属性代码n定位隐含–所在位置则根据行列号转换为相应的坐标,也就是说定位是根据数据在数据集中的位置得到的。栅格结构是按一定的规则排列的,所表示的实体的位置很容易隐含在格网文件的存储结构中n栅格数据结构结构容易实现,算法简单,且易于扩充、修改,也很直观,特别是易于同遥感影像的结合处理,给地理空间数据处理带来了极大的方便决定栅格单元代码的方式•基本原则:在决定栅格代码时尽量保持地表的真实性,保证最大的信息容量。•注意:每一个单元可能对应多个地物种类或多个属性值。比如遥感图像中的“混合像元”。1.中心点法–处理方法:用处于栅格中心处的地物类型或现象特性决定栅格代码–常用于具有连续分布特性的地理要素,如降雨量分布、人口密度图等。例如:中心点O落在代码为C的地物范围内,按中心点法的规则,该矩形区域相应的栅格单元代码为C2.面积占优法–处理方法:以占栅格区域面积比例最大的地物类型或现象特性决定栅格单元的代码–面积占优法常用于分类较细,地物类别斑块较小的情况–例如:所示的例子中,显见B类地物所占面积最大,故相应栅格代码定为B3.重要性法–处理方法:根据栅格内不同地物的重要性,选取最重要的地物类型决定相应的栅格单元代码–重要性法常用于具有特殊意义而面积较小的地理要素,特别是点、线状地理要素,如城镇、26•交通枢纽、交通线、河流水系等,在栅格中代码应尽量表示这些重要地物–例如:假设A类最重要的地物类型,即A比B和C类更为重要,则栅格单元的代码应为A4.百分比法–处理方法:根据栅格区域内各地理要素所占面积的百分比数确定栅格单元的代码–适用于地物面积具有重要意义的分类体系–例如:可记面积最大的两类BA,也可以根据B类和A类所占面积百分比数在代码中加入数字5.其他方法–根据具体的应用内容,栅格单元的代码确定方式还可以采用其他方法,如插值方法(平均值就是其中之一),或使用特定的计算函数等。栅格表达法的精度与分辨率有关。图(a)、(b)、(c)中,栅格的分辨率分别为7x5,15x11,24x13。分辨率的大小与下面两个问题有关:1记录和存储栅格数据硬件设备的性能。2与实际应用需求有关。实际上,分辨率越高,其影象表达地理空间现象的特征就越细微。栅格模型具有如下几个特点:1栅格的空间分辨率指一个像元在地面所代表的实际面积大小(一个正方形的面积);2对于同一幅图形或图象来说,随着分辨率的增大,存储空间也随之增大。例如,若每一像元占用一个字节,而且分辨率为100*100m,那么,一个面积为100km*100km的区域就有1000*1000=1000000个像元,所占存储空间为1M个字节;如果分辨率为10*10m,那么,同样面积的区域就有10000*10000=1亿个像元,所占存储空间近100MB;3表达空间目标、计算空间实体相关参数的精度与分辨率密切相关,分辨率越高,精度越高;4非常适合进行空间分析。例如,同一地区多幅遥感图象的叠加操作等;5不适合进行比例尺变化,投影变换等。4.3栅格数据类型栅格数据适用于保存和分析在面上连续的数据。每个单元包含了一个值,以表示在某一类或域中的所属关系,也可以表示一种观测值或推导值。•栅格数据包括影像和格网(grids)。–影像数据包括航/卫片和扫描图像;–格网表示推导的数据,经常用于分析和模拟。它们可以通过采用点来建立,如土壤中某一化学成分的聚集层;也可以根据影像的分类结果,如:土地覆被;还可以从矢量转化而来。–格网可以保存连续变化的值,如:地表高程;–格网也可以保存域值,如:植被类型图。–格网所保存的每个域值的信息还可以加上其它属性,如:数值代码、植被类型名称、对一定野生物种的适宜程度等。这不同于特征数据而把这些属性同每个特征相对应。4.4栅格数据结构、压缩和文件•栅格数据结构是指栅格数据的存储、使得它们能被计算机使用与处理。•单元依序编码(cell-by-cellencoding)数据结构:栅格模型被存为矩阵,其格网单元值写成一个行列式文件。栅格数据编码•栅格数据编码方法分为两大类:–直接栅格编码–压缩编码方法1链码2游程长度编码3块码4四叉树直接栅格编码(逐个像元编码)27直接编码就是将栅格数据看作一个数据矩阵,逐行(或逐列)逐个记录代码,可以每行都从左到右逐个象元进行记录,也可以奇数行地从左到右而偶数行地从右向左记录,为了特定目的还可采用其他特殊的顺序•逐个像元编码将数据模型存储为矩形,其像元值写成行列式。•适合于表达栅格的像元值连续变化的数据,如高程等。遥感影像的每个像元具有多个值(多波段),按照bsq、bil、bip方式存储。压缩编码方式压缩编码的目的就是用尽可能少的数据量记录尽可能多的信息,其类型分为1信息无损编码:编码过程中没有任何信息损失,通过解码操作可以完全恢复原来的信息2信息有损编码:为了提高编码效率,最大限度地压缩数据,在压缩过程中损失一部分相对不太重要的信息,解码时这部分难以恢复在地理信息系统中的压缩编码多采用信息无损编码,而对原始遥感影像进行压缩时也可以采取有损压缩编码方法。1链码(ChainCodes)n链式编码又称为弗里曼链码(Freeman,1961)或边界链码。该编码方法将数据表示为由某一原点开始并按某些基本方向确定的单位矢量链。n基本方向可定义为:东=0,东南=1,南=2,西南=3,西=4,西北=5,北=6,东北=7等八个基本方向。优点:链式编码对多边形的表示具有很强的数据压缩能力,且具有一定的运算功能,如面积和周长计算等,探测边界急弯和凹进部分等都比较容易,比较适于存储图形数据。缺点:对叠置运算如组合、相交等则很难实施,对局部修改将改变整体结构,效率较低,而且由于链码以每个区域为单位存储边界,相邻区域的公共边界被重复存储会产生冗余。2游程长度编码(Run-LengthCodes)它的基本思路是:对于一幅栅格图像,常常有行(或列)方向上相邻的若干点具有相同的属性代码,因而可采取某种方法压缩那些重复的记录内容。部分GIS软件采用此编码方式,ArcGIS、IDRISI等n其实现方法有两种–一种编码方案是,只在各行(或列)数据的代码发生变化时依次记录该代码以及相同的代码重复的个数,从而实现数据的压缩。–另一种游程长度编码方案就是逐个记录各行(或列)代码发生变化的位置和相应代码••按第一种编码方法,此数据游程长度编码:(0,1),(4,2),(7,5);(4,5),(7,3);(4,4),(8,2),(7,2);(0,2),(4,1),(8,3),(7,2);(0,2),(8,4),(7,1),(8,1);(0,3)(8,5);(0,4),(8,4);(0,5),(8,3)。用44个整数表达了原始数据中的个栅格。•••游程长度编码的数据结构以行和组来记录格网单元值。每一组包括了一个格网值和拥有该值的格网个数。28数据压缩法之一,以缓和存贮量和分辨率间的矛盾;压缩效果和地图上各种面的复杂程度有关。游程长度编码优缺点n优点–压缩效率较高,且易于进行检索,叠加合并等操作,运算简单,适用于机器存储容量小,数据需大量压缩,而又要避免复杂的编码解码运算增加处理和操作时间的情况n缺点–对于图斑破碎,属性和边界多变的数据压缩效率较低,甚至压缩后的数据量比原始数据还大。3块码(ChainCodes)块码是游程长度编码扩展到二维的情况,采用方形区域作为记录单元,每个记录单元包括相邻的若干栅格,数据结构由初始位置(行、列号)和半径,再加上记录单位的代码组成。4四叉树编码四叉树编码将整个图像区逐步分解为一系列仅包含单一类型的方形区域,最小的方形区域为一个栅格象元。其基本分割方法是将一幅栅格地图或图像等分为四部分。逐块检查其栅格属性值(或灰度)。如果某个子区的所有栅格值都具有相同的值。则这个子区就不再继续分割,否则还要把这个子区再分割成四个子区。这样依次地分割,直到每个子块都只含有相同的属性值或灰度为止。由上而下的方法运算量大,耗时较长。因而实践中可以采用从下而上的方法建立四叉树编码。对栅格数据按如下的顺序进行检测:如果每相邻四个栅格值相同则进行合并,逐次往上递归合并,直到符合四叉树的原则为止。这种方法重复计算较少,运算速度较快。采用四叉树编码时,为了保证四叉树分解能不断地进行下去,要求图像必须为2n×2n的栅格阵列,对于非标准尺寸的图像需首先通过增加背景的方法将图像扩充为2n×2n的图像。四叉树结构按其编码的方法不同分为常规四叉树和线性四叉树:常规四叉树:除了记录叶结/节点之外,还要记录中间结点(非叶结/节点)。结点之间借助指针联系,每个结点需要用六个量表达:四个叶结点指针,一个父结点指针和一个结点的属性或灰度值。这些指针不仅增加了数据贮存量,而且增加了操作的复杂性。常规四叉树主要在数据索引和图幅索引等方面应用线性四叉树:只存贮最后叶结点的信息。包括叶结点的位置、深度和本结点的属性或灰度值。所谓深度是指处于四叉树的第几层上。由深度可推知子区的大小。线性四叉树叶结点的编号需要遵循一定的规则,这种编号称为地址码,它隐含了叶结点的位置和深度信息。最常用的地址码是四进制或十进制的Morton码。0 4 4 7 7 7 7 7 4 4 4 4 4 7 7 7 4 4 4 4 8 8 7 7 0 0 4 8 8 8 7 7 0 0 8 8 8 8 7 8 0 0 0 8 8 8 8 8 290 0 0 0 8 8 8 8 0 0 0 0 0 8 8 8 四叉树编码的优缺点优点:四叉树编码具有可变的分辨率,树的深度随数据的破碎程度而变化,并且有区域性质,压缩数据灵活,许多数据和转换运算可以在编码数据上直接实现,大大地提高了运算效率,并支持拓扑“洞”(嵌套多边形)的表达,是优秀的栅格压缩编码之一。缺点:其最大不足是其不稳定性,即同样的原始数据应用不同的算法进行编码可能会得到不同的编码结果。不利于数据分析。压缩编码的相关问题n同所有的数据结构问题一样,压缩编码过程的主要矛盾也是数据量压缩和运算时间之间的矛盾:为了更有效地利用空间资源,减少数据冗余,不得不花费更多的运算时间进行编码。n好的压缩编码方法就是要在尽可能减少运算时间的基础上达到最大的数据压缩效率,并且是算法适应性强,易于实现常见栅格压缩编码方法总结:n链码的压缩效率较高,已经近矢量结构,对边界的运算比较方便,但不具有区域的性质,区域运算困难。n游程长度编码既可以在很大程度上压缩数据,又最大限度地保留了原始栅格结构,编码解码十分容易。但对破碎数据处理效果不好。n块码和四叉树编码具有区域性质,又具有可变的分辨率,有较高的压缩效率,但运算效率是其瓶颈。其中四叉树编码可以直接进行大量图形图像运算,效率较高,是很有前途的方法。4.5栅格数据的投影与几何变换•地图投影与几何变换是矢量/栅格数据空间配准的基础。•栅格数据的投影仍以行与列为基础,但行与列是以现实世界的实际坐标来量测的。•栅格数据的起始位置一般是左上角,投影坐标系统的起始位置一般是左下角。因此,通过行列数、像元大小来确定像元左下角、右上角、像元中心坐标。–如:高程格网可定义如下:•行:463,列:318,格网单元大小:30米;•左下角UTM坐标:499995,5177175;30••右上角UTM坐标:509535,9191065。地理坐标参照:图像处理中的卫星影像的几何变换,常见的有两种方法:–仿射变换(affinetransformation):通过旋转、移动和比例变换(scaling)对图象作地理坐标参照。–多项式方程(polynomialequations):也称为拉伸(warping)或橡皮板变换(rubbersheeting),为比例变换和图像旋转提供数学模型。••矢栅结构的比较及转换算法相互转换算法•矢量格式向栅格格式的转换•内部点扩散算法•复数积分算法•射线算法和扫描算法•边界代数算法•栅格格式向矢量格式的转换•1)多边形边界提取:•2)边界线追踪•3)拓扑关系生成•4)去除多余点及曲线圆滑第五章空间数据的处理数据编辑、坐标变化、格式转换§5-1坐标变换一、图幅数据的坐标变换(1.2.3为几何变换)1、比例尺变换:乘系数2、变形误差改正:通过控制点利用高次变换、二次变换和仿射变换加以改正3、坐标旋转和平移31即数字化坐标变换,利用仿射变换改正。4、投影变换:三种方法。二、几何纠正1、高次变换其中A、B代表二次以上高次项之和。上式是高次曲线方程,符合上式的变换称为高次变换。式中有12个未知数,所以在进行高次变换时,需要有6对以上控制点的坐标和理论值,才能求出待定系数。2、二次变换当不考虑高次变换方程中的A和B时,则变成二次曲线方程,称为二次变换。二次变换适用于原图有非线性变形的情况,至少需要5对控制点的坐标及其理论值,才能解算待定系数。3、仿射变换实质是两坐标系间的旋转变换。设图纸变形引起x,y两个方向比例尺不同,当x,y比例尺相同时,为相似变换。特性:·直线变换后仍为直线;·平行线变换后仍为平行线;·不同方向上的长度比发生变化。求解上式中的6个未知数,需不在一直线上的3对已知控制点,由于误差,需多余观测,所以,用于图幅定向至少需要四对控制点。三、地图投影变换假定原图点的坐标为x,y(称为旧坐标),新图点的坐标为X,Y(称为新坐标),则由旧坐标变换为新坐标的基本方程式为:1、解析变换法1)反解变换法(又称间接变换法)2)正解变换法(又称直接变换法)2、数值变换法利用若干同名数字化点(对同一点在两种投影中均已知其坐标的点),采用插值法、有限差分法或多项式逼近的方法,即用数值变换法来建立两投影间的变换关系式。例如,采用二元三次多项式进行变换:通过选择10个以上的两种投影之间的共同点,并组成最小二乘法的条件式,进行解算系数。3、数值解析变换法当已知新投影的公式,但不知原投影的公式时,可先通过数值变换求出原投影点的地理坐标φ,λ,然后代入新投影公式中,求出新投影点的坐标。即:32§5-2图形编辑图形编辑又叫数据编辑、数字化编辑,是指对地图资料数字化后的数据进行编辑加工,其主要的目的是在改正数据差错的同时,相应地改正数字化资料的图形。图形编辑是一交互处理过程,GIS具备的图形编辑功能的要求是:1)具有友好的人机界面,即操作灵活、易于理解、响应迅速等;2)具有对几何数据和属性编码的修改功能,如点、线、面的增加、删除、修改等;3)具有分层显示和窗口操作功能,便于用户的使用。一、编辑操作1、结点的编辑1)结点吻合(Snap)或称结点匹配、结点咬合,结点附和。方法:A、结点移动,用鼠标将其它两点移到另一点;B、鼠标拉框,用鼠标拉一个矩形,落入该矩形内的结点坐标通过求它们的中间坐标匹配成一致;C、求交点,求两条线的交点或其延长线的交点,作为吻合的结点;D、自动匹配,给定一个吻合容差,或称为咬合距,在图形数字化时或之后,将容差范围内的结点自动吻合成一点。一般,若结点容差设置合理,大多数结点能够吻合在一起,但有些情况还需要使用前三种方法进行人工编辑。2)结点与线的吻合在数字化过程中,常遇到一个结点与一个线状目标的中间相交。由于测量或数字化误差,它不可能完全交于线目标上,需要进行编辑,称为结点与线的吻合。编辑的方法:A、结点移动,将结点移动到线目标上。B、使用线段求交;C、自动编辑,在给定容差内,自动求交并吻合在一起。3)需要考虑两种情况A、要求坐标一致,而不建立拓扑关系;如高架桥(不需打断,直接移动)B、不仅坐标一致,且要建立之间的空间关联关系;如道路交叉口(需要打断)2、图形编辑包括用鼠标增加或删除一个点、线、面实体,移动、旋转一个点、线、面实体。1)删除和增加一个顶点删除顶点,在数据库中不用整体删除与目标有关的数据,只是在原来存储的位置重写一次坐标,拓扑关系不变。增加顶点,则操作和处理都要复杂。不能在原来的存储位置上重写,需要给一个新的目标标识号,在新位置上重写,而将原来的目标删除,此时需要做一系列处理,调整空间拓扑关系。2)移动一个顶点33移动顶点只涉及某个点的坐标,不涉及拓扑关系的维护,较简单。3)删除一段弧段复杂,先要把原来的弧段打断,存储上原来的弧段实际被删除,拓扑关系需要调整和变化.3、数据检查与清理数据检查指拓扑关系的检查,结点是否匹配,是否存在悬挂弧段,多边形是否封闭,是否有假结点。要求系统能将有错误或不正确的拓扑关系的点、线和面用不同的颜色和符号表示出来,以便于人工检查和修改。数据清理则是用自动的方法清除空间数据的错误.例如给定一个结点吻合的容差使该容差范围内的结点自动吻合在一起,并建立拓扑关系。给定悬挂弧段容差,将小于该容差的短弧自动删除。在Arc/info中用DataClean命令,在Geostar中选择整体结点匹配菜单。4、撤消与恢复编辑Undo,Redo功能是必要的。但功能的实现是困难的。当撤消编辑,即恢复目标,要恢复目标的标识和坐标、拓扑关系。这一处理过程相当复杂.因此,有些GIS不在图形编辑时实时建立和维护拓扑关系,如Arc/Info等,而在图形编辑之后,发Clean或Build命令重新建立拓扑关系。这样,在每次进行任何一次编辑,都要重新Clean或Build,对用户不便。二、关键算法1、点的捕捉设光标点为S(x,y),某一点状要素的坐标为A(X,Y)可设一捕捉半径D(通常为3~5个象素,这主要由屏幕的分辩率和屏幕的尺寸决定)。若S和A的距离d小于D则认为捕捉成功,即认为找到的点是A,否则失败,继续搜索其它点。乘方运算影响了搜索的速度,因此,把距离d的计算改为:捕捉范围由圆改为矩形,这可大大加快搜索速度。2、线的捕捉设光标点坐标为S(x,y),D为捕捉半径,线的坐标为(x1,y1),(x2,y2),…(xn,yn)。通过计算S到该线的每个直线段的距离d。.若min(d1,d2,…dn-1)<D,则认为光标S捕捉到了该条线,否则为未捕捉到。加快线捕捉的速度的方法:341)在实际的捕捉中,可每计算一个距离di就进行一次比较,若di<D,则捕捉成功,不需再进行下面直线段到点S的距离计算了。2)把不可能被光标捕捉到的线,用简单算法去除。3)对于线段也采用类似的方法处理。4)简化距离公式:点S(x,y)到直线段(x1,y1),(x2,y2)的距离d的计算公式为:简化为:3、面的捕捉实际上就是判断光标点S(x,y)是否在多边形内,若在多边形内则说明捕捉到。判断点是否在多边形内的算法主要有垂线法或转角法。垂线法的基本思想是从光标点引垂线(实际上可以是任意方向的射线),计算与多边形的交点个数。若交点个数为奇数则说明该点在多边形内;若交点个数为偶数,则该点在多边形外。加快速度的方法:1)找出该多边形的外接矩形,若光标点落在该矩形中,才有可能捕捉到该面,否则放弃对该多边形的进一步计算和判断。2)对不可能有交点的线段应通过简单的坐标比较迅速去除。3)运用计算交点的技巧。4、图形编辑的数据组织—空间索引为加速检索,需要分层建索引,主要方法有格网索引和四叉树索引。1)格网索引a、每个要素在一个或多个网格中b、每个网格可含多个要素c、要素不真正被网格分割,35空间索引:格网号(Peano或Morton)对象索引:相反空间对象2)四叉树索引线性四叉树和层次四叉树都可以用来进行空间索引。A、线性四叉树,先采用Morton或Peano码,再根据空间对象覆盖的范围进行四叉树分割。B、层次四叉树,需要记录中间结点和父结点与子结点之间的指针,若某个地物覆盖了哪个中间结点,还要记录该空间对象的标识。建立了索引文件后的图形编辑,不仅要修改原始的空间数据,而且要修改相关的索引文件。§5-3拓扑关系的自动建立一、点线拓扑关系的自动建立1、在图形采集和编辑中实时建立弧段-结点表Oid起结点终结点a1a2N1N2N2N3结点-弧段表Oid弧段号N1N2N3a1a1,a2a22、在图形采集和编辑之后自动建立,其基本原理与前类似。二、多边形拓扑关系自动建立1、链的组织1)找出在链的中间相交的情况,自动切成新链;2)把链按一定顺序存储,并把链按顺序编号。2、结点匹配1)把一定限差内的链的端点作为一个结点,其坐标值取多个端点的平均值。2)对结点顺序编号。3、检查多边形是否闭合通过判断一条链的端点是否有与之匹配的端点来进行.多边形不闭合的原因:1)由于结点匹配限差的问题,造成应匹配的端点未匹配;2)由于数字化误差较大,或数字化错误,这些可以通过图形编辑或重新确定匹配限差来确定。3)还可能这条链本身就是悬挂链,不需参加多边形拓扑,这种情况下可以作一标记,使之不参加下一阶段拓扑建立多边形的工作。4、建立多边形361)概念a、顺时针方向构多边形:指多边形是在链的右侧。b、最靠右边的链:指从链的一个端点出发,在这条链的方向上最右边的第一条链,a的最右边的链为dc、多边形面积的计算当多边形由顺时针方向构成时,面积为正;反之,面积为负。2)建立多边形的基本过程1°顺序取一个结点为起始结点,取完为止;取过该结点的任一条链作为起始链。2°取这条链的另一结点,找这个结点上,靠这条链最右边的链,作为下一条链。3°是否回到起点:是,已形成一多边形,记录之,并转4°;否,转2°。4°取起始点上开始的,刚才所形成多边形的最后一条边作为新的起始链,转2°;若这条链已用过两次,即已成为两个多边形的边,则转1°。例:1°从P1开始,起始链定为P1P2,从P2点算起,P1P2最右边的链为P2P5;从P5算起,P2P5最右边的链为P5P1,...形成的多边形为P1P2P5P1。2°从P1开始,以P1P5为起始链,形成的多边形为P1P5P4P1。3°从P1开始,以P1P4为起始链,形成的多边形为P1P4P3P2P1。4°这时P1为结点的所有链均被使用了两次,因而转向下一个结点P2,继续进行多边形追踪,直至所有的结点取完。共可追踪出五个多边形,即A1、A2、A3、A4、A5。5、岛的判断找出多边形互相包含的情况.1°、计算所有多边形的面积。2°、分别对面积为正的多边形和面积为负的多边形排序。3°、从面积为正的多边形中,顺序取每个多边形,取完为止。若负面积多边形个数为0,则结束。4°、找出该多边形所包含的所有面积为负的多边形,并把这些面积为负的多边形加入到包含它们的多边形中,转3°。正面积多边形包含的负面积多边形是关键.1°、找出所有比该正面积多边形面积小的负面积多边形。2°、用外接矩形法去掉不可能包含的多边形。即负面积多边形的外接矩形不和该正面积多边形的外接矩37形相交或被包含时,则不可能为该正面积多边形包含。3°、取负面积多边形上的一点,看是否在正面积多边形内,若在内,则被包含;若在外,则不被包含。6、确定多边形的属性多边形以内点标识。内点与多边形匹配后,内点的属性常赋于多边形.§5-4图形的裁剪、合并和图幅接边一、图形的裁剪--开窗处理1、方式:正窗:提取窗口内的数据。开负窗:提取窗口外的数据子集。矩形窗和多边形窗。2、算法:包括点、线、面的窗口裁剪---计算机图形学(矢量、编码、中点分割裁剪法)。而不规则多边形开窗------相当于多边形叠置处理。二、图形合并---数据文件合并一幅图内的多层数据合并在一起;或将相邻的多幅图的同一层数据合并.涉及到空间拓扑关系的重建。对于多边形,由于同一个目标在两幅图内已形成的多边形,合并时,需去除公共边界,属性合并,具体算法,删去共同线段。实际处理过程是先删除两个多边形,解除空间关系后,删除公共边,再重建拓扑。三、图幅接边—形成无缝数据库几何裂缝:指由数据文件边界分开的一个地物的两部分不能精确地衔接。--几何接边逻辑裂缝:同一地物地物编码不同或具有不同的属性信息,如公路的宽度,等高线高程等。---逻辑接边1、识别或提取相邻图幅。--要求图幅编号合理2、几何接边直接移动,突变回缩2-3个点减少突变3、逻辑接边1)检查同一地物在相邻图幅的地物编码和属性值是否一致,不一致,进行人工编辑。2)将同一地物在相邻图幅的空间数据在逻辑上连在一起。a、索引文件,建立双向指针。b、关键字,空间操作的方法。§5-6数据压缩与光滑一、数据压缩矢量数据压缩栅格数据压缩38数据压缩↓↑光滑二、曲线光滑(拟合)是假象曲线为一组离散点,寻找形式较简单、性能良好的曲线解析式。插值方式:曲线通过给定的离散点。如拉格朗日插值,三次样条曲线逼近方式:曲线尽量逼近给定离散点。如贝塞尔和B样条曲线。§5-7空间数据格式转换一、矢量向栅格转换点:简单的坐标变换线:线的栅格化面:线的栅格化+面填充面(多边形)的填充方法1、内部点扩散法(种子扩散法)2、扫描法3、射线法4、复数积分法3、边界代数算法二、栅格向矢量转换从栅格单元转换为几何图形的过程为矢量化;(一)要求(矢量化过程应保持):1)栅->矢转换为拓扑转换,即保持实体原有的连通性、邻接性等;2)转换实体保持正确的外形。(二)方法方法一,实际应用中大多数采用人工矢量化法,如扫描矢量化,该法工作量大,成为GIS数据输入、更新的瓶颈问题之一。方法二,程序转化转换(全自动或半自动)第六章空间分析地理空间本身的特征、空间决策过程和复杂空间系统的时空演化过程分析空间分析是对分析空间数据有关技术的统称。根据作用的数据性质不同,可以分为:39基于空间图形数据的分析运算;基于非空间属性的数据运算;空间和非空间数据的联合运算。空间分析赖以进行的基础是地理空间数据库,其运用的手段包括各种几何的逻辑运算、数理统计分析,代数运算等数学手段,最终的目的是解决人们所涉及到地理空间的实际问题,提取和传输地理空间信息,特别是隐含信息,以辅助决策数据的空间分析是直接从空间物体的空间位置、联系等方面研究空间事物,以期对空间事物作出定量描述。从信息提取的角度来看,这类分析并不是严格意义是的空间分析,而是一种描述和说明,是特征的提取和参数的计算数据的空间分析需要复杂的数学工具空间分析的定义(1)空间分析是基于地理对象的空间布局的地理数据分析技术将空间分析分为三个部分:统计分析、地图分析和数学模型。(2)空间查询和空间分析是从GIS目标之间的空间关系中获取派生的信息和新的知识(3)空间分析是基于地理对象的位置和形态特征的空间数据分析技术,其目的在于提取和传输空间信息该定义侧重于空间信息的提取和空间信息传输(4)空间分析是指为制定规划和决策,应用逻辑或数学模型分析空间数据或空间观测该定义从决策支持的角度出发(5)空间分析是在对地理空间中的目标进行形态结构定义与分类的基础上,对目标的空间关系和空间行为进行描述,为目标的空间查询和空间相关分析提供参考,进一步为空间决策支持提供服务的功能体系模型是面向应用空间分析是工具型GIS的核心和必备的功能,而应用模型则是应用型GIS的核心。空间分析与GIS结合意义空间分析的应用范围十分广泛,各种具有空间属性的空间对象都可通过空间分析揭示其空间分布特征。一般来讲,GIS侧重于图形显示和数据库管理,即描述空间对象及其属性的相互关系,而空间分析侧生于数值计算,即应用空间分析模型进行有关空间自相关、空间结构特征、空间插值、空间模拟等方面的计算。为GIS增加空间分析模块可以使GIS具有更强的空间数据的分析能力,使GIS更加完整,功能更强大空间查询主要有两类:40第一类是按属性信息的要求来查询定位空间位置,称为“属性查图形”。第二类是根据对象的空间位置查询有关属性信息,称为“图形查属性”。空间量算几何量算形状量算质心量算距离量算长度面积缓冲区分析邻近度(Proximity)描述了地理空间中两个地物距离相近的程度,其确定是空间分析的一个重要手段。缓冲区分析是解决邻近度问题的空间分析工具之一当轴线的弯曲空间不容许双线的边线无压盖地通过时,就会产生若干个自相交多边形自相交多边形分为两种情况:岛屿多边形和重叠多边形叠加分析GIS叠加分析可以分为以下几类:视觉信息叠加、点与多边形叠加、线与多边形叠加、多边形叠加、栅格图层叠加网络分析主要目的地理网络(如交通网络)、城市基础设施网络(如各种网线、电力线、电话线、供排水管线等)进行地理分析和模型化根本目的研究、筹划一项网络工程如何安排,并使其运行效果最好网络数据结构链(Link)网络中流动的管线,如街道、河流、水管等,其状态属性包括阻力和需求。结点(Node)网络中链的结点,如港口、车站、电站等,其状态属性包括阻力和需求等。结点中又有下面几种特殊的类型。障碍(Barrier),禁止网络中链上流动的点。拐点(Turn),出现在网络链中的分割结点上,状态属性有阻力,如拐弯的时间和中心(Center),是接受或分配资源的位置,如水库、商业中心、电站等站点(Stop),在路径选择中资源增减的结点最短路径分析在最短路径选择中,两点之间的距离可以定义为实际的距离,也可定义为两点间的时间、运费、流量等,可定义为使用这条边所需付出的代价。因此,可以对不同的专题内容进行最短路径分析资源分配资源分配网络模型由中心点(分配中心或收集中心)及其属性和网络组成。分配有两种形式,一种是由分配中心向四周分配,另一种是由四周向收集中心分配。空间插值的概念和理论空间插值的理论假设是空间位置上越靠近的点,越可能具有相似的特征值;而距离越远的41点,其特征值相似的可能性越小空间插值常用于将离散点的测量数据转换为连续的数据曲面,以便与其它空间现象的分布模式进行比较,它包括了空间内插和外推两种算法在以下几种情况下必须作空间插值:现有的离散曲面的分辨率,象元大小或方向与所要求的不符,需要重新插值现有的连续曲面的数据模型与所需的数据模型不符,需要重新插值。栅格TIN现有的数据不能完全覆盖所要求的区域范围,需要插值。如将离散的采样点数据内插为连续的数据表面。采样点的空间位置对空间插值的结果影响很大,理想的情况是在研究区内均匀布点然而当区域景观大量存在有规律的空间分布模式时,如有规律间隔的数或沟渠,用完全规则的采样网络则显然会得到片面的结果,正是这个原因,统计学家希望通过一些随机的采样来计算无偏的均值和方差但是完全随机的采样同样存在缺陷,首先随机的采样点的分布位置是不相关的,而规则采样点的分布则只需要一个起点位置,方向和固定大小的间隔,尤其是在复杂的山地和林地里比较容易。其次完全随机采样,会导致采样点的分布不均,一些点的数据密集,另一些点的数据缺少空间插值:内插:在已观测点的区域内估算未观测点的数据的过程;外推:在已观测点的区域外估算未观测点的数据的过程.—--预测。一、边界内插首先假定任何重要的变化都发生在区域的边界上,边界内的变化则是均匀的、同质的。边界内插的方法之一是泰森多边形法。泰森多边形法的基本原理是,未知点的最佳值由最邻近的观测值产生。趋势面分析是一种多项式回归分析技术。多项式回归的基本思想是用多项式表示线或面,按最小二乘法原理对数据点进行拟合,拟合时假定数据点的空间坐标X、Y为变量,而表示特征值的Z坐标为因变量。1、当数据为一维时,1)线性回归:2、数据是二维的42二元二次或高次多项式局部内插利用局部范围内的已知采样点的数据内插出未知点的数据。空间统计分类分析1主成份分析2系统聚类分析3判别分析第七章GIS可视化与制图地图及其设计目标地图目标共享信息突出关系验证分析结果设计目标突出地图特点履行既定目标地图的类型普通地图提供位置信息多种要素以及用户专题地图属性信息的分发单一属性或关系不同的目的,不同的地图设计地图设计理论颜色,阴影类型,文本显示颜色和符号的感知几何要素和文本易于理解可视化的对比度和层次感视平衡在ArcMap里创建地图在Layoutview设计在数据框架中组织图层地图元素(Mapelements)被增加到虚拟页面地图以MXD文件存储数据位置图层属性43确定地图设计元素题目;指北针;地图主体;图例;比例尺;其他文本信息插入地图设计要素增加指北针和比例尺增加参照系在地图上显示相对位置可用的参照系统:不同的格子线或网格类型可显示在一张地图中插入文本信息标题和作者数据元,日期,投影方式等地图日期和数据生产日期制作感言等布局工具缩放和平移布局页面额外的布局设置在Tools>Options中格网和标尺决定地图元素的大小用向导管理元素(elements)用网格为地图中的要素定位可以使用捕捉工具精确高效设定网格创建并使用地图模版打印和绘制地图导出地图第八章GIS发展热点与未来趋势1、面向对象技术与GIS的结合2、GIS与GPS、RS的进一步集成,3、真三维GIS和时空GIS4、GIS应用模型的发展5、Internet与GIS的结合(WebGIS,组件GIS,OpenGIS)§8-13S集成44§8-2GIS与RS结合一、GIS与遥感结合的必要性1、遥感是GIS重要的数据源,有效的数据更新手段2、GIS可为遥感分析提供有用的辅助信息和手段二、GIS与遥感结合的途径(a)发展一个能综合处理矢量和栅格数据的矢栅一体的GIS(b)通过国际标准的空间数据交换格式作中间媒介、相互转换(c)通过GIS与遥感系统间建立接口,实现格式转换与数据传送§8-3GIS与GPS结合GIS与GPS结合的形式1.单台移动式2.集中监控式1)控制中心,由大屏幕计算机、无线电台、通讯适配器、电源和天线系统组成,并配备GIS。2)基站,由电台、通讯适配器、电源和天线系统组成。3)移动站(即车载系统),由电台、天线、通讯适配器和GPS接收机组成。§8-4WebGISWeb原理Web结构为浏览器/服务器,其原理就是用浏览器下载服务器管理的文件并显示出来。浏览器通过统一资源定位符URL来访问服务器并请求取得文档.WebGIS是建立在Web技术上的一种特殊环境下的地理信息系统,利用Web技术来扩展和完整GIS的一项新技术。WebGIS的应用分为:1)空间数据发布,2)空间查询检索3)空间模型服务,4)Web资源组织WebGIS其本质与一般的地理信息系统没有区别,具有数据采集、存储、处理、分析、和输出等基本功能,只是运行环境不同。3、WebGIS与一般GIS相比特点1)基于C/S模式2)信息传输是全球性的3)是一分布式系统,用户、服务器可分布在不同地点和计算机平台上。GIS的未来趋势-智能化GIS它将地理知识划分为五个主要元素:1地图和全球可视化2地理数据集3空间处理和工作流模型4数据模型5元数据分布式GIS1、分布式系统和C/S模型451)分布式系统(DistributedSystem)定义:一组计算机的集合,但从用户的角度来看,如同一台计算机。2)C/S模型(Client/Server,客户机/服务器)是一种分布式系统,C/S模型基于简单的请求/应答协议,即客户端向服务器提出信息处理的请求,服务器针对请求完成处理,并将结果作为响应返回客户端。2、GIS与分布式由于GIS固有特点,使得运行于网络上的分布式系统特别适合于构造较大规模的GIS应用,其表现为:1)数据的分布2)应用功能的分布3)外设共享4)并行计算46
因篇幅问题不能全部显示,请点此查看更多更全内容
Copyright © 2019- huatuo7.cn 版权所有 湘ICP备2022005869号-9
违法及侵权请联系:TEL:199 18 7713 E-MAIL:2724546146@qq.com
本站由北京市万商天勤律师事务所王兴未律师提供法律服务