GISer必备数据格式清单

技术文章4年前 (2021-05-13)2741

你知道GIS数据有哪些类型吗?

GISer的职业生涯中,都会遇到各种各样的数据。本期,小编将会为大家详细介绍GIS中常用的各种数据格式。请毫不犹豫的分享和收藏吧,万一派上用场了呢!

Part One 矢量数据

矢量数据(Vector Data)是用X、Y、Z坐标表示地图图形或地理实体位置的数据。矢量数据一般通过记录坐标的方式来尽可能将地理实体的空间位置表现的准确无误。常见的矢量数据有:点、线、面等格式。

SHP (Shapefile)

Shapefile是目前最常见的一种矢量数据格式。作为行业标准,几乎所有的商业和开源GIS软件都支持Shapefile。

一个Shapefile数据最少包括三个文件:

主文件(*.shp)——存储地理要素的几何图形的文件。

索引文件(*.shx)——存储图形要素与属性信息索引的文件。

dBASE表文件(*.dbf)——存储要素信息属性的dBase表文件。

除此之外还有可选的文件,包括:

空间参考文件(*.prj)、几何体的空间索引文件(*.sbn 和 *.sbx)、只读的Shapefiles的几何体的空间索引文件(*.fbn 和*.fbx)等等。


KMZ/KML (Keyhole Markup Language)

KML是标记语言(Keyhole Markup Language)的缩写,最初由Keyhole公司开发,是一种基于XML 语法与格式的、用于描述和保存地理信息(如点、线、图像、多边形和模型等)的编码规范。KMZ是一个经过ZIP格式压缩过的KML文件,其文件自身可以包含图标,影像和模型等。KMZ/KML可以被 Google Earth、Google Map和ArcGIS Earth等识别并显示。

FileGDB(File Geodatabase)

FileGDB是由Esri创建的一种采用标准关系数据库技术来表现地理信息的数据模型。其具有结构和性能上的优势:快速的性能、多样的数据关系、兼容存储栅格数据、优化空间索引以及数据压缩等。


GeoJSON

GeoJSON是一种对各种地理数据结构进行编码的格式;它是基于Javascript对象表示法的地理空间信息数据交换格式。GeoJSON对象可以表示几何、特征或者特征集合。GeoJSON支持下面几何类型:点、线、面、多点、多线、多面和几何集合。GeoJSON里的特征包含一个几何对象和其他属性,特征集合表示一系列特征。

一个完整的GeoJSON数据结构总是一个(JSON术语里的)对象。在GeoJSON里,对象由名/值对——也称作成员的集合组成。对每个成员来说,名字总是字符串。成员的值要么是字符串、数字、对象、数组,要么是下面文本常量中的一个:"true","false"和"null"。数组是由值是上面所说的元素组成。


AutoCAD(.DXF)

DXF 是AutoCAD与其它软件之间进行CAD数据交换的开放矢量数据文件格式,可以分为两类:ASCII格式和二进制格式;ASCII具有可读性好的特点,但占用的空间较大;二进制格式则占用的空间小、读取速度快。由于AutoCAD现在是最流行的CAD系统,DXF也被广泛使用,成为事实上的标准。绝大多数CAD系统都能读入或输出DXF文件。

ArcInfo Coverage

ArcInfo Coverage是较旧的一种地理空间数据格式。它没有扩展名,只是一组文件夹。Coverage使用要素类来存储点、弧、多边形或注释。Tic是地理控制点,有助于确定覆盖范围。


E00 ArcInfo Interchange

后缀为E00的文件是Esri的一种通用交换格式文件。这种文件通过明码的方式表达了

Arc/Info中几乎所有的矢量格式以及属性信息,广泛应用于与其他软件之间进行数据交换。


Part 2 栅格数据


栅格数据就是将空间分割成有规律的网格,每一个网格称为一个单元(像素),并在各单元上赋予相应的属性值来表示实体的一种数据形式。

Esri Grid

如果要将属性数据添加到栅格文件中,那么Esri网格格式是您的最佳选择。但是,你只能将属性添加到整数网格。属性存储在值属性表(VAT)中 ——网格中每个网格单元对应唯一一个属性记录,count值表示单元格的数量。

Esri网格文件的两种类型是整数和浮点网格。土地覆盖物将是离散网格的一个例子。每个类都有一个唯一的整数单元格值。高程数据是浮点网格的示例。每个单元格表示海拔浮动值。


GeoTIFF (Geographic Tagged Image File Format)

GeoTIFF已经成为GIS和卫星遥感应用的行业图像标准文件。几乎所有的GIS和图像处理软件包都具有GeoTIFF兼容性。GeoTIFF包含的其他文件有: TFW(渲染栅格地理位置所需的文件)、XML(可选,元数据文件)、 AUX(输出辅助文件,存储投影等信息)。

Erdas Imagine(.img)

Erdas Imagine是美国ERDAS 公司开发的遥感图像处理系统(ERDAS IMAGINE)使用的遥感影像格式。这种格式广泛应用于遥感数据处理,因为它提供了一个用于整合来自多源传感器数据的框架。该框架支持地理参考、地理编码元数据、多波段、不同数据类型的数据的存储,同时该格式基于瓦片的方式进行数据的存取,这样加快了数据显示和重采样的速度。


ENVI(ENVI .hdr Labelled Raster)

ENVI使用的是通用栅格数据格式,包含一个简单的二进制文件( a simple flat binary )和一个相关的ASCII(文本)的头文件。这也保证了单个ENVI栅格文件没有大小上限。ENVI栅格文件必须包含这两个文件,其中头文件的后缀名为.hdr,数据文件的后缀随意,甚至可以不带后缀名。这两个文件是通过文件名来关联,即数据文件和头文件名称一致。

PCIDSK(PCI Geomatics Database File)

PCIDSK(.pix)是由加拿大PCI公司PCI Geomatics软件开发的地球观测数据格式,该格式使用512KB的块结构设计来保证以最小的磁盘和操作系统级别的开销来完成对图像各个部分的读写。地面控制点信息(GCP)以及投影信息可以以光栅几何参数的形式进行存储。

JPEG 2000 (Joint Photographic Experts Group)

JPEG 2000通常以JP2为文件扩展名。它们是经过压缩的文件,最新的JPG格式可以选择有损或无损压缩。JPEG 2000 GIS格式需要一个提供光栅地理定位的文件。因为有损压缩,JPEG 2000是背景图像的最佳选择,它可以实现与MrSID格式相似的20:1的压缩比。

MrSID (Multiresolution Seamless Image Database)

LizardTech专有的MrSID格式通常用于需要压缩的正射影像。 MrSID图像文件以SID为后缀,并附有一个带有文件扩展名为SDW的坐标文件。MrSIDs具有令人印象深刻的压缩比,彩色图像可以以超过20:1的比例进行压缩。

ECW (Enhanced Commission Wavelet)

ECW格式文件通常用于卫星图像的压缩。这种GIS文件类型具有较高的压缩比,同时仍保持图像中的质量对比度。 ECW格式由ER Mapper开发,但现在由Hexagon Geospatial拥有。

HDF (Hierarchical Data Format)

HDF格式是一种不必转换格式就可以在不同平台间传递的数据格式,由美国国家高级计算应用中心(NCSA)研制,已经应用于MODIS、MISR等数据中。当前流行的版本是HDF5。HDF有6种主要数据类型:栅格图像数据、调色板(图像色谱)、科学数据集、HDF注释(信息说明数据)、Vdata(数据表)、Vgroup(相关数据组合)。HDF采用分层式数据管理结构,并可以直接从嵌套的文件中获得各种信息。因此,打开一个HDF文件,在读取图像数据的同时可以方便的查取到其地理定位、轨道参数、图像属性、图像噪声等各种信息参数。

LERC(Limited Error Raster Compression)

LERC是由ESRI开发的一个开源删格数据格式,支持任何像素类型数据(不仅仅是RGB或Byte)的快速编码和解码。用户在编码时设置每个像素的最大压缩误差,因此在得到最大压缩比的同时保留了原始图像的精度(在用户定义的精度范围内)。这种数据格式被广泛应用于ESRI的高程文件或服务中。

Part 3 切片地图


受服务器处理能力与网络传输带宽等因素的影响,切片格式的地图越来越流行,切片地图是一种多分辨率层次的金字塔模型,从切片金字塔的底层到顶层,分辨率越来越低,但表示的地理范围不变。

Esri Vector Tile Package(.vtpk)

Esri的矢量切片(Vector Tile Package)以vtpk为文件后缀,利用协议缓冲(Protocol Buffers)技术的紧凑的二进制格式来传递信息。当渲染地图时矢量切片使用一系列储存的内部数据进行制图。被组织到矢量切片的图层(比如道路、水、区域),都有包含几何图形和可变属性的独立要素(例如姓名、类型等等)。通俗的说,就是将矢量数据以建立金字塔的方式,像栅格切片那样分割成一个一个描述性文件,然后在前端根据显示需要按需请求不同的矢量瓦片数据进行显示。

Esri Tile Package(.tpk)

TPK是ArcGIS10.1推出的一种数据文件类型,主要是用于将切片文件打包形成离线地图包,TPK可以在ArcGIS Runtime或者ArcGIS for Android/iOS中作为切片底图被加载。

Esri Scene Layer Package(.slpk)

SLPK(Scene Layer Package)是一个将符合I3S(Indexed 3D Scene,ESRI 为3D数据推出的支持Web、移动和云端的数据标准)规范的节点信息和资源打包到一起的一个压缩包文件。目前主要支持:3D模型、集成格网、点以及点云数据。


OGC GeoPackage

GeoPackage是一种开放的、基于OGC标准的、独立于平台的、便携式的用于传输地理空间信息的压缩格式。GeoPackage统一规范在SQLite数据库中存储以下内容:矢量数据、不同比例尺的影像切片、扩展文件等。

MBTiles

MBTiles 是由MapBox公司主导的一种地图切片存储的数据规范,它使用SQLite数据库,可大大提高海量地图切片的读取速度,比通过切片文件方式的读取要快很多,适用于Android、IPhone等智能手机的离线地图存储。

MapBox Vector Tile(.mvt)

MapBox 矢量切片通过Google Protocol Buffers(一种兼容多语言、多平台、易扩展的数据序列化格式)进行编码,这种格式应用于客户端或服务端高效渲染或查询要素信息。使用.mvt文件为后缀。

小结

由于GIS数据格式种类繁多,仅GDAL库支持的矢量删格数据格式就多达上百种,小编在此也仅是汇总了一些比较常用或比较新的数据格式方便大家查阅,对于空间数据库和数据服务未能覆盖,后续有机会会再进行详细地梳理。如果各位读者也了解一些未列入的常用数据格式,欢迎补充。

References:

[1] The Ultimate List of GIS Formats - Geospatial File Extensions - GIS Geography

[2] OGR Vector Formats

[3] GDAL Raster Formats

[4] ArcGIS for Developers

[5] Mapbox


相关文章

[转载]ArcGIS制图技巧

[转载]ArcGIS制图技巧

  1  引言 1.1  制图的目的 随着GIS在各行各业的深入应用,各信息化部门和...

shapefile与字符集编码设置

shapefile与字符集编码设置

在 ArcGIS Desktop (ArcMap, ArcCatalog, and ArcToolbox) 中,有编码页转换功能(CODE PAGE CONVERSION),可以读写多种字符编码的 s...

ArcGIS地图通用线符号的制作

ArcGIS地图通用线符号的制作

ArcGIS地图中有一些线性数据,如交通网络,应用的领域非常广泛,其符号表达已逐渐被大众所认识和熟知。这类线符号的制作,虽没达到约定俗成的程度,但已具有一定的通用性,值得制图员去学习和掌握。所以本文将...

ArcGIS地质填充符号的制作

ArcGIS地质填充符号的制作

地质制图中,面符号的制作复杂度最高,存在规则和不规则的样式,通常由底色和图案组成,表示岩性和年代,是极具代表性的符号种类。ArcGIS提供了3种实现地质面符号的方法:基于矢量、基于图片和基于制图表达技...

shapefile 输出的地理处理注意事项

shapefile 输出的地理处理注意事项

多年以来,Esri 研发了三种用于存储地理信息的主要数据格式:coverage、shapefile 以及地理数据库。其中,Shapefile 为存储地理及属性信息提供了一种简单的格式。正由于...

ARCGIS如何查看自己的地图单位?

ARCGIS如何查看自己的地图单位?

不同坐标系的数据底图单位是不一致的,地图单位的查看是通过查看数据的坐标系中的线性单位。具体可以在内容列表中通过双击数据打开数据的图层属性——源,进行查看。...