shapefile与字符集编码设置

技术文章5年前 (2020-04-15)3281

在 ArcGIS Desktop (ArcMap, ArcCatalog, and ArcToolbox) 中,有编码页转换功能(CODE PAGE CONVERSION),可以读写多种字符编码的 shapefile 和 dBASE 表。在系统注册表中,编码页转换功能(CODE PAGE CONVERSION)命名为 'dbfDefault',可以修改这个值。

在 ArcGIS 10.2.1 之前,可以通过下面的方法来设置编码行为:
在 shapefile (.DBF) 的头文件中包含了引用的编码页,用来与用户的区域设置一致。例如,如果用户使用了日本的区域设置,那编码页是'Shft-JIS'。
在 ArcGIS 10.2.1 版本,shapefile (.DBF) 的编码页的默认设置为 UTF-8 (UNICODE) 。

ArcGIS Desktop 10.2.1 和 10.2.2 出补丁了,可以打上,如下类似的方法去修改:
10.2.1: http://support.esri.com/en/dow ... /2090
10.2.2: http://support.esri.com/en/dow ... /2089

'dbfDefault' 的作用

使用 ArcGIS for Desktop 打开 dBase 表文件时,程序先去读头文件中的 Language Driver ID (LDID) 或者是同名 *.CPG文件。前面二者都是用来在读文件之前,决定用什么编码类型来正确读出文件。如果有必要, ArcGIS for Desktop 会进行编码转换来显示字符串。

如果文件缺失 LDID 或者 .CPG 文件,编码就会被假定为 Windows (ANSI/Multi-byte)。也是因为这个原因,如果文件是 OEM 编码的,并且没有写入 LDID 或者 .CPG,字符就会出现乱码。 也就说 ArcGIS 把 OEM 文件当成 ANSI 文件来处理了。
多数情况下, shapefiles 和 dBASE 文件都会存储编码页信息。 但是有些程序的OEM文件没有包含编码页信息,例如 Microsoft Access 2000 and Excel 2000,所以这些文件读取时,就会乱码。为了避免这个问题,用户可以给没有编码页信息的文件设置dbfDefault 。

  • 写: 在注册表中设置 'dbfDefault' ,可以决定导出的 shapefile 和 dBASE 的编码类型。例如,把 'dbfDefault' 设置为 OEM ,那么用 ArcMap, ArcCatalog, ArcToolbox 生成出来的 shapefile 和 dBASE 文件就是以 OEM编码的,设置成 ANSI ,那 shapefile 和 dBASE 文件就是 ANSI 编码的。

  • 读: 读 shapefile 和 dBASE 文件的逻辑与写是相同的,如果缺失编码信息,ArcGIS 读取文件的编码类型由 dbfDefault 决定。


不适用'dbfDefault' 的情况:

'dbfDefault' 这项设置仅对 ArcGIS Desktop 生效,对于一些很老版本的ArcGIS 产品不适用;仅对 shapefile 生效,Personal GDB等不生效。

  • 无视 'dbfDefault' 设置的包括:

In ArcInfo Workstation,
? ARCSHAPE with &CODEPAGE OEM creates a shapefile in OEM
? ARCSHAPE with &CODEPAGE ANSI creates a shapefile in ANSI
? INFODBASE with &CODEPAGE OEM creates a dBASE file in OEM
? INFODBASE with &CODEPAGE ANSI creates a dBASE file in ANSI
In ArcView 3.x,
? Shapefile and dBASE files are saved in the ANSI code page.
In ArcGIS for Desktop (regardless of the dbfDefault setting),
? Personal geodatabases are saved in Unicode
? Personal geodatabase tables are saved in Unicode
? Coverages are saved in the ISO code page
? INFO files are saved in the ISO code page
? Interchange files are saved in the ANSI code page
? Text files are saved in the ANSI code page


'dbfDefault' 设置方法
1.开始--运行,输入”Regedit“,打开注册表。
2.如是用的是 10.x 版本 ArcGIS Desktop,定位到” My Computer\HKEY_CURRENT_USER\Software\ESRI\Desktop 10.x' (如果是9.3.1之前的版本,定位到 'My Computer\HKEY_CURRENT_USER\Software\ESRI')。
3.创建项 'Common',接着创建 'CodePage'项,添加 ‘字符串’,名称: dbfDefault,健值:oem(或者UTF-8)。

如下为支持的编码值:

OEM Code Page Values:
OEM, 437, 708, 720, 737, 775, 850, 852, 855, 857, 860, 861, 862, 863, 864, 865, 866, 869, 932, 936, 950

ANSI Code Page Values:
ANSI, 1250, 1251, 1252, 1253, 1254, 1255, 1256, 1257, 1258, Big5, SJIS

ISO Code Page Values:
ISO, 88591, 88592, 88593, 88594, 88595, 88596, 88597, 88598, 88599, 885910, 885913, 885915, EUC

Unicode Values:
UTF-8

现在,Shapefiles 可以以 UTF-8 存储,但是,只有在 ArcGIS Desktop 中才能被识别。

ArcGIS Desktop 10.2.X 后 shapefile 字符集编码设置
ArcGIS Desktop 10.2.1 的编码默认还只是 UTF-8 ,不支持像早期版本一样可以i自定义设置,现在出了补丁,可以支持用户配置。

在 ArcGIS 10.2.1 之前的版本,创建 shapefile 的时候,其编码类型是由操作系统的语言区域设置(language locale)决定的。 而从 ArcGIS Desktop 10.2.1 版本以及之后的版本,产生的shapefile都是 UTF-8 编码的。Esri的这项改动就导致了一些问题的出现,主要就是多字符编码相关的,对于我们来说,就是中文字符的编码。

因此,如果希望更改 ArcGIS 默认的 shapefile 的编码类型,就需要按照版本安装如下补丁了:
10.2.1: http://support.esri.com/en/dow ... /2090
10.2.2: http://support.esri.com/en/dow ... /2089

相关文章

ArcGIS地图通用线符号的制作

ArcGIS地图通用线符号的制作

ArcGIS地图中有一些线性数据,如交通网络,应用的领域非常广泛,其符号表达已逐渐被大众所认识和熟知。这类线符号的制作,虽没达到约定俗成的程度,但已具有一定的通用性,值得制图员去学习和掌握。所以本文将...

ArcGIS地质填充符号的制作

ArcGIS地质填充符号的制作

地质制图中,面符号的制作复杂度最高,存在规则和不规则的样式,通常由底色和图案组成,表示岩性和年代,是极具代表性的符号种类。ArcGIS提供了3种实现地质面符号的方法:基于矢量、基于图片和基于制图表达技...

ArcGIS地图符号制作教程

ArcGIS地图符号制作教程

什么是地图符号?地图符号是地图的语言,它以图形的方式描述地图中地理要素、标注、注记的形状、大小、位置、数量和质量特征。地图的符号的作用是什么?地图主要依据符号的形状、尺寸和色彩来反映地图内容。图形形状...

ARCGIS如何查看自己的地图单位?

ARCGIS如何查看自己的地图单位?

不同坐标系的数据底图单位是不一致的,地图单位的查看是通过查看数据的坐标系中的线性单位。具体可以在内容列表中通过双击数据打开数据的图层属性——源,进行查看。...

ArcGIS地图配准

ArcGIS地图配准

运用ArcGIS软件对地图进行配准!    1 数据准备:网络下载的中国地图,最好是带有经纬网格的地图(有经纬度坐标,方便配准时添加控制点)  2 加载数据:打开arcgis软件,加载数据,会出现提示...

ArcGIS空间数据制图入门教程(附练习数据下载)

ArcGIS空间数据制图入门教程(附练习数据下载)

一、实验目的通过实验操作,了解符号化、注记标注、格网绘制以及地图整饰的意义;掌握基本的符号化方法、自动标注操作以及相关地图的整饰和输出的操作。对数字地图制图有初步的认识。二、实验数据行政区划数据其中包...