ArcGis或MapGis中浏览数据乱码问题

常见问题4年前 (2021-05-07)6112

工作中经常需要使用ArcGis或MapGis的数据,但经常会出现收集来的数据或者汇交的数据是乱码,通常我们会认为可能是软件在不同格式转换过程中因为不兼容等问题导致的,但经过长时间的实践发现,数据本身没有问题的情况也是很普遍的。

 



  这种情况有一个比较明显的特点就是,在有的电脑上是乱码,但在另外的电脑上就没有乱码,一般都是将数据拿到其他的电脑上进行处理,所以我们推测产生这种问题的原因应该是同软件的版本或者软件的运行环境有关。经过多次调试,发现此问题应是ArcGis和MapGis的默认编码不同造成的。其中MapGIS,默认使用CP936(GBK)编码存储,无论是你使用何种系统,系统的默认语言都是使用GBK编码;而ArcGis的编码系统则根据安装软件时发生变化,当你安装的系统的原始版本并不是简体中文,那么这个就会发生变化(尤其是盗版系统,经常可能是英文版或者俄文版改写的),所以ArcGis的默认编码就会相对比较多。同时如果收集的资料来源并非国内,这样出现乱码的可能性就会更大了。


  所以,这个问题的根本原因就是读取文件使用的编码类型和文件实际存储的编码类型不一致。


  Shapefile文件的头文件(dBase Header)中,一般会包含shapefile使用的编码类型的信息,这个信息成为 LDID ( Language Driver ID),这样在使用应用程序打开 shapefile 的时候,应用程序就知道用何种编码类型去正确读取它,而不会发生乱码。 在 ArcGIS Desktop 生产的 shapefile 数据中通常会包含这项信息。在Shapefile的子文件中,有时我们还会发现同名 *.cpg 文件,文件中也存储了编码信息,用记事本打开,看到例如 utf-8。


  二者被ArcGIS 识别的优先顺序是,LDID 优先于 CPG文件。也就是如果头文件中没有约定读shapefile的编码类型时,如果这时刚好有个CPG文件,那么ArcGIS就会使用这里的编码类型读取。


  我们知道 shapefile 是个开放格式,只要你了解了数据规范,完全可以脱离ArcGIS自己生产出来。在Windows中文语言设置下,假设你自己写代码或者使用第三方的程序生产了shapefile。如果是 ArcGIS 10.2 和之前的版本,那么在本机上读取一般是没问题,ArcGIS 默认编码是按照本机默认编码,没有乱码。


  可是拿到 ArcGIS 10.2.1 以后的版本中发现乱!码!了!在缺失 LDID 和 CPG时,这几个版本默认使用 UTF-8 来读取 shapefile,这样必然乱码了。

 



  解决方法就是使用记事本工具打开,修改同名的CPG文件,文本内容oem或者936,如果部分第三方软件没有该文件,只需要新建同名的CPG文件,文本内容同上。


  此外,我们需要了解的是中文系统一般采用GBK的编码方式,因此中文系统下,生成的shapefile文件都是以GBK来编码其中的字段属性的,如果dbf不是GBK编码就会出现乱码问题。此外常用的编码类型如下,这种问题同我们下载的字幕出现乱码的原理是一样的。



相关文章

Q1_文件打开失败

Q1_文件打开失败

 在进行文件格式转换过程中,Map2Shp软件尽最大的可能修正原始数据中存在的各种错误,但并不能保证100%的修复。如果出现转换失败情况,请查看转换日志中错误信息,与本附录对照,采取建议处理...

INFO3_属性字段结构定义错误

INFO3_属性字段结构定义错误

INFO3:第N个属性字段结构定义错误    说明:待转换MapGIS文件第N个属性字段结构定义错误,请在MapGIS软件中确认第N个属性结构定义是否正确,修复...

Q01_使用Map2Shp时计算机上必须安装MapGis软件吗

Q01_使用Map2Shp时计算机上必须安装MapGis软件吗

我的计算机上必须安装MapGis软件吗?Map2Shp软件不是基于中地公司MapGis二次开发包开发,因而不依赖MapGis系统,也无需安装MapGis软件狗,可以在任意计算机上安装运行。...

Q03_Map2Shp的几何检验功能指的什么

Q03_Map2Shp的几何检验功能指的什么

Map2Shp的几何检验功能指的什么?市面上每种GIS软件对空间几何数据都有着特殊而且严格的拓扑要求,ESRI公司Shape文件与中地Mapgis格式对空间数据的几何规则要求并不一致,因此需要对Map...

什么是多部件(MultiPatch)要素?Shp2Map不支持多部件要素怎么处理?

什么是多部件(MultiPatch)要素?Shp2Map不支持多部件要素怎么处理?

什么是多部件(MultiPatch)要素?有时,您需要创建由多个物理部分组成但只引用数据库中的一组属性的要素。对于点,这些要素被称为多点,而对于线和面要素,这些要素被称为多部分。一组岛屿可以通过多部分...

如何修复损坏的 shapefile

如何修复损坏的 shapefile

以下说明介绍了有助于修复受损 shapefile 的多个选项。常见损坏原因有:保存编辑内容时计算机崩溃;添加非法几何,例如,蝴蝶结;或使用其他软件(例如,Microsoft Excel)修改属性表。如...