微波EDA网,见证研发工程师的成长!
首页 > 研发问答 > 嵌入式设计讨论 > 嵌入式系统设计讨论 > GB2312 字符集及其编码

GB2312 字符集及其编码

时间:10-02 整理:3721RD 点击:
  1、ASCII 字符集及其编码
   用一个字节表示,从编号 0 到编号 127,共 128 个字符    随着计算机的发展,世界各地都开始了使用计算机,但是很多国家用的不是英文,他们的字母里有很多是
ASCII 字符集中没有的。 为了可以在计算机中保存这些非英文国家的文字和符号,决定采用 127 号之后未
编排的空位来表示这些新的字母和符号,并且还加入了很多画表格时需要用到的横线、竖线、以及交叉线
等形状,一直把序号编到了最后一个状态 255,从 128 到 255 的字符被称为扩展字符集。
2、GB2312 字符集及其编码
  等计算机传到中国来,一个字节(一个字节是 8 位,共可以表达 2^8 = 256 个字符)的所有编码已
经用完,没有可以使用的编码来表示汉字了,而且一个字节不能表示 6000 多个常用的汉字,所以汉字就
需要 2 个字节来表示。  

  第一个字节从编号 0 到编号 127 的字符不变,还是表示 ASCII,而之后的 0xA1 到 0xFE 用于汉字编
码,这个字节被称为汉字的区号或者高位字节,0xA1 到 0xFE 换算成区号就是从 01 区到 94 区(换算关
系就是对编码值减去 0xA0)。
  第二个字节的 0xA1 到 0xFE 用于汉字编码,这个字节被称为汉字的位号或者低位字节,0xA1 到 0xFE
换算成位号就是从位号 01 到位号 94(换算关系就是对编码值减去 0xA0)。 根据区号和位号的设置,那么
就有 94*94 = 8836 个编码可供使用。 在这些编码里,我们还把数学符号、罗马希腊字母、日文的假名都
编码进去了,连在 ASCII 里本来就有的数字、标点、字母都统统重新编了两个字节长的编码,即全角字符,
而原来在 127 号之前的那些字符称为半角字符。
  由这些编码组成的字符,我们为其取了一个名字叫 GB2312,GB2312 是对 ASCII 字符集的简体中文
扩展,这个就是 GB2312 的由来。 GB2312 编码全称《信息交换用汉字编码字符集——基本集》,由中国
国家标准总局 1980 年发布,1981 年 5 月 1 日开始实施的一套国家标准,标准号是 GB 2312—1980。


参考:安富莱_stm32_v6开发板emwin教程

Copyright © 2017-2020 微波EDA网 版权所有

网站地图

Top