区位码\国标码\内码,三者的联系与区别是?
来源:学生作业帮助网 编辑:六六作业网 时间:2024/12/19 20:05:37
区位码\国标码\内码,三者的联系与区别是?
区位码\国标码\内码,三者的联系与区别是?
区位码\国标码\内码,三者的联系与区别是?
简单点理解,区位码也就是国标码.
所谓“国标码”,是指国家标准汉字编码.一般是指国家标准局1981年发布的《信息交换用汉字编码字符集(基本集)》,简称GB-2312.在这个集中,收进汉字6763个,其中一级汉字3755个,二级汉字3008个.一级汉字为常用字,按拼音顺序排列,二级汉字为次常用字,按部首排列.
GB-2312中,把没字分为94个区,每个区94个位.每个收进的汉字有一个因定的区位.例如“啊”字,位于16区,01位,这个区号和位号就构成了它的区位码“1601”.这就是我上面说的,区位码就是国标码.
但区位码和国标码还是有一点差别,那就是在GB-2312中预留了一些空位,可以进行补充、扩展,经扩展的区位码就从数量、范围上超过了GB-2312了.
上面是就大陆而言的,台湾、香港、和其他汉语国家,也是用区位码,但他们的区位号与大陆用的就不一定相同了.这是区位与国标的又一区别.
内码是保存在计算机中或文件中的汉字编码.它是十六进制的(当然在机器中是二进制了).要计算机中,汉字不能直接用区位码来表示.例如“65”,在ASCII中,它表示“A”,在GB-2312中表示第65区.如果在计算机中用一个“65”用来表示65区的话,就不知是“A”,还是“65区”了.所以在计算机“内部”,就要用“内码”了.内码的基础还是区位码.一般用一个汉字的区位码加上十六进制的“A0A0”或“2020”就是该字的内码了.
因为ASCII的基本集只有128个,编号为0-127;而十六进投影的“A0”,换算为十进制,就是“160”了,这样就不会和ASCII的基本集相冲突了.
就谈这一点儿,够吗?