计算机汉字编码简介
为(wei)进(jin)行(xing)信息交换(huan),各汉字使用地区都制订了一系列(lie)汉字字符集标准。
① GB2313字(zi)(zi)(zi)(zi)符(fu)(fu)集(ji),收入(ru)汉字(zi)(zi)(zi)(zi)6763个,符(fu)(fu)号715个,总计7478个字(zi)(zi)(zi)(zi)符(fu)(fu),这(zhei)是(shi)大陆普遍使(shi)用(yong)的简体(ti)(ti)(ti)字(zi)(zi)(zi)(zi)符(fu)(fu)集(ji)。楷(kai)体(ti)(ti)(ti)-GB2313、仿(fang)宋(song)-GB2313、华文行楷(kai)等市面(mian)上(shang)绝大多(duo)数字(zi)(zi)(zi)(zi)体(ti)(ti)(ti)支(zhi)持(chi)显示(shi)这(zhei)个字(zi)(zi)(zi)(zi)符(fu)(fu)集(ji),亦是(shi)大多(duo)数输(shu)入(ru)法所采(cai)用(yong)的字(zi)(zi)(zi)(zi)符(fu)(fu)集(ji)。市面(mian)上(shang)绝大多(duo)数所谓的繁(fan)体(ti)(ti)(ti)字(zi)(zi)(zi)(zi)体(ti)(ti)(ti),其(qi)实采(cai)用(yong)的是(shi)GB-2313字(zi)(zi)(zi)(zi)符(fu)(fu)集(ji)简体(ti)(ti)(ti)字(zi)(zi)(zi)(zi)的编(bian)码,用(yong)字(zi)(zi)(zi)(zi)体(ti)(ti)(ti)显示(shi)为繁(fan)体(ti)(ti)(ti)字(zi)(zi)(zi)(zi),而不是(shi)直接用(yong)GBK字(zi)(zi)(zi)(zi)符(fu)(fu)集(ji)中繁(fan)体(ti)(ti)(ti)字(zi)(zi)(zi)(zi)的编(bian)码,错误百(bai)出。
② BIG-5字(zi)(zi)符(fu)(fu)(fu)集(ji),收入(ru)13060个繁体汉字(zi)(zi),808个符(fu)(fu)(fu)号,总计13868个字(zi)(zi)符(fu)(fu)(fu),目前普遍使用(yong)于台(tai)(tai)湾、香港(gang)等(deng)地区(qu)。台(tai)(tai)湾教育部标(biao)准宋体楷体等(deng)港(gang)台(tai)(tai)大多数(shu)字(zi)(zi)体支持这个字(zi)(zi)符(fu)(fu)(fu)集(ji)的(de)显示。
③ GBK字(zi)(zi)符(fu)(fu)(fu)集(ji)(ji),又称大字(zi)(zi)符(fu)(fu)(fu)集(ji)(ji)(GB=GuóBiāo国标,K=扩展),包含以上两种(zhong)字(zi)(zi)符(fu)(fu)(fu)集(ji)(ji)汉(han)(han)字(zi)(zi),收入21003个汉(han)(han)字(zi)(zi),882个符(fu)(fu)(fu)号,共计21885个字(zi)(zi)符(fu)(fu)(fu),包括了(le)中(zhong)(zhong)(zhong)(zhong)日韩(CJK)统一(yi)汉(han)(han)字(zi)(zi)20902个、扩展A集(ji)(ji)(CJK Ext-A) 中(zhong)(zhong)(zhong)(zhong)的汉(han)(han)字(zi)(zi)52个。Windows 9598简体(ti)中(zhong)(zhong)(zhong)(zhong)文版就带有这(zhei)个GBK.txt文件。宋(song)(song)体(ti)、隶书、黑体(ti)、幼(you)圆(yuan)、华文中(zhong)(zhong)(zhong)(zhong)宋(song)(song)、华文细(xi)黑、华文楷(kai)体(ti)、标楷(kai)体(ti)(DFKai-SB)、Arial Unicode MS、MingLiU、PMingLiU等字(zi)(zi)体(ti)支(zhi)持显示(shi)这(zhei)个字(zi)(zi)符(fu)(fu)(fu)集(ji)(ji)。微软拼音输入法2003、全拼、紫光拼音等输入法,能够(gou)录入如镕镕炁夬喆(zhe)嚞(zhe)姤(gou)赟赟?龑昳堃慜靕臹等GBK简繁体(ti)汉(han)(han)字(zi)(zi)。
BIG-5 (繁(fan)体(ti)中文(wen))与GB-2313 (简体(ti)中文(wen)),编(bian)(bian)码不(bu)(bu)相兼容,字(zi)(zi)符在不(bu)(bu)同的(de)(de)操作系统(tong)中便产生(sheng)乱码。文(wen)本文(wen)字(zi)(zi)的(de)(de)简体(ti)与繁(fan)体(ti)(文(wen)字(zi)(zi)及编(bian)(bian)码)之(zhi)间(jian)的(de)(de)转换,可用(yong)BabelPad、TextPro或Convertz之(zhi)类的(de)(de)转码软件(jian)来解决。若(ruo)是程序,Windows XP操作系统(tong),可用(yong)Microsoft AppLocale Utility 1.0解决;Windows 2000的(de)(de)操作系统(tong),大概只有用(yong):中文(wen)之(zhi)星、四(si)通利(li)方(fang)、南极星、金山快译之(zhi)类的(de)(de)转码软件(jian)方(fang)能解决了。
④ GB18030字(zi)(zi)符(fu)(fu)集(ji),包含GBK字(zi)(zi)符(fu)(fu)集(ji)、CJK Ext-A 全(quan)部6582个(ge)汉(han)字(zi)(zi),共计27533个(ge)汉(han)字(zi)(zi)。宋(song)体(ti)(ti)-18030、方正楷体(ti)(ti)(FZKai-Z03)、书同(tong)文楷体(ti)(ti)(MS Song)宋(song)体(ti)(ti)(ht_cjk+)、香港华康标准宋(song)体(ti)(ti)(DFSongStd)、华康香港标准楷体(ti)(ti)、CERG Chinese Font、韩(han)国New Gulim,以(yi)及微软(ruan)Windows Vista操(cao)作(zuo)系统提供的(de)(de)宋(song)黑(hei)楷仿宋(song)等字(zi)(zi)体(ti)(ti)亦(yi)支(zhi)持(chi)这个(ge)字(zi)(zi)符(fu)(fu)集(ji)的(de)(de)显示(shi)。Windows 98支(zhi)持(chi)这个(ge)字(zi)(zi)符(fu)(fu)集(ji),以(yi)下的(de)(de)字(zi)(zi)符(fu)(fu)集(ji)则不支(zhi)持(chi)。手写(xie)输入法逍遥笔(bi)4.0版支(zhi)持(chi)GB18030字(zi)(zi)符(fu)(fu)集(ji)及方正超大(da)字(zi)(zi)符(fu)(fu)集(ji)汉(han)字(zi)(zi)的(de)(de)录(lu)入。
⑤ 方正(zheng)超(chao)大字(zi)符集(ji),包含GB18030字(zi)符集(ji)、CJK Ext-B中的36862个汉字(zi),共计(ji)64395个汉字(zi)。宋体-方正(zheng)超(chao)大字(zi)符集(ji)支(zhi)持(chi)这(zhei)个字(zi)符集(ji)的显示。Microsoft Office XP或2003简(jian)体中文版就自带有这(zhei)个字(zi)体。Windows 2000的操(cao)作系(xi)统(tong)需安装超(chao)大字(zi)符集(ji)支(zhi)持(chi)包“Surrogate更新”。
⑥ ISO/IEC 10646 / Unicode字(zi)(zi)(zi)(zi)(zi)符(fu)集(ji),这(zhei)是全球可以共享(xiang)的(de)编(bian)码字(zi)(zi)(zi)(zi)(zi)符(fu)集(ji),两者(zhe)相互兼融,涵(han)盖了世界上主要(yao)语文(wen)的(de)字(zi)(zi)(zi)(zi)(zi)符(fu),其中包括(kuo)简繁体(ti)汉(han)(han)字(zi)(zi)(zi)(zi)(zi),计有:CJK统一汉(han)(han)字(zi)(zi)(zi)(zi)(zi)20902个(ge),CJK Ext-A 6582个(ge),Ext-B 42711个(ge),共计70195个(ge)汉(han)(han)字(zi)(zi)(zi)(zi)(zi)。SimSun-ExtB(宋体(ti))、MingLiU-ExtB(细(xi)明体(ti))能显(xian)示全部Ext-B汉(han)(han)字(zi)(zi)(zi)(zi)(zi)。至今尚无单独一款(kuan)字(zi)(zi)(zi)(zi)(zi)体(ti)能够(gou)显(xian)示全部70195个(ge)汉(han)(han)字(zi)(zi)(zi)(zi)(zi),但可用海峰五笔(bi)、新概念五笔(bi)、仓(cang)颉输(shu)入(ru)法(fa)(fa)世纪版、新版的(de)微软(ruan)新注音(yin)、仓(cang)颉输(shu)入(ru)法(fa)(fa) 6.0 版(单码功能)等输(shu)入(ru)法(fa)(fa)录入(ru)。Ext-C还有2万多个(ge)汉(han)(han)字(zi)(zi)(zi)(zi)(zi)。详情请参阅香港中文(wen)大学网(wang)(wang)站(zhan)、马来西(xi)亚仓(cang)颉之友网(wang)(wang)站(zhan)、福建(jian)陈清钰个(ge)人(ren)网(wang)(wang)站(zhan)。
⑦ 汉字(zi)构形数据库2.3版,内含楷书字(zi)形60082个(ge)、小(xiao)篆11100个(ge)、楚系简帛文(wen)字(zi)2627个(ge)、金文(wen)3459个(ge)、甲骨文(wen)177个(ge)、异体字(zi)12768组。可以(yi)安装(zhuang)该程序,亦(yi)可以(yi)解压后使用其中的字(zi)体文(wen)件,对于整理某些古代文(wen)献十分有用。
如果(guo)超(chao)出了(le)输(shu)入(ru)法所支持的字符(fu)集(ji),就不能录(lu)入(ru)计(ji)算机。如果(guo)没有相应字体的支持,则(ze)显示(shi)为(wei)黑(hei)框(kuang)、方框(kuang)或空白。如果(guo)操(cao)作系统或应用软件不支持该字符(fu)集(ji),则(ze)显示(shi)为(wei)问号(一个或两个)。在网(wang)页上亦(yi)存在同样的情况。