返回首页
什么是生僻字

        生僻字的概念是相对的,个体不认识的“生僻字”与信息系统不识别的“生僻字”是两个概念。生僻字是指目前无法在机构业务系统、个人电脑、手机终端等设备上正常输入、存储、显示的汉字。从技术角度来说,生僻字主要是指不在GBK字符编码集(1995年)范围内的汉字。

        生僻字(rarely used Chinese characters)

        GB/T 13000编码区间(U+4E00~U+9FA5,20,902字)之外的汉字。

        注:1993年发布的GB 13000收录了U+4E00~U+9FA5共20,902个汉字,1995年发布的《汉字内码扩展规范》(以下简称GBK)含21,003个汉字(增加了101个汉字及偏旁部首,包括 “䶮”“䴖”“䦅”等52个汉字),现已被GB 18030代替;由于GBK字符集内的20,902个汉字已能被国内外绝大部分技术产品和国内的应用系统所支持,而其他的汉字往往会遇到问题,故一般认为在20,902个汉字之外的汉字为生僻字。