网站编码的选择(GB2312|GBK|UTF-8|BIG5)

 在安装网站程序的时候很多朋友都会犹豫到底选择那种编码好些呢?现在大多数网站程序都提供GBK和UTF-8的版本程序,也有的网站程序还提供GB2312和BIG5的版本。

  要选择网站程序的编码形式,我们需要先了解GB2312、GBK、UTF-8和BIG5。只有了解了这些编码后我们才能更好的选择适合的。

GB2312编码:

  GB2312是中华人民共和国国家汉字信息交换用编码,GB2312标准共收录6763个汉字,其中一级汉字3755个,二级汉字3008个;同时收录了包括拉丁字母、希腊字母、日文平假名及片假名字母、俄语西里尔字母在内的682个字符。

GBK编码:
  GBK是在国家标准GB2312基础上扩容后兼容GB2312的标准(好像还不是国家标准),文字编码是双字节来表示的,即不论中、英文字符均使用双字节来表示,只不过为区分中文,将其最高位都定成1。GBK包含全部中文字符。

UTF-8编码:
  UTF-8编码则是用以解决国际上字符的一种多字节编码,它对英文使用8位(即一个字节),中文使用24位(三个字节)来编码。对于英文字符较多的论坛则用UTF-8节省空间。UTF-8编码的文字可以在各国各种支持UTF-8字符集的浏览器上显示。例如,如果是UTF-8编码,则在外国人的英文IE上也能显示中文,而无需他们下载IE的中文语言支持包,它包含全世界所有国家需要用到的字符。

BIG5编码:
  和GBK编码一样,属于地域性编码,包含全部的繁体字。通行于台湾、香港、澳门等地区的一个繁体字编码方案。俗称“大五码”。

  看完之后让我们再来选择下网站程序的编码吧,GBK2312就支持6763个汉字所以一般都不做考虑。现在大部分网站程序已经没有GB2312编码的了。常见的就是GBK、UTF-8和BIG5。根据网站的用户群范围,如果是国内的话选择GBK,要是港台等地区选择繁体BIG5。要是国际化或者是为了支持小语种语言那就选择UTF-8吧,否则会出现很多“□□□□□□”。但选择UTF-8的坏处是数据库体积扩大了。

  现在会自己选择了吧。

知识共享许可协议
《网站编码的选择(GB2312|GBK|UTF-8|BIG5)》常伟华 创作。
采用 知识共享 署名-相同方式共享 3.0 中国大陆 许可协议进行许可。
  • 多说评论
  • 签名
  • 新浪微博
  • 默认评论
  • Tab Header 5

0 条评论 / 点击此处发表评论

Tab Content 5

开发技术


开发平台和工具

sitemap     168.90ms