woaidongmao

文章均收录自他人博客,但不喜标题前加-[转贴],因其丑陋,见谅!~
随笔 - 1469, 文章 - 0, 评论 - 661, 引用 - 0
数据加载中……

EUC

维基百科,自由的百科全书

跳转到: 导航, 搜索

EUC全名为Extended Unix Code,是一个使用8编码来表示字符的方法。

它使用了一些兼容于ISO/IEC 2022区位码的94x94编码表,把每个区位加上0xA0来表示,以便兼容于ASCII

它主要用于表示及储存汉语文字日语文字朝鲜文字

目录

[隐藏]

[编辑] EUC-CN

EUC-CNGB 2312最常用的表示方法。浏览器编码表上的“GB2312,通常都是指“EUC-CN”表示法。

GB 2312字元使用两个字节来表示。

“第一位字节”使用0xA1-0xF7

“第二位字节”使用0xA1-0xFE

举例来说,“啊”字是GB 2312之中的第一个汉字,它的区位码是1601

EUC-CN之中,它把0xA0+16=0xB0,0xA0+1=0xA1,得出0xB0A1

[编辑] EUC-JP

EUC-JP用来储存日本JIS X 0208(旧称JIS C 6226)及JIS X 0212字集的字符。但是,日语文字较多使用ISO-2022-JPShift JIS的方法来表示。

半角片假名使用两个字节来表示。

“第一位字节”使用0x8E

“第二位字节”使用0xA1-0xDF

JIS X 0208字元使用两个字节来表示。

“第一位字节”使用0xA1-0xFE

“第二位字节”使用0xA1-0xFE

JIS X 0212字元使用三个字节来表示。

“第一位字节”使用0x8F

“第二位字节”使用0xA1-0xFE

“第三位字节”使用0xA1-0xFE

[编辑] EUC-JISX0213

EUC-JISX0213是一个制定中的EUC规格,用来表示JIS X 0213字集的字符。

半角片假名使用两个字节来表示。

“第一位字节”使用0x8E

“第二位字节”使用0xA1-0xDF

JIS X 0213第一字面字元使用两个字节来表示。

“第一位字节”使用0xA1-0xFE

“第二位字节”使用0xA1-0xFE

JIS X 0213第二字面字元使用三个字节来表示。

“第一位字节”使用0x8F

“第二位字节”使用0xA1-0xFE

“第三位字节”使用0xA1-0xFE

[编辑] EUC-KR

EUC-KR用来储存韩国KS X 1001字集(旧称KS C 5601)的字符。此规格由KS X 2901(旧称KS C 5861)定义。

KS X 1001字元使用两个字节来表示。

“高位字节”使用0xA1-0xFE

“低位字节”使用0xA1-0xFE

[编辑] EUC-TW

EUC-TW本来是台湾使用的其中一个汉字储存方法,以CNS 11643字表为基础。但是台湾普遍使用大五碼EUC-TW甚少使用。

CNS 11643第一字面的字元使用两个字节来表示。

“第一位字节”使用0xA1-0xFE

“第二位字节”使用0xA1-0xFE

CNS 11643其他字面的字元使用四个字节来表示。

“第一位字节”使用0x8E

“第二位字节”使用0xA1-0xB00xA1-0xA7分别代表第1至第7个字面,其余未定义)

“第三位字节”使用0xA1-0xFE

“第四位字节”使用0xA1-0xFE

CNS 11643第一字面可选择使用两个字节或四个字节来表示)

[编辑] 参看

[编辑] 参考文献

  • 小林劍,(1999年). CJKV Information Processing. First Edition. O'Reilly and Associates, Inc. ISBN 1-56592-224-7;中文版,鄭褚璋譯,(2002年)中日韓越資訊處理 第一版,台北市,美商歐萊禮股份有限公司。 ISBN 986-7794-03-6

 

posted on 2009-11-17 13:42 肥仔 阅读(747) 评论(0)  编辑 收藏 引用 所属分类: 字符编码


只有注册用户登录后才能发表评论。
网站导航: 博客园   IT新闻   BlogJava   博问   Chat2DB   管理