byte 1 為 8E 時, 為 4 byte 編碼, byte 2 範圍為 A1-B0, byte 3 與 byte 4 範圍均為 A1-FE
備註: 4 byte 編碼時, byte 2 為 A1 與 2 byte 編碼之字碼相同 (即第 1 字面), CNS 目前只使用了
7 個字面, 因此 byte 2 實際使用範圍為 A1-A7, 早期第 15 字面有放了一些字碼, 後來都已編入
前 7 個字面內了
3.GB
HTML charset: gb2312, gbk, euc-cn
RTF charset: 134
編碼方式: 雙 byte 語系, byte 1 範圍為 81-FE, byte 2 範圍為 40-7E, 80-FE
三.日文
Unicode 範圍: 3040-30FF, 31F0-31FF(混用中文字碼)
備註:FF00-FFEF 有半形日文,應轉至一般日文字碼處理
locale 編碼: Shift-JIS, EUC-JP
1.Shift-JIS
HTML charset: shift_jis, x-sjis, iso-2022-jp
RTF charset: 128
編碼方式: 單/雙 byte 語系
byte 1 範圍為 A1-DF 時為 1 byte 編碼
byte 1 範圍為 81-9F, E0-EF 時為 2 byte 編碼, byte 2 範圍為 40-7E, 80-FC
2.EUC-JP
HTML charset: euc-jp, x-euc-jp
RTF charset: 無
編碼方式: 多 byte 語系
byte 1 為 8E 時, 為 2 byte 編碼, byte 2 範圍為 A1-DF
byte 1 範圍為 A1-FE 時, 為 2 byte 編碼, byte 2 範圍為 A1-FE
byte 1 為 8F 時為 3 byte 編碼, byte 2 與 byte 3 範圍均為 A1-FE
備註: IE 不支援 3 byte 編碼部份
四.韓文
Unicode 範圍: 1100-11FF, 3130-318F, AC00-D7AF(混用中文字碼)
備註:FF00-FFEF 有半形韓文,應轉至一般韓文字碼處理
评论10
最新资源