字符編碼術語中,碼位或稱編碼位置[1],即英文的code point或code position,是組成碼空間(或代碼頁)的數值[2]。 例如,ASCII碼包含128個碼位,範圍是016進制到7F16進制擴展ASCII碼包含256個碼位,範圍是016進制到FF16進制,而Unicode包含1,114,112個碼位,範圍是016進制到10FFFF16進制。Unicode碼空間劃分為17個Unicode字符平面基本多文種平面,16個輔助平面),每個平面有65,536(= 216)個碼位。因此Unicode碼空間總計是17 × 65,536 = 1,114,112.

定義

碼位的抽象意涵, 不同於下列概念:

  • 作為具體編碼的比特流。例如,UTF-16編碼的比特流,既可以是大尾序,也可以是小尾序。
  • 具有特定字形的字符. 因為字符集中的字符(碼位)的具體外觀隨字型(font)——字體顯示樣式——的不同而變化。
  • 特定碼空間的編碼方式。例如,一個Unicode碼空間的碼位,可以用UTF-8編碼;也可以用UTF-16編碼。
  • 用不同字形顯示一個字符,即字位.

參考

  1. ^ GB 18030-2005《信息技術 中文編碼字符集》中,既使用了碼位,也用了編碼位置。
  2. ^ Glossary of Unicode Terms. [2012-03-12]. (原始內容存檔於2015-12-26).