拉丁字母補充-1

拉丁字母補充-1Latin-1 Supplement),又稱C1控制字元及拉丁字母補充-1C1 Controls and Latin-1 Supplement),是Unicode標準下的第二個Unicode區段。該區段將ISO 8859-1中的上部區段80~FF(U+0080..U+00FF)予以編碼,唯C1控制字元並非可見字元。該區段的碼位範圍為U+0080..U+00FF,共有128個字元,當中包括C1控制字元拉丁字母-1標點規約符號、30組帶附加符號大寫小寫拉丁字母,及2個數學運算子。

C1控制字元及拉丁字母補充-1
C1 Controls and Latin-1 Supplement
範圍U+0080..U+00FF
(128個碼位)
平面基本多文種平面BMP
文字拉丁字母(64個)
通用(64個)
應用
符號系列
已分配128個碼位
未分配0個保留碼位
來源標準ISO/IEC 8859-1
統一碼版本歷史
1.0.0128 (+128)
註釋[1][2]

C1控制字元及拉丁字母補充-1區段內的字元自Unicode標準的1.0版本起一直沿用至今,[3]而該區段在1.0版本的名稱只是稱作「拉丁字母1」(Latin1)。[4]

字元表

碼位 顯示 描述 縮寫
C1控制字元
U+0080 填充字元 PAD
U+0081 高八位元組預設 HOP
U+0082 在此允許換行 BPH
U+0083 在此不允許換行 NBH
U+0084 索引(index) IND
U+0085 換行 NEL
U+0086 所選範圍開始 SSA
U+0087 所選範圍終止 ESA
U+0088 字元(水平)列表組 HTS
U+0089 齊行的字元(水平)列表 HTJ
U+008A 字行(垂直)列表組 LTS
U+008B 局部字行向前(向下) PLD
U+008C 局部字行向後(向上) PLU
U+008D 反向換行(索引) RI
U+008E 單一移位(single-shift)2 SS2
U+008F 單一移位3 SS3
U+0090 裝置控制字串 DCS
U+0091 私人使用區1 PU1
U+0092 私人使用區2 PU2
U+0093 設定傳輸狀態 STS
U+0094 取消字元 CCH
U+0095 等待訊息 MW
U+0096 保護區開始 SPA
U+0097 保護區終止 EPA
U+0098 字串開端 SOS
U+0099 單圖像字元導引字元 SGCI
U+009A 單字元導引字元 SCI
U+009B 控制序列導引字元 CSI
U+009C 字串終止字元 ST
U+009D 操作系統指令 OSC
U+009E 私人訊息 PM
U+009F 應用程式指令 APC
碼位 顯示 描述
拉丁字母-1標點及符號
U+00A0   不換行空格[註 1]
U+00A1 ¡ 倒感嘆號
U+00A2 ¢ 分(cent)記號
U+00A3 £ 英鎊記號
U+00A4 ¤ 國際通貨符號
U+00A5 ¥ 圓(¥)符號
U+00A6 ¦ 斷豎線
U+00A7 § 分節符號
U+00A8 ¨ 分音符
U+00A9 © 著作權符號
U+00AA ª 陰性序數標識
U+00AB « 左書名號
U+00AC ¬ 邏輯非記號
U+00AD 軟連字元[註 2]
U+00AE ® 註冊商標符號
U+00AF ¯ 長音符號
U+00B0 ° 度數符號
U+00B1 ± 正負號
U+00B2 ² 上標數字2
U+00B3 ³ 上標數字3
U+00B4 ´ 尖音符
U+00B5 µ 微符號
U+00B6 段落符號
U+00B7 · 間隔號
U+00B8 ¸ 軟音符
U+00B9 ¹ 上標數字1
U+00BA º 陽性序數標識
U+00BB » 右書名號
U+00BC ¼ 普通分數四分之一
U+00BD ½ 普通分數二分之一
U+00BE ¾ 普通分數四分之三
U+00BF ¿ 倒問號
碼位 顯示 描述
字母
U+00C0 À 帶重音符的大寫拉丁字母A
U+00C1 Á 帶尖音符的大寫拉丁字母A
U+00C2 Â 帶揚抑符的大寫拉丁字母A
U+00C3 Ã 帶波浪號的大寫拉丁字母A
U+00C4 Ä 帶分音符的大寫拉丁字母A
U+00C5 Å 帶上圓圈的大寫拉丁字母A
U+00C6 Æ 大寫拉丁字母AE
U+00C7 Ç 帶軟音符的大寫拉丁字母C
U+00C8 È 帶重音符的大寫拉丁字母E
U+00C9 É 帶尖音符的大寫拉丁字母E
U+00CA Ê 帶揚抑符的大寫拉丁字母E
U+00CB Ë 帶分音符的大寫拉丁字母E
U+00CC Ì 帶重音符的大寫拉丁字母I
U+00CD Í 帶尖音符的大寫拉丁字母I
U+00CE Î 帶揚抑符的大寫拉丁字母I
U+00CF Ï 帶分音符的大寫拉丁字母I
U+00D0 Ð 大寫拉丁字母Ð
U+00D1 Ñ 帶波浪號的大寫拉丁字母N
U+00D2 Ò 帶重音符的大寫拉丁符號O
U+00D3 Ó 帶尖音符的大寫拉丁字母O
U+00D4 Ô 帶揚抑符的大寫拉丁字母O
U+00D5 Õ 帶波浪號的大寫拉丁字母O
U+00D6 Ö 帶分音符的大寫拉丁字母O
數學運算子
U+00D7 × 乘法符號
字母
U+00D8 Ø 帶刪節線的大寫拉丁字母O
U+00D9 Ù 帶重音符的大寫拉丁字母U
U+00DA Ú 帶尖音符的大寫拉丁字母U
U+00DB Û 帶揚抑符的大寫拉丁字母U
U+00DC Ü 帶分音符的大寫拉丁字母U
U+00DD Ý 帶尖音符的大寫拉丁字母Y
U+00DE Þ 大寫拉丁字母Þ
U+00DF ß 小寫拉丁字母ß
碼位 顯示 描述
U+00E0 à 帶重音符的小寫拉丁字母A
U+00E1 á 帶尖音符的小寫拉丁字母A
U+00E2 â 帶揚抑符的小寫拉丁字母A
U+00E3 ã 帶波浪號的小寫拉丁字母A
U+00E4 ä 帶分音符的小寫拉丁字母A
U+00E5 å 帶上圓圈的小寫拉丁字母A
U+00E6 æ 小寫拉丁字母AE
U+00E7 ç 帶軟音符的小寫拉丁字母C
U+00E8 è 帶重音符的小寫拉丁字母E
U+00E9 é 帶尖音符的小寫拉丁字母E
U+00EA ê 帶揚抑符的小寫拉丁字母E
U+00EB ë 帶分音符的小寫拉丁字母E
U+00EC ì 帶重音符的小寫拉丁字母I
U+00ED í 帶尖音符的小寫拉丁字母I
U+00EE î 帶揚抑符的小寫拉丁字母I
U+00EF ï 帶分音符的小寫拉丁字母I
U+00F0 ð 小寫拉丁字母Ð
U+00F1 ñ 帶波浪號的小寫拉丁字母N
U+00F2 ò 帶重音符的小寫拉丁字母O
U+00F3 ó 帶尖音符的小寫拉丁字母O
U+00F4 ô 帶抑揚符的小寫拉丁字母O
U+00F5 õ 帶波浪號的小寫拉丁字母O
U+00F6 ö 帶分音符的小寫拉丁字母O
數學運算子
U+00F7 ÷ 除法符號
字母
U+00F8 ø 帶刪節線的小寫拉丁字母O
U+00F9 ù 帶重音符的小寫拉丁字母U
U+00FA ú 帶尖音符的小寫拉丁字母U
U+00FB û 帶揚抑符的小寫拉丁字母U
U+00FC ü 帶分音符的小寫拉丁字母U
U+00FD ý 帶尖音符的小寫拉丁字母Y
U+00FE þ 小寫拉丁字母Þ
U+00FF ÿ 帶分音符的小寫拉丁字母Y


子標題

「C1控制字元及拉丁字母補充-1」區段內包含四個子標題,分別為C1控制字元、拉丁字母-1標點及符號、字母及數學運算子。[5]

C1控制字元

「C1控制字元」(C1 controls)子標題下包含32個繼承自ISO/IEC 8859-1及其他8位元字元標準的補充控制字元(control code)。C0與C1控制字元的別名乃基於ISO/IEC 6429:1992而取。[5]

拉丁字母-1標點及符號

「拉丁字母-1標點及符號」(Latin-1 Punctuation and Symbols)子標題下包含32個常見的國際標點字元(如倒感嘆號、倒問號和間隔號等)及匯率符號、佔位變音符記號(spacing diacritic mark)、普通分數及上標數字等符號。[5]

字母

「字母」(Letters)子標題下包含30組用於西歐語言的大寫和小寫拉丁字母,亦額外包含兩個不常用於字詞開首的小寫字母。[5]

數學運算子

「數學運算子」(Mathematical operator)子標題下包含乘號和除號。[5]

符號、字母與控制符數量

下表顯示「C1控制字元及拉丁字母補充-1」區段中,各子標題的字母、符號與控制符數量。

子標題名稱 符號數量 字元代碼範圍
C1控制字元 32個控制字元 U+0080..U+009F
拉丁字母-1標點及符號 32個標點符號及規約符號 U+00A0..U+00BF
字母 30組帶附加符號大寫小寫拉丁字母 U+00C0..U+00D6U+00D8..U+00F6U+00F8..U+00FF
數學運算子 包含U+00D7 × MULTIPLICATION SIGNU+00F7 ÷ DIVISION SIGN共兩個符號。 U+00D7U+00F7

區塊

C1控制字元及拉丁字母補充-1
C1 Controls and Latin-1 Supplement[1]
Unicode Consortium 官方碼表 (PDF)
  0 1 2 3 4 5 6 7 8 9 A B C D E F
U+008x XXX XXX BPH NBH  IND NEL SSA ESA HTS HTJ VTS PLD PLU  RI   SS2 SS3
U+009x DCS PU1 PU2 STS CCH  MW  SPA EPA SOS XXX SCI  CSI   ST  OSC  PM  APC
U+00Ax NBSP ¡ ¢ £ ¤ ¥ ¦ § ¨ © ª « ¬ SHY ® ¯
U+00Bx ° ± ² ³ ´ µ · ¸ ¹ º » ¼ ½ ¾ ¿
U+00Cx À Á Â Ã Ä Å Æ Ç È É Ê Ë Ì Í Î Ï
U+00Dx Ð Ñ Ò Ó Ô Õ Ö × Ø Ù Ú Û Ü Ý Þ ß
U+00Ex à á â ã ä å æ ç è é ê ë ì í î ï
U+00Fx ð ñ ò ó ô õ ö ÷ ø ù ú û ü ý þ ÿ
註釋
1.^ 依據 Unicode 14.0

繪文字

拉丁字母補充-1區段包含兩個繪文字U+00A9 © COPYRIGHT SIGNU+00AE ® REGISTERED SIGN[6][7]

該區段就兩個繪文字的繪文字形式(添加U+FE0F VS16)或文字展示形式(添加U+FE0E VS15)定義四個標準化變體,並以後者作為預設。[8]

繪文字可選變體
U+ 00A9 00AE
基本碼位 © ®
基本+VS15(文字) ©︎ ®︎
基本+VS16(繪文字) ©️ ®️

歷史

下列與Unicode相關的檔案記錄了在拉丁字母補充-1區塊中定義特定字元的目的和過程:

參見

注釋

  1. ^ 縮寫為NBSP
  2. ^ 縮寫為SHY

參考資料

  1. ^ Unicode character database. The Unicode Standard. [2016-07-09]. (原始內容存檔於2017-09-25) (英語). 
  2. ^ Enumerated Versions of The Unicode Standard. The Unicode Standard. [2016-07-09]. (原始內容存檔於2016-06-29) (英語). 
  3. ^ The Unicode Standard Version 1.0, Volume 1. Addison-Wesley Publishing Company, Inc. 1991 [1990]. ISBN 0-201-56788-1. 
  4. ^ 3.8: Block-by-Block Charts (PDF). The Unicode Standard. Unicode Consortium. [2021-10-10]. (原始內容 (PDF)存檔於2021-02-11) (英語). 
  5. ^ 5.0 5.1 5.2 5.3 5.4 Unicode 6.2 code charts (PDF). The Unicode Standard. [2013-04-01]. (原始內容 (PDF)存檔於2018-07-04) (英語). 
  6. ^ UTR #51: Unicode Emoji. Unicode Consortium. 2020-02-11 [2022-05-17]. (原始內容存檔於2020-06-30). 
  7. ^ UCD: Emoji Data for UTR #51. Unicode Consortium. 2021-08-26 [2022-05-17]. (原始內容存檔於2022-03-28). 
  8. ^ UTS #51 Emoji Variation Sequences. The Unicode Consortium. [2022-05-17]. (原始內容存檔於2022-03-31).