拉丁字母補充-1
拉丁字母補充-1(Latin-1 Supplement),又稱C1控制字符及拉丁字母補充-1(C1 Controls and Latin-1 Supplement),是Unicode標準下的第二個Unicode區段。該區段將ISO 8859-1中的上部區段80~FF(U+0080..U+00FF)予以編碼,唯C1控制字符並非可見字符。該區段的碼位範圍為U+0080..U+00FF,共有128個字符,當中包括C1控制字符、拉丁字母-1標點與規約符號、30組帶附加符號的大寫及小寫拉丁字母,及2個數學運算子。
C1控制字符及拉丁字母補充-1 C1 Controls and Latin-1 Supplement | |
---|---|
範圍 | U+0080..U+00FF (128個碼位) |
平面 | 基本多文種平面(BMP) |
文字 | 拉丁字母(64個) 通用(64個) |
應用 | |
符號系列 | |
已分配 | 128個碼位 |
未分配 | 0個保留碼位 |
來源標準 | ISO/IEC 8859-1 |
統一碼版本歷史 | |
1.0.0 | 128 (+128) |
註釋:[1][2] |
C1控制字符及拉丁字母補充-1區段內的字符自Unicode標準的1.0版本起一直沿用至今,[3]而該區段在1.0版本的名稱只是稱作「拉丁字母1」(Latin1)。[4]
字符表
|
|
|
|
子標題
「C1控制字符及拉丁字母補充-1」區段內包含四個子標題,分別為C1控制字符、拉丁字母-1標點及符號、字母及數學運算子。[5]
C1控制字符
「C1控制字符」(C1 controls)子標題下包含32個繼承自ISO/IEC 8859-1及其他8位元字符標準的補充控制字符(control code)。C0與C1控制字符的別名乃基於ISO/IEC 6429:1992而取。[5]
拉丁字母-1標點及符號
「拉丁字母-1標點及符號」(Latin-1 Punctuation and Symbols)子標題下包含32個常見的國際標點字符(如倒感嘆號、倒問號和間隔號等)及匯率符號、佔位變音符記號(spacing diacritic mark)、普通分數及上標數字等符號。[5]
字母
「字母」(Letters)子標題下包含30組用於西歐語言的大寫和小寫拉丁字母,亦額外包含兩個不常用於字詞開首的小寫字母。[5]
數學運算子
「數學運算子」(Mathematical operator)子標題下包含乘號和除號。[5]
符號、字母與控制符數量
下表顯示「C1控制字符及拉丁字母補充-1」區段中,各子標題的字母、符號與控制符數量。
子標題名稱 | 符號數量 | 字符代碼範圍 |
---|---|---|
C1控制字符 | 32個控制字符 | U+0080..U+009F |
拉丁字母-1標點及符號 | 32個標點符號及規約符號 | U+00A0..U+00BF |
字母 | 30組帶附加符號的大寫及小寫拉丁字母 | U+00C0..U+00D6、U+00D8..U+00F6及U+00F8..U+00FF |
數學運算子 | 包含U+00D7 × MULTIPLICATION SIGN 及U+00F7 ÷ DIVISION SIGN共兩個符號。 | U+00D7及U+00F7 |
區塊
C1控制字符及拉丁字母補充-1 C1 Controls and Latin-1 Supplement[1] Unicode Consortium 官方碼表 (PDF) | ||||||||||||||||
0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | A | B | C | D | E | F | |
U+008x | XXX | XXX | BPH | NBH | IND | NEL | SSA | ESA | HTS | HTJ | VTS | PLD | PLU | RI | SS2 | SS3 |
U+009x | DCS | PU1 | PU2 | STS | CCH | MW | SPA | EPA | SOS | XXX | SCI | CSI | ST | OSC | PM | APC |
U+00Ax | NBSP | ¡ | ¢ | £ | ¤ | ¥ | ¦ | § | ¨ | © | ª | « | ¬ | SHY | ® | ¯ |
U+00Bx | ° | ± | ² | ³ | ´ | µ | ¶ | · | ¸ | ¹ | º | » | ¼ | ½ | ¾ | ¿ |
U+00Cx | À | Á | Â | Ã | Ä | Å | Æ | Ç | È | É | Ê | Ë | Ì | Í | Î | Ï |
U+00Dx | Ð | Ñ | Ò | Ó | Ô | Õ | Ö | × | Ø | Ù | Ú | Û | Ü | Ý | Þ | ß |
U+00Ex | à | á | â | ã | ä | å | æ | ç | è | é | ê | ë | ì | í | î | ï |
U+00Fx | ð | ñ | ò | ó | ô | õ | ö | ÷ | ø | ù | ú | û | ü | ý | þ | ÿ |
註釋
|
繪文字
拉丁字母補充-1區段包含兩個繪文字:U+00A9 © COPYRIGHT SIGN及U+00AE ® REGISTERED SIGN。[6][7]
該區段就兩個繪文字的繪文字形式(添加U+FE0F ️ VS16)或文字展示形式(添加U+FE0E ︎ VS15)定義四個標準化變體,並以後者作為預設。[8]
U+ | 00A9 | 00AE |
基本碼位 | © | ® |
基本+VS15(文字) | ©︎ | ®︎ |
基本+VS16(繪文字) | ©️ | ®️ |
歷史
下列與Unicode相關的檔案記錄了在拉丁字母補充-1區塊中定義特定字符的目的和過程:
版本 | 最終碼位[a] | 碼位數 | L2 ID | WG2 ID | 文件 |
---|---|---|---|---|---|
1.0.0 | U+0080..009F | 32 | X3L2/95-002 | PDAM No. 3 to ISO/IEC 10646-1 on coding of C1 controls, 1994-11-01 | |
X3L2/95-028 | N1148 | Nine tables of replies to repeated/extended votes, 1995-02-22 | |||
N1203 (頁面存檔備份,存於互聯網檔案館) | Umamaheswaran, V. S.; Ksar, Mike, Unconfirmed minutes of SC2/WG2 Meeting 27, Geneva, 1995-05-03 | ||||
X3L2/95-061 | DAM no.3 to ISO/IEC 10646-1 (Coding of C1 controls), 1995-06-01 | ||||
N1307 | Table of replies to JTC1 letter ballot on 10646 DAM 3, Coding of C1 Controls, (SC2 N 2666), 1996-01-15 | ||||
N1309 | Paterson, Bruce, Report and Disposition of Comments on DAM 1, UTF 16 and DAM 2, UTF-8, DAM 3, Coding of C1 Controls, and DAM 4, Removal of Annex G: UTF1, 1996-01-17 | ||||
N1312 | Paterson, Bruce, Draft Final Text of 10646 AMD-3, Coding of C1 Controls, 1996-01-17 | ||||
L2/99-048 | Umamaheswaran, V. S., C1 controls in the code charts, 1999-02-04 | ||||
L2/99-054R | Aliprand, Joan, Approved Minutes from the UTC/L2 meeting in Palo Alto, February 3-5, 1999, 1999-06-21 | ||||
N3046 (頁面存檔備份,存於互聯網檔案館) | Suignard, Michel, Improving formal definition for control characters, 2006-02-22 | ||||
N3103 (pdf, doc (頁面存檔備份,存於互聯網檔案館)) | Umamaheswaran, V. S., Unconfirmed minutes of WG 2 meeting 48, Mountain View, CA, USA; 2006-04-24/27, 2006-08-25 | ||||
U+00A0..00FF | 96 | (待查) | |||
X3L2/94-077 | N994 (頁面存檔備份,存於互聯網檔案館) | Davis, Mark, ISO/IEC 10646-1 - Proposed Draft Corrigendum 1, 1994-03-03 | |||
X3L2/94-098 | N1033 (pdf, doc (頁面存檔備份,存於互聯網檔案館)) | Umamaheswaran, V. S.; Ksar, Mike, Unconfirmed Minutes of ISO/IEC JTC 1/SC 2/WG 2 Meeting 25, Falez Hotel, Antalya, Turkey, 1994-04-18--22, 1994-06-01 | |||
L2/11-016 | Moore, Lisa, UTC #126 / L2 #223 Minutes, 2011-02-15 | ||||
L2/11-116 | Moore, Lisa, UTC #127 / L2 #224 Minutes, 2011-05-17, Change the general category of to U+00AA FEMININE ORDINAL INDICATOR and U+00BA MASCULINE ORDINAL INDICATOR "Lo" for Unicode 6.1. | ||||
L2/11-261R2 | Moore, Lisa, UTC #128 / L2 #225 Minutes, 2011-08-16, Change the general category from "So" to "Po" ... [U+00A7 and U+00B6] | ||||
L2/15-050R[b][c] | Davis, Mark; et al, Additional variation selectors for emoji, 2015-01-29 | ||||
|
參見
註釋
參考資料
- ^ Unicode character database. The Unicode Standard. [2016-07-09]. (原始內容存檔於2017-09-25) (英語).
- ^ Enumerated Versions of The Unicode Standard. The Unicode Standard. [2016-07-09]. (原始內容存檔於2016-06-29) (英語).
- ^ The Unicode Standard Version 1.0, Volume 1. Addison-Wesley Publishing Company, Inc. 1991 [1990]. ISBN 0-201-56788-1.
- ^ 3.8: Block-by-Block Charts (PDF). The Unicode Standard. Unicode Consortium. [2021-10-10]. (原始內容 (PDF)存檔於2021-02-11) (英語).
- ^ 5.0 5.1 5.2 5.3 5.4 Unicode 6.2 code charts (PDF). The Unicode Standard. [2013-04-01]. (原始內容 (PDF)存檔於2018-07-04) (英語).
- ^ UTR #51: Unicode Emoji. Unicode Consortium. 2020-02-11 [2022-05-17]. (原始內容存檔於2020-06-30).
- ^ UCD: Emoji Data for UTR #51. Unicode Consortium. 2021-08-26 [2022-05-17]. (原始內容存檔於2022-03-28).
- ^ UTS #51 Emoji Variation Sequences. The Unicode Consortium. [2022-05-17]. (原始內容存檔於2022-03-31).