拉丁字母补充-1

拉丁字母补充-1Latin-1 Supplement),又称C1控制字符及拉丁字母补充-1C1 Controls and Latin-1 Supplement),是Unicode标准下的第二个Unicode区段。该区段将ISO 8859-1中的上部区段80~FF(U+0080..U+00FF)予以编码,唯C1控制字符并非可见字符。该区段的码位范围为U+0080..U+00FF,共有128个字符,当中包括C1控制字符拉丁字母-1标点规约符号、30组带附加符号大写小写拉丁字母,及2个数学运算符。

C1控制字符及拉丁字母补充-1
C1 Controls and Latin-1 Supplement
范围U+0080..U+00FF
(128个码位)
平面基本多文种平面BMP
文字拉丁字母(64个)
通用(64个)
应用
符号系列
已分配128个码位
未分配0个保留码位
来源标准ISO/IEC 8859-1
统一码版本历史
1.0.0128 (+128)
注释[1][2]

C1控制字符及拉丁字母补充-1区段内的字符自Unicode标准的1.0版本起一直沿用至今,[3]而该区段在1.0版本的名称只是称作“拉丁字母1”(Latin1)。[4]

字符表

码位 显示 描述 缩写
C1控制字符
U+0080 填充字符 PAD
U+0081 高八字节默认 HOP
U+0082 在此允许换行 BPH
U+0083 在此不允许换行 NBH
U+0084 索引(index) IND
U+0085 换行 NEL
U+0086 所选范围开始 SSA
U+0087 所选范围终止 ESA
U+0088 字符(水平)列表组 HTS
U+0089 齐行的字符(水平)列表 HTJ
U+008A 字行(垂直)列表组 LTS
U+008B 局部字行向前(向下) PLD
U+008C 局部字行向后(向上) PLU
U+008D 反向换行(索引) RI
U+008E 单一移位(single-shift)2 SS2
U+008F 单一移位3 SS3
U+0090 装置控制字符串 DCS
U+0091 私人使用区1 PU1
U+0092 私人使用区2 PU2
U+0093 设置传输状态 STS
U+0094 取消字符 CCH
U+0095 等待消息 MW
U+0096 保护区开始 SPA
U+0097 保护区终止 EPA
U+0098 字符串开端 SOS
U+0099 单图像字符导引字符 SGCI
U+009A 单字符导引字符 SCI
U+009B 控制序列导引字符 CSI
U+009C 字符串终止字符 ST
U+009D 操作系统指令 OSC
U+009E 私人消息 PM
U+009F 应用程式指令 APC
码位 显示 描述
拉丁字母-1标点及符号
U+00A0   不换行空格[注 1]
U+00A1 ¡ 倒感叹号
U+00A2 ¢ 分(cent)记号
U+00A3 £ 英镑记号
U+00A4 ¤ 国际通货符号
U+00A5 ¥ 圆(¥)符号
U+00A6 ¦ 断竖线
U+00A7 § 分节符号
U+00A8 ¨ 分音符
U+00A9 © 著作权符号
U+00AA ª 阴性序数标识
U+00AB « 左书名号
U+00AC ¬ 逻辑非记号
U+00AD 软连字符[注 2]
U+00AE ® 注册商标符号
U+00AF ¯ 长音符号
U+00B0 ° 度数符号
U+00B1 ± 正负号
U+00B2 ² 上标数字2
U+00B3 ³ 上标数字3
U+00B4 ´ 尖音符
U+00B5 µ 微符号
U+00B6 段落符号
U+00B7 · 间隔号
U+00B8 ¸ 软音符
U+00B9 ¹ 上标数字1
U+00BA º 阳性序数标识
U+00BB » 右书名号
U+00BC ¼ 普通分数四分之一
U+00BD ½ 普通分数二分之一
U+00BE ¾ 普通分数四分之三
U+00BF ¿ 倒问号
码位 显示 描述
字母
U+00C0 À 带重音符的大写拉丁字母A
U+00C1 Á 带尖音符的大写拉丁字母A
U+00C2 Â 带扬抑符的大写拉丁字母A
U+00C3 Ã 带波浪号的大写拉丁字母A
U+00C4 Ä 带分音符的大写拉丁字母A
U+00C5 Å 带上圆圈的大写拉丁字母A
U+00C6 Æ 大写拉丁字母AE
U+00C7 Ç 带软音符的大写拉丁字母C
U+00C8 È 带重音符的大写拉丁字母E
U+00C9 É 带尖音符的大写拉丁字母E
U+00CA Ê 带扬抑符的大写拉丁字母E
U+00CB Ë 带分音符的大写拉丁字母E
U+00CC Ì 带重音符的大写拉丁字母I
U+00CD Í 带尖音符的大写拉丁字母I
U+00CE Î 带扬抑符的大写拉丁字母I
U+00CF Ï 带分音符的大写拉丁字母I
U+00D0 Ð 大写拉丁字母Ð
U+00D1 Ñ 带波浪号的大写拉丁字母N
U+00D2 Ò 带重音符的大写拉丁符号O
U+00D3 Ó 带尖音符的大写拉丁字母O
U+00D4 Ô 带扬抑符的大写拉丁字母O
U+00D5 Õ 带波浪号的大写拉丁字母O
U+00D6 Ö 带分音符的大写拉丁字母O
数学运算符
U+00D7 × 乘法符号
字母
U+00D8 Ø 带删节线的大写拉丁字母O
U+00D9 Ù 带重音符的大写拉丁字母U
U+00DA Ú 带尖音符的大写拉丁字母U
U+00DB Û 带扬抑符的大写拉丁字母U
U+00DC Ü 带分音符的大写拉丁字母U
U+00DD Ý 带尖音符的大写拉丁字母Y
U+00DE Þ 大写拉丁字母Þ
U+00DF ß 小写拉丁字母ß
码位 显示 描述
U+00E0 à 带重音符的小写拉丁字母A
U+00E1 á 带尖音符的小写拉丁字母A
U+00E2 â 带扬抑符的小写拉丁字母A
U+00E3 ã 带波浪号的小写拉丁字母A
U+00E4 ä 带分音符的小写拉丁字母A
U+00E5 å 带上圆圈的小写拉丁字母A
U+00E6 æ 小写拉丁字母AE
U+00E7 ç 带软音符的小写拉丁字母C
U+00E8 è 带重音符的小写拉丁字母E
U+00E9 é 带尖音符的小写拉丁字母E
U+00EA ê 带扬抑符的小写拉丁字母E
U+00EB ë 带分音符的小写拉丁字母E
U+00EC ì 带重音符的小写拉丁字母I
U+00ED í 带尖音符的小写拉丁字母I
U+00EE î 带扬抑符的小写拉丁字母I
U+00EF ï 带分音符的小写拉丁字母I
U+00F0 ð 小写拉丁字母Ð
U+00F1 ñ 带波浪号的小写拉丁字母N
U+00F2 ò 带重音符的小写拉丁字母O
U+00F3 ó 带尖音符的小写拉丁字母O
U+00F4 ô 带抑扬符的小写拉丁字母O
U+00F5 õ 带波浪号的小写拉丁字母O
U+00F6 ö 带分音符的小写拉丁字母O
数学运算符
U+00F7 ÷ 除法符号
字母
U+00F8 ø 带删节线的小写拉丁字母O
U+00F9 ù 带重音符的小写拉丁字母U
U+00FA ú 带尖音符的小写拉丁字母U
U+00FB û 带扬抑符的小写拉丁字母U
U+00FC ü 带分音符的小写拉丁字母U
U+00FD ý 带尖音符的小写拉丁字母Y
U+00FE þ 小写拉丁字母Þ
U+00FF ÿ 带分音符的小写拉丁字母Y


子标题

“C1控制字符及拉丁字母补充-1”区段内包含四个子标题,分别为C1控制字符、拉丁字母-1标点及符号、字母及数学运算符。[5]

C1控制字符

“C1控制字符”(C1 controls)子标题下包含32个继承自ISO/IEC 8859-1及其他8位字符标准的补充控制字符(control code)。C0与C1控制字符的别名乃基于ISO/IEC 6429:1992而取。[5]

拉丁字母-1标点及符号

“拉丁字母-1标点及符号”(Latin-1 Punctuation and Symbols)子标题下包含32个常见的国际标点字符(如倒感叹号、倒问号和间隔号等)及汇率符号、占位变音权标号(spacing diacritic mark)、普通分数及上标数字等符号。[5]

字母

“字母”(Letters)子标题下包含30组用于西欧语言的大写和小写拉丁字母,亦额外包含两个不常用于字词开首的小写字母。[5]

数学运算符

“数学运算符”(Mathematical operator)子标题下包含乘号和除号。[5]

符号、字母与控制符数量

下表显示“C1控制字符及拉丁字母补充-1”区段中,各子标题的字母、符号与控制符数量。

子标题名称 符号数量 字符代码范围
C1控制字符 32个控制字符 U+0080..U+009F
拉丁字母-1标点及符号 32个标点符号及规约符号 U+00A0..U+00BF
字母 30组带附加符号大写小写拉丁字母 U+00C0..U+00D6U+00D8..U+00F6U+00F8..U+00FF
数学运算符 包含U+00D7 × MULTIPLICATION SIGNU+00F7 ÷ DIVISION SIGN共两个符号。 U+00D7U+00F7

区块

C1控制字符及拉丁字母补充-1
C1 Controls and Latin-1 Supplement[1]
Unicode Consortium 官方码表 (PDF)
  0 1 2 3 4 5 6 7 8 9 A B C D E F
U+008x XXX XXX BPH NBH  IND NEL SSA ESA HTS HTJ VTS PLD PLU  RI   SS2 SS3
U+009x DCS PU1 PU2 STS CCH  MW  SPA EPA SOS XXX SCI  CSI   ST  OSC  PM  APC
U+00Ax NBSP ¡ ¢ £ ¤ ¥ ¦ § ¨ © ª « ¬ SHY ® ¯
U+00Bx ° ± ² ³ ´ µ · ¸ ¹ º » ¼ ½ ¾ ¿
U+00Cx À Á Â Ã Ä Å Æ Ç È É Ê Ë Ì Í Î Ï
U+00Dx Ð Ñ Ò Ó Ô Õ Ö × Ø Ù Ú Û Ü Ý Þ ß
U+00Ex à á â ã ä å æ ç è é ê ë ì í î ï
U+00Fx ð ñ ò ó ô õ ö ÷ ø ù ú û ü ý þ ÿ
注释
1.^ 依据 Unicode 14.0

绘文字

拉丁字母补充-1区段包含两个绘文字U+00A9 © COPYRIGHT SIGNU+00AE ® REGISTERED SIGN[6][7]

该区段就两个绘文字的绘文字形式(添加U+FE0F VS16)或文字展示形式(添加U+FE0E VS15)定义四个标准化变体,并以后者作为默认。[8]

绘文字可选变体
U+ 00A9 00AE
基本码位 © ®
基本+VS15(文本) ©︎ ®︎
基本+VS16(绘文字) ©️ ®️

历史

下列与Unicode相关的文件记录了在拉丁字母补充-1区块中定义特定字符的目的和过程:

参见

注释

  1. ^ 缩写为NBSP
  2. ^ 缩写为SHY

参考资料

  1. ^ Unicode character database. The Unicode Standard. [2016-07-09]. (原始内容存档于2017-09-25) (英语). 
  2. ^ Enumerated Versions of The Unicode Standard. The Unicode Standard. [2016-07-09]. (原始内容存档于2016-06-29) (英语). 
  3. ^ The Unicode Standard Version 1.0, Volume 1. Addison-Wesley Publishing Company, Inc. 1991 [1990]. ISBN 0-201-56788-1. 
  4. ^ 3.8: Block-by-Block Charts (PDF). The Unicode Standard. Unicode Consortium. [2021-10-10]. (原始内容 (PDF)存档于2021-02-11) (英语). 
  5. ^ 5.0 5.1 5.2 5.3 5.4 Unicode 6.2 code charts (PDF). The Unicode Standard. [2013-04-01]. (原始内容 (PDF)存档于2018-07-04) (英语). 
  6. ^ UTR #51: Unicode Emoji. Unicode Consortium. 2020-02-11 [2022-05-17]. (原始内容存档于2020-06-30). 
  7. ^ UCD: Emoji Data for UTR #51. Unicode Consortium. 2021-08-26 [2022-05-17]. (原始内容存档于2022-03-28). 
  8. ^ UTS #51 Emoji Variation Sequences. The Unicode Consortium. [2022-05-17]. (原始内容存档于2022-03-31).