User:Liangent/sptest
Liangent/sptest | |
空格是行文為防止混淆或有特定用途的空位。中文傳統無標點,字與字之間亦無空格,但空格有特定用途,如每段起首須縮入兩個字位[1],尊稱前要留空一格等等。
中文排版
在使用中文電腦初期,文書處理及網頁編輯工具大多改自英文軟體,與BIG5編碼並不完全相容;英文字為1byte、BIG5中文字是2byte,假使邊界或斷行排版沒設定好,不足容納中文字時會造成該字或整段亂碼,因此比照英文排版在各字間加半形空格(多出1byte緩衝)以避開程式錯誤。
及至中文文書和網頁編輯軟體發展成熟後,不再產生亂碼情形,也就無須在字間加空格。現今僅少數香港媒體新聞網頁,如香港電台仍沿襲早期排版方式[2]。
Unicode定義
Unicode 定義了大量空格符號,列表如下:
編碼 | 不換行 | 用于 URL | HTML | 名稱 | 區域 | 顯示 | |
---|---|---|---|---|---|---|---|
U+0020 | 空格 | 基本拉丁 | ] [ | ||||
正常半形空格,同 ASCII 字元 0x20 | |||||||
U+00A0 | ✓ | | 不換行空格(No-Break Space) | Latin-1 Supplement | ] [ | ||
同 U+0020,但不換行 | |||||||
U+1680 | ✓ | 歐甘空格(Ogham Space Mark) | 歐甘字母 | ] [ | |||
用於分隔歐甘文字。 | |||||||
U+180E | ✓ | 蒙古文元音分隔符(Mongolian Vowel Separator,MVS) | 蒙古文 | ][ | |||
作用近似 U+00A0 No-Break Space。用於蒙古文時寬度通常為普通空格三分之一。 | |||||||
U+2002 |   | En 空格(En Space)或 Nut | 一般標點 | ] [ | |||
與 en 同寬(em之一半)。 | |||||||
U+2003 |   | Em 空格(Em Space)或 Mutton | 一般標點 | ] [ | |||
與 em 同寬。 | |||||||
U+2004 | Em 三分之一空格(Three-Per-Em Space)或 Thick Space | 一般標點 | ] [ | ||||
em 之三分之一寬 | |||||||
U+2005 | Em 四分之一空格(Four-Per-Em Space)或 Mid Space | 一般標點 | ] [ | ||||
em 之四分之一寬 | |||||||
U+2006 | Em 六分之一空格(Six-Per-Em Space) | 一般標點 | ] [ | ||||
em 之六分之一寬。電腦字型有時與 U+2009 等同。 | |||||||
U+2007 | ✓ | 數字空格(Figure Space) | 一般標點 | ] [ | |||
用於分隔數字之定位符,與單一數字同寬 | |||||||
U+2008 | 標點穴格 | 一般標點 | ] [ | ||||
與同字型之窄標點同寬,即句號或逗號(西方語文)之寬度[3] | |||||||
U+2009 |   | 窄空格(Thin Space) | 一般標點 | ] [ | |||
em 之六分之一(有時設計成五分之一)寬。建議用作SI 單位數字之千位分隔符。與 U+2002 至 U+2008 不同,其寬可根據排版調整[4] | |||||||
U+200A | 髮寬空格(Hair Space) | 一般標點 | ] [ | ||||
窄於窄空格(thin space) | |||||||
U+200B | 零寬空格(Zero Width Space,簡稱「ZWSP」) | 一般標點 | ][ | ||||
U+200C | ✓ | ‌ | 零宽不连字(Zero Width Non Joiner,簡稱「ZWNJ」) | 一般標點 | ][ | ||
U+200D | ✓ | ‍ | 零宽连字(Zero Width Joiner,簡稱「ZWJ」) | 一般標點 | ][ | ||
U+202F | ✓ | 窄式不換行空格(Narrow No-Break Space) | 一般標點 | ] [ | |||
U+205F | 中數學空格(Medium Mathematical Space,簡稱「MMSP」) | 一般標點 | ] [ | ||||
用於數學方程式。em 之 18 分之 4 寬[5]在數學排版領域,空格寬度通常以十八份之幾的方式給定;4/18 em 可用於數個情況,例如數式 a + b 中 a 與 + 及 + 與 b 之間[6] | |||||||
U+2060 | ✓ | ✓ | 文字連接符(Word Joiner) | 一般標點 | ][ | ||
同 U+200B,但該處不能換行。Unicode 3.2 新增,以代替 U+FEFF 字元廢止之零寬不换行空格功能 | |||||||
U+3000 | 表意文字空格 | CJK 符號及標點 | ] [ | ||||
與 CJK 文字同寬(全形) | |||||||
U+FEFF | ✓ | ✓ | 零寬不换行空格(Zero Width No-Break Space) = 位元組順序記號(Byte Order Mark,簡稱「BOM」) | Arabic Presentation Forms-B | ][ | ||
主要用作位元組次序標記字元。原來之不換行指示功能於 Unicode 3.2 起廢止,代之以 U+2060。 |
Unicode 在「控制圖像(Control Pictures)」區域亦提供一些具像字元用來代表空格:例如 Symbol For Space ␠ (U+2420)、Blank Symbol ␢ (U+2422) 和 Open Box ␣ (U+2423)。有些文書處理軟件如 Microsoft Word 會使用 interpunct · 代表半形空格。
注釋
- ^ 沿自1919年胡適、周作人、錢玄同等向中華民國教育部提出《請頒行新式標點符號議案(修正案)》[1][2]
- ^ 天文台明日考慮需否發三號強風信號. 香港電台. 2012-07-21 [2012-07-22] (中文(香港)).
- ^ Character design standards - space characters. Character design standards. Microsoft. 1998–1999 [2009-05-18].
- ^ The Unicode Standard 5.0, printed edition, p.205
- ^ General Punctuation (PDF). The Unicode Standard 5.1. Unicode Inc. 1991–2008 [2009-05-13].
- ^ Sargent, Murray III. Unicode Nearly Plain Text Encoding of Mathematics (Version 2). Unicode Technical Note #28. Unicode Inc: 19–20. 2006-08-29 [2009-05-19].