合字

一般表示將多於一個字母的合成一個字形

合字連字連結字合體字(英語:Ligature),在西方字型排印學中一般表示將多於一個字母的合成一個字形。如印刷品中常常將拉丁字母兩個字母fii上一點常與f的一鈎合併,而德語字母ß原為ss等等。漢字的合字在不同情況下也稱作合文合體字

12pt Garamond字模:長s與i的連字

合字經過演變、長時間流行後,可能被視為直接的符號文字而非合字。如W源自VV或UU,Æ源自AE,而表示「與」的意思的「&」,原是e和t的合字。

歷史

印刷合字單純源於手寫本中連寫的字元。以發現的最早的楔形文字手寫本中就已經含有很多連寫字元。中世紀的拉丁文手寫本中,謄寫僧人為加快速度將字元連寫,誕生了很多手寫縮合字,如在哥德體中,帶右圈的字母(b, o,和p)和帶左圈的字母(c, e, o, d, gq)的圈部都被重疊書寫。很多手寫本字元如h, mn的豎劃都被重疊,而且誕生了很多手寫縮合字。14世紀的手寫本中含有很多這種手寫縮合字。

活字印刷誕生後,很多合字直接被製造成了鉛字。但是在1950年代無襯線字型廣泛使用,以及1970年代照相排版技術之後,合字就逐漸很少被使用。最早能進行合字電腦排版(之後激光印表機)之一的是高德納TeX程式(詳見下文)。這一潮流也影響到了1985年之後的桌面排版技術。早期電腦軟件無法進行合字替換(但TeX可以),大部分新製作的電腦字型裏也沒有合字。早期的個人電腦多使用英文,而英文中並不是必須使用合字,所以也沒有實際需要。

隨着現代電腦處理的多語言化和現代電子排版技術(如OpenType)的流行,合字開始逐漸恢復被使用。

拉丁文字

 
拉丁文字中的典型合字

書法合字

 
fi和fl

許多合字都把字母f和其後的字元組合起來,最常用的就是(或f‌i,顯示為兩個獨立字元)。很多字型的這兩個字母並排在一起後,字母i上的點會抵擋到字母f的弧形勾,無法正確排印,所以乾脆就製造一個合字鉛字,把i的點融入f的勾來直接使用。其他f合字包括fj[1]f‌l(fl)、f‌f(ff)、f‌f‌i(ffi)、和f‌f‌l(ffl)。其他合字包括fafefofrfsftfbfhfufy,以及f後加句號逗號連字元,還有不太常用的雙寫fffft

使用這些合字是因為通常的小寫字母f中弧形勾影響字元間距調整。

有時,跨詞合字(如shelfful[2]ff)是不希望出現的,電腦程式(如TeX)提供手動方式將它們分開。一些字型帶有fff合字(如Requiem體甚至包括一個 fffl合字)用於德語的複合詞,如Sauerstoffflasche(氧氣罐)和Schifffahrt(遊艇)(僅在遵循1996年拼寫改革法的前提下才寫作fff)。正式的德文正寫法,如杜登詞典所述,不贊成跨詞合字,由於fff組合在德文中只會在組合詞出現如(Schiff-fahrtSauerstoff-flasche),所以這樣跨詞合字在德文中使用會被認為是不正確的。[3]英語中類似的例子則是Shelfful

土耳其語中有帶點和不帶點的字母I,如單詞fırın(烤箱)和fikir(主意)。fi合字容易混淆,所以在土耳其文排印中一般不使用該合字。像fl合字一般也不用,土耳其語本來就沒有這樣的拼寫。

 
「ß」寫作「ſʒ」合字的例子。柏林街頭的標識(Petersburger Straße)。右邊的標識(Bersarinplatz)最後一個字是tʒ合字。

合字ſʒ(sz)和(tz)來自德語哥德體,現在街頭、城市廣場的標識中帶Platz或者以-platz結尾時仍常被使用。

有時st(st)、ſt(ſt)、chctQu以及Th的合字也被使用(如字型Linux Libertine)。

德文ß

德語eszett合字(亦稱scharfes S「清S」)ß,其名稱es-zett(意為「S-Z」)表示其源自「長S加Z」或「長S在圓S之上」。儘管「長s」ſ已經在現代德文正寫法消失了,ß仍被保留並被視為合字,傳統上在大寫的時候以及字母排序的時候覆寫為「SS」。2008年其大寫字母「ẞ」加入Unicode並出現更多字形。ß僅在德國和奧地利使用,瑞士德文不用這個合字。

起源於合字的字母

 
Adobe Caslon Pro中的合字

字母W7世紀左右才被加入拉丁字母表的,其發音不盡相同。古英語使用盧恩字母Ƿ(Wynn),但受到諾曼人影響後廢棄不用。14世紀,這個起源於雙寫的VU的「新」字母W誕生並在字母表中佔有一席。由於它相對於其他字母比較年輕,只有很少歐洲語言(英語、荷蘭語、德語、波蘭語、威爾斯語馬耳他語瓦龍語)使用它來拼寫本土詞彙。

字元Æ(小寫æ,中世紀時稱為aesc)作為一個字元在丹麥語挪威語冰島語以及古英語中使用,並不是一個印刷用的合字。它是一個實在的字母——代表一個元音,且在字母表中有位置。現代英文正寫法中Æ不作為一個單獨字母,而只是一種拼寫異形,如百科全書的英文單詞encyclopædia也可拼寫成encyclopaedia或encyclopedia。

Æ源自中世紀拉丁文,當時只是一些詞彙的隨意合字如Æneas。它還可以在英文和法文中出現,但是現在已經傾向把AE分開印刷。[4]同樣,Œœ在法文中雖然通常印刷成合字,但在技術限制情況下仍可以拆開書寫。

德文正寫法中,帶兩點的字母元音äöü來自歷史上的aeoeue合字(嚴格的說是標在頂端的e,即)。現在當文書處理無法顯示這三個字元的情況下仍可覆寫為二合字母ae、oe、ue。字母排序中它們不等價於aeoeue,而是被簡單看成aou。而北歐語言則不同:帶兩點的字母被視為獨立字母,並排在字母表最後。

一些元音中的圈形附加符號,如å起源於一個o合字[5]。現在把舊式aa覆寫為å已經稱為不成文習慣,但在此之前也可寫成a上再加一個小a(),如Johannes Bureus、Runa ABC boken[6]

uo合字ů的使用實例也在早期現代高地德語裏找到,但其後來混同到u中(如中期高地德語fuosz、早期現代高地德語fuͦß、現代德語Fuß)。它仍存在於捷克語中,被稱為kroužek

西班牙語葡萄牙語中的上波浪線,分別用於字母ñ表示元音鼻音化,起源於一個nn合字[7](Espanna = España、anno = año)。同樣法語中的抑揚符也源自不發音s。[8]法語、葡萄牙語、西班牙語等中的字母ç其實是一個字母c蓋在一個z上面的形式。

字母ƕ(Hwair)僅用於轉寫哥德語,代表hw合字。最早在1900年左右心理學者使用這個字用於代替二合字母hv用於表示有問題的現象,如Jacques Paul Migne在其1860年代的著作(Patrologia Latina,第18卷)。

拜占庭帝國有一個獨特的合字Ȣ(o-u合字),它源於希臘字母的ο-υ兩個字母的合字,並被加入到了字母表中。

ƣ(Gha)是一個罕見的字母,起源於Q和G,但在ISO的檔案中誤注成O-I合字(參見Unicode註解)。

國際音標使用合字來表示塞擦音,其中6個有Unicode編碼:ʣ、ʤ、ʥ、ʦ、ʧ、ʨ。一個擦音仍使用合字:ɮ,而國際音標擴充裏加入了另外三個:ʩ、ʪ、ʫ

還有一些罕見合字,如Ꜳꜳ、Ꜵꜵ、Ꜷꜷ、Ꜹꜹ、Ꜻꜻ、Ꜽꜽ、Ꝏꝏ、ᵫ、ᵺ、Ỻỻ、Ꜩꜩ、ᴂ、ᴔ

起源於合字的符號

 
Et合字(Insular Minuscule的寫法)

最常用的合字符號當屬&。它起源於Et的合字,即拉丁文的單詞「和」(et)。它在法文中保持原音原意而在英文中也使用。由於其使用廣泛,一般已經不認為它是一個合字而是一個普通符號。

和其他合字一樣,它被仍當作一個字母來使用(如早期現代英語),英語中它念作and而不是et,而&c念作et cetera(等等)。大多數字型中的字形和兩字直接組合不一樣,但仍有一些字型(如Trebuchet MS)就把&設計為合字。

同樣,美元符號$可能也起源於合字(「pesos」,但有也有其他不同說法),但現在實際上已經被當成一個普通符號。[9]西班牙比塞塔(peseta)也有時被寫作合字₧(源自Pts)。

二合字母

 
大寫IJ字形看起來像「斷臂的U」合字(Helvetica字型,由Omega TeX彩現)

二合字母,如西班牙語威爾斯語中的ll,一般不被看成是合字,因為印刷上兩個字母通常是分開的。正如上討論的合字一樣,一些二合字母在一些語言中有不同處理方式。西班牙1994年拼寫改革時,二合字母chll已經被考慮為分開的兩個字母。

法文的情況也一樣,œu被看成為合字œ與字母u的組合。

儘管如此,荷蘭語中「ij」的定位比較模糊。根據不同的使用標準,它可看成是一個二合字母,或合字,或者一個獨立字母。它有獨立的大小寫形式,而在一些專業字型中,通常是有一個獨立字形也有合字(如Zapfino)。無襯線字型大寫字母的IJ流行於荷蘭,通常形狀像是一個斷左臂的U。更令人混淆的是,手寫時可以把小寫字母y寫作沒有點的ij,和大寫字母IJ(同樣沒有點)看起來只是大小差異而已。而Y在本土荷蘭語詞彙中不被使用。

含有合字的拉丁語文

非拉丁字元

合字不僅出現在拉丁文字中:

  • 婆羅米系文字元音附標文字頻繁使用合字標註輔音。合字的數量依據語言而不同,如同樣的天城文,用於梵文的合字就要比印地文多。總數為37的輔音中,在天城文兩個字母組成的合字總數為1369,很少字型能全部顯示這些合字。微軟Windows系統附帶的Mangal等字型帶有印地語支援,但不能正確處理在द, ट, ठ, ड,和ढ右邊的輔音合字,而只是加怛達點畵後按照一般形式顯示在輔音之後。
  • 希臘字母中使用一些合字,特別是在Ο(Omicron)和Υ(Upsilon)連寫並衍生出一個西里爾字母。參見Ȣ字母。
  • 西里爾合字:ЉЊЫѾIotified西里爾字母是早期西里爾字母І和其他元音的合字:Я的前身)、ѤѨѬЮ(源自另外一個合字ѸУ的早期形式)。塞爾維亞語字母表中的兩個字母 ЉЊ 在19世紀曾分別是ЛН軟音符號ь)的合字。還有一個ЯЕ的合字:Ԙԙ,其他合字包括Ꚅ、ꚅ 和 Ꚉ、ꚉ
  • 格拉哥里字母的一些手寫形式:用於中世紀到19世紀書寫的斯拉夫人語言,多為方形且常用合字。
  • 希伯來語中字母א‎(Aleph)和ל‎(Lamed)在一些前現代文字中(主要是宗教或「猶太-阿拉伯」文字)可組合為合字。該組合很常用,因為[ʔ][a]l-(在希伯來文中寫作alephlamed)是阿拉伯語中的定冠詞
  • 阿拉伯文:各個字母在詞頭,詞中,詞尾均有不同形式。如阿拉伯文的mīm,單獨書寫為م‎,三個連寫(mmm,顯示為詞頭,詞中,詞尾形)就變為ممم‎。注意lām + ʼalif的情況是特殊的:‎,lām + ʼalif在詞中、詞尾形式是‎。在Unicode有幾個特殊的合字,如安拉位於U+FDF2:‎;太斯米位於U+FDFD:‎ 等。
  • 烏爾都語使用阿拉伯文字納斯塔里格體的手寫體,在電子排印中有大量合字。烏爾都語最常用的排版工具InPage使用納斯塔里格體字型產生多達20,000個合字。
  • 藏文在Unicode有一個特殊的合字U+0F00:)。
  • 日文自江戶時代起便有以把文字組合在一起形成文字繪的遊戲,例子有へのへのもへじ
  • 漢字中如孔孟好學 )、招財進寶 [10][11]日進斗金雙喜傳統上經常會合為一字書寫,稱為合文,另外還有大量疊字流傳至今。近年,也有網民將「草泥馬」「成龍」等字編成合文。

電腦排版

TeX是電腦排版系統中能使用合字的典型程式。它能提供五個常用合字:fffiflffiffl。當TeX遇到這些組合時會自動替換成合字。當然操作者可以手動切換。

OpenType字型格式可以針對一個字元提供多個字形,因此用來作為合字替換,但需要軟件支援。XǝTeX就是一個可以運用這一優勢的TeX排版引擎。這種替換原先主要用於阿拉伯文排版,但現在已經廣泛用於西文OpenType字型。OpenType中,這些是標準liga、歷史性hlig、上下文clig、需求性rlig和任意性dlig合字。這些在CSS3中可用font-feature-settings啟用或禁用。[12]

CSS還支援font-variant-ligatures特效。common-ligaturesdiscretionary-ligatureshistorical-ligaturescontextual特效也被支援。[13]

下表列出了常用文字對的合字以及Unicode代碼。正確顯示需要使用能正確處理合字的作業系統瀏覽器並呼叫正確的Unicode 電腦字型

Unicode中對合字的處理不是一個字元定義,而是一種繪製形式。即Unicode不把合字當作一個字元,而是把合字處理為字元序列,由字形繪製系統去處理是否用合字的字形在螢幕上顯示或者列印。比如,如果一個現代字型需要顯示h後加r,且該字型確實有hr合字,這個合字才會被顯示出來。因此,使用特殊Unicode合字字元是「不鼓勵」且「在任何環境下不會被再度編碼」的。[14]注意,合字æ和œ不能隨意替代ae和oe,比如does不能寫作dœs。

Unicode中的合字列表(拉丁字母)

這是一個不完整列表。U+A732到U+A73D區域及其臨近區域的一些字元沒有列出。
非合字 合字 Unicode HTML
et & U+0026 &
ſs、ſz ß U+1E9E、U+00DF ẞ、ß
AE、ae Æ、æ U+00C6、U+00E6 Æ æ
OE、oe Œ、œ U+0152、U+0153 Œ œ
IJ、ij IJij U+0132、U+0133 IJ ij
ue U+1D6B ᵫ
TZ、tz U+A728、U+A729 Ꜩ ꜩ
AA、aa U+A732、U+A733 Ꜳ ꜳ
AO、ao U+A734、U+A735 Ꜵ ꜵ
AU、au U+A736、U+A737 Ꜷ ꜷ
AV、av U+A738、U+A739 Ꜹ ꜹ
AY、ay U+A73C、U+A73D Ꜽ ꜽ
OO、oo U+A74E、U+A74F Ꝏ ꝏ
ui U+AB50 ꭐ
f‌f U+FB00 ff
f‌i U+FB01 fi
f‌l U+FB02 fl
f‌f‌i U+FB03 ffi
f‌f‌l U+FB04 ffl
ſt U+FB05 ſt
st U+FB06 st
eT 🙰 U+1F670 🙰

另外,Dz克羅地亞語和波斯尼亞語字母DŽ、LJ和NJ都有單獨的碼位。它們不是合字而是二合字母

僅在標音時使用的合字
非合字 合字 Unicode HTML
db ȸ U+0238 ȸ
qp (cp) ȹ U+0239 ȹ
(或lezh) ɮ U+026E ɮ
dz ʣ U+02A3 ʣ
(或dezh) ʤ U+02A4 ʤ
(或dz curl) ʥ U+02A5 ʥ
ts ʦ U+02A6 ʦ
(或tesh) ʧ U+02A7 ʧ
(或tc curl) ʨ U+02A8 ʨ
ʩ U+02A9 ʩ
ls ʪ U+02AA ʪ
lz ʫ U+02AB ʫ

U+0238和U+0239是二合字母,但實際上是合字。[15]

計量單位的合字
除個別符號外絕大多數編成合字形式的計量單位的符號收錄於CJK Compatibility(U+3300到U+33FF)區域中
非合字 合字 Unicode HTML
°C U+2103 ℃
°F U+2109 ℉
fm U+3399 ㎙
nm U+339A ㎚
μm U+339B ㎛
mm U+339C ㎜
cm U+339D ㎝
dm U+3377 ㍷
km、KM U+339E、U+33CE ㎞ ㏎
μg U+338D ㎍
mg U+338E ㎎
kg U+338F ㎏
cal U+3388 ㎈
kcal U+3389 ㎉
μl U+3395 ㎕
ml U+3396 ㎖
dl U+3397 ㎗
kl U+3398 ㎘
Pa U+33A9 ㎩
kPa U+33AA ㎪
mPa U+33AB ㎫
GPa U+33AC ㎬
pA U+3380 ㎀
nA U+3381 ㎁
μA U+3382 ㎂
mA U+3383 ㎃
kA U+3384 ㎄
pV U+33B4 ㎴
nV U+33B5 ㎵
μV U+33B6 ㎶
mV、MV U+33B7、U+33B9 ㎷ ㎹
kV U+33B8 ㎸
pW U+33BA ㎺
nW U+33BB ㎻
μW U+33BC ㎼
mW、MW U+33BD、U+33BF ㎽ ㎿
kW U+33BE ㎾
U+33C0 ㏁
U+33C1 ㏂
Hz U+3390 ㎏
kHz U+3391 ㎐
MHz U+3392 ㎑
GHz U+3393 ㎒
THz U+3394 ㎓
KB U+3385 ㎅
MB U+3386 ㎆
GB U+3387 ㎇
lm U+33D0 ㏐
ln U+33D1 ㏑
lx U+33D3 ㏓
mol U+33D6 ㏖
rad U+33AD ㎭
rad/s U+33AE ㎮
ps U+33B0 ㎰
ns U+33B1 ㎱
μs U+33B2 ㎲
ms U+33B3 ㎳

註釋

  1. ^ 字母組合fj英語中僅有fjordfjeld中出現,但加上世界語挪威語和其他j代表半元音[j]的語言
  2. ^ Helmut Kopka; Patrick W. Daly. A Guide to LaTeX, 3rd Ed.. Addison-Wesley. 1999: 22. ISBN 0201398257. 
  3. ^ Duden 1, Mannheim 1996, p. 69.
  4. ^ The Chicago Manual of Style、14th Ed. Chicago: The University of Chicago Press. 1993: 6.61. 
  5. ^ 905-906 (Nordisk familjebok / Uggleupplagan. 33. Väderlek - Äänekoski). runeberg.org. 2017-09-12 [2010-03-19]. (原始內容存檔於2012-10-24). 
  6. ^ 存档副本. [2010-02-05]. (原始內容存檔於2010-01-24). 
  7. ^ AulaHispanica.com. [2010-03-19]. (原始內容存檔於2010-07-02). 
  8. ^ Teach Yourself French. Collier's Cyclopedia、1901.
  9. ^ Cajori, Florian. A History of Mathematical Notations. New York: Dover (reprint). 1993. ISBN 0-486-67766-4.  - contains section on the history of the dollar sign, with much documentary evidence supporting the theory $ began as a ligature for "pesos".
  10. ^ 搜查線:招財進寶合體字 由溥儀創造?. 東方日報. 2016年10月11日 [2019年5月20日]. (原始內容存檔於2019年6月12日). 
  11. ^ 蛤?!這些「組合字」春聯竟然還有讀音 「招財進寶」唸…. 三立新聞網. 2016年2月8日 [2019年5月20日]. (原始內容存檔於2018年2月20日). 
  12. ^ font-feature-settings property. MSDN. MSDN. [24 November 2014]. (原始內容存檔於2015-01-10). 
  13. ^ CSS font-variant-ligatures Property. CSS Portal. [2014-11-29]. (原始內容存檔於2015-02-22). 
  14. ^ Ligatures, Digraphs and Presentation Forms頁面存檔備份,存於互聯網檔案館), Unicode FAQ
  15. ^ Freytag, Asmus; McGowan, Rick; Whistler, Ken. Known Anomalies in Unicode Character Names. Unicode Technical Note #27. Unicode Inc. 2006-05-08 [2009-05-29]. (原始內容存檔於2009-04-21). 

參閲

外部連結