伪翻译
概要
若一个软体在设计时并未将本地化能力(localizability)纳入考虑,那么在实际针对这软体进行本地化翻译时,将有可能会面临许多问题。例如文字在翻译后可能比来源语言的文字还要更长,那么将导致翻译后的文字被截断而难于辨识。例如软体的选单、文字区域、按键、核取方块等,设计者在做界面设计时通常先调整出适切于来源语言文字长度的大小(通常为英文),并进一步调整界面的对齐、位置、行距等等。然而,一些语言从来源语言被翻译后,往往会比来源语言的长度更长,例如德文或是挪威文通常都比英文要来的长,于是原始的界面大小便会显得过小而无法正常显示翻译后的文字。
问题还可能更加严重,一些语言的文字或符号可能因为软体原始指定的字形并未支援,而导致无法正常显示。问题也会出现在输入端,某些程式设计师错误的假设使用者在输入时不会输入一些特殊字元或是特定语言的文字,而导致使用者在实际操作软体时发生问题。
针对一些已然成熟且多数的目标语言翻译已经可以取得的软体而言,或是仅会有少量界面变更的软体,直接将翻译套用至该软体并进行多个语言的测试,可能是最直接且最好的测试方式。而针对一些新开发的软体,或是将会有庞大的界面变更的软体,等待翻译完毕之后再进行界面测试,则可能因此延迟了整个测试的时程。并且,在软体开发的初期也不见得会开始进行界面文字的翻译,因为界面有很大的机率会被调整甚至重新设计。若要等到产品比较成熟后,开始进行界面翻译,然后才进行翻译的界面测试,产品的上市时程将可能因此被延误。在这样的状况之下,伪本地化将会是最佳的选择,原因之一包含翻译并不会真正的被执行。
一般而言,程式里预计要被翻译的文字都将会被伪翻译(pseudo-translation)。假定英文为软体的来源语言文字,一般而言伪翻译的文字必须要比来源语言的文字长度还要长,文字并且要包含较长且不含空白的单字,并且最好包含了不同语系的文字。如此一来,测试者便可借由审查每个界面的元件来验证有无文字被截断的状况发生。
方法
为了使测试者更加容易的操作且辨识经过伪翻译后的软体与界面,伪翻译可以借由以下的方式来进行;
假定原始的来源语言的其中一个界面文字是:
- Close Current File
伪翻译后的结果:
- Çlôôsèè Çúrrrèñtt Fîllèè
以这个例子而言,不仅欧语的延伸字元也可同时被检视能否正常呈现,界面文字也就由某公式适度的加长,并且最重要的是文字近似于原始的英文,测试者将会较为容易操作软体。
而要针对文字是否有被截断,还可以在伪翻译后的文字前后加上特定符号,例如:
- αÇlôôsèè Çúrrrèñtt Fîllèèß
如此一来,测试人员可以借由首尾的α与ß来判定伪翻译后的文字是否有被截断。
近年来,随著机器翻译技术的进步,借由机器翻译也可达到与伪本地化相当的效果。