用户:Jackchows/草稿/中文输入法

中文输入法是指为了将汉字输入计算机手机等电子设备而采用的编码方法,是中文信息处理的重要技术。

中文输入法从1980年代发展起来的,中间为几个阶段:单字输入、词语输入、整句输入。对于中文输入法的要求是以单字输入为基础达到全面覆盖;以词语输入为主干达到快速易用;整句输入还处于发展之中。

输入原理

历史

形码输入法

拼音输入法

混合输入法

专利与著作权

中文输入法的拆字方法与原则若其符合专利法条件可受到专利权的保护。但是任何人依据同一套拆字方法或原则衍生出的编码表是唯一的、都一模一样,所以此编码表不受著作权法保护。[1][2]

功能及品质

 
中州韵输入法引擎的Windows发行版——小狼毫输入法的用户界面
商业化、内建与否

通常系统内建的输入法最方便、最泛用。而需要额外安装者次之。除下载或携带安装程式的不便以外,有些系统会限制使用者不得安装软体。商业化的输入法除了需要付费,许多地方可能没有安装而造成使用不便;更甚有因公司倒闭而使输入法绝灭,使用者只好重新学习新的输入法。目前有少量开源输入法,比如中州韵输入法引擎

易学

通常初学者会考量一个输入法是否易学,以下是一些影响易学性的变数:

  • 字根数目:通常字根数越多,记忆量便增加
  • 编码的合理性:编码较合理,能方便记忆,加快学习速度
  • 口诀:有些编码虽不甚合理,但附有特殊口诀,而容易记忆
  • 取码规则的繁复与否
速度
  • 重码率:重码率越低,免却选字的疑虑,输入速度越快
  • 编码长度:编码越短,输入时间越低。但另一方面,编码长度太短,又会增加重码率。因此好的输入法须取得平衡。
  • 简码:简码可大幅增加常用字的输入速度,但必须额外背诵。因此是否要背简码、简码是否好背,也是考量要点。
容错性
  • 有些输入法可一字多拆,避免一些字型由于主观认知上的差异而拆不出的困扰
  • 有些输入法支援模糊输入,如,如此一来,不会拆字时,便可用模糊的输入方式拆出
符号输入

标点符号在中文文章中相当重要,因此标点符号是否容易输入也至关紧要。 有些输入法除常用标点符号以外,尚可输入较少用的符号,如注音、希腊符号、数学符号、等等。

自由性

有些输入法可自定编码或自定词库,以词定字、以句定词、优化词库,增加灵活性。输入法的学习、记忆功能亦会影响到输入速率及体验,故不少输入法都有动态字频、动态词频。

字库大小

一些输入法只针对常用字编码,导致生僻字不是无法输入,就是难以输入。

人工智慧

无论音码、形码、形音码、音形码、无理码输入法在出现重码时期望可以通过人工智慧辅助选字。这方面音码因为重码较多,比较迫切,因此做得较好;相比下形码因为重码较少,支持人工智慧选字的形码输入法较少,有较大发展空间。

参考资料

参见

外部链接

中文输入法

新闻

线上中文输入系统

指南

应用商店提供的中文输入法