常用国字标准字体表
中华民国教育部在1973年(民国62年)委托台湾师范大学国文研究所成立专案小组,负责研订国民常用字及标准字体。经长期的研订和试用,在1982年(民国71年)正式启用《常用国字标准字体表》,共计收录4808个字[1][2]。在1996年(民国85年),教育部公布《常用国字标准字体笔顺手册》,用国字标准字体说明常用字的笔顺。
教育部正字及异体字表
- 常用国字标准字体表,简称甲表,ISBN 9789570906646,教育部于1978年5月印行,内附“教育部社会教育司委托国立台湾师范大学国文研究所研订常用国字及标准字体总报告”。收到各界意见修订后,委由正中书局于1979年6月出版,于1982年9月1日作为常用字和字体标准正式启用,内收4808字。
- 次常用国字标准字体表,简称乙表,ISBN 9786660913003,于1982年10月印行,12月出版的次常用字和字体标准,内收6341字。1993年公布的《国字标准字体楷书母稿》中,次常用字为6343字。在最新版的《异体字字典》附录,次常用字更订为6329字[3]。
- 罕用国字标准字体表,简称丙表,ISBN 9786660913010,于1983年10月印行,隔年4月出版的的罕用字和字体标准,内收18388字。在最新版的《异体字字典》附录,罕用字更订为18318字。
- 异体国字字表,简称丁表,于1984年3月印行的异体字标准,内收异体18588字,补遗22字。在最新版的《异体字字典》附录,收异体字74381字。
教育部国家教育研究院负责维护的《异体字字典》附录收有〈正字表〉。该表依据教育部常用字、次常用字、罕用字三个标准字体表订定;遇有具独立音义而三字表未收之字形,则补收为新正字。联绵词为描摹语音而设,故有多种字形,其异形之用字,原则上均视为独立正字,除非文献明示正异关系或字构可见孳乳线索[4][5]。据《异体字字典》正式七版(2024年)所收正字编录,计收29920字。
研订方法
常用国字标准字体表(甲表)
1973年2月,由“国字整理小组”扩编的“常用国字编纂处”在林尹、周何、李鍌、陈新雄、李殿魁、张文彬、于大成、王熙元、胡自逢、许锬辉、黄永武、黄庆萱等文字学学者的领导下,着手进行常用标准国字的整理工作。其收字及选字标准为,从中文大辞典编纂处 “总字表”(49905字)、师大国文研究所“常用字表”(2408字)及教育部“国民学校常用字汇表”(4864字)中,合并统计其总出现次数,再参酌各方意见修订而成[4][6][1][7]。
- 常用字资料来源及其出现次数表:从“总字表”出现次较多之字挑选出7980字,结合“常用字表”,并合并“国民学校常用字汇表”[注 3]之字频统计。
- 国民常用字调查表:以“常用字资料来源及其出现次数表”选定之7980字为基础,将“常用字表”与“国民学校常用字汇表”二者出现次的总和作为总出现次。依出现总次的高低排序,合并正俗字,选出其中最常用的4708字制成,此为初步统计结果。1978年(民国67年)教育部参酌各方意见将字表增订至4808字,定名为《常用国字标准字体表》。
次常用国字标准字体表(乙表)
编纂团队继续研订出次常用国字10740字。在参酌各方意见后,依使用频率,区分为《次常用国字标准字体表》(乙表)6341字(含单位词9字)以及《罕用字体表》(丙表)4399字。甲、乙、丙三表之异体字,则另立《异体字表》(丁表)来收纳,以便检索查找[4]。
乙表的选字原则为:
- 凡十三经、四史、《楚辞》、《文选》、《淮南子》、《老子》、《庄子》、《荀子》、《韩非子》、《吕氏春秋》、《管子》等书用字。
- 以《中文大辞典》为根据,再参酌其他辞书,凡某字之词头次数超过两次以上者。
- 现代学术专业或地方性用字,经讨论决定者。
罕用国字标准字体表(丙表)
编纂团队研议扩充《罕用字体表》,丙表从原本的4399字增加为18388字(若含附录字18字、补遗74字,则为18480字)[4]。
《丙表》扩充之收字审定原则为:
字元编码及字体电脑化
1980至1987年间,由中研院中美科学学术合作委员会与文建会(后升格为文化部)赞助的“资讯应用国字整理小组”发布《中文资讯交换码》,纳编53940个汉字,包括:正体常用字4808、正体备用字17032、异体常用备用字11517和正体罕用字20583[11]。正体常用字即为《常用国字标准字体表》的4808字[12]。
1986年,中央标准局公布《通用汉字标准交换码》(后更名为《中文标准交换码》)纳编“常用及次常用字”,共计13051字,成为中文资讯处理交换码纳编字数的国家标准[1]。该标准的第一字面字集(5401字)编入《常用国字标准字体表》及常见的“国中小教科书常用字”,第二字面字集(7650字)编入《次常用国字标准字体表》及使用频率较高的“罕用国字”[13]。《中文标准交换码》日后陆续扩编,目前大约有96600多个汉字[14][15]。繁体中文资讯处理编码的业界标准五大专案码则是以《通用汉字标准交换码》的前身“常用字码集”为蓝本而设计,于1983年12月推出[16]。
教育部在公开招标评比后,于1991年委托华康科技公司制作《常用字表》及《次常用字表》楷、宋、黑、隶等体的电脑母稿。1993年6月,教育部公布了《国字标准字体楷书母稿》及《国字标准字体宋体母稿》。隔年,教育部发布其电子字型档[1]。1998年公布《国字标准字体方体母稿》(方体指不含圆体的黑体)和《国字隶书母稿》。1999年公布《国字标准字体宋体母稿增补编》。
其他
1993年,中央研究院中文词知识库小组利用“中文新闻语料库”(撷取1990-91年的联合报、中国时报、自由时报及天下杂志)编制了《新闻语料字频统计表》,并依注音编制成索引,于1995年出版《注音检索现代汉语字频表》,共计5666字[17][18]。
1997年,教育部出版《国语辞典简编本编辑资料字词频统计报告》,该研究是为编辑《国语辞典简编本》而抽取1992-93年的报刊杂志、畅销书和国中小国文课本,进行字频和词频统计,并和《常用国字标准字体表》加以比较。该份统计报告的字频表共收录了5731字[19]。
1998年,教育部出版《八十四年常用语词调查报告书》,搜集了民国八十四年(1995年)之语料样本,进行字频和词频统计,并和《常用国字标准字体表》加以比较。教育部之后陆续出版民国八十五年、八十六年、八十七年之《常用语词调查报告书》[20]。1999年又出版《八十七年口语语料调查报告书》,搜集口语语料样本,其字频表收字3788字[21]。
2000年,教育部出版《国小学童常用字词调查报告书》[22],该研究对当时(1998-99年)国小学童的常用读物进行字频和词频统计,并和《常用国字标准字体表》加以比较,其字频表共收录5021字。该报告书后来编纂为《教育部常用字库辞典》,成为教育部识字量测验的数据库来源。
2012年,中华文化总会推出中华语文知识库,其“汉字源流汇编”收录常用汉字3000字,并依次列举甲骨文、金文、 战国文字、小篆、隶书、楷书六种字体,说明汉字形体之演变[23]。
2013年,教育部委托国家教育研究院推动“建置应用语料库及标准体系”的华语文教育计划。研究团队召开多次学者专家的咨询会议,又依据“台湾华语文语料库”的统计成果并征求资深华语文教师的意见,在2020年完成了“台湾华语文能力基准”的订定,作为非母语人士学习华语的能力指标及分级标准之凭据。该指标分为三等七级,其字表部分总计收录3100字[24][25]。
2018年,国家教育研究院出版《九十九年常用语词调查报告书》和《一○○至一○四年常用语词调查报告书》,采录民国99年(2010年),以及民国100至104年的语料,进行字频和词频统计,并和《常用国字标准字体表》加以比较。以2015年为例,其字频表收录5289字,字频10以上的字数为3404字,而《常用国字标准字体表》未收录但字频达10以上之高频字,共计117字。另外,在2010年至2015年各年度的字频表中,字频10以上的字数,介于3269字至3410字之间。与教育部《常用国字标准字体表》比较,每年均出现而未收录于该表的高频字有21个[26]。
2020年,国家教育研究院出版《解读新闻字词:新闻媒体常用语词调查(105-107年)》,将常用语词调查从多类型文本的抽样转变为对新闻文本的大数据分析,针对报导文章进行字频和词频统计。国教院陆续出版了后续年度的《解读新闻字词:新闻媒体常用语词调查》,其中有些年度调查会和《常用国字标准字体表》加以比较。“2010年至2015年”与“2016年至2020年”两期间的调查,虽采样来源和规模不同,但各年度常用字仍大致在3300字至3400字左右。2010年至2020年的共同常用字为2861字,再和《常用国字标准字体表》比较,两者的共同收录字为2824字[27]。
标准、课纲和华语考试
根据教育部在1994年委托执行的“我国失学国民脱盲识字标准及脱盲识字字汇之研究”,台湾一般成人日常生活所需之基本字汇为2328字,基本字为1659字,次基本字为669字。凡解读日常生活基本字汇之能力在 470 个字以下者,列为“不识字”;能认 870 个字以上,而未达 1680 字者为“半识字”;能认 1680 字,并具有书写日常生活之简单应用文字能力者为“识字者”,可视为脱离文盲[28][29]。
十二年国民基本教育课程纲要(108课纲)规定在第一学习阶段(国小 1-2 年级)认识常用国字至少 1000 字,使用 700 字。第二学习阶段(国小 3-4 年级)认识常用国字至少 1800 字,使用 1200 字。第三学习阶段(国小 5-6 年级)认识常用国字至少 2700 字,使用 2200 字。第四学习阶段(国中 7-9 年级)认识国字至少 4500 字,使用 3500 字。
华语文能力测验所参照的台湾华语文能力基准(TBCL),是为外国人学习华语所制定,规定基础(1-3级)要了解246~801个汉字,进阶(4-5级)要了解1300~1900个汉字,精熟(6-7级)要了解2500~3100个汉字。
注释
参考文献
- ^ 1.0 1.1 1.2 1.3 1.4 曾荣汾. 教育部標準字體研訂的概況簡介 (PDF). 辭典學論文集. 文字学学术研讨会. 1994 [2021-05-14]. (原始内容存档 (PDF)于2021-05-07).
- ^ * 曾荣汾 & al., 国字标准字体(教师手册) (页面存档备份,存于互联网档案馆),中华民国教育部,ISBN 957-00-4240-0
- 1979年(甲):常用国字标准字体表;
- 1982年(乙):次常用国字标准字体表。
- 李鍌 & al., 常用国字标准字体笔顺手册 (页面存档备份,存于互联网档案馆)(序 (页面存档备份,存于互联网档案馆)),中华民国教育部,1995. Book available online (authoritative work). ISBN 957-00-7082-X
- ^ 次常用國字標準字體表. [2021-05-14]. (原始内容存档于2021-05-14).
其中有5字不可考(幽灵汉字)。在目前教育部异体字字典的附录中,已被改收至〈待考正字表〉。另有9字为单位符号,改收至〈单位词参考表〉。扣除这14字后,共6329字
- ^ 4.0 4.1 4.2 4.3 李添富. 《異體字字典》的應用與未來. 东洋学. 2018, 71 [2021-05-14]. (原始内容存档于2021-05-14).
- ^ 巫俊勋. 《異體字字典》未收字研究 ─以《字彙》為範圍 (PDF). 政大中文学报. 2019, 32: 315–358.
- ^ 李添富. 《異體字字 典》正字選錄原則 (PDF). 世界汉字学会第四届年会“表意文字体系与汉字学科建设”国际学术研讨会. 2016-06-24~2016-06-28 [2024-01-15]. (原始内容存档 (PDF)于2024-08-12).
- ^ 世界华文教育协进会. 第1屆世界華文教學研討會論文集. 世界华文出版社. 1985: 614-614 [2021-05-14]. (原始内容存档于2021-05-14).
常用字的选字即以中文大辞典编纂处的“总字表”(四九九O五字),委员会研订之“常用字表”(二四O八字),及教育部“国民学校常用字汇表”(四八六四字),合并统计其总出现次数,于民国六十四年九月十五日正式完成“国民常用字表”
- ^ 国家教育研究院. 九十九年常用語詞調查報告書. 元照. 2018 [2021-05-14]. (原始内容存档于2021-05-14).
- ^ 林佑玫. 國小國語教科書生字序列研究 (PDF). 国立台中教育大学语文教育研究所. 2010 [2021-05-15]. (原始内容存档 (PDF)于2021-05-15).
- ^ 黄沛荣. 海峽兩岸整理文字的現況與省思. 华文世界. 1991, 62: 18–26 [2024-01-15]. (原始内容存档于2024-07-10).
- ^ 曾世熊. 中文資訊交換碼 Chinese Character Code for Information Interchange,簡稱CCCII. 圖書館學與資訊科學大辭典. [2022-12-22]. (原始内容存档于2022-12-18).
- ^ 中央研究院資訊科學研究所 20 週年慶特刊 謝清俊先生之簡介與訪談簡要. [2022-12-22]. (原始内容存档于2020-10-20).
- ^ 認識全字庫- 中文碼介紹- CNS11643 中文全字庫. [2021-05-14]. (原始内容存档于2021-05-14).
- ^ 全字庫現況. [2022-12-22]. (原始内容存档于2023-01-27).
- ^ 全字庫中文標準交換碼 - 中文碼現況. [2022-12-22]. (原始内容存档于2022-12-17).
现有字数:现行全字库中,户政与地政部分用字经检查为认同字,因而删除该码位资料,但仍保留该码位的位置,现有字数即去除这些被认同掉的字码,所计算得到的总字数……全字库第八字面和第九字面所储存的是拼音文字,所以没有注音、仓颉等属性资料码位个数
- ^ 行政院主计资讯处. 102 與文字共舞___中文數位化發展簡介. [2023-09-04]. (原始内容存档于2023-09-04).
- ^ 注音檢索現代漢語字頻表 (PDF). CKIP Lab 中文词知识库小组.
- ^ 中文新聞語料庫. 中央研究院智财技转处.
- ^ 國語辭典簡編本編輯資料字詞頻統計報告. 教育部语文成果网.
- ^ 常用國語語詞調查報告. 教育部语文成果网.
- ^ 八十七年口語語料調查報告書. 教育部语文成果网.
- ^ 國小學童常用字詞調查報告書. [2021-05-20]. (原始内容存档于2021-05-20).
- ^ 中華語文知識庫 - 漢字源流. [2022-02-21]. (原始内容存档于2022-05-17).
- ^ 吴鉴城; 白明弘; 林庆隆. 臺灣華語文語料庫在華語文教育的應用. 华语文教学研究. 2019, 16 (3): 29–55.
- ^ 參考指引、技術報告及字詞表. 《国教院》华语文语料库2024.
- ^ 《一○○至一○四年常用語詞調查報告書》(下). [2023-12-16]. (原始内容存档于2023-12-16).
- ^ 解讀新聞字詞:新聞媒體常用語詞調查(109年). 台湾教育研究资讯网.
- ^ 我國失學國民脫盲識字標準及脫盲識字字彙之研究. [2023-12-16]. (原始内容存档于2023-12-16).
- ^ 黄富顺. 我國失學國民脫盲識字標準及脫盲識字字彙之研究 (PDF). 成人教育. [2023-12-16]. (原始内容存档 (PDF)于2023-12-16).
参见
外部链接
字表
- 《常用国字标准字体表》(4808字) (页面存档备份,存于互联网档案馆)
- 《异体字字典》正字表(29920字)
- 《中文标准交换码》第一字面(5401字) (页面存档备份,存于互联网档案馆)
- 《教育部常用字库辞典》(5021字) (页面存档备份,存于互联网档案馆)
- “华语文能力基准”汉字表(3100字)
- “汉字源流”常用汉字(3000字) (页面存档备份,存于互联网档案馆)
笔顺
其他
- 国字标准字体教师手册 (页面存档备份,存于互联网档案馆)
- 教育部语文成果网 - 字形类 (页面存档备份,存于互联网档案馆)
- 日本・中国・台湾・香港・韩国の常用汉字と汉字コード (页面存档备份,存于互联网档案馆) (日语)