语料库

信息技术名词,大批量电子化自然语言样本所构成的集合

语料库一詞在語言學上意指大量的文本,通常經過整理,具有既定格式與標記。

根据语料库的特征,可以分为单语语料库、双语语料库、平行语料库等,根据语料的来源,可以分为书面语语料库、口语语料库、作文语料库、学习者语料库、古文书语料库等。[1]

語料庫列表

多語

英语

汉语

繁體中文

簡體中文

日语

研究机构

外部連結

参考文献

  1. ^ 狐狸等间隔. 日语语料库超入门. 微信公众平台. [2022-12-20]. (原始内容存档于2022-12-20).