...实作 • 一个文件的标注是无语言的(metalinguistic) 提供的是关于文件的语言信息,而不是文件本身的内容 • 生语料库(raw corpus) 指没有经过任何处理的电子文件语料库 AUO Proprietary & Confidential 15 • 为什么要标注语料?
基于62个网页-相关网页
SunPinyin的繁体支持,需要词典和生语料(raw corpus),我接下来的一段时间会更多放精力在SunPinyin的后续开发上,希望早日完成计划的各项features ..
基于26个网页-相关网页
依其形式来分,何安平教授(2004:4-6)将语料库分为两大类:原始语料库 (Raw Corpus)即未经任何加工的语料库,和附码语料库(Annotated Corpora)。
基于10个网页-相关网页
应用推荐