In Tibetan information processing,the word is to be treated as the fundamental unit for parsing,the sentence comprehension,the automatic abstract,the automatic classification,the machine translation and so on,Therefore,Tibetan word segmentation is essential for Tibetan information processing.
在藏文信息处理中,涉及句法、语义都需要以词为基本单位,句法分析、语句理解、自动文摘、自动分类和机器翻译等,都是在切词之后基于词的层面来完成各项处理。 因此,藏文分词是藏文信息处理的基础。
参考来源 - 藏文自动分词系统中紧缩词的识别 in C·2,447,543篇论文数据,部分数据来源于NoteExpress
应用推荐