中文分词。分词就是将连续的字序列按照一定的规范重新组合成词序列的过程。我们知道,在英文的行文中,单词之间是以空格作为自然分界符的,而中文只是字、句和段能通过明显的分界符来简单划界,唯独词没有一个形式上的分界符,虽然英文也同样存在短语的划分问题,不过在词这一层上,中文比之英文要复杂得多、困难得多。
中文分词(chinese word segmentation)是指将一个汉字序列切分成一个个单独的词。中文分词是文本挖掘的基础,对于输入的一段中文,成功地进行中文分词,可以达到电脑自...
基于540个网页-相关网页
...; 即时通讯;中文分词 [gap=2863]Key words: software quality improvement; intenet message; the Chinese phrase Separation ...
基于40个网页-相关网页
简易中文分词 SCWS
中文分词规范 word segmentation standard for Chinese ; Chinese segmentation specification
云寻觅中文分词 Yunxunmi Chinese Word Segmentation
中文分词技术 Chinses Words Divided Syncopation Technology
中文分词基础件 WordMaster
中文分词器 Chinese word segmentation machine
中文分词连写 Link writing for Chinese words
中文自动分词 Chinese word segmentation ; chinese word automatic segmentation ; Chinese Automatic Segmentation ; Chinese automatic word segmentation
This paper presents an approach independent on word segmentation techniques and text collections.
本文的研究成果是提出了一种不需要进行中文分词,且不依赖文本数据集,能够同时适宜于中英文文献的文本表达方法。
参考来源 - 基于粗糙集理论的文本自动分类研究2) The implement of XunLei indexer, it mainly include how to create Chinese participle and reverse table.
迅雷资源搜索引擎索引器的实现,主要是如何建立中文分词和倒排表。
参考来源 - 迅雷资源搜索引擎的研究与实现For designing and implementing Chinese words segmentation module in the search engine based on Nutch. this paper put forward a algorithm based on forwards maximum match algorithm (MM).
对于设计实现能够在基于nutch的搜索引擎中处理中文信息的中文分词模块,论文采用基于中文字典的正向最大匹配分词算法。
参考来源 - 基于WEB服务的空间信息专业搜索引擎的应用研究·2,447,543篇论文数据,部分数据来源于NoteExpress
实行中文分词连写确实具有必要性。
中文分词是校园网搜索引擎项目的一个核心技术。
Word segment was a core technology of campus search engine project.
迅雷资源搜索引擎索引器的实现,主要是如何建立中文分词和倒排表。
The implement of XunLei indexer, it mainly include how to create Chinese participle and reverse table.
应用推荐