文本分类用电脑对文本集(或其他实体或物件)按照一定的分类体系或标准进行自动分类标记。它根据一个已经被标注的训练文档集合, 找到文档特征和文档类别之间的关系模型, 然后利用这种学习得到的关系模型对 新的文档进行类别判断。文本分类从基于知识的方法逐渐转变为基于统计 和机器学习的方法。
文本分类(Text Classification)是指依据文本的内容,由计算机根据某种分类算法,把文本判分为预先定义好的一个或多个类别的过程。
基于386个网页-相关网页
基于量子自组织网络的Web文本自动分类方法 - jorbin - 博客园 关键词:数据挖掘;文本分类;学习算法 [gap=556]Key words:data mining;document classification;learning algorithm
基于24个网页-相关网页
自动文本分类 automatic text categorization ; automated text classification
文本分类与聚类 text categorization and clustering
中文文本分类 chinese text classification ; Chinese Text Categorization
文本分类算法 Text Classification Algorithm ; text categorization algorithm
短文本分类 short text classification
实时文本分类 Online Text Categorization
文本分类与挖掘 Text classification and mining
文本分类模型 Text Categorization Model
大规模文本分类 large-scale text categorization
Second,codebook is optimized by the method of text classification.
其次,利用文本分类分析单词语义性质的方法,优化初始的词汇表。
参考来源 - 词包模型中视觉单词歧义性分析This method has obvious advantages especially in similar text categorization.
这种分类方法在相似文本分类中具有明显的优势。
参考来源 - 期刊学术社区·2,447,543篇论文数据,部分数据来源于NoteExpress
其他方式依赖于自动文本分类技术。
文章提出了一种基于粗糙集理论的文本分类方法。
This paper presents a rough set theory based on the text classification.
对于文本分类的核心训练算法,给出主要步骤的推导过程;
The main deducing steps are presented in the core-training algorithm of text categorization.
应用推荐