自动文本分类是对大量的非结构化的文字信息(文本文档、网页等)按照给定的分类体系,根据文字信息内容分到指定的类别中去,是一种有指导的学习过程。 分类过程采用基于统计的方法和向量空间模型可以对常见的文本网页信息进行分类,分类的准确率可以达到85%以上。分类速度50篇/秒。
其他方式依赖于自动文本分类技术。
本文就中文自动文本分类系统进行了一些研究。
This paper presents some research on automatic Chinese text categorization system (CATCS).
电子文档的飞速增长为自动文本分类提供了巨大的机遇和挑战。
The rapid growth in the amount of electronic documents brings both great opportunities and real challenges for automatic text classification.
应用推荐