《文本挖掘(英文版)》是一部文本挖掘领域名著,作者为世界知名的权威学者。书中涵盖了核心文本挖掘操作、文本挖掘预处理技术、分类、聚类、信息提取、信息提取的概率模型、预处理应用、可视化方法、链接分析、文本挖掘应用等内容,很好地结合了文本挖掘的理论和实践。
Among them, automatic text categorizing is an important technology. It can sort web documents, and distribute each document to a categorizing set.
文本挖掘中常用的技术有文本的自动分类、聚类、文本总结和关联分析等,其中文本自动分类是一种重要的方法。
参考来源 - 粗糙集理论在文本挖掘的分类算法中的应用研究We introduce the research situations and the questions about the texts excavation and the datacleaning in the world.2nd part: the theory research of the datacleaning and text excavation.
引入问题,介绍国内外文本挖掘和数据清洗方面的研究现状以及目前存在的问题;第二部分数据清洗与文本挖掘基本理论研究。
参考来源 - 数据清洗技术在文本挖掘中的应用So knowledge discovery from projects is text mining from requisitions.
因此对项目进行知识挖掘就转变为对项目建议书的文本挖掘。
参考来源 - 科研项目管理中的文本挖掘方法研究及应用·2,447,543篇论文数据,部分数据来源于NoteExpress
应用推荐