本文利用特征提取方法,在大规模分类语料库将具有较强特征表示功能的关键短语(Key Phrase)提取出来,并按主题聚类。在此基础上,完成了一个知识与统计相结合的文本分类和主题词标引系统
基于84个网页-相关网页
在这种方法中使用了标题和类似摘 要的简介(snippet) 来进行解析和关键短语( salient phrase) 的 提取, 由于每个结果集合使用一个短语来表现主题, 直观有 效, 便于应用到实际中, 实验证明取得了较好的效果.
基于8个网页-相关网页
·2,447,543篇论文数据,部分数据来源于NoteExpress
应用推荐