为了解决这些问题,人们开始了 基于概念的信息检索技巧的研究,潜语义标引(Latent Semantic Indexing,LSI) 就是这样一种技巧【8l【”。
基于4个网页-相关网页
Andrian 等提出了采用隐含语义标引(latent semantic inde- xing,LSI) 的方法来计算相似度 [6] 。隐含语义标引的方法基于 向量空间基本模型,不依赖于标引词的匹配来计算...
基于2个网页-相关网页
Moreover,clustering models of traditional text semantic clustering fields,Vector Space Model,Boolean Model,Probability Model, Set Operations,Support Vector Machines and Latent Semantic Indexing Model,etc. ,they are indexed by word frequency as characteristic item in documents set.
另外,在传统的文本语义聚类领域的聚类模型中向量空间模型、布尔模型、概率模型、集合运算、支持向量机和潜语义标引模型等,均是以文档集合中出现的单词词频作为特征项来检索,并没有考虑到单词所位于的结构层次,因而不能有效地针对XML这种结构嵌套的文件进行聚类。
参考来源 - 基于密度方法的XML文档聚类研究·2,447,543篇论文数据,部分数据来源于NoteExpress
本文提出了一种语义聚类和扩展的新方法,称为有指导的统计隐含语义标引(SPLSI)算法。
This paper proposes a new method for meaning clustering called 'Supervised Probabilistic Latent Semantic Indexing' (SPLSI).
同时提出一种基于内容的图像标引与检索系统结构,能自适应的在图像语义库中添加较为成功的语义表述。
The same time, it raise a new structure of system of content based image indexing and retrieval which can adapt oneself for adding successful semantic users did to semantic database.
传统的采用主题词和关键词对文档进行标引的方法,由于不能提供语义推理而越来越不适合目前的网络环境。
The traditional way of document indexing based on subject words and can't work well in the network environment because of the lack of the ability of semantic deducing.
应用推荐