Document Virtual Folder 虚拟资料夹―依文件 ; 文档虚拟文件夹
Hybrid Vector Space Model (HVSM) is proposed for WebPages based on query logs. In HVSM, for a given Webpage, a virtual document is generated from its text content based on topic keywords extracted from search click-through data.
基于用户行为的混合网页表示模型首先从搜索引擎的搜索日志中抽取访问过给定网页的查询,将这些查询作为描述该网页的主题词,然后以主题词为中心从网页中抽取内容生成描述网页的虚拟文档以及相应的向量表示。
参考来源 - 搜索引擎中文档聚类方法研究·2,447,543篇论文数据,部分数据来源于NoteExpress
The fields in a document are often the attributes of a virtual document.
而类 Document 中的域一般就是实际文档的一些属性。
This virtual document model works at the level of elements in the XML document.
这种虚拟的文档模型工作于XML文档的元素级。
You can think of this class as a virtual document, such as an HTML page, a PDF file, or a text file.
你可以把这个类想象成代表了一个实际的文档,比如一个html页面,一个PD f文档,或者一个文本文件。
应用推荐