...处理;信息抽取;正文抽取 [gap=1228]Key words: Chinese information processing; information extraction; content extraction ...
基于22个网页-相关网页
作为专业术语,网页核心内容抽取(Content Extraction) ,最早由 Rahman 等人在2001 年提出,作者同时还给出了一个基本的核心内容抽取算法[2]。
基于14个网页-相关网页
Automatic Content Extraction 自动内容抽取 ; 的自动内容抽取 ; 抽取
Content Extraction Signature 签名 ; 取签名
Automatic content Extraction on 在自动内容抽取评测 ; 本文在自动内容抽取评测
Web content extraction 网页内容抽取
Self-certified Content Extraction Signature 基于自认证的可截取签名
ID-based Content Extraction Group Signature 基于身份的可截取群签名
ID-based Content Extraction threshold Signature 基于身份的可截取门限签名
Content Feature Extraction 内容特征提取
The statistical characteristics are called multi-features of a web page. A novel algorithm of content extraction for both Hub-pages and Authority-pages is proposed based on their multi-features.
文中提出了基于多特征的网页内容提取算法。
参考来源 - 基于多特征的网页内容提取研究Based on the above measure, we construct a content extraction part under the environment of pervasive computing.
3.在上述方法的基础上,本文设计了一个在普适环境下的正文抽取插件。
参考来源 - 面向普适计算的正文抽取技术的研究与设计This thesis proposes the algorithm which is to find the similar pages in the same site, and it can overcome the weaknesses of other Web content extraction.
本文提出了一种在同一网站中寻找相似网页的算法,它可以克服其他网页内容抽取方法中存在的弱点。
参考来源 - 基于文本内容的网页过滤技术研究·2,447,543篇论文数据,部分数据来源于NoteExpress
Content extraction is a kind of data mining technology which is widely used in Internet.
网页文本抽取是一种在互联网上运用广泛的数据挖掘技术。
This paper presents a new method for content extraction from Web pages based on statistic and content-features.
该文提出了一种基于统计与正文特征的网页正文抽取方法。
You can configure options such as the number of items to fetch per feed, update interval and the content extraction method.
你还可以自己设置诸如每次显示的条目数、更新间隔、内容筛选法则等。
应用推荐