结构化数据抽取(Structured Data Extraction)的目标是从Web页面中抽取结构化数据。这些结构化数据往往存储在后台数据库中,由网页按一定格式承载着展示给用户。
基于24个网页-相关网页
论坛的结构化数据抽取是对论坛中帖子的标题、作者、发表时间和内容文本块等论坛元数据的抽取,它是处理论坛数据的基础。
Forum structured data extraction is the meta-data extraction from web forums such as post title, post author, post time and post content. It is the foundation of processing forum data.
使用XML从半结构化数据集中抽取有用信息。
Using XML to extract useful information from semi-structured data sets.
半结构化数据是网络中一种重要的数据形式,其数据抽取和知识发现研究是半结构化数据各项研究的核心。
Semi-instructured data is a kind of the important type in networks, and its data extracting and knowledge discovery is the core for semi-structured researches.
应用推荐