Vision-basedWeb Page Information Extraction Algorithm
基于视觉特征的Web页面信息抽取算法_计算机应用技术_发表网 b页面时的潜在行为,得出HTML元素从视觉上簇聚相关内容的特征。因此,本文提出了基于视觉特征的Web页面信息抽取算法(Vision-based Web Page Information Extraction Algorithm,VWPIEA),从HTML标记的DOM树入手,经过一系列的DOM缩减、视觉分析、参数调整等步骤,得出页面的正文区域
基于4个网页-相关网页