一种网络信息抽取及处理的方法,包括如下步骤:一。新闻下载步骤:包括如下步骤 url分析步骤:系统指定一定的url,程序能够自动的从这些url上分析出新闻的最终内容url,而不用对每个新闻网站做一个特定的url模块,采用给予url统计以及对url进行相关性分析的方法,在一个含有最终内容新闻连接地址的网页,进行统计和分析,找到有用的最终url地址。
PD F文件网络信息抽取的重要资源。
PDF files are important resource of Internet information extraction.
这种网络具有与人脑相类似的学习记忆能力和输入信息特征抽取能力。
This network has the ability of learning memory and input information trait extracting.
本文探讨了用神经网络从模式中自动抽取特征向量并确定特征向量是否已具有足够特征信息的方法,给出了计算机模拟的结果。
In this paper, we have studied the method of drawing automatically from pattern and assessing whether feature vectors contain enough feature information. The result of computer simulation is given.
应用推荐