I used fuzzy string matching, FreeDB searches, ID3 versions 1 and 2, and lots of text-mode user interactions.
我用到了模糊字符串匹配、FreeDB检索、ID3版本1和2,以及许多文本模式用户交互。
The idea of fuzzy matching and information of content and structure of the text of web page are introduced into the algorithm, and the efficiency of the algorithm is optimized.
本文依据冗余网页的特点引入模糊匹配的思想,利用网页文本的内容、结构信息,提出了基于特征串的中文网页的快速去重算法,同时对算法进行了优化处理。
应用推荐