数据清洗 (Data Cleaning),同时也被称为数据净化(Data Scrubbing), 是为了改进数据质量而执行从数据中探测并驱除错误和矛盾的过程
基于48个网页-相关网页
这一过程称为数据净化(Data Cleanup)。数据净化要处理许多可能存在的错误类型,这些类型包括数据源中丢失数据和 有错误数据,还包括两个或多个数据源里的不一致数据和...
基于24个网页-相关网页
③数据净化(data sanitization):仅移去事物中的信息,在统计揭漏控制中可称为非扰动算法图1.1数据挖掘示意图Fi91.1 Schematic diagram of data mining多方安全计...
基于1个网页-相关网页
结合实例详细介绍了数据净化、用户识别、会话识别、路径补充和事务识别等数据预处理技术。
Combined the examples, data cleaning, user identification, session identification, path completion and transaction identification are discussed deeply.
对于传统的数据源来说,通常需要投入大量人力物力,进行分析和数据净化工作,然后才能将其用于语义建模技术。
Legacy data sources are likely to require much human effort in terms of analysis and data cleansing before they can be availed to semantic modeling technologies.
数据预处理就是处理这些冗余信息,经过数据净化、用户识别、会话识别、路径补全操作后得到能够用于挖掘的数据。
Data preprocessing is to treat these redundant information such as data purifying, user recognition, session recognition and pathway complement.
应用推荐