数据清洗是指发现并纠正数据文件中可识别的错误的最后一道程序,包括检查数据一致性,处理无效值和缺失值等。与问卷审核不同,录入后的数据清理一般是由计算机而不是人工完成。
数据清洗(data cleaning)是数据质量提高技术研究的主要内容,主要集中在几个方面:重复对象检测、缺失数据处理、异常数据检测、逻辑错误检测、不一致数据...
基于580个网页-相关网页
... Data Collection Cleaning 数据集清理 Data cleaning & management 数据清洗 Data Cleaning and Filtering 数据清理与过滤 ...
基于48个网页-相关网页
...致性(>或=); •数据读写(IO)与处理软件之间的转换; 数据预处理 数据预处理(data preprocessing)或 数据清洗 ( data scrubbing )或数据清理(data cleaning)或数据净化(data cleansing)是数据处理的第一步。
基于24个网页-相关网页
...,算法,数据挖掘,机器学习等相关专业硕士及以上学历,互联网公司算法,NLP实习经历(必须);2、熟悉数据抓取,数据清洗(ETL),数据仓库建模;3、有用户画像建模工作经验优先;4、有互联网自然语言识别NLP工作经验优先;5、有算法和建模工作经验优先; 6、...
基于16个网页-相关网页
在数据装入数据仓库之前,应该对数据进行数据清洗。
Before data finally is loaded into data warehouse, it should be cleaned.
数据清洗是数据仓库和数据挖掘中非常重要的一个环节。
Data cleansing is an important step both in data warehousing and data mining.
本文的重点是对可扩展可定制数据清洗框架的研究与设计。
This paper put much emphasis on the research and design of the data cleaning framework which can be extensible and customized.
应用推荐