欧宝体育官网登录:【DAMA精选】数据处理的危险:界说不明晰或无效的比较

发表时间:2023-05-31 04:31:55

来源:欧宝官方体育下载 作者:欧宝娱乐app在线登录

  据美国一家新闻媒体陈述,根据2011年人口普查局数据,在美国有1.086亿人靠福利停止,而只要1.017亿人有全职作业,好像总人口中有较多人在靠福利停止。媒体解说了这些差异:这1.086亿数字关于“福利人口”来自人口普查数据……参加了2011年第四季度查询,包含“居住在一个或多个受惠家庭中的每一个人”,因而是包含了那些没有遭到政府恩惠的人。别的,“有全职作业的人”的图形…只包含那些作业的人,而不是居住在至少有一个人作业的家庭中的每一个人。

  在展现信息时,契合道德的做法是告知清楚工作的布景及其含义。比方人口普查时,明晰、明确地讲清楚普查人口的界说以及会有什么福利和优点。假如省掉了相关的布景信息,出现出来的表面现象可能是数据不支持(所需的信息)。不论这种作用是熟练成心诈骗仍是熟练才能缺乏所造成的,这样运用数据都是不道德的。

  在一段时间内对数字进行计算滑润处理,完全可以改动人们对数字的观点。“数据发掘和勘探”是一个最近新造的术语,指的是数据发掘计算查询中的一种现象,即在数据调集上履行翔实的相关性剖析,本质上该数据调集是一个经过练习的计算模型。熟练存在“明显计算性”现象,因而有理由希望一些具有明显计算性的成果,但实际上是一个随机成果,未经练习的人会被这个成果误导。这种现象在金融和医疗范畴很常见(Jensen,2000;ma.utexas.edu,2012)。