工具包:如何​​共享数据?

工具包:如何​​共享数据?

目录

什么是数据挖掘?

在最近的新闻中,您可能已经听说了有关大数据和数据挖掘的内容。 数据挖掘 表示在大量数据中搜索模式和关系,通常称为 大数据数据总是被分析以寻找模式,但计算机使数据的收集、存储和分析变得更加高效和普遍。通过 自动推论,这些模式用于发现趋势,得出结论,有时甚至预测未来的模式。

数据挖掘通常以对每个人有益的方式使用。在医疗保健领域,它有助于识别疾病爆发。例如,在卢旺达,一位哈佛大学研究人员使用数据挖掘来跟踪人们的运动模式,并将其与健康统计数据进行比较。他发现,在霍乱爆发前两周,人们的运动模式发生了变化,因此,他能够 推断 何时爆发。 政府还使用数据挖掘来优化流量,企业还可以使用数据挖掘来分析客户的购买模式,而执法机构也可以使用数据挖掘来解决犯罪。

虽然将数据与其他数据关联起来会增加其价值,但也引发了隐私问题。医疗机构、公民机构和其他只想研究模式的组织通常会采取措施匿名化数据。至少,他们通常会删除姓名和社会安全号码等个人身份信息 (PII),这些信息可用于唯一地识别个人。然而,即使是年龄或婚姻状况等本身并不独特的特征,也可以与其他 PII 结合起来,以找出具有这种独特特征的人 组合 特征。在某些情况下,机构可能会使用更复杂的计算方法来掩盖身份。此类策略通常依赖于将某人归入涵盖更多人的一般类别,例如说某人的年龄在 20-29 岁之间,而不是说他们 27 岁。然而,即使这些技术也并非万无一失,许多机构根本不使用它们。

数据共享和互联网业务模型

开展业务或使用服务时,一定会共享您的信息。 企业会挖掘这些数据以弄清楚他们的客户是谁以及正在购买什么,并且他们还经常与第三方广告商共享客户数据或将其出售给数据经纪人。 对于提供免费在线服务的公司来说,出售广告空间和用户数据是他们赚钱的主要方式。

在大多数情况下,法律并不限制企业出售或共享您的信息。 加利福尼亚州和其他州最近制定了一些限制措施,但通常不清楚在特定情况下适用哪些法律。 除非您“选择退出”,否则大多数企业和组织将默认共享您的信息。 通常,组织的隐私权政策会告诉您如何使用您的信息-但不能保证他们会遵循这些信息,并且隐私权政策如有更改,恕不另行通知。 您也不能仅仅因为一家公司通常享有良好的声誉或良好的客户服务就不能假设他们不会共享您的信息。

您的数据是宝贵的商品

数据聚合器,也称为数据经纪人,专门学习有关消费者的一切信息。数据经纪人对这些信息的处理几乎没有限制,尽管他们通常不会免费公开所有信息。数据经纪人将与您有业务往来的公司的信息、在线跟踪数据和政府网站的公共记录结合起来,制作出具有唯一 ID 的消费者档案,然后将其出售给广告公司。这些档案可能与您的姓名相关联,也可能不相关联 - 但即使是数据经纪人编制的“匿名”档案也可能有足够的信息来唯一地识别您。

广告商对你了解得越多,他们就越能预测你未来的行为。有一个臭名昭著的例子,塔吉特通过数据挖掘推断出购买无香乳液的女性更有可能怀孕,并开始向他们发送婴儿用品广告。特别是,数据经纪人和在线广告服务通过跟踪你每次购物或上网的行为赚取了数百万美元。他们使用在线跟踪从社交媒体网站、购物网站以及新闻和娱乐网站收集数据,然后挖掘这些数据以找出表明你兴趣的模式。然后,广告商可以根据你的在线(和离线)行为显示你的兴趣来展示广告。

单按钮模块

构建工具包
回到主页