工具包:如何​​共享數據?

插圖:兩隻手使用計算機通過數據挖掘來調查一個人。

什麼是數據挖掘?

在最近的新聞中,您可能已經聽說了有關大數據和數據挖掘的內容。 數據挖掘 表示在大量數據中搜索模式和關係,通常稱為 大數據。 一直對數據進行模式分析,但是計算機已經收集了tor更加有效和普通的數據分析。 通過過程 自動推論,這些模式用於發現趨勢,得出結論,有時甚至預測未來的模式。

數據挖掘通常以使所有人受益的方式使用。 在醫療保健領域,它有助於識別疾病暴發。 例如,在盧旺達,哈佛大學的研究人員使用數據挖掘來rack人的運動方式,並將其與健康統計數據進行比較。 他發現霍亂爆發前兩週的運動方式發生了變化,因此,他能夠 推斷 何時爆發。 政府還使用數據挖掘來優化流量,企業還可以使用數據挖掘來分析客戶的購買模式,執法機構也可以使用數據挖掘來解決犯罪。

儘管將數據與其他數據鏈接起來可以增加其價值,但是卻引起了人們對隱私的擔憂。 僅想研究模式的醫療保健機構,公民機構和其他組織通常會採取措施使數據匿名化。 至少,他們通常會剝離個人身份信息(PII),例如姓名和社會保險號,這些信息可用於唯一地挑選個人。 但是,即使查rac可以將本身不具有特色的方法(例如年齡或婚姻狀況)與其他PII結合起來,以挑選出具有獨特性的人 組合 查rac地域學。 在某些情況下,代理商可能會使用更複雜的計算方法來掩蓋身份。 此類策略通常依賴於將某人分配到一個涵蓋更多人的常規類別,例如說某人的年齡在20-29歲之間,而不是說他們在27歲。但是,即使這些技術也不是萬無一失的,許多代理商確實做到了根本不使用它們。

數據共享和互聯網業務模型

開展業務或使用服務時,一定會共享您的信息。 企業會挖掘這些數據以弄清楚他們的客戶是誰以及正在購買什麼,並且他們還經常與第三方廣告商共享客戶數據或將其出售給數據經紀人。 對於提供免費在線服務的公司來說,出售廣告空間和用戶數據是他們賺錢的主要方式。

在大多數情況下,法律並不限制企業出售或共享您的信息。 加利福尼亞州和其他州最近制定了一些限制措施,但通常不清楚在特定情況下適用哪些法律。 除非您“選擇退出”,否則大多數企業和組織將默認共享您的信息。 通常,組織的隱私權政策會告訴您如何使用您的信息-但不能保證他們會遵循這些信息,並且隱私權政策如有更改,恕不另行通知。 您也不能僅僅因為一家公司享有良好的聲譽或良好的客戶服務就不能假設他們不會共享您的信息。

您的數據是寶貴的商品

數據匯總tors,也稱為數據經紀人,專門研究有關消費者的所有信息。 儘管數據經紀人通常不會將所有信息免費公開提供,但對於數據經紀人可以使用此信息進行的操作幾乎沒有限制。 數據經紀人將您與之有業務往來的公司的信息在線組合在一起rac國王數據以及來自政府網站的公共記錄,以製作具有唯一ID的消費者資料,然後可以將其出售給廣告公司。 這些概要文件可能與您的名字鏈接在一起,也可能不與您的名字鏈接在一起,但是即使是由數據代理程序編譯的“匿名”概要文件也可能具有足夠的信息來唯一地標識您。

廣告商對您的了解越多,他們就越能預測您的未來行為。 在一個沒有tor例如,塔吉特(Target)通過數據挖掘推斷出,購買無香乳液的女性更有可能懷孕,並開始向她們發送嬰兒產品廣告。 尤其是,數據經紀人和在線廣告服務已創造了數百萬美元的業務收入,rac每次您購買商品或上網時都將成為國王。 他們在網上使用rac國王從社交媒體網站,購物網站以及新聞和娛樂網站收集數據,然後挖掘該數據以尋找表明您的興趣的模式。 然後,廣告客戶可以根據您的興趣(如在線(和離線)行為所示)展示廣告。