当前位置: 首页 > 科技观察

白宫大数据报告:尽早解决隐私问题

时间:2023-03-22 02:00:15 科技观察

主要关注点:大数据正在产生大量需要尽早解决的隐私主题。该报告的引文写道:“这份报告的一个惊人发现是,将个人信息用于住房、信贷、就业、健康、教育和购物中心购物的大数据分析有可能掩盖长期存在的民权保护。”美国人与数据之间的关系,她(他)的机会和潜力将得到扩大而不是减少。该报告讨论了一系列与隐私相关的主题,包括以下五个:1.“去标识化”并不总是有效组织经常采用隐私保护技术来去标识化链接到特定个人或设备的数据。不幸的是,重新识别技术在链接这些数据方面同样有效。报告指出:“多种类型数据的结合可能会导致一些分析师称之为“马赛克效应”,即可以从甚至不包括PIN的数据集中推导出或推断出个人身份信息,重点是关于描绘一个人的形象和她(他)喜欢的东西”。随着重新识别匿名数据的技术变得越来越强大,个人如何管理他们的私人信息和身份,或者根据来自多个数据集的信息做出决策,变得越来越混乱。2.“智能个性化”有助于辨别报告称,不同类型的非结构化数据的融合使营销人员能够“在消费者提出要求之前,将他们想要的东西准确定位”。消息、产品或服务发送到那里”。“不幸的是,全球个性化也为定价、服务和机会方面的精细和不那么精细的辨别力留下了空间。”3.“小”数据带来更大的隐私威胁无论关于潜在侵犯个人权利的言论有多少,当今最常见的隐私风险大多数都与“小数据”有关,例如黑客针对个人银行信息进行攻击财务欺诈。报告指出:“这些风险并不总是很大、速度很快或信息丰富,也不意味着与大数据相关的某种复杂分析。”报告称,小数据的保护已受到美国隐私法、强有力的实施细则以及全球隐私保护机制修正案的监管。即使这是真的,最近的2篇文章表明在这方面还有很大的改进空间。4.预测医学可能导致隐私混乱“预测医学”是一种很有前途的大数据应用,它深入挖掘患者的健康状况和遗传信息,以预测她(他)是否会患上某种特定疾病,从而接受治疗。这里数据滥用的可能性是巨大的。例如,通过“预测医学”收集的健康信息可用于为具有相似基因的人(例如患者的孩子)提供医疗决策信息。报告指出:“目前涵盖信息并适用于健康的隐私框架并未很好地适应这些新发展,或促进推动它们的研究。”5.相反,隐私法阻碍了一些重要的分析报告:“大数据分析允许数据科学家积累大量数据,包括非结构化数据,并发现异常和模式”,“在这种发现模型中一个关键的隐私挑战是“你必须大海捞针。要获得一定数量的洞察力,你需要一定数量的数据。”所以难题来了:研究人员可以从访问大量敏感遗传信息数据集中受益,但隐私法限制她(他们)访问这些数据。例如,BroadInstitute的遗传学研究人员未能检测到遗传信息报告称,在包含3,500个基因的数据集中发现了与精神分裂症相关的变异,但在35,000个病例中取得了“具有统计学意义”的结果。