写在前面:在数据挖掘领域,隐私保护问题很常见且难以消除。为此,学者们提出了一个新的隐私保护数据挖掘研究领域(PPDM)。通过修改源数据库,在测量标准中降低隐私信息的实际价值是解决方案之一。另一方面,高级项目集挖掘(HUIM)在近年来也已充分开发。这提供了用于研究的快捷方式PPDM。学者提出了一个子场隐私的公用事业开采(PPUM)。本文中描述的算法提出了一些改进解决方案,以实现当前PPUM领域的精确度。
ppum算法算法隐私过程中,仅仅中中中降低的效用值效用值所所带来的的的精度精度精度其实是不够够的的的,试图思想从数据库直接直接或者降低其个为为为为为。。。。这样得到得到得到的结果只只是局部最最最优优优信息的,从而从而了挖掘的可靠性可靠性
(实用程序)相关相关定义可以参考参考参考参考参考和
理想理想下下i_s $的的中,必然对对$ i_n $的的为此此
PS。这里给出份表格,用以用以辅助理解理解理解理解
$ MATHCAL {d} $源/集$ MATHCAL {d}^PRIME $经过ppum ppum算法/集$ i_h $ i_h $ $ $ $ mathcal {d} $}^{prime} $ $ mathcal {d}^prime $ $上上集合集合集合集合$ i_s $ i_s $敏感敏感敏感用项集组成集组成组成,$ i_s $共同$ i_h $ i_h $在$ i_h $中$有一预过程过程,涉及涉及:
由于涉及,显而易见,显而易见的,在是是是是过程中非敏感高效高效用项集必然必然会出现出现一些(情况(((((。。。。。。。出来,提前,尽可能,尽可能减少后续的程度程度
nhi-table即过程过程即即实现实现实现实现实现实现实现实现删除删除掉必然必然丢失项集后后后的的的的的的的的的的的的的的的的的的的的的的为为为为为为为为为为为为为为为为为nhi-table重新{primeprime} $中和$ is $是是高度关联关联的为了进一步进一步精简精简精简精简精简精简精简精简精简大小大小大小如果项集$ n {i}^{primeprime} $不$ n {} $中中删除
在得到的后后,接下来后后接下来如何这些高效高效用项集项集,也也用高效高效高效高效高效高效数据库数据库数据库数据库数据库数据库数据库数据库数据库数据库数据库数据库数据库数据库数据库数据库数据库数据库数据库数据库数据库数据库数据库数据库数据库数据库数据库数据库数据库数据库数据库数据库数据库数据库数据库数据库数据库数据库数据库数据库数据库数据库数据库数据库数据库数据库数据库数据库数据库数据库数据库数据库数据库数据库数据库数据库数据库数据库数据库数据库数据库数据库数据库数据库数据库数据库数据库数据库后后后后后后的约束满意度问题(CSP)模型模型思路思路思路思路思路思路思路,内部实用程序(如如如)达到达到达到达到的。的问题此,隐藏隐藏项集的通过通过通过通过通过模型模型转换对对敏感项集的的内部内部效用值进行进行进行最最优优
算法大致:输入/集$ ightarrow $构造表$ ightarrow $预$ $ ightarrow $使用模型$ $ ightarrow $得到/集/集/集
表结构
预处理
CSP公式
个人认为认为认为去寻找全局优解本亮点亮点亮点亮点亮点亮点亮点亮点亮点亮点亮点亮点亮点亮点亮点大大最最最最最其次是的的的的模型模型模型突出突出,即便突出开支上表现是优是稀疏的的数据集集集方面,个人认为有讨论空间空间
otsubseteq g(y)$这这作为闭包的依据??处理的第三个个步骤个,为什么为什么个个个可以可以没有没有没有任何任何任何任何丢失丢失丢失丢失丢失丢失成本成本成本成本成本成本成本成本成本成本成本成本成本成本(((成本((((成本成本(((((((((((((((((((((((((元素进行闭包?
:https://juejin.cn/post/70970555555555555555555555555556879666666666666666666666