你有没有想过:刚和朋友聊完理财、美妆、买房等日常话题、贷款,为什么会收到包括抖音、腾讯新闻,甚至一些视频网站推送的聊天内容相关的广告?人们从未像现在这样担心个人隐私。今年“3月15日晚会”曝出,智联招聘、51job、猎聘等因管理不善,大量个人简历外泄、倒卖,形成黑色产业。此外,内存优化器、超级清理器、手机管家Pro以清理内存为名,通过技术手段不断获取手机中的信息,包括应用列表、位置信息、联系人等。近日,证券交易所记者时代周刊深入多个上千人的数据交易QQ群,发现各行各业的用户隐私数据被大肆出卖,触目惊心。不时有人在群里喊话,“送出一手GM(股民)、WD(网贷)、BJ(医保)资讯,拼多多、淘宝、京东的一手网购数据。如果你需要数据,联系我……”这些数据是根据行业细分明码标价的。甚至还有个人信息收集系统的展示,号称可以收集全国老板的私人联系方式。还有各种爬取数据的软件,在网站上“爬取”,“嵌入”到App中,“铲”出数据。在整个数据交易过程中,内部人员、黑客、爬虫软件开发商、清洁工、加工商、材料商、买家等寄生于此,催生了一个“年产值”上千亿的数据黑市。在Netflix2020年出品的纪录片《监视资本主义:智能陷阱》中,app权限申请泛滥,生动地向人们展示了这样一幕:社交软件后台的“三名工作人员”正在紧张地分析着眼前的年轻人。视频停留多长时间,什么样的情感更能引起人们的共鸣,什么样的广告会吸引他点击。这三个人中的一个叫做停留目标,根据停留时间帮你选择下一个推送内容,让你一直刷屏;另一个叫做成长目标,可以让你邀请尽可能多的朋友来增加社交依赖;另一个叫做广告目标,保证当你对某样东西感兴趣的时候,它会准确的给你发送一个订购链接。所有这些行为的背后都是所谓的算法模型。精准算法的背后,是海量数据对人数字化的支撑。那么,这些数据从何而来?获取权限是大小商家通过APP或小程序收集用户隐私数据的第一步。当你安装一个应用程序时,用户协议的数万字显示在你掌上手机的屏幕上。您会逐字阅读还是快速按下“同意”?“不同意”可能会导致应用程序退出并变得无法使用。APP跨界维权已是不争的事实。以美图秀秀为例,很难想象一款P图软件需要获取一个人如此多的信息,包括搜索记录、浏览记录,甚至还有日历和地理位置。仔细阅读美图秀秀的个人信息保护政策后发现,将美图秀秀的内容分享给第三方平台时,也会读取用户的应用列表信息。美图秀秀还将向游戏合作伙伴提供身份证号码信息,甚至与合作伙伴共享用户的支付信息。条款还规定,基于现代移动互联网产品的互操作性,该产品可能与美图关联公司或外部合作伙伴推出的其他产品或功能相连接。手机号码、授信额度、还款金额、贷款成功状态、逾期状态等。这意味着只要用户使用美图软件并授权,美图秀秀不仅可以从自己的应用程序中获取用户信息,还可以获得来自第三方平台的更详细和具体的信息。“这种行为其实很普遍,国内用户个人信息保护意识可能不强,这给了企业很多选择余地,业内称之为‘占坑’,有些数据现在不需要,但是不需要,代表以后就不需要了,获得用户授权后抓取的用户信息越多越好。某金融科技公司大数据风控架构师肖强说。证券时报记者从衣、食、住、行、社交、娱乐、理财等方面对25款App相关权限的获取进行统计发现,通讯录权限与用户的身份密切相关。社交圈已成为标准的应用程序权限。此外,这些APP还会使用一些特定的功能来读取通讯地址、手机存储、照片,甚至记录面部识别、日历、通话记录。手机APP权限申请已经到了泛滥的地步。有点欣慰的是,App过度申请收集数据的权限正在加强。3月22日,国家互联网信息办公室、工业和信息化部、公安部、市场监督管理总局联合发布《常见类型移动互联网应用程序必要个人信息范围规定》,明确了地图等39项常见必要个人信息的范围导航、即时通讯、网络购物等,并要求运营商不得向用户提供不必要的个人信息,但拒绝用户使用App的基本功能服务。不过,肖强告诉记者,“或许大家都知道该APP在收集个人隐私数据,但除此之外,用户数据也可能同时被隐藏在该APP中的第三方SDK(软件开发包)收集。”“SDK能收集到多详细的用户信息?”北京网贷协会数据安全专家韩红辉表示,“一旦嵌入SDK,如果注册登录APP,默认授权,可以记录所有行为数据。在不知不觉中抓取手机通讯录、聊天记录、银行账户密码密码、短信、通讯录、位置信息等。因此,用户授权App收集个人信息,但往往不知道自己的个人信息何时、如何被分享与第三方SDK。很多App的《隐私政策》都包含了分享的相关声明,最常见的就是“用户的个人信息可能会与第三方分享”。然而,几乎没有应用程序会详细列出所谓的“第三方”在隐私政策中包含的内容。对个人信息安全的担忧,反映的是用户越来越敏感的神经,也是用户对个人数据缺乏知情权和主动权的体现。SDK对于用户来说就像一颗隐藏的“定时炸弹”,其危险性不言而喻。SDK提供商泄露和滥用用户信息的行为非常隐蔽,甚至成为泄露用户隐私的源头之一。谁窃取了用户隐私?树腾科技一位销售经理告诉记者,他们有自己专门的渠道获取一些数据,其中最重要的渠道就是通过第三方SDK获取数据。“通过这种渠道获取的数据会更加准确,类似漏斗模型,会根据需求筛选数据,比如网贷行业的用户数据,用户登录XX普惠,必须授权APP使用一次。授权后,SDK会收集用户的所有登录痕迹,如果其他消费金融公司也使用这款SDK软件开发包,也可以共享。以“敏感信息”为由公开不容忽视的是,通过网络倒卖用户个人信息的行为非常猖獗,近日,记者潜入了几个上千人的QQ群,发现群里不时有人喊卖各行各业公民个人信息的命令。记者以买家身份联系了一位名为“空城”的QQ卖家,以先检测数据真实性为由,要求对方提供股东信息。个人信息数据。为了证明其数据来源,“空城”向记者提供了数据来源的截图。收集的股东个人信息来自各大证券公司的APP。广发证券、中投证券、国泰君安等均中招。正如“空城”所说,QQ群里确实有人在卖数据的时候打着“公司内部信息”的旗号公开卖数据。“内鬼”是个人信息流入黑市的重要渠道之一。接触大量个人信息的职业门槛不高,职级不需要太高,泄露源可能来自各个层面。2020年,公安机关将严厉打击利用工作便利窃取、泄露公民个人信息的违法犯罪行为。各行各业都有涉案人员,重点行业涉案人员已抓获500余人,这只是冰山一角。除了“内鬼”泄密,窃取公民隐私的技术手段也多种多样。调查采访期间,黑市数据交易市场十分活跃,数据采集软件种类繁多,其中一款名为汇融客App,号称“全网最全的大数据获客软件”。其销售经理告诉记者,“我们的软件是全自动采集的,只要搜索关键词,就可以在各大网站、三大地图、三大运营商上搜索到你想要的客户资源和群体。”功能,我们还可以提供营销资料,带货视频等,每个功能都会对应不同的价格。”当记者询问与哪三大地图合作时,销售经理表示,主要是腾讯地图、高德地图和百度地图,并授权使用其数据接口,并向记者发送了与三大地图的合同协议对此,记者询问百度、腾讯、高德是否授权汇融科使用平台用户数据,对方均表示不了解这家公司,不会随意授权API(数据接口)腾讯内部相关人士告诉记者,这个章节是假的,字体也有差异,为了证明这款软件的数据爬取能力,上述销售经理表示可以先帮忙后台注册测试一下。记者下载该APP发现,该APP可以根据地理位置、行业、客户类型等进行搜索,然后导出相应的用户数据,添加微信w单击一下。“因为只是体验,不会看到客户的手机号,这也是我们公司为了保护其他会员的权益,我们会和一些第三方SDK合作,我们也会对接一些大型互联网公司的API数据接口。我们与腾讯、百度、华为、阿里、抖音、快手、美团、饿了么都有战略合作关系,资源高度整合。”销售经理说,记者发现,汇融客软件显示的数据来源主要是地图数据、工商数据、抖音、快手、阿里巴巴、美团、饿了么、京东等互联网巨头。对于该软件提到的数据来源,证券时报记者向腾讯、阿里、美团、京东等多方查询,大多表示未与名为汇融客的第三方共享API数据接口,仅快手表示没有回应。阿里公关进一步表示,集团不可能允许公司通过API接口爬取调用蚂蚁用户信息,目前正在深入调查此事。“通过一些相关的技术,一定可以从这些网站上爬取用户数据。其实爬虫技术并不神秘,就是‘爬’网页,‘铲’数据,然后进行处理清洗。有很多这样的软件,而且大部分都是全网不分青红皂白地抓取客户数据,然后通过处理进行精准分类。这也延伸到了专业数据清洗和标注的人。专门编写爬虫代码的阿强向记者透露,除了内部人员和技术手段,黑客是窃取大量个人信息的另一重要来源,从此前的京东用户密码泄露事件到用户数据如家酒店外泄事件,网站与黑客一直在就用户数据进行着一场旷日持久的攻防战,黑客通过技术入侵网站窃取市民个人信息并不难,短则几天,长则一个月,很少被管理员发现,在黑客圈子里,大家心照不宣,入侵网站获取权限和信息后,会互相交换数据,交换信息,这样被盗的公民个人信息库就变成了规模越来越大,掌握的个人信息也越来越完整。2020年,全国公安机关侦查侦破“净网2020”专项行动黑客攻击和新技术犯罪案件1782起,共抓获涉案黑客2952人。事实上,还有更多的黑客还潜伏在地下。个人信息通过内部人员、网络技术、黑客等渠道流入数据黑市,进入大大小小的各级代理人手中。个人信息价格标记者,即数据中间人,他们与数据源沟通数据购买者,在地下数据交易市场中扮演着非常重要的角色。个人数据通过供应商以不同的价格在黑市上流通。材料供应商甚至会开发自己的代理。级别越高,数据来源越多,数据信息越完整。上述销售经理是行业供应商之一。他告诉记者,只有电话号码、微信、QQ号等普通个人信息。单条价格约7-8美分,每条个人信息收入约3-4美分。“我每个月的销售数据大概在40万到50万元之间,金融、教育、医美等行业都是做的,这方面的需求量会比较大。””记者在与多家物资供应商接触采访过程中了解到,上述销售经理并非一级物资供应商,三级物资供应商的采购成本为0.7~0.8元/件,且终端平均售价为1.2~1.5元/个以上只是普通私人数据在数??据黑市交易中的价格,在数据黑市中,依然存在所谓的“渗透数据”意味着所有的信息都能被抓取,除了电话号码、微信等基本信息外,还包括用户的身份证号码、出行记录、开房记录、通话记录、家庭成员、工作、婚姻状况、居住地户籍等,一些物资商甚至在QQ群中直接标价“渗透数据”,查询简单个人信息15元/项,包括姓名、性别、手机号;中间信息50元元/件,除简单信息外,还包括户籍地址、身份证号码、照片;高级信息100元/条,在中级信息的基础上,还包括当前居住地址、开房记录、车辆信息;VIP客户600元/件。“正常的市场价格只是通话备案,要价在1500元左右,开房备案在2200-2500元左右,家庭成员信息在300元左右。”一位材料商表示,网名“冯”,据不完全统计,国内个人信息泄露数量已达55.3亿左右,平均每个人有4条相关个人信息泄露,如车辆、房产、住址、职业等,年龄、电话号码、身份证信息等在黑市上频繁流动,国内知名信息安全团队“雨攻组”去年10月发布报告称,在一年半的时间里,有多达由于8.6亿条个人信息数据被明码标价出售,个人数据基本处于裸奔状态,灰色产业链巨大。“我想买金融信息炒股.数量没有限制。有资料找我!”一位买家在QQ群里发了这样一条消息,很快就有多家供应商通过私聊向他推荐了数据资源。经过沟通和比价,上述买家告诉记者他从某供应商处获取了10000条理财个人信息,包括姓名、电话、微信等,价格为1元/条。记者进一步询问获取这些数据的主要目的,买家表示,只是为了推广金融产品,根据多方采访,购买个人信息最多的是需要卖广告、卖假发票、发垃圾信息的,以及从事网络催收的。其中,房地产、财富管理公司、保险公司、母婴及保健品行业、教育培训机构是渴望获得个人信息的核心群体。被盗的个人信息被用于欺诈的情况并不少见。例如,保健品的用户信息主要针对老年人,专门用于诈骗。在与买家的接触过程中,记者发现,他们中的大部分人都知道买卖数据交易是黑产品,但还是这么做了。一个重要原因是通过正规渠道做广告,比如百度竞价排名,获客成本在60-80元/左右,通过地下黑市购买用户数据可以大大降低成本。从信息采集到信息销售再到信息利用,每一个交易环节环环相扣,由此形成的“灰色产业链”难以估量。据猎聘网报道,目前中国网络黑业从业人员超过40万人,至少有160万人依托进行网络诈骗,“年产值”超过1000亿元。数据合规交易痛点海量个人信息地下市场规模目前尚无准确统计。但是,从公安机关的专项打击行动中,我们可以窥见一斑。2020年,全国公安机关将深入推进“清洁网络2020”专项行动。全年共查处网络犯罪案件5.6万件,抓获犯罪嫌疑人8万余人。其中,查处侵犯公民个人信息案件6524起,抓获犯罪嫌疑人1.3万名。但显然,这并不是黑市的全貌。贵阳大数据交易所业务经理陈经理告诉记者,“目前通过正规渠道进行数据交易的并不多,更多的数据可能还是在黑市交易。”贵阳大数据交易所是国内第一家大数据交易所。2015年4月正式挂牌运营,喊出未来3-5年日交易量100亿元以上的口号。时至今日,交易所已成立6年。陈经理向记者透露,目前交易所每日成交量远未达到当时设定的目标。大数据服务商聚联信CEO罗浩和陈经理均提到,交易过程中的数据权属验证、数据回溯、安全合法性、隐私保护等问题尚未解决。好好解决。特别是数据的收集、处理、采用和交易等数据权利验证可能有多个参与者。在何种情况下、何种类型的参与者可以获得数据权利,实践中尚未达成共识。目前可见的红线是来源是否合法,交易数据是否经过脱敏处理(涉及敏感信息的去个性化和隐私处理)。但问题是,在数据流通过程中,其实很难发现非法来源和脱敏数据。再加上数据的开放性还远远不够,导致市场上合法流通的数据种类和数量有限,让玩家挥拳难上加难。腾讯、阿里等互联网巨头在拥有海量数据的同时,可以实现大数据云计算的闭环。他们希望将它们打包成数据产品和服务进行销售,这比单纯买卖数据更有价值,也可以避免违法行为。风险。这些玩家不愿意分享数据,这从腾讯、阿里、贵阳大数据交易所合约到期后都没有续约就可以看出来。但是从技术角度来说,已经有一种技术可以实现B2B之间的数据合规交易。大数据服务商星云CTO张俊学告诉记者,公司已经采用了一套“联邦学习”算法。简单的理解就是根据双方已有的数据,共同建立一个坐标系。这个坐标系就是所谓的建模。建模完成后,可以更准确地判断客户在坐标系中是处于安全点还是危险点。但在建模过程中,双方并不知道对方的用户信息,无需担心用户隐私被复制泄露。据张俊学介绍,上述联邦学习算法目前只解决B2B之间的数据合规交易,主要用于银行和金融机构之间的数据交易,成本较高,尚未大规模应用.大成律师事务所律师肖萨告诉记者,目前在中国合规使用个人信息很大程度上取决于公司的自律。各大运营商是否履行了保护用户隐私的责任,如何保护公众隐私和商业模式在过程中找到平衡点,在保护个人权益的前提下,规范、安全、有序地使用个人数据,并释放大数据的红利值得研究。
