1最近大促不断,各家电商都在摩拳擦掌,迎接年底的大丰收。各种APP的促销推送和产品推荐也是全天候不间断。我们必须让每个人都离开他们的手,过个好年。由此看来,最大的受害者就是家乡等压岁钱的熊孩子了。不但拿不到钱,还可能被两手空空的长辈扒光,年纪轻轻就得承受命运的打击。提到APP推送和产品推荐,很多人都有一个恐慌的顾虑。那就是怀疑你的APP在录自己。经常发生的是,我和某人谈了一些事情,然后不久之后,我在购物应用程序或搜索引擎或浏览器或应用程序的广告行业中看到相关广告,这让人感到恐慌,觉得有一双神秘的眼睛看着自己,非常害怕。怎么说呢,我觉得大家的想象力太丰富了,这种猜测也有道理,但也说不准。没错,我们的生活确实被各种精准推送占据,各大APP也确实存在一定程度的“猜”行为,目的也确实是让你买单。错误的是,没有人在记录你。其实,科技和大数据发展到现在,录音是一种非常低效的播放方式,音速不够快。我们的高科技镰刀都在以光速前进。2为什么说没有公司使用录音进行信息收集和广告推送?不是公司的良心发现了,商业公司有良心其实是一件很奇怪的事情。但凡事都必须有目的。广告推送的目的是追求转化率,追求自身利益最大化,成本最小化。卖家也要看性价比。从项目成本和收益来看,录音是一个效率低、利润低、出错率高、成本高的沙雕项目,所以没人做。大胆尝试录音方案的朋克大多在投入产出失衡后破产,所以市面上很少能看到完整的商用录音分析方案。不同的。想一想,如果要做录音解决方案,首先绕不过去的就是app的资源占用问题。连续录制对于应用程序来说是一个巨大的负担。结果就是app运行效率低下,耗电量和发热量大大增加,跑起来跟吃香一样别扭。另外,你如何保存录制的音频?保存在本地?这个音频文件会大到无法想象。一个APP录一天,最后录下来的文件好几个G,有朋克用户,看你的源文件剪辑,找到录音就等着铁拳来袭。在线传输?用户的流量是要花钱的,当用户定期查看手机的流量记录时,发现只有你的一个应用消耗了很多流量,而且不是视频或游戏应用,就会暴露在分钟。本地直接解析?只保留文字?这是可行的,但最大的问题是你要小心你的竞争对手反编译你的安装包。一旦人们看到相关的代码和型号,内衣就会消失。事实上,很少有互联网公司在本地部署复杂的模型,因为太容易被对手直接破译;如果使用云模型进行记录分析,流量消耗和网络稳定性都会大大降低准确性。从技术上讲,录音是一种不合理的解决方案。不是做不到,而是成本高而且麻烦。与道德无关。3如果只是录音比较麻烦,那也没关系。如果一个东西好用,麻烦一点也不是什么大问题。痛苦和快乐也是一种生活。但录制方案最致命的问题是在消耗大量资源后,准确率过热。想一想,如果你的APP采用了录音监控的方案,你面临的第一个问题就是区分谁在说话?是手机的主人吗?音源是个大问题。想象一下,我从你身边走过,大喊我爱杰士邦,然后你打开手机,看到杰士邦的广告,是不是觉得很沙?你觉得我在性骚扰你吗?解决完要录谁的声音的问题(声纹式方案),就会遇到第二个问题,就是需要识别语言的准确性。我们日常生活的环境非常嘈杂,会有很多噪音,而且很多人的普通话不标准,机器无法有效识别。事实上,机器无法识别大多数方言中的各种沙雕。尤其是温州话,那是魔鬼的语言,一种神奇的语言,在战争中可以作为密码使用。如果解决了语言准确性的问题,那么还有第三个问题,就是音频的实时语义识别问题。这个问题目前是一个几乎无解的问题。所有的人工智能在遇到音频的实时语义识别时,都会很容易变得弱智。注意,我说的语义识别不是所谓的把你说的翻译成文字。那东西不难。我所说的是真正理解您的语言的含义。比如死鬼这个词,男人对女人说,男人对男人说,女人对男人说,男人对敌人说,意思完全不同,但都是死鬼。人类对语义的理解需要结合特定的场景,甚至是特定的说话人(同一个词,不同的人有不同的意思),这些都是现阶段机器做不到的。别说机器做不到,很多人做不到,比如:弹性工作制=别想着按时下班,谁受得了。尤其是APP录音,需要快速记录人们在现实生活中快速出现的场景、不明对话对象、不明普通话不标准的魔幻对话,记录分析,获取准确含义。如果哪家公司有这个本事,连推个屁,直接拿诺贝尔奖。以上三个问题,我喜欢称之为录制计划灵魂的三个问题,在三个问题之上,还有终极问题。还记得我之前说的大部分录音项目都破产了,还有一小部分,小部分去哪了?一小部分因为收集隐私而被捕,他们完全财务自由。毕竟,监狱不花钱。4当你读到这里时,你一定是既开悟又困惑。我突然想起来,我真的不会被记录下来。我比较纳闷的是,为什么我说了一句,然后APP上就出现了相关的推送?这么说吧,没有公司做录音,但不代表没有公司用声音来收集信息。只是这种收集数据的方式并不是你想的那种大规模记录监控,而是通过特定的关键词进行觉醒。比如你用苹果,你会[嗨,Siri]来唤醒siri功能。如果你用小米,你会【小爱同学】唤醒网络。其实很多APP推送都是采用类似的方案,就是根本不记录你说了什么,也不分析你说了什么。只要你说出一个特定的词,你就会被唤醒,但是这个唤醒并不是亮屏之类的,而是唤醒推送逻辑,把相关的item推送给你。再举个栗子,如果是外卖app,这个叫醒词库可能包括【奶茶】、【披萨】、【烤串】、【麻辣烫】、【哈密瓜】等词,只要当你说类似的话,那么推送可能会被唤醒。例如,对于OTA应用,这个唤醒词汇可能包含[旅游]、[泰国]、[签证]、[酒店]、[度假]等词,只要你说类似的词,它就可能唤醒上推。再比如一个购物APP,唤醒词库可能包含[口红]、[靴子]、[裙子]、[水果]、[笔记本]等词,只要你说出相似的词,它可能会醒来并推动。每个APP的词库可能有几千甚至几十万个词,基本涵盖了你可能的消费场景。有很多神奇的功能,就像变魔术一样。一个觉醒剧本+词库的事情,就是这么玄乎。5虽然词库唤醒逻辑是一个比较实用的方案,但是在实际的信息采集中,有更多主流有效的信息让商家知道你是谁,怎么卖东西给你。这些你忽略的东西才是真正的关键。我只提到2个简单的。首先是输入法。谁知道你的一切?当然是输入法了。不要总是怀疑是什么APP在监控你的聊天记录。你首先要怀疑的是你的输入法有没有卖给你。只要打字,藏不住的就是输入法。你输入什么,在哪里(搜索引擎?社交软件?地图?短信?跟卖家议价?)对输入法都是透明的。此外,您经常输入哪些词以及它们的意思并不难获得或分析。上面提到的语义分析的困难对于纯音频来说也是如此。纯文本的语义分析是一项比较成熟的技术。另外,所有的输入法都是越用越好用,越用越懂。那么,你怎么理解你呢?你可以考虑一下。二是推送SDK。什么是开发工具包?你可以把它理解为一个软件包,嵌入在APP中执行特定功能的特定模块。最流行的SDK是推送SDK,就是你手机上各种APP收到的推送消息。有专门的公司做SDK嵌入各大APP,然后他们负责推送。比自己开发好用多了,而且专业的SDK往往能很好适配各种手机和应用,所以一般APP都是外购推送SDK。你手机上的30个APP可能都是同一家公司提供的推送SDK,所以对于这家公司来说,你的手机基本上是透明的,很明显你会知道手机上安装了哪些APP,有哪些用户知道。常用什么APP,甚至用户对手机的应用轨迹和应用行为。这些行为可以被标记,然后打包交易。这个市场目前非常成熟。国内推SDK的巨头不超过5家(最大的3家),对外卖标签数据非常积极。你看,当你知道了输入法和SDK,你对世界的认知就会改变。当您收到广告时,您甚至可以分析是哪个广告卖给了您。是搜索引擎或搜索引擎时使用的输入法,还是监控您的移动应用程序活动的SDK,还是您某些语言的词库?很多人其实在卖的时候都不知道是怎么卖的。.猜猜谁卖了你其实很有趣,有点黑色幽默。6本文只是对录音传闻和最基本的信息收集渠道的简单介绍。通过逻辑钩子来制作用户画像,还有很多更微妙甚至更富想象力的方式。书名是《作者已被各大公司吊起来打》。数据收集、画像和广告推送的技术和产品逻辑并不是真正的秘密。甚至还有专门讨论广告推送逻辑原理和策略的技术书籍。我同意技术是无辜的,但我也认为技术需要被约束,或者技术背后的人需要被约束。在这个人人几乎透明的时代,我们其实更需要警惕所谓的大数据,也更需要法律的约束。因为数据虽然可以让生活更方便,但一旦失控,也会引发灾难。当我知道你所有的数据,在某种程度上,我比你更了解你,我就是你。所以,要约束人的行为,就要加大作恶的成本。毕竟,人是复杂的;人性是自私的。我不希望有一天我们成为大数据玩的棋子。恐怕已经设计好的世界不再有趣了。
