当前位置: 首页 > 科技观察

基于iOS11机器学习的垃圾短信过滤应用:熊猫吃短信

时间:2023-03-15 01:24:46 科技观察

作为生活在移动互联网时代的技术极客,饱受骚扰短信之苦,但目前还没有不需要自己上传短信的简单过滤应用。于是我就从自己收到的20000+条短信和测试期间用户提交的短信样本中训练pandas。iOS11带来了非常强大的CoreML机器学习框架,供开发者用于视觉处理。我会用它做一个文本分类应用,让大熊猫在手机里安家。精准语义识别Panda从海量样本中学习了垃圾短信的文本模式,能够非常准确的对来自复杂语义环境的短信进行分类。比如下图中【JDPay】的两条短信就非常相似。对于垃圾短信识别,您可以复制短信,点击APP中的准确度测试来测试准确度。使用非常简单,安装后打开设置→信息→未知和过滤信息,选择熊猫吃短信。熊猫会默默帮你吃掉垃圾信息。关注隐私熊猫不需要服务器,也不需要连接到互联网。该应用程序带有一个完整的训练模型,可以使用CoreML对手机上的短信进行分类。iOS11的沙箱限制也不允许短信过滤器访问网络并与主应用程序共享数据。虽然iOS11可以通过配置项发送短信到自己的服务器在云端进行判断,但是Panda并没有使用这个功能。自动进化的熊猫正在迅速成长,分类的准确性取决于熊猫是否看到过相似的信息。但是世界那么大,总有我们没吃过的东西,熊猫也知之甚少。本着自愿原则,您可以在应用程序中提交新的短信样本来喂熊猫,熊猫会从新的样本中学习新的垃圾短信或正常短信模式。注意:提交短信样本会将短信匿名上传到服务器,而不是本地训练。熊猫会在云端完成学习,然后分发到每个人的手机上。关于偏食,自从我教pandas(监督学习)以来,一定程度上继承了我的喜好。对于一些含糊不清的短信,比如打折、促销信息等,我都会一律标记为骚扰短信。但有些人可能喜欢收到这样的通知,这取决于你。系统限制由于iOS11的系统设计,过滤后的短信也会在AppleWatch上显示徽章和通知。此外,iOS11还根据对话过滤短信。如果同一个号码同时发送骚扰短信和普通短信,则整个对话将被过滤。这种现象对于五位数的号码很常见,但是对于10开头的短信发送端口就很少见了。最后,熊猫标志来自我最喜欢的一张回滚图片。Panda目前只针对中文进行训练,在其他语言环境下可能会乱七八糟。