今天,数据是组织最重要的资产之一。无论您是想设计客户旅程还是预测业务的未来,数据都是取得成功的主要工具。这就是企业主致力于开发定制解决方案以保持数据清洁的原因,尤其是客户或联系人数据库。但随着公司的多名员工处理、操纵和使用联系人数据集,许多不一致和不准确的地方很快就出现了。然后,公司的IT人员构建了一个内部解决方案,神奇地消除了数据库中存在的所有错误。从头开始编写每个解决方案虽然可以编写代码来清理和规范化数据集,但考虑到实施它所需的资源量(时间、人员和金钱),这绝对是一个低效的解决方案。考虑到每年的维护和升级成本,它比现有解决方案贵两到三倍。这让我想起一位程序员朋友最近告诉我的一件事:在每个开发人员生命中的某个时刻,他们意识到手工编写每个解决方案是多么低效。有时,采用市场上现有的解决方案(开源库或商业产品)比从头开始编写解决方案更有效。在这篇博文中,我解释了一些常见的术语和步骤,用于清理和验证客户数据库中的地址。这肯定会帮助您了解在市场上可用的解决方案之间进行选择时要寻找的内容。涉及的常用术语在深入了解该过程的细节之前,让我们先了解一下该领域中使用的一些常用术语及其含义。地址标准化地址标准化(也称地址规范)是根据权威标准(如美国的USPS地址标准)更新地址格式。此过程确保地址以可接受的格式存在——包括正确的拼写、缩写、地理编码和附加的ZIP+4值。地址验证地址验证是针对权威数据库(例如美国的USPS)运行标准化地址并确保这些地址真实有效的过程——这意味着它们是国内邮寄的有效地点。两者之间的区别有时这两个术语可以互换使用,但两者之间是有区别的。地址应首先规范化以遵循可接受的格式。一旦标准化,现在就可以验证它们以检查这些地址是否真实有效。标准化和验证地址的过程该过程包括以下步骤:1.分析地址在对地址数据库执行任何活动之前,评估当前状态很重要。这时候地址分析就非常有用了。它识别包含不完整或缺失地址信息的记录,以及不遵循标准化模式的记录。地址分析突出显示了数据集中可能的清理和规范化机会。此外,配置文件报告通常会在过程结束时再次生成,以便比较初始报告和最终报告以查看数据集中是否仍然存在错误。2.解析地址USPS地址标准化从将每个地址解析为子组件开始。这很重要,因为地址大多存储为数据集中的单个字段。对整个字段运行验证检查不如对子部分运行检查准确。因此,单个地址通常会解析为街道号码、街道名称、邮政编码、城市、州和国家/地区。3.地理编码在这一步中,计算所有地址的纬度和经度地理编码。除此之外,根据计算出的地理编码,您还可以找出5位邮政编码和4位送货区域路线。4.重构地址一旦所有这些信息都被计算和规范化,现在不是重新格式化和重建地址为所需格式的时候了。一旦完成,它可以保存在数据库中,或者如果需要,可以随时随地实时计算。这种格式的一个例子是USPS地址标准,它要求送货地址有三行——第一行包含收件人姓名,第二行包含街道地址,第三行包含城市、州和邮政编码.5.验证地址当地址具有所有必要的组件时,您现在可以根据任何权威数据库验证其有效性,以确定该地址是否是真实的、可邮寄的位置。除了验证之外,此类数据库还可以判断地址类型——住宅或商业地址,以及其他细节。结论您现在有一个用于清理和验证地址数据的5步无代码流程。从头开始实施这样的解决方案可能非常具有挑战性,并且可能需要数年时间才能提高结果的准确性。当今行业中有许多地址验证工具,包括一些经过CASS认证的工具,CASS是USPS分配给提供准确地址标准化和验证服务的软件供应商的认证名称。这些类型的工具绝对可以提高您团队的运营效率,并使他们能够通过使用正确和准确的位置信息为客户设计出色的体验。原标题:HowtoCleanandVerifyAddressData'WithoutUsingCode',作者:数据阶梯
