当前位置: 首页 > 科技观察

Hightouch是如何使用“反向ETL”在仓库和SaaS应用之间同步数据的?_0

时间:2023-03-20 11:44:24 科技观察

【.comExpressTranslation】Hightouch在由AmplifyPartners领投的一轮融资中筹集了1210万美元,AmplifyPartners是一个旨在帮助公司将客户数据从数据仓库同步到CRM、营销和许多其他业务工具的平台。现代企业数据堆栈包括各种组件,从Fivetran等数据摄取工具到Snowflake和Google的BigQuery等基于云的数据仓库。通过以这种方式汇集来自多个来源的数据,公司可以运行查询并生成无法从独立数据孤岛获得的见解。一旦数据在仓库中,用户需要将其取出并导入到Salesforce等应用程序中,Hightouch在数据工程领域占有一席之地。因此,虽然Fivetran是许多公司用来将数据“提取、转换和加载”数据到其仓库的最著名平台之一,但Hightouch的做法恰恰相反,即所谓的“反向ETL”。图1:Hightouch:将数据从仓库导入业务应用程序简单来说,反向ETL就是在表之间复制和粘贴数据。例如,公司可能希望将数据从服务台管理平台Zendesk提取到Salesforce。为此,他们可以使用Fivetran将数据导入仓库,然后使用Hightouch从仓库中获取数据并导入Salesforce。这样做有助于销售团队了解客户通过Zendesk请求的支持类型。Hightouch联合创始人KashishGupta对媒体表示:“通过让仓库中的数据更有用,Hightouch让Fivetran变得更强大,反之亦然——如果没有Fivetran提供的数据,Hightouch中的许多工作流程将无法实现。”2018年成立于旧金山,过去三年积累了众多知名客户。除了与Nando's和Autotrader等B2C公司合作外,它还与Kong、Plaid和Mattermost等B2B公司合作。IntegratedHightouch支持来自广泛公司的大约60个“目标”集成,从ActiveCampaign、Anaplan、Asana、Amplitude到Facebook、GoogleSheets和Marketo。该公司还提供“自定义目的地”选项,使用户能够构建自己的Hightouch目的地。在数据源方面,Hightouch可以从Amazon的Redshift、Databricks、Google的BigQuery、Looker、Snowflake、Airtable等来源获取数据。Hightouch本身是一个SaaS应用程序,公司可以将其部署在他们选择的任何云上,允许非数据工程师通过SQL查询数据。Hightouch然后将其UI中的列映射到相应目标SaaS工具的列。“然后,Hightouch会自动实时同步永久数据,”Gupta说。“视觉过滤”部分的用户在他们构建的模型之上,这意味着他们自己不必了解任何SQL。例如,营销团队可以根据“在过去30天内登录并查看2种产品的所有用户”或“居住在纽约市的50岁以上的所有人和人们”,将来自多个来源的数据组合到一个仓库中,以执行图3:针对技术水平较低的用户的视觉过滤根据Gupta的说法,为了实现Hightouch提供的功能,许多公司采用的主要现有解决方案是编写Python脚本并将脚本与Tray或ZapierCombine等工具集成。但实际上,在反向ETL领域还有其他类似的参与者。Census是另一家成立于2018年的旧金山公司,几个月前筹集了1600万美元。同样新兴的还有Grouparoo和Polytomic等早期公司,它们都筹集了小额资金过去九个月的种子轮。正如你所料,每个产品都有自己的差异化优势。例如,Hightouch使非技术用户能够在现有模型之上过滤数据。同时,Grouparoo正在构建一个开源数据框架。然而,具有相似价值主张的多种产品大约在同一时间上市这一事实表明,公司需要将内部客户数据与无数其他业务系统同步。更广泛地说,最近在数据集成领域采取了很多行动:GitLab将新的开源平台Meltano剥离为一家独立公司,DbtLabs(前身为FishtownAnalytics)筹集了1.5亿美元(价值15亿美元)以帮助分析师转换仓库中的数据。而Airbyte今年也拿到了风险投资,随后开放了平台支持数据湖,从亚马逊的S3开始。但是,Hightouch不同于这些数据集成平台。事实上,它的技术是互补的。除了今天的融资,Hightouch还宣布与DbtLabs和Fivetran就整合进行深度合作。两家公司都会向自己想要在仓库外使用集体数据的用户推荐Hightouch。开源?“开源”是涉及更广泛数据工程领域的许多公司的共同主题,Grouparoo、Meltano、DbtLabs和Airbyte都在开源的基础上构建商业产品。Hightouch还没有接受开源理念,但这在未来可能会受到关注。Gupta解释说:“我们正在研究这方面的路线图。我们的客户没有要求开源。”归根结底,Hightouch是一款不同于数据堆栈中其他工具的产品。许多公司可能并不急于在自己的基础设施上托管Hightouch——首先,它本身不存储任何客户数据。“应用程序托管在我们的云中,但数据100%驻留在客户的基础设施上,”Gupta说。“数据直接从客户的数据仓库进入其自己的云存储桶,然后进入SaaS工具。因此,我们能够与金融科技和医疗保健客户大规模合作,他们能够证明Hightouch不会对他们的数据驻留或安全性。”原标题:HowHightouchuses'reverseETL'tosyncdatafromwarehousetoSaaSapps,作者:PaulSawers【翻译稿件,合作站点转载请注明原译者和出处.com】