当前位置: 首页 > 科技观察

如何使用Tableau可视化AmazonRedshift数据

时间:2023-03-17 16:27:46 科技观察

【.com快译】作为数据分析师,相信大家对Tableau和AWSRedshift都不陌生。并且很明显,将Reshift的列式数据库的成熟度和速度优势与Tableau的丰富性和交互性相结合,将会带来极佳的实践体验。在今天的文章中,我们将了解将两者集成在一起的过程,最终目标是构建演示页面以了解访问者数量如何影响性能。注意:在本文中,我们使用可免费下载的TableauDesktop10.0。下载安装后,您可以通过以下内容将其连接到Redshift。当然,您需要确保拥有自己的Redshift信息(包括主机名、数据库名称、用户名和密码)。连接在TableauDesktop的启动页面上,选择Coonect下的AmazonRedshift选项。输入您的Redshift信息并单击登录。在上面显示的数据源页面上,执行以下操作:单击页面顶部的数据源名称并输入Tableau将使用的唯一数据源名称。***名称是根据数据源命名约定选择的,以帮助其他用户了解Tableau当前插入的数据源。在模式下拉菜单中选择模式,或使用搜索模式名称后出现的文本框。选择表格下的表格,或使用搜索表格名称后出现的文本框。将工作表拖入操作区,然后单击工作表选项卡开始分析。现在Tableau已经连接到我们的Redshift数据库,让我们开始可视化数据。对于可视化,在Tableau桌面版的菜单栏中选择Data,然后在弹出菜单下方的数据源列表中选择一个表。在本例中,我们要基于clientid表创建报告和图表(如下所示)。接下来,从该菜单栏中选择Dashboard>NewDashboard。当前显示的图片会返回Timestamp、PagePath、Clientid的页面访问次数:如上一阶段所示,这里我们可以根据实际业务需要,尝试使用Tableau的简单UI和过滤器进行数据可视化:在菜单中栏选择工作表>新建工作表。接下来从菜单栏中选择数据>用户。在左侧的维度和度量部分,您可以选择相关的列和行来调整工作表。例如,下面的屏幕截图显示了按日期查看了哪些页面以及查看了多少次。另外,如果想查看具体的Clientid(普通版暂不支持开箱即用的查看该信息),可以为它创建一个类似的图片:某个特定页面的访问次数到目前为止特定的clientid或者,您也可以安排数据简单的更改来为同一示例创建不同的可视化效果:特定clientid按时间戳访问特定页面的次数如您所见,可以很容易地将Redshift数据可视化桌面桌面。高级用例:使用Panoply虽然Tableau与Redshift集成得很好,但由于涉及的准备步骤很多,它可能会乏味、冗长且难以维护。在高级用例中,数据库通常包含大量表格并且需要连续处理以实现可视化。正因为如此,我们应该使用Panoply.io来解决相关问题:Panoply.io可视化插件Panoply.io提供了一套数据仓库解决方案,可以实现从数据源提取到加载再到转换的全过程。除了能够直接与Tableau集成外,Panoply服务还可以与外部商业智能工具(如Chart.io、Looker和PowerBI)接口。这种自动化数据管理解决方案利用Redshift基础架构,并通过消除日常管理流程来增强它。这种增强跨越了底层基础设施和数据库层。您可以将Panoply视为一个自动化的数据工程机器人,它可以处理大多数数据工程任务和数据库管理操作。原标题:HowtoVisualizeYourAmazonRedshiftDataUsingTableau,原作者:AlonBrody