很多数据分析爱好者会使用PowerBI构建仪表盘和可视化数据。然而,在构建和改进复杂的Dashboards时,Widgets的添加或删除总是通过不同的字段和对应的表来实现的。经过多次更改后,数据结构可能看起来很杂乱——帮助构建仪表板的表格和列表变得一团糟。经过一些数据处理后,最终的Dashboard可以包含所有当前使用的字段。不幸的是,在PowerBI上实现仪表板的完整预览的唯一方法是自己浏览所有小部件的数据并手动记下那些使用的字段。但是程序员会尽量避免不必要的手动操作,所以我们应该努力学习,寻找这方面的解决方案。别担心,最终的解决方案非常简单!解构PBIX文件在不直接使用PowerBI的情况下组织PowerBI的第一步是研究.PBIX文件。WinRAR等免费压缩器能够解压缩任何.PBIX文件。以上功能为用户提供了一系列不同的文件格式和目录选项,为后续的分析和操作创造了可能。浏览解压后的文件,可以看到一个包含“layout”的“Report”文件夹。这个文件夹包含了Dashboard视觉结构的所有信息,例如:?每个Widget的大小和x/y坐标?使用的字段名称?所有设置和参数?标题?...和其他海量信息布局文件见它由一串JSON、表单和同义词库组成。我们将使用Python对所有数据字段和使用的小部件进行汇总。从文本编辑器打开布局以构建解析器。本来以为一个普通的JSON解析器就可以解决问题,可惜JSON内部有嵌套结构,所以代码比想象的要长,但总体来说还是比较短的。.经过解码和场景构建,得到了满意的结果:分析器成功返回了每个Widget对应的表和字段。然后用Pandas将以上数据汇总成一个数据框,删除所有重复的信息(比如两个Widget共享的信息)。这一步的结果呈现在一个简洁的数据框中,涵盖了Dashboard中使用的所有数据:JupyterNotebook上的输出数据框在线版准备好了,所有程序现在可以从布局文件中复制字符串并粘贴到JupyterNotebook,与等式完美配合。虽然它工作得相当好,但整个操作不是很用户友好,所以下一步是将方程式转化为实用程序。继续使用Python,您可以选择使用Flask构建Web应用程序。该工具的在线版本通常只将字符串作为输入。运行方程式,在返回数据框后,将数据框转换为HTML表格,最后将HTML表格显示给用户。该工具是完全免费的,没有任何广告。它有时在HerokuWeb服务器上运行速度稍慢。终于得到了一个唯一的数据字段,显示了Dashboard中使用的所有数据,接下来要做什么?然而,尽管取得了可喜的成果,研究才刚刚开始。还有足够的空间来展开脚本文件并浏览解压缩文件夹中的其他文件。.PBIX文件开辟了许多新的机会。例如,可以简单地调整文件、重新压缩并使用PowerBI重新打开它——似乎有一些效果。这意味着用户可以使用Python脚本编辑仪表板。接下来我需要做什么?以下是您可以考虑的一些事项:?跟踪更改?自动化报告?创建更广泛的报告作者保留所有权利,如有侵权请联系删除。学习Python的路上肯定会遇到困难,不要慌张,我这里有一套学习资料,包括40+电子书,800+教学视频,涉及Python基础、爬虫、框架、数据分析、机学习等等,别怕你学不会!https://shimo.im/docs/JWCghr8...《Python学习资料》关注公众号【蟒圈】,每日优质文章推送。
