版本:2.0
上次更新:2022-05-04
首先,让我们了解什么是增强分析。著名的咨询公司(单词的较小能力)Gartner给出了这个定义:“增强分析是指使用机器学习和人工智能来帮助数据以帮助数据掌握,见解和见解的技术,从而增强人们的能力在分析和业务分析平台中探索和分析数据。” [^1]。
在这里,我的理解是要强调使用机器学习和人工智能作为帮助简化数据准备,利用数据中潜在现象和法律的一种手段,并通常通过图形来解释自动采矿的现象。其中,人工智能的作用更多是。大多数是以易于理解的方式表达高级田野专家(例如算法和机器学习模型)中添加的固有法律,而不是人力来分析操作并促进交叉行业和促进交叉行业和促进交叉域业务知识,最后放弃“每个人都是数据分析师”的商业口号。
与传统数据视觉分析软件相比,增强分析具有更突出的优势[^2]:
AVA是一个更轻松的视觉分析的技术框架。VA代表视觉分析,第一个A具有多种含义:其目标是成为自动化的视觉分析解决方案(AI驱动)和支持增强分析。
从数据的引入,数据检查和洞察力(包括经验驱动因素和数据驱动程序的两个建议路径[^3]),建议图表的集成解决方案最终构成了建议图表。从用户的角度来看,它是给我的。最令人印象深刻的是开放性,严格和易用性。
接下来,尝试从狭窄的技术角度分开解释。
它可以描述为违规行为。如果没有同一件事的“统一”标准,它将导致技术实施和沟通困难和潜在误解的偏差。官员给出了更详细的解释^4。这是软件合作的中间的重量,以及通常被忽略的部分。前者具有经典书籍[^5]给出的图形的定义。对于视觉图的字段,它还需要一个统一而清晰的规范 - 图表知识库(CKB),这是一个知识库,该知识库基于JSON形式提供图表经验。
典型的结构化定义如下:
对于图表的分类,诸如图表坐标系,图表类别和数据条件之类的因素是图表分类的主要因素。这里没有说明。对于用户,它还完全支持图表自定义。
AVA使用DataWizard模块根据数据模式规则提取输入数据,生成字段功能(字段名称,数据类型,统计信息等),自然(连续性,离散)以及多场(相关性)之间的关系,相关性,相关性,相关性,相关性,周期性等)[^6],最终将提取功能交给了规则引擎以生成图表。可以说数据提取的步骤可以解决可能生成人工数据的错误 -从技术角度来看,基于数据标签分类,降低人工标签的成本并提高效率。
例如,如果数据库视图中的数据列是整数类型,并且在存储存储中存储的数据库中,数字类型通常是产品的聚合结果的数量。提示,如果字符串通常用作一个参与图表的数据,通常需要人工干预校正/重新标记数据类型。这也是一些依赖手动参与的产品产生的低效率问题。
为了更好地理解,这是基于规则引擎的图表的主要介绍。对于LiteInsight说明,您可以参考Tencent的文章^7。
根据图纸的数据特征以及基于图表业务方案的一系列权重规则,推荐规则。最后,推荐图表集合并根据分数对图表列表进行排序。支持扩展规则和定义规则权重,这非常适合在特定字段中更差异化的图表建议。
许多数据产品都有用户创建的大量用户。这些现有的可视化图表可能存在许多问题。视觉编码选择不当,缺乏传奇以及错误的宣传和其他问题将阻碍我们从可视化中获得有效的知识,甚至使理解真实的数据很难。拥有良好的视觉设计和图表制造商本身的技术知识[^3]。
核心角色是根据规则自动识别错误并给出错误提示,提高图形建议的准确性,并在IEEE会议[^8]上发布论文。
将来,我们期待看到的是,图表插图可以成为图表的必不可少的能力。除了图表优化本身外,我们发现Chartlinter也可以是无创的新手指南,以告诉我们的用户一些新功能TA有用。[^9]
本文认为,入口点会导致AVA作为增强的分析框架所解决的疼痛点和技术解决方案,但是 - 深度分析没有涉及一些算法和论文,并且需要更多时间来研究它。
本文的主要目的是希望商业BI产品在智能BI产品方向上面临的问题和现有解决方案,希望能够讨论业务BI产品。欢迎讨论或私人消息。
[^1]:Gartner增强分析和解释[^2]:增强分析解释:定义,用例,好处,功能[^3]:AVA 2.0
[^5]:图形语法[^6]:DataWizard简介
[^8]:vizlinter:数据可视化[^9]的Linter和Fixer框架:图表,您的图表可以更好地更好