当前位置: 首页 > Web前端 > HTML

浅谈信息熵在数字体验监测领域的应用

时间:2023-03-29 12:06:39 HTML

什么是信息熵?热力学第二定律也可以表述为熵增原理:不可逆热力学过程中熵的微增量总是大于零。在自然过程中,孤立系统的总无序度(或“熵”)不会减少。熵,在物理学的意义上,已经成为衡量一个系统混乱程度的指标。1948年,美国数学家、信息论之父克劳德·埃尔伍德·香农(ClaudeElwoodShannon)在《贝尔系统技术》期刊上发表了一篇题为《通信的数学理论》的论文,提出了信息的经典定义——“信息用于消除随机不确定性”,并进一步提出信息熵的概念,解决了信息度量的问题——用熵值来表示随机变量不确定性的度量,用来定量度量信息的大小,这也给人类社会带来了一个新词——比特(比特),成为衡量信息量的单位数学家、信息论之父克劳德·埃尔伍德·香农(ClaudeElwoodShannon)1916年4月30日—2001年2月24日信息熵如何衡量信息的大小?距离的单位是米,时间的单位是秒。同样,信息的单位是信息量。人们对am有一个直观的感受日常生活中的信息量:比如“太阳从东边升起,西边落下”,这句话不包含任何信息,因为它肯定会发生,这句话不能消除任何不确定性;“A区发生8.0级地震”,这句话包含了很多信息,因为它发生的概率很小,这句话消除了很多不确定性。因此,特定事件的信息量应随其发生概率的增加而减少,随其不确定性的增加而增加,不能为负。当发生概率较低的事件时,人们接收到的信息量较大;当发生概率较高的事件时,人们接收到的信息量较小。如果把信息看作是在消除随机事件的不确定性的过程中引入的变化,那么信息量的大小与随机事件发生概率的对数有关,函数F表示观察具体发生所带来的信息随机事件x的数量,具体计算公式为,p为随机事件x发生的概率,若对数为2,则信息量的单位为bit。例如,如果抛硬币,随机事件“正面朝上”的概率为50%,那么当人们观察到“正面朝上”发生时,随机事件“正面朝上”的不确定性被消除,数量此时收到的信息是1比特。接下来,我们以抛硬币为例。这个过程实际上包括了“headsup”和“tailup”两个随机事件,这两个随机事件发生的概率是50%。这时,如果把“抛硬币”的过程看成一个随机系统,这个随机系统的信息量是多少?随机事件相当于从随机系统的输出中观察到某个值。衡量随机系统的整体信息量,可以用系统中所有随机事件发生时信息的数学期望来表示随机系统的整体信息量,即信息熵,越高一个随机系统的信息熵越大,信息量越大。具体计算公式为,p为事件x的发生概率。回到上面的例子,“抛一次硬币”这个随机系统的信息总量就是“正面朝上”和“反面朝上”这两个随机事件的信息熵。若加入条件a,硬币质量均匀,“正面朝上”和“反面朝上”两个随机事件发生的概率均为50%,则该随机系统的信息熵可计算为1;如果加上条件b,硬币质量参差不齐,“正面朝上”的概率为20%,“反面朝上”的概率为80%。可以计算出这个随机系统的信息熵小于1,可以得出“抛质量不均匀的硬币”的信息量小于“抛质量均匀的硬币”的信息量”。理论反映在现实中,用信息熵来监测终端应用的数字化体验既然可以计算“抛硬币”随机系统的信息量,那么手机屏幕的“图片呈现”是否可以算是像素渲染?随机系统,使其能够衡量终端应用运行时“呈现在屏幕上”的信息量,进而评估终端应用的每一帧给最终用户带来的信息价值?答案显然是肯定的。博锐数据秉承“理论指导实践,实践验证理论”的科学态度,充分理解香农-信息熵理论原理,深入挖掘实际应用场景。在业界普遍薄弱的视觉体验指标方面,新一代主动移动应用数字体验监测平台BonreeAPP3.0,创造性地使用信息熵来衡量终端应用呈现的屏幕信息价值:信息量:获取终端应用运行时屏幕每一帧像素出现的概率,采用香农信息熵算法计算每一帧的信息量。基于“熵值越高,信息量越大”的特性,信息量的取值范围为0-100,从低到高。借助BonreeAPP3.0基于结构化问题洞察的数据分析算法,信息量不仅是一个视觉体验指标,用于衡量应用运行时每一帧应用能为终端用户带来多少信息价值,但同样如果出现接近白屏、黑屏等低信息屏的问题,且持续时间超过1秒,则该屏所在的时区会被判断为视觉体验有问题——页面内容为不足,会转化为相应的可优化延迟,直接量化修复问题的收益。例如,如果一个应用运行黑屏2.62秒,则说明界面信息量为0的时间为2.62秒,触发页面内容不足的判断和优化延迟的计算。如果修复这个问题,至少会减少终端用户在使用app时停留在白屏的时间1.62秒,将大大提升用户体验水平。白屏、黑屏、蓝屏等纯色画面时,信息量为0,画面中的手机画面内容丰富。此时信息量为82页面内容不足:界面上用户可见的内容太少,时长已经超过1秒,出现这个问题说明有一个白屏、黑屏等,导致用户无法看到有效内容。受此问题影响的时区中的任何指标异常都可能导致此问题。可优化延迟:由应用程序执行脚本时的所有优化问题(即“慢”问题)转化而来,用于衡量“慢”问题修复后可为终端用户减少的服务等待时间。优化问题包括卡顿、页面内容不足等体验问题,以及DNS慢、请求响应慢等根本原因问题。不同信息量的应用画面对比如下:A.某财经APP信息量为7时的画面,可以看到除了下面的logo和名称外,基本是白屏。B、某财经APP信息量为72时的画面,页面内容较多,可以为用户提供丰富的信息。信息熵在数字体验监测领域的应用价值博瑞数据将信息熵应用于视觉体验评价的探索与实践,不仅契合了“看似主观的用户体验,还是由事物的客观表现决定”的理念”,也成功解决了整个行业长期以来面临的一个难题——在终端应用的数字化体验评估中,主要使用性能和稳定性数据,而间接或主观数据多用于视觉体验评估。无法使用客观数据直接衡量应用程序的视觉体验水平。BoreeData新一代主动移动应用数字体验监测平台BonreeAPP3.0,依托强大的图像采集和数据处理技术,独家将信息熵应用于全国终端应用数字体验监测。以画面信息量作为评价视觉体验的关键指标,结合自主研发的自动化测试框架、强大可靠的RPA技术、业界领先的数据采集能力和遍布全球的真实移动设备云世界,无需为目标应用嵌入SDKProbe,如点击、滑动等远程操作,可快速捕捉视觉体验、交互体验、网络请求、应用状态等数字化体验水平和应用性能瓶颈以真实用户的视角,在移动应用运行过程中,帮助企业提前感知终端应用的数字化体验,对比分析竞品优劣势,对应用性能故障进行预警,快速重现定位问题的根本原因,并建立一个可观察的和可衡量的数字体验管理系统。