当前位置: 首页 > 科技观察

OpenHarmony啃论文俱乐部——这些小风景你不应该错过_0

时间:2023-03-12 05:20:27 科技观察

OpenHarmony吃纸俱乐部——这些小风景你不能错过51cto.com【本期看点】PNG的一个意想不到的工作方式。详细解释第十八代MPEG的隐藏关系。AV1|H.266的王位之争,谁才是最终的赢家。还不如走一条从来没有想过的医疗道路。细胞神经网络也可以很疯狂!知道了!原来这是人类视觉系统(HVS)。【技术DNA】【智能场景】图像压缩历史图像压缩研究起源于1940年代。1948年,香农的经典论文《通信的数学原理》首次提到了信息率失真函数的概念。1959年,他建立了率失真理论,从而为信源编码奠定了理论基础。随后,Berger等人对其进行了深入研究,并取得了一些进展。一些研究人员逐渐开始研究声音、文本和图像信号的压缩技术。20世纪80年代中后期,相关学科的快速发展和新兴学科的不断涌现,为图像压缩编码注入了新的活力。人们对图像信息需求的急剧增加也有利地推动了图像压缩技术的进步。许多学者基于模式识别、计算机图形学、计算机视觉、神经网络、小波分析和解析几何等理论,开始探索和研究新的图像压缩技术。理论和新方法。背景技术在当今通信高度发达的时代,图像压缩已经成为一个要求很高的领域。短视频、音视频通话、直播等等,相信这些都是大家每天都能看到,离不开的东西。多媒体数据,无论是图形、音频还是视频数据,在解压缩时都需要相当大的传输带宽和存储容量;并且对图像、视频序列和计算机动画的需求正在以非常高的速度增长,因此有必要研究和分析图像压缩压缩图像和所有多媒体应用程序以节省存储和传输时间的最新技术。如何压缩以减少冗余和无关性一直是压缩领域中两个重要和基础的部分,图像压缩也不例外。其次,图像压缩最终是为了人类。将图像压缩到最佳水平非常重要。就像很多人总想买个高刷新屏来玩游戏,但其实很多不玩游戏的人往往看不出使用高刷新屏有什么区别,这和我们人的视觉有关系统。人类视觉系统(HVS)人类视觉系统是世界上最好的图像处理系统,但它远非完美。人眼的视觉系统对图像的感知是不均匀、非线性的,无法感知图像的任何变化。例如,图像系数的量化误差引起的图像变化,在一定范围内是人眼无法感知的。因此,如果编码方案能够利用人类视觉系统的一些特性,就可以获得较高的压缩比。对人眼视觉特性的深入研究以及由此建立的各种数学模型一直是各种图像数字压缩算法的基础。例如分辨率:当空间平面上的两个黑点相互靠近到一定程度时,距离黑点一定距离的观察者是无法分辨的,这意味着人眼分辨空间的能力场景的细节是有限的,极限值就是分辨率。研究表明,人眼的分辨力具有以下特点:当光线强度过强、过弱或背景亮度过强时,人眼的分辨力都会降低。当视觉对象移动得更快时,人眼的分辨率就会降低。人眼对颜色细节的分辨力比对亮度细节的分辨力差。如果黑白分辨率为1,那么黑红为0.4,绿蓝为0.19。长期以来,人们通过对人类视觉现象的观察和研究,发现人眼的视觉特性具有很多特点,尤其是视觉遮蔽效应,可以直接或间接地提高对视频信息的处理能力。如何充分利用人眼的视觉特性,成为现代编码技术首先要考虑的一个基本问题。医学影像的压缩随着现代医疗的不断进步和经济实力的增强,越来越多的医学影像设备投入临床应用,数字化医学影像在医学临床诊断中发挥着越来越重要的作用。医学图像压缩技术的研究尤为迫切。DICOMDICOM(医学数字成像和通信)是医学图像和相关信息的国际标准。它定义了一种医学图像格式,可用于满足临床需求的质量数据交换。从商业的角度来看,DICOM数据压缩和图像质量是可以极大地影响医疗机构成像效率的两个因素。DICOM数据压缩有助于有效管理医疗机构中的医学成像工作流程,并且是设计企业成像工作流程时要考虑的关键因素。由于数据压缩和传输速度造成的延迟而导致的累积时间损失量直接影响产生的收入水平。传输速度的提高会带来更高的生产率,从而转化为更多的收入。但就个人生命安全而言,DICOM的数据压缩和图像质量关系到很多人的生命安全。例如,假设带宽约为12Mbps,则发送1542张图像CT研究需要5分钟,平均为930.17MB。未压缩的研究路由需要10分钟,而JPEG无损压缩需要6分钟,假设压缩是在从模态接收图像时以最小的开销完成的,这会导致一点延迟(6分钟对5分钟)。在急诊室环境中,缩短4分钟的周转时间可能至关重要,甚至可以挽救生命。视频压缩视频编码方法是指将原始视频格式文件通过压缩技术转换成另一种视频格式文件的方法。视频流传输中最重要的编解码器标准包括ITU的H.261、H.263和H.264。自1967年作为第一个数字编码标准引入H.120以来,数字视频编码已经取得了长足的进步。MPEG2于1994年推出,MPEG4于1999年推出,H.264于2003年推出。接下来,本文将列举MPEG2、MPEG4和H.264的特点,并说明它们的区别。MPEG2MPEG2是一种用于压缩数字广播视频和DVD的编解码器。使用MPEG-2编解码器编码的媒体文件通常具有文件扩展名.mpg、.mpeg、.m2v、.mp2,或者在某些情况下为.mp3。它也称为H.262,目前仍在数字电视广播和DVD视频标准中使用。创建于1994年以修复其前身MPEG1的缺点,MPEG2需要与现有硬件和软件相互兼容。它最初由索尼、汤姆逊和三菱电机开发,后来成为DVD和标清数字电视的标准视频格式。MPEG4MPEG4标准是1995年发起的MPEG4格式。最初是专门为非常低的比特率而创建的,现在它可以支持高达4Mbps。MPEG4由六部分组成:视觉、软件、系统、交付的多媒体集成框架(DMIF)、一致性测试和音频。该视频编码标准旨在用于广播、对话和交互环境。它还旨在执行基于内容的可伸缩性。由于MPEG4的构建方式(使用MPEG1、MPEG2和VRML的特性),它既可以用于网络环境也可以用于电视,并且来自两个频道的内容可以集成到相同的多媒体环境中。H.264H.264视频编码格式,也称为H.264/MPEG-4AVC(高级视频编码),是迄今为止使用最广泛的视频内容录制、压缩和分发格式。如果您使用过Netflix和YouTube等互联网流媒体资源,以及Adob??eFlashPlayer等网络软件,您就会知道H.264的功能。地面、有线和卫星上的各种HDTV广播也使用H.264视频编码格式。它由ITU-T视频编码专家组(VCEG)和ISO/IECJTC1运动图像专家组(MPEG)标准化。第一个版本于2003年完成。H.264视频格式旨在以比以前的视频编码格式更低的比特率提供良好的视频质量,并且在这样做时不会增加设计复杂性或实施成本过高。它还具有灵活性,因此可以应用于各种网络和系统。其他关键技术细胞神经网络的图像压缩技术各种细胞神经N/w通用机器(CNNUM)算法提出了对静止和运动图像的极快压缩。其核心思想是将图像划分为空间子带,只存储下一个子带的重建图像和去除空间冗余的原始图像。该算法在无损压缩方面表现更好,在压缩比和速度方面优于JPEG标准。优点:压缩效率快应用:射线照相、图像存储和多媒体应用S-treeshadowmethod1998年后,一种新的灰度图像压缩方法被提出,图像的比特率和质量表明STC方法比BTCC方法更可靠方法。该方法的执行周期不到BTCC的一半。优点:在每个块中考虑了噪声并增加了执行时间图像的质量也保持在令人满意的方式,并且所提出的阴影树方法可以获得非常高的速度改进。应用:实时通信和图像检索。适用于双层图像压缩算法的无损压缩主要集中在块编码算法上。对于二进制源符号概率P0和p1算法,它解析其编码间隔。在BAC的基础上,采用了跨两个阶段的模板移动方法。为了索引概率表模板,我们构建了一个12位上下文表。优点:适应每一点图像信息。基于模糊算法的压缩模糊向量量化算法:在满足向量量化问题的同时,提出了一种有效利用模糊聚类优点的算法。优点:快速简单,概念上有吸引力基于模糊算法的图像压缩:系统性能取决于基于小波的子带和矢量量化分解。优点:计算要求低,画质更好更多信息请访问:51CTO与华为官方共建的鸿蒙技术社区https://ost.51cto.com