当前位置: 首页 > 数码发展

联发科天玑9300全球首发评测:大芯威猛如虎! GPU-AI双惊喜

时间:2024-02-24 10:21:55 数码发展

1.开启全大核新时代:性能好、能效高每年年底,旗舰移动平台都会百花齐放、百花齐放,而今年将会更加令人兴奋。

前方,三星Exynos 2400和高通骁龙8 Gen3竞相登场。

现在,联发科的天玑9300压轴登场,带来了颠覆性的改变——“全核”。

众所周知,自从Arm提出big.LITTLE大小核设计理念以来,近年来的手机处理器,尤其是旗舰机型,一直秉承着这一理念。

即使加入了所谓的超大核心,也只是一个延伸。

本质上,没有任何变化。

大小核的初衷是分工合作。

大核心负责繁重的任务,小核心提高能源效率。

这种设计在过去几年中表现得相当完美,尤其是随着工艺技术的不断改进,它可以兼顾性能和能源效率。

但一方面,手机应用场景和工作负载不断变化,对处理器性能的需求也不是一成不变的。

大大小小的核心系统逐渐无法适应时代的演变,尤其是小核心往往无法满足其需求。

另一方面,工艺技术的改进难度越来越大,但改进效果却越来越不明显。

另外,Arm在小核架构上一直处于衰落状态,提升幅度很小。

这导致了本应节省电力的小核心。

它变得不那么省电,有时甚至成为一种拖累。

事实上,在天玑9000系列诞生之前,联发科就在深入思考未来,尤其是如何解决随着性能提升而功耗增加的问题。

花了三年多的时间。

这就是今天的天玑9300的由来。

天玑9300脱离传统架构设计思维,采用全核架构,包括4个最高频率3.25GHz的Cortex-X4大核,以及4个最高频率2.0GHz的Cortex-A720大核。

这种设计的好处是多方面的:首先,并行计算能力得到了极大的提升。

与上一代天玑9200相比,峰值性能提升高达40%。

无论是执行单个繁重任务还是多个并行任务,效率都能得到大幅提升,同时功耗降低33%,同时兼顾电池寿命。

你可能不明白,它们都是大核心,耗电量更大,那为什么它们实际上更省电呢?其实很简单。

例如,执行相同的任务时,大核单位时间的功耗比小核多50%,但只需1/3的时间即可完成。

总体而言,大核心消耗的电量更少。

自然,更节能。

二是充分应用乱序执行内核,提高应用程序执行效率,减少卡顿的发生。

传统的小核架构是顺序执行的,即面对多条指令时,必须按顺序执行。

即使突然有紧急任务,也必须等待当前指令执行完成。

这种设计的优点是省电,缺点是效率低。

乱序执行是高性能架构的标准特性,可以根据执行和加载优先级灵活并行多个执行。

第三个是多线程并行应用程序的启动。

全核架构下,系统会自动识别重要任务并确定优先级,减少等待时间。

同时,性能更强的核心越大,计算性能就越强,尤其是在资源拥堵的情况下更容易满足需求,即使正在执行其他任务也能快速启动新的应用程序。

以下是原神最高画质与微信视频通话同时运行的现场演示。

目测全帧游戏和通话体验:四是可以轻松双开高负载应用。

无论是超大核还是大核,都能满足高负载应用的需求,同时开启两个也不会出现资源短缺的情况。

例如,在以60帧极高画质播放《原神》的同时,还可以进行微信视频通话。

整个过程30分钟即可完成全画幅。

根据实际测量,与传统大小核架构相比,平均帧率提升15.5%,平均功耗15.5%。

下降12.3%。

当然,你也可以同时玩游戏和直播,没有任何延迟。

对于大屏手机和折叠屏手机来说,多应用并行使用和双开高负载应用尤为实用,可以充分利用屏幕空间。

那么,与传统的大小核架构相比,全大核架构是否需要系统和应用单独优化和部署呢?对此,联发科解释称,CPU具有良好的通用性,全核架构内部差异更小,所以基本不存在这样的问题,并且联发科内部一直在做不断的性能调优和优化。

对外做好与客户、生态系统的合作与优化。

此外,联发科还持续与谷歌合作,提供Android系统和AOSP项目上游源码的支持,减轻开发者负担,实现用户不敏感。

在联发科看来,随着应用环境的变化以及半导体技术难度的提高,全核架构将是未来的一大趋势。

我相信行业会朝这个方向发展,就连苹果也会这么做。

联发科正在勇敢地引领这一趋势。

趋势。

2、端侧AI再上新台阶:轻松处理330亿参数的大型模型。

天玑9300集成了业界首款搭载硬件生成AI引擎的全新第七代APU 790 AI处理器,并集成了性能核心和通用核心。

,全链路针对生成式AI进行优化,整数和浮点计算性能提升2倍,功耗降低45%。

天玑9300成功运行了330亿参数的大模型,遥遥领先于骁龙8 Gen3 100亿。

此外,还与vivo深度合作,实现了70亿参数大语言模型和130亿参数大语言模型的端到端实现。

侧跑。

天玑9300专注于解决端侧AI的三大痛点:内存限制、生成速度慢、大模型应用类型有限。

针对手机内存容量的限制,天玑9300支持内存硬件压缩技术NeuroPilot Compression,结合大语言模型的INT4混合精度量化,大幅降低大模型的内存占用61%。

比如还支持330亿个参数的大模型,原本至少需要13GB内存,所以对于16GB内存的手机来说是完全不够的。

在联发科的指导下,只要5GB就够了。

另外,Android系统本身占用4GB,APP应用需要6GB才能存活。

甚至还有 1GB 的可用空间。

针对生成速度问题,天玑9300深度适配Transformer模型,优化Softmax+LayerNorm算子,处理速度提升高达8倍。

此外,天玑9300支持业界最快的LPDDR5T 9600Mbps内存,可提供77GB/s带宽,保证AI计算无瓶颈。

正是这些设计,使得天玑9300 70亿参数大模型生成速度可以达到每秒20个Token,Stable Diffusion 1.5 Vincent图速度可以在1秒以内。

针对设备端大模型数量受限的问题,天玑9300拥有业界领先的LoRA(低秩自适应)融合,并首次搭载生成式AI设备端“技能扩展” ” 技术 NeuroPilot Fusioin,它提供了更基础的大型模型。

全面的客户端能力,实现多样化的本地内容生成。

上面提到的很多技术和优化都是联发科NeuroPilot AI开发平台的一部分,可以为开发者提供端侧生成式AI落地的一站式资源,以及很多案例分享。

目前,联发科端侧生成式AI拥有超过20家合作伙伴,包括Google、Meta、百度、百川、抖音、快手、虎牙、爱奇艺、美图秀秀等。

3、GPU等技术:光追已达到了一个新的水平。

除了全核CPU和高性能AI之外,227亿晶体管堆叠的天玑9300在其他方面也都充满诚意,处于行业领先水平。

我们简单回顾一下:天玑9300集成了新一代旗舰GPU Immortalis-G720,拥有12核。

与上一代11核Immortalis-G715相比,峰值性能提升了46%,相当于前两代的进步。

同等性能下,功耗相同。

降低 40%。

天玑9300在上一代引入硬件光线追踪和可变刷新率的基础上,搭载了第二代硬件光线追踪引擎。

光线追踪游戏可以稳定运行到60FPS,还有游戏机级别的全局光照技术。

此外,联发科独有的MAGT游戏自适应控制技术已升级为Star Speed Engine,让双方可以在硬件状态和游戏需求之间“奔跑”并相互了解。

不仅会与游戏广泛合作,还会拓展到更多类型。

应用。

目前已有超过50款游戏加入天机追光生态,涵盖Unreal、Unity、Messiah三大引擎,涵盖八种不同类型。

Imagiq 990旗舰ISP集成AI语义分割视频引擎,支持16层图像语义分割,实时逐帧优化画面色彩、纹理、噪点、亮度等,升级景深、光斑双引擎,集成OIS光学防抖专用核心,支持全像素对焦+2倍无损变焦。

MiraVisioin 990显示单元支持180Hz WQHD和120Hz 4K显示输出。

集成旗舰智能电视级AI景深画质引擎。

结合APU AI性能,可以实时监控主要物体和背景图像,并动态调整主要物体的对比度、清晰度和颜色。

,增强立体感。

音频降噪支持3个麦克风,具有全向高动态声音采集能力和噪音分离技术。

无线连接支持Wi-Fi 7,理论峰值速度为6.5Gbps。

它搭载独家Wi-Fi 7增强技术MediaTek Xtra Range 2.0,室内覆盖范围可达4.5米。

它还拥有多达3根蓝牙天线和双通道蓝牙闪存连接技术。

5G基带支持Sub-6GHz四载波聚合和多制式双卡双通。

UltraSave 3.0技术可大幅降低5G通信功耗,5G/AI融合可支持态势感知功能。

4、基准:要在各方面击败竞品,无论硬件设计有多好,有多少技术特点,都取决于性能。

虽然跑分并不能代表一切,但任何时候跑分都是产品品质最基本、最直接的体现。

此次,我们提前拿到了联发科提供的天玑9300工程样机,并进行了多轮基准测试。

下面的对比结果来自小米14系列推出的骁龙8 Gen3,均取得了最好的成绩。

工程样机非常方正厚重,比普通手机大了好几倍,主要是因为外面有辅助结构包裹,方便测试和调试,也有利于增强散热。

Gen3领先10000多分。

事实上,体能好的机器甚至可以达到215万点以上。

仔细观察子项目,可以看到CPU和GPU明显领先于竞争对手,而内存和UX则略低,但毕竟是工程原型。

GeekBench 6.2单核成绩为2209,多核成绩为7587,体能好的机器多核成绩可以达到7700以上,与骁龙8 Gen3相比,单核性能领先约1%,基本持平,而多核性能领先6%以上,且所有大核表现都不错。

GPU性能方面,天玑9300全面爆发,T-Rex达到887FPS,Manhattan 3.0和3.1分别达到497FPS和337FPS,Aztec Ruins OpenGL和Vulkan在2K分辨率/高抛分别达到94FPS和99FPS。

与骁龙8 Gen3相比,上述各项分别领先约72%、39%、31%、29%和29%。

Tyrannosaurus 项目有点老了,这里将被忽略。

还可以看到,天玑9300 GPU的优势达到了惊人的20-40%。

考虑到移动GPU已经加入了第二代光线追踪,我们特意测试了最新的Basemark GPUScore In-Vitro。

其光线追踪渲染场景占比约为25-30%,远高于另一款光线追踪测试工具3DMark Solar Bay的10-15%比例,更能体现高负载光线追踪游戏的实际表现。

根据实际测试,天玑9300得分为4714分,领先骁龙8 Gen3约28%。

这与GFXBench测试结果基本一致,证明发哥这次在GPU上确实强大。

一直被调侃“买GPU免费送CPU”的高通要承受很大的压力了。

我们来看看实际的游戏表现。

首先,必不可少的《原神》,60帧模式,极高的画质,在虚拟城市中运行15分钟,实际渲染分辨率为1800×810。

结果平均帧率达到了59.7FPS,曲线非常稳定,平均功耗为4.63W。

然后是《崩坏:星穹铁道》,60帧模式,最高画质,在星辰大海中运行15分钟,实际渲染分辨率为1680×756。

结果平均帧率达到了58.8FPS(在物理条件好的机器上可以超过59FPS),也相当稳定,而平均功耗为5.13W。

当然,AI也是当今手机SoC性能不可或缺的一部分。

但由于每个公司的架构设计不同,缺乏行业标准的测试工具,所以并不容易横向比较。

在AI Benchmark(工程机终端评分)中获得3145分。

该项目创下了新纪录。

天玑9300已经成为目前AI性能第一。

在AI Benchmark官网,天玑9300荣获AI算力(芯片)第一名。

当然,人工智能也依赖于生成性应用。

文圣图的实际体验可以在不到1秒的时间内完成,文圣文也能快速输出相当高质量的诗歌。

总的来说,天玑9300作为联发科新一代顶级旗舰,带来了更新的全核CPU设计、全链路优化的AI、强大的GPU、全面均衡的平台技术和体验,再次让“发哥”站稳了脚跟。

巅峰之作,正式吹响新一代旗舰移动平台终极之战的号角。

从首跑测试成绩来看,天玑9300的整体性能和CPU性能略胜骁龙8 Gen3。

GPU 性能要优越得多。

实际游戏体验相当稳定。

生成式AI也能快速得到想要的结果。

总的来说,它甚至超出了我们的预期。

11月13日,vivo X100将首次与天玑9300一起发布。

现在就看手机终端的性能了!相信随着vivo X100系列的全球首发以及天玑9300的更多应用,高端市场将再次迎来新的浪潮,带动整个行业向前发展。