当前位置: 首页 > 网络应用技术

Jizhi ai |NVIDIA JETSON DLA硬件系统体系结构

时间:2023-03-07 18:26:41 网络应用技术

   

   大家好,我是一个非常明智的愿景。本文介绍了NVIDIA JETSON DLA硬件系统体系结构。

   NV具有广泛的硬件应用程序,不限于3D图形渲染,AI计算等,而Jetson系列是NV Edge Computing领域的主要力量。在设备上有DLA模块,例如JetsonAgx Xavier,Jetson NX。DLA深学习加速器的全名是专门用于卷积神经网络的模块。处理能力。因此,在这些设备中,您可以选择的算法加速方法是GPU加速和DLA加速度。在这里,我们将谈论NVDLA。

  DLA的系统体系结构分为小型NVDLA系统和大型NVDLA系统,如下所示,小型NVDLA系统主要用于成本敏感的IoT设备方案,当它更强大,更高时,大型NVDLA系统将会更好选择。您可以看到两者之间的最大区别是SRAM和微控制器。大型NVDLA的访问界面是SRAM和DRAM。其中,SRAM界面是独立存在的,可以进一步增强DLA的计算能力,并与电影中的许多处理器共享带宽。目前,这种独立的SRAM可以有效地降低系统带宽压力并提高处理效率。

   更薄的,加速卷积神经网络,NVDLA可以改进到以下模块中:

   DLA内核的清晰硬件架构几乎是这样的:

  在:

   支持偏见添加,非线性函数,例如Sigmoid函数,relu,双曲线切线,BN,Elementwise等。有几个功能块,每个功能块都有不同的用途:

   PDP支持最大和最小池化方法。平面中的几个相邻输入元素将发送到非线性函数以计算输出元素。

   通道处理旨在解决局部响应(LRN)层。本地响应变态通过通过通道方向对局部输入区域的归一化进行水平抑制。返回函数如下:如下:

   可以通过编程相应的寄存器绕过上述两个方程式,以便可以将CDP视为独立搜索表(LUT)。

   Rubik模块与BDMA相似。它不用任何数据计算即可翻译数据映射格式:

   为了在电影上使用SRAM,NVDLA需要在DRAM和SRAM之间移动数据,并且BDMA可以用于实现此目标。有两种类型的移动路径,一种是将数据从外部DRAM复制到内部。SRAM,另一个是将数据从内部SRAM复制到外部DRAM。当然,这两个方向不能同时工作。

   BDMA还可以将数据从外部DRAM移动到外部DRAM,或者从内部SRAM转移到内部SRAM。为了将所有数据移动到立方体中,BDMA支持重复的行并可以在多行之间跳跃。

   好的,以上共享了NV Jetson DLA硬件系统体系结构,我希望我的共享可以帮助您学习一点。

   [公共帐户传输]

  “ jizhi ai | nvidia jetson dla硬件系统体系结构”

  原来的;https://juejin.cn/post/7101289585488953381