NVIDIA Jetson 边缘智能计算平台之软件篇

1. JETSON 软件介绍

最核心的就是JetPack ADK,它可以使硬件之间的差异性隔离,方便我们的用户针对不同的应用场景来选择不同的算法,实现各种的功能。

下图为JETSON Xavier NX两种硬件的规格:

我们可以通过软件在里面控制它的CPU的主频和GPU的主频,把它调整为两个不同的模式,比如对功耗较为敏感的,可以选择功耗较低的10W的规格,其算力为14 TOPs。解码能力总共有32路1080P的解码,编码最高支持到14路,并且编码与解码实现硬件隔离。并且IO种类丰富,方便在其他机器人上做各种设计。

2. TensorRT

举例:

当算力最小的Jetson NANO使用了TensorRT之后,大大提高了性能;

下图与其他竞争对手的对比


可以看到,从NVIDIA的角度来说,通过TensorRT我们可以使我们的硬件达到在其他同类产品中很不错的性能,并且我们的硬件支持所有的网络和最新的算法,以方便于满足用户最新的需求。

3. DEEPSTREAM

 

可以帮助用户在异构计算的平台下快速的实现部署

JETSON平台上有CPU、GPU、DLA等,该软件就是针对于对我们平台不太熟悉的用户,可以利用DEEPSTREAM发布的一套SDK,给用户一个很好的起点,更好的了解如何在我们的平台完成一个视频分析的流程,方便后续开发自己整套的应用,会极大的缩短自己所耗费的时间。

应用案例

①用DEEPSTREAM在NANO上可以进行8路1080P实时的检测;

②用DEEPSTREAM在JETSON AGX XAVIER上进行40路实时的检测;

4. TLT (TRANSFER LEARNING TOOLKIT)迁移学习工具包

 

 

Ø 快速高效的深度学习培训工作流程

Ø 在训练前模型中利用先前的投资

Ø 优先输出并准备部署

Ø 可以做网络裁剪和网络的自适应等,另外还对嵌入式等相对于算力比较受限的场景也很有用

 

 

在JETSON TX2上采用TLT之后

① 推理速度提高了3倍;

② Memory占比下降了32倍,当时的网络模型由200多兆下降到了5兆左右;

③ 同时支持5路视频,30帧的分析;

④大于90%的精确度;