行业动态

龙8国际官网娱乐热点丨加速边缘生成式AI落地Arm全新NPU性能提

2024-05-19 04:26:17 来源:龙8国际官网注册 作者:龙8国际官网唯一入口

  在此过程中,边缘应用,特别是工业机器视觉、可穿戴设备以及消费者机器人等领域,已逐渐成为其落地实践的核心场景。

  随着Transformer与大模型技术的持续进步,AI模型的通用性、多模态兼容性和模型微调效率均取得了显著的提升。

  在视觉和生成式AI应用场景中,如视频解析、图文融合、图像增强与生成、图像分类和目标检测等,Transformer架构展现了巨大的价值。

  由于其注意力机制易于利用并行计算,显著提高了硬件利用效率,使得这些模型能够部署在资源受限的边缘设备上。

  ①设计边缘AI芯片和系统时,需在计算能力与能效之间寻求恰当的平衡,以确保高效性能的同时,满足功耗和成本限制。

  ③随着越来越多的数据在边缘进行处理,数据安全和隐私保护变得尤为关键。因此,边缘AI芯片设计必须包含加密和安全功能,以确保数据的完整性和安全性。

  ④鉴于边缘AI应用的多样性,为统一多样化的应用需求并实现规模化效益,软件定义和易于软件移植的标准显得尤为重要。

  随着人工智能技术的不断发展,对高性能计算领域的需求持续上升。作为一种专为深度学习和人工智能应用设计的硬件加速器,NPU的出现标志着AI硬件架构的重大进步。

  NPU加速器的崛起,源于人工智能和深度学习算法在各行业的广泛应用,以及对高性能计算需求的持续增长。

  通过链化技术,Ethos-U85将元素级运算与先前的运算相结合,从而减少了SRAM在写入和读取中间张量时的需求。

  具体而言,它实现了四倍的性能提升和20%的能效提升,同时保持了一致的工具链,为开发者提供了无缝的体验。

  该产品支持从128到2048个MAC单元的配置,并在最高性能配置下提供4TOPs的AI算力。这使得其能够应对各种复杂的AI任务。

  它不仅支持低功耗MCU系统中的AI加速,还可在高性能边缘计算系统中与应用处理器、标准操作系统和高级开发语言无缝集成。

  除了提供卷积神经网络(CNN)所需的权重矩阵乘运算外,它还能支持矩阵相乘,这是Transformer架构网络的基本组成部分。

  Arm公司同步推出了全新的物联网参考设计平台——Corstone-320,该平台致力于推动语音、音频和视觉系统的高效部署。

  为广泛的边缘AI应用提供了卓越的性能支持,如实时图像分类、目标识别以及在智能音箱上实现具备自然语言翻译功能的语音助手等。

  此外,Corstone-320物联网参考设计平台还提供了全面的软件、工具和支持,包括Arm虚拟硬件。

  其软硬件一体化的设计使得开发者在物理芯片准备就绪之前即可启动软件开发工作,从而大大加快了产品上市速度,缩短了日益复杂的边缘AI设备的上市时间。

  借助Corstone-320预先集成、预先验证的参考设计模板,Arm能够助力合作伙伴有效降低边缘智能芯片的开发成本,缩短开发周期。

  Arm中国的工程师正致力于将其NPU驱动程序集成至加速器子系统中,这一举措显示出他们正努力将其技术融入更广泛的行业生态中。

  此外,安谋科技推出的[周易]X2 NPU在性能上有了显著的提升,并且支持软件开源,这意味着它能够更加高效地利用CPU、GPU、NPU等多种计算资源。

  与此同时,海光信息作为国内CPU和DCU领域的领军企业,在信创产业和AI市场的共同推动下实现了迅猛的发展。

  Arm中国研发的NPU加速器,通过提供高性能、低功耗的专用硬件加速,以及丰富的调试工具和多种层次的开发与调试支持;

  这一成果不仅有助于推动国产CPU技术的进步,更能够提升国产CPU在AI领域的竞争力,为实现国产CPU的自主可控和发展提供有力支持。

  大小模型在云、边、端的协同结合,将成为未来AI产品的重要发展方向,为AI应用在各行业的赋能提供有力支持。

  部分资料参考:51CTO:《Arm马健:以新一代 Ethos-U AI加速器及全新物联网参考设计平台》,电子产品世界:《Arm推出新一代Ethos-U AI加速器及全新物联网参考设计平台》,雷锋网:《Arm全新NPU性能提升4倍,支持Transformer,边缘生成式AI时代指日可待》

  本公众号所刊发稿件及图片来源于网络,仅用于交流使用,如有侵权请联系回复,我们收到信息后会在24小时内处理。


龙8国际官网娱乐
上一篇:苹果M4自研芯片将增强AI功能 京东方Q1净利同比 下一篇:54位大咖演讲精华!中国生成式AI大会收官TOP5