中国电子技术网

设为首页 网站地图 加入收藏

 
 

RISC-V 张量单元声称可增强人工智能应用

关键词:RISC-V 人工智能

时间:2023-10-26 10:35:38      来源:网络

新型 RISC-V 张量单元基于完全可定制的 64 位内核,声称与仅在标量处理器上运行软件相比,可以为人工智能 (AI) 应用程序提供巨大的性能提升。张量单元通过硬件设计提供人工智能应用所需的矩阵乘法,在保持低能耗的同时提供强大的计算性能。

新型 RISC-V 张量单元基于完全可定制的 64 位内核,声称与仅在标量处理器上运行软件相比,可以为人工智能 (AI) 应用程序提供巨大的性能提升。张量单元通过硬件设计提供人工智能应用所需的矩阵乘法,在保持低能耗的同时提供强大的计算性能。

机器学习模型(例如 LLaMa-2 或 ChatGPT)包含数十亿个参数,需要每秒数万亿次操作的大量计算能力。这是因为大型语言模型 (LLM) 中的大部分计算都是构建为完全连接的层,可以通过矩阵乘法有效地实现。

Semidynamics 推出的张量单元提供了专门为矩阵乘法工作负载量身定制的硬件。它通过利用矢量单元功能以及该公司的 Gazzillion 技术从内存中快速获取所需的数据来实现这一点。矢量单元通过 Gazzillion 技术不断馈送数据,确保没有数据丢失。

向量单元包含多个向量(大致相当于 GPU ),它们并行执行多个计算。每个矢量都具有能够执行加法、减法、融合乘加、除法、平方根和逻辑运算的运算单元。

 
图 1 张量单元针对 64 位 RISC-V 内核进行了优化。资料半动力学

张量单元构建在公司的矢量处理单元之上,利用现有的矢量寄存器来存储矩阵(见图1)。因此,它可用于需要矩阵乘法功能的层。此外,Tensor Unit 可以将 Vector Unit 用于激活函数层,这相对于通常难以处理激活层的独立 NPU 来说是一个显着的改进。

Semidynamics 创始人兼执行官 Roger Espasa 表示,虽然其他解决方案依靠难以编程的直接内存访问 (DMA) 来解决这个问题,但他公司的解决方案将 Tensor Unit 无缝集成到其缓存一致性子系统中,开辟了一个新的解决方案。人工智能软件编程简单的时代。

此外,张量单元使用向量寄存器来存储其数据,并且不包含新的、架构上可见的状态。因此,它可以在任何支持 RISC-V 矢量的 Linux 下无缝工作,无需任何更改。


图 2这是包含 Atrevido-423 RISC-V 内核、Gazzillion 单元、向量单元和张量单元的整体整体。资料半动力学

  • 分享到:

 

猜你喜欢

  • 主 题:自主移动机器人(AMR)平台方案介绍
  • 时 间:2024.11.19
  • 公 司:安森美

  • 主 题:PIC®和AVR®单片机如何在常见应用中尽展所长
  • 时 间:2024.11.26
  • 公 司:DigiKey & Microchip

  • 主 题:盛思锐新型传感器发布:引领环境监测新纪元
  • 时 间:2024.12.12
  • 公 司:sensirion