重点内容速览:
| RISC-V的关键优势 :开放指令集与可控微架构
| 数据中心对CPU的核心需求
| 高性能RISC-V CPU产品
这几年RISC-V在国内的关注度很高,参与的公司也很多,而且芯片销量也在快速增长。据Semico Research的统计,2023年全球基于RISC-V技术的芯片出货量超过100亿颗,预计2025年将会超过800亿颗。
这种增长不仅体现在数量上,还体现在应用的多样化和复杂性上。例如,RISC-V处理器能够直接将针对AI、ML和其他数据密集型任务的专用指令集成到处理器中,从而优化从深度学习到计算机视觉在内的各种计算密集型任务。我们也看到RISC-V处理器除了在AIoT领域的应用外,也开始在工业、汽车、以及数据中心应用中展现其潜力。
RISC-V的关键优势:开放指令集与可控微架构
RISC-V是一个基于精简指令集(RISC)原则设计的开放指令集,秉承简单有效的设计哲学,具备开放、简洁、模块化、可扩展的优势。RISC-V 指令集可以自由地用于任何目的,允许任何人或任何企业设计、制造、销售RISC-V芯片和软件。与x86和Arm等指令集相比,RISC-V具有三大关键优势:
一是开放。 对一个处理器来说,有两个非常关键的技术,一是指令集标准;二是微架构实现。其中指令集标准(ISA)是上层软件和底层芯片的界面与桥梁;微架构实现,则是处理器具体的流水线架构实现,包括超标量,乱序,多发射,动态调度等。
目前市场上流行的x86指令集是由英特尔主导的,属于封闭指令集与黑盒微架构的结合;Arm则是商业公司主导,属于封闭指令集与单一授权微架构的结合。虽然Arm的微架构可以开放给客户,但是授权费用昂贵,高性能的微架构一般都是千万美元起步,而且独此一家,如果它不售卖则无法获得。但RISC-V则不同,它凭借开放指令集标准,微架构竞争充分,国内外参与企业众多,可以从不同公司购买竞争力更强的微架构。
二是模块化,可定制。RISC-V的模块化设计允许开发者根据特定应用需求选择和扩展指令集,使处理器高度定制化,以适应不同的应用场景。RISC-V可定制向量计算、矩阵计算等AI计算指令集扩展,实现智算专用加速。
三是精简、高效。 RISC-V指令集去除了许多传统指令集种的复杂性和冗余,不仅降低了硬件实现的复杂度,还提高了执行效率。加上,其简洁,无历史包袱,定制AI芯片效率高,有助于更快速算法执行与数据处理。
近几年来,RISC-V硬件性能提升显著,数据中心应用已经起步。RISC-V硬件已经覆盖大部分场景,并向高性能场景演进。高性能领域国内外并跑,均启动服务器CPU研发。
知合计算CPU设计总监刘畅在今年RISC-V中国峰会上表示,RISC-V处理器产品性能正在对x86和Arm处理器产品穷追猛赶。有部分公司推出的RISC-V产品性能已经逼近x86和Arm主流规格。
比如,国外初创公司中,以SiFive(高性能标杆)、Ventenna(主打Chiplet)、Tenstorrent(RISC-V+AI)为代表的公司,在高性能、Chiplet、RISC-V DataFlow方向布局。
国内初创公司中,以知合计算(高性能+AI推理)、进迭时空(高性能+虚拟化)、赛昉科技(高性能+自研总线)等为代表,在高性能、AI推理、IOMMU虚拟化与自研Mesh总线方向展开。
加上阿里达摩院在RISC-V领域的全方位投入,市面上已经开始出现一些性能表现不错的RISC-V产品可以应用于数据中心了。
在加上RISC-V的短板正在快速补齐,生态加速进化,RISC-V在数据中心方面的应用土壤已经具备。
数据中心对CPU的核心需求
数据中心对CPU有哪些核心需求呢?据业内专家表示,数据中心对CPU的需求主要是高性能,虚拟化和CPU推理能力三个关键指标。
首先,高性能。数据中心要求CPU的单核性能指标是Spec 2006单核要超过15分/GHz。据公开资料显示,目前单核性能最高的是AMD的CPU,可达到23~25分/GHz;其次是Arm内核的CPU,可到到20分/GHz;RISC-V内核的CPU最高可达18分,国内也有厂商在冲击该分数。
业界希望国内有更多公司的产品能够突破该门槛分数,同时还能够实现多核互联。因为CPU芯片依赖先进工艺,单芯片总算力尤为重要,RISC-V片内互联总线(Mesh)需要早日突破。
还有国内目前先进工艺受限,因此,单芯片达到光罩极限后,Chiplet芯粒互联愈发重要,但计算Die和IO Die分工,需要产业协同。
二是虚拟化。其实虚拟化分为三大层面,首先是CPU的虚拟化,RISC-V已经推出RVH扩展,实现了内核虚拟化;其次是内存虚拟化,RISC-V也已经有MMU虚拟化,也已经支持了;第三个是针对外设的,即IOMMU,大部分人以为外设是低速的,但其实该虚拟化主要针对高速外设,特别是高性能网卡和高性能SD。目前RISC-V在这方面还有所欠缺,而IOMMU就是RISC-V外设虚拟化规范,类似英特尔VT-D和Arm SMMU,其作用与MMU类似,但方向相反,起到“地址转换,设备隔离,内存保护”等IO虚拟化作用。
IOMMU将填补虚拟化重要拼图,因为对于通算与存储服务器来说,IOMMU虚拟化是数据面安全、高效直通的必要条件。
三是CPU推理。CPU推理,图灵完备,具备大规模Scale Out横向扩展,高性价比,软件生态友好等综合优势;而RISC-V指令集与架构均可定制,在DataFlow数据流图、矩阵算力扩展等方面,具备独特竞争优势,可以卡位CPU推理。
高性能RISC-V CPU产品
目前,多家公司已经推出了面向数据中心应用的 RISC-V CPU。例如,SiFive 推出了 P870-D,这是一款对标 Arm N2 的高性能 RISC-V 数据中心 CPU 设计。Ventana Micro Systems 也推出了 Veyron V2,这是其首款面向数据中心的 RISC-V CPU,采用多核小芯片形式,并且支持标准 RISC-V 向量指令。这些处理器不仅在性能上与传统的 Arm 和 x86 架构竞争,还通过支持 RISC-V 生态系统(RISE)来提高硬件与软件的兼容性。
另外,赛昉科技推出的昉·天枢-90 和昉·天枢-80 CPU Core IP 也是面向数据中心应用的重要产品。昉·天枢-90 是一款高性能的商业级国产 RISC-V CPU Core IP,采用超标量、深度乱序执行设计,支持标准 RISC-V RV64GCBH 扩展,广泛应用于数据中心、高性能网络通讯和机器学习等领域。
RISC-V 数据中心 CPU 正在迅速发展,并逐渐成为数据中心领域的一个重要选择。这些处理器不仅在性能上具备竞争力,还通过开放标准和生态系统建设,为数据中心提供了更多的灵活性和扩展性。
据SiFive的产品新闻稿显示,SiFive P870-D 是一款专为数据中心设计的高性能处理器,支持高达256个核心的扩展,适用于需要并行处理的工作负载,如视频流、存储和Web服务器。其性能与 Arm Neoverse N2 相当,但规模仅为后者的3/4,表明其在能效和成本效益方面具有优势。
技术特性方面,P870-D 支持开放式 AMBA CHI 协议,允许灵活扩展集群数量,并且具备分布式和可扩展的 IOMMU,用于加速虚拟化设备的 I/O。它还支持 RISC-V Sv57 扩展,提供57位虚拟地址空间,增强内存管理能力。
此外,P870-D 集成了 RAS(可靠性、可用性和可维护性)功能,能够在问题出现前检测到错误并保护数据完整性,从而提高系统的整体可靠性。
更重要的是,SiFive 正在与 Arteris 等生态系统合作伙伴合作,以简化完整系统的开发。通过将 SiFive 基于 RISC-V 的处理器与 Arteris 的片上网络(NoC)IP 集成,客户可以加快开发速度并更快地将其产品推向市场。
Ventana Veyron V2 也是目前性能最高的 RISC-V 处理器之一,它采用小芯片方法,配备 IO 集线器和加速器,支持 UCIe 以实现每个插槽192个内核。尽管性能可能略逊于Zen 4c,但Veyron V2专注于UCIe和领域特定加速(DSA),提供现代计算平台。
技术参数方面,Veyron V2拥有32核心和128MB L3缓存,实现 AMBA CHI 特性,并通过 RAS 功能提高可靠性。架构设计支持安全启动、身份验证和Chiplet身份验证,通过UCIe连接到IO集线器,提供DDR和PCIe控制器接口。支持RISC-V ISA扩展(RISE),推动其在数据中心领域的成熟。
市场定位方面,Veyron V2可应用于数据中心、汽车、5G等应用。
除了这两款产品,国内公司的玄铁930和香山昆明湖的RISC-V IP性能也相当不错。
结语
RISC-V CPU在数据中心智算领域的应用才刚刚起步,前景看起来虽然不多,但也有不少明显的短板需要去克服。比如说高性能和虚拟化的短板,以及软件生态和高端微架构人才短缺且被众多公司稀释等问题。
但只要RISC-V公司能够抓住智算新机会,发挥指令集与架构级可定制优势,瞄准CPU推理等新兴领域,实现差异化竞争。在产业协同努力下,相信这些问题都会迎刃而解的。
全部评论