别再被误导了,RDMA不是什么"高端专属"的技术

如果你在网络行业待过一段时间,大概率听过这样的说法:"RDMA是超算和金融行业才用得起的东西,普通数据中心根本用不上。"这句话在五年前或许有一定道理。但放到今天,它已经成为网络基础设施领域较大的误解之一。随着云计算、分布式存储和人工智能训练任务的增长,RDMA早已走出了实验室,成为越来越多企业数据中心里的标配能力。

为什么大家会觉得RDMA"高高在上"

这个误解的形成并非没有原因。早期的RDMA确实很"贵",最初的RDMA主要依赖InfiniBand网络,需要专用交换机和配套设备,整套方案的价格让大多数企业望而却步,只有少数大型超算中心和对延迟非常敏感的交易系统才会使用。技术门槛确实存在,RDMA涉及内核旁路、零拷贝传输、硬件卸载等一系列底层概念,对于没有系统学习过高性能网络的管理员来说理解起来有一定难度,很多技术文章一上来就堆砌术语让人望而生畏。生态曾经是封闭的,早年间支持RDMA的硬件和软件生态较为有限,普通操作系统和应用程序很难直接利用这项技术,这进一步加深了"这东西跟我没关系"的印象。

RDMA到底是什么

抛开所有术语,RDMA的全称是"Remote Direct Memory Access",翻译成中文就是"远程直接内存访问"。打个比方,想象你在办公室里需要把一份文件从隔壁同事的桌上拿过来。传统的网络传输方式就像你打电话给同事,让同事把文件拍照发给你,你再打印出来——中间经过了很多步骤,每多一步就多一分延迟和开销。而RDMA相当于你直接走到同事桌前,自己动手把文件拿回来,全程不需要同事帮忙。用技术语言来说,RDMA允许一台服务器的网卡直接读写另一台服务器的内存,完全绕过双方的CPU和操作系统内核,这就是所谓的"内核旁路"和"零拷贝"。

RDMA带来的三大核心优势

超低延迟

传统网络通信需要经过多层协议栈处理,每次都要CPU介入,延迟通常在数十微秒级别。RDMA通过硬件直接处理数据传输,端到端延迟可以降到1微秒左右,提升幅度达到数十倍。

极低CPU占用

在传统的TCP/IP网络中,网络数据传输会大量消耗CPU资源。使用RDMA后,数据传输由网卡硬件直接完成,CPU可以被释放出来处理业务逻辑。对于数据库、分布式存储这类CPU敏感型应用来说,这个优势非常明显。

超高吞吐

RDMA天然支持高带宽场景。配合25G、100G甚至更高带宽的网络适配器,单链路吞吐可以轻松应对大规模数据迁移、AI模型训练等高吞吐需求。

RoCE让RDMA真正走进普通数据中心

如果说InfiniBand时代的RDMA还是"阳春白雪",那么RoCE(RDMA over Converged Ethernet)的出现则彻底改变了格局。RoCE技术的核心思路很简单——把RDMA的能力直接"搬到"标准以太网上运行。这意味着你不需要推倒现有的以太网基础设施,不需要购买专用交换机,只要在服务器端换上支持RDMA的智能网卡,就能享受到低延迟、低CPU占用的数据传输能力。目前主流的RoCEv2协议已经非常成熟,被广泛应用于云存储、虚拟化、容器网络和人工智能集群等场景,国内外主流云服务商已在内部大规模使用RoCE网络。

什么样的网卡能支持RDMA

要使用RDMA,你需要一块支持该功能的智能网卡。联瑞电子(LR-LINK)提供了多款支持RDMA/RoCE能力的网络适配器,覆盖从25G到100G的不同场景需求。

25G双口SFP28方案

推荐型号:LRES1021PF-2SFP28,PCIe x8双口25G SFP28以太网适配器,支持RoCEv2协议。适合虚拟化服务器和中等规模存储集群的接入,向下兼容10G速率,是现有10G网络向25G平滑升级的理想选择。双口设计可同时承载业务流量和存储流量,实现网络融合。

100G双口QSFP28高性能方案

推荐型号:LRES1014PF-2QSFP28,PCIe x16双口100G QSFP28以太网适配器,基于Intel E810主控,支持RoCEv2协议。单口速率可达100Gbps,支持多速率配置(10/25/50/100Gbps),适合高性能计算节点和AI训练服务器的高速互联。在大规模AI训练、分布式存储和高性能数据库场景中,100G RDMA可以显著降低数据传输延迟,释放CPU算力。

什么时候应该考虑RDMA

并非所有场景都需要RDMA。以下几个判断标准可以帮助你决定是否需要引入这项技术。你的应用对延迟敏感吗?如果你的业务涉及实时数据库、分布式锁等对网络延迟非常敏感的场景,RDMA带来的微秒级延迟优势非常有价值。你的网络是否成为瓶颈?当服务器CPU大量时间花在处理网络数据包而非执行业务逻辑时,RDMA的内核旁路机制可以有效释放CPU资源。你在做大规模数据搬运吗?AI训练中的模型参数同步、分布式存储的数据复制、大规模虚拟机迁移,这些场景下RDMA的高吞吐和低开销优势非常明显。你的带宽达到25G以上了吗?当网络带宽从10G升级到25G甚至100G时,传统TCP/IP协议栈的CPU开销会急剧增加,RDMA的价值也更加凸显。

常见问题解答

RDMA和DPDK有什么区别

RDMA是一种网络协议层面的能力,需要网卡硬件支持,它从协议层面实现了内核旁路和零拷贝。DPDK是一种软件框架,通过用户态驱动和轮询机制来加速数据包处理,仍然需要CPU参与。两者可以互补,但RDMA的硬件卸载效率通常更高。

使用RDMA需要修改应用程序吗

取决于你选择的RDMA编程接口。使用"verbs"接口需要对应用进行专门适配。但如果使用iWARP或通过NVMe-oF、SMB Direct等已经支持RDMA的上层协议,应用程序可能不需要做任何修改,底层的存储或文件服务协议会自动利用RDMA加速。

RDMA对交换机有要求吗

RoCEv2在标准以太网上运行,但为了获得良好效果,建议交换机支持PFC(基于优先级的流量控制)和ECN(显式拥塞通知)等无损网络特性。普通的非管理型交换机虽然也能传输RoCE流量,但可能在高负载时出现丢包,影响RDMA性能。

25G和100G网卡都支持RDMA吗

不一定。RDMA是一项需要网卡芯片专门设计支持的功能,并非所有高速网卡都具备。在选购时,需要确认网卡明确标注支持RDMA或RoCEv2。联瑞电子的LRES1021PF-2SFP28和LRES1014PF-2QSFP28等型号均已支持该功能。

RDMA的安全性如何保障

由于RDMA绕过了操作系统内核,传统的基于内核的网络防火墙和访问控制机制无法直接拦截RDMA流量。在生产环境中,可以通过网络隔离(VLAN/VRF)、加密传输(如IPsec)以及物理层面的安全策略来保障RDMA通信的安全性。

Logo

openEuler 是由开放原子开源基金会孵化的全场景开源操作系统项目,面向数字基础设施四大核心场景(服务器、云计算、边缘计算、嵌入式),全面支持 ARM、x86、RISC-V、loongArch、PowerPC、SW-64 等多样性计算架构

更多推荐