什么是RDMA：零基础也能看懂的技术解读

深圳联瑞电子LRLINK

37人浏览 · 2026-06-26 14:19:00

深圳联瑞电子LRLINK · 2026-06-26 14:19:00 发布

别再被误导了，RDMA不是什么"高端专属"的技术

如果你在网络行业待过一段时间，大概率听过这样的说法："RDMA是超算和金融行业才用得起的东西，普通数据中心根本用不上。"这句话在五年前或许有一定道理。但放到今天，它已经成为网络基础设施领域较大的误解之一。随着云计算、分布式存储和人工智能训练任务的增长，RDMA早已走出了实验室，成为越来越多企业数据中心里的标配能力。

为什么大家会觉得RDMA"高高在上"

这个误解的形成并非没有原因。早期的RDMA确实很"贵"，最初的RDMA主要依赖InfiniBand网络，需要专用交换机和配套设备，整套方案的价格让大多数企业望而却步，只有少数大型超算中心和对延迟非常敏感的交易系统才会使用。技术门槛确实存在，RDMA涉及内核旁路、零拷贝传输、硬件卸载等一系列底层概念，对于没有系统学习过高性能网络的管理员来说理解起来有一定难度，很多技术文章一上来就堆砌术语让人望而生畏。生态曾经是封闭的，早年间支持RDMA的硬件和软件生态较为有限，普通操作系统和应用程序很难直接利用这项技术，这进一步加深了"这东西跟我没关系"的印象。

RDMA到底是什么

抛开所有术语，RDMA的全称是"Remote Direct Memory Access"，翻译成中文就是"远程直接内存访问"。打个比方，想象你在办公室里需要把一份文件从隔壁同事的桌上拿过来。传统的网络传输方式就像你打电话给同事，让同事把文件拍照发给你，你再打印出来——中间经过了很多步骤，每多一步就多一分延迟和开销。而RDMA相当于你直接走到同事桌前，自己动手把文件拿回来，全程不需要同事帮忙。用技术语言来说，RDMA允许一台服务器的网卡直接读写另一台服务器的内存，完全绕过双方的CPU和操作系统内核，这就是所谓的"内核旁路"和"零拷贝"。

RDMA带来的三大核心优势

超低延迟

传统网络通信需要经过多层协议栈处理，每次都要CPU介入，延迟通常在数十微秒级别。RDMA通过硬件直接处理数据传输，端到端延迟可以降到1微秒左右，提升幅度达到数十倍。

极低CPU占用

在传统的TCP/IP网络中，网络数据传输会大量消耗CPU资源。使用RDMA后，数据传输由网卡硬件直接完成，CPU可以被释放出来处理业务逻辑。对于数据库、分布式存储这类CPU敏感型应用来说，这个优势非常明显。

超高吞吐

RDMA天然支持高带宽场景。配合25G、100G甚至更高带宽的网络适配器，单链路吞吐可以轻松应对大规模数据迁移、AI模型训练等高吞吐需求。

RoCE让RDMA真正走进普通数据中心

如果说InfiniBand时代的RDMA还是"阳春白雪"，那么RoCE（RDMA over Converged Ethernet）的出现则彻底改变了格局。RoCE技术的核心思路很简单——把RDMA的能力直接"搬到"标准以太网上运行。这意味着你不需要推倒现有的以太网基础设施，不需要购买专用交换机，只要在服务器端换上支持RDMA的智能网卡，就能享受到低延迟、低CPU占用的数据传输能力。目前主流的RoCEv2协议已经非常成熟，被广泛应用于云存储、虚拟化、容器网络和人工智能集群等场景，国内外主流云服务商已在内部大规模使用RoCE网络。

什么样的网卡能支持RDMA

要使用RDMA，你需要一块支持该功能的智能网卡。联瑞电子（LR-LINK）提供了多款支持RDMA/RoCE能力的网络适配器，覆盖从25G到100G的不同场景需求。

25G双口SFP28方案

推荐型号：LRES1021PF-2SFP28，PCIe x8双口25G SFP28以太网适配器，支持RoCEv2协议。适合虚拟化服务器和中等规模存储集群的接入，向下兼容10G速率，是现有10G网络向25G平滑升级的理想选择。双口设计可同时承载业务流量和存储流量，实现网络融合。

100G双口QSFP28高性能方案

推荐型号：LRES1014PF-2QSFP28，PCIe x16双口100G QSFP28以太网适配器，基于Intel E810主控，支持RoCEv2协议。单口速率可达100Gbps，支持多速率配置（10/25/50/100Gbps），适合高性能计算节点和AI训练服务器的高速互联。在大规模AI训练、分布式存储和高性能数据库场景中，100G RDMA可以显著降低数据传输延迟，释放CPU算力。

什么时候应该考虑RDMA

并非所有场景都需要RDMA。以下几个判断标准可以帮助你决定是否需要引入这项技术。你的应用对延迟敏感吗？如果你的业务涉及实时数据库、分布式锁等对网络延迟非常敏感的场景，RDMA带来的微秒级延迟优势非常有价值。你的网络是否成为瓶颈？当服务器CPU大量时间花在处理网络数据包而非执行业务逻辑时，RDMA的内核旁路机制可以有效释放CPU资源。你在做大规模数据搬运吗？AI训练中的模型参数同步、分布式存储的数据复制、大规模虚拟机迁移，这些场景下RDMA的高吞吐和低开销优势非常明显。你的带宽达到25G以上了吗？当网络带宽从10G升级到25G甚至100G时，传统TCP/IP协议栈的CPU开销会急剧增加，RDMA的价值也更加凸显。

常见问题解答

RDMA和DPDK有什么区别

RDMA是一种网络协议层面的能力，需要网卡硬件支持，它从协议层面实现了内核旁路和零拷贝。DPDK是一种软件框架，通过用户态驱动和轮询机制来加速数据包处理，仍然需要CPU参与。两者可以互补，但RDMA的硬件卸载效率通常更高。

使用RDMA需要修改应用程序吗

取决于你选择的RDMA编程接口。使用"verbs"接口需要对应用进行专门适配。但如果使用iWARP或通过NVMe-oF、SMB Direct等已经支持RDMA的上层协议，应用程序可能不需要做任何修改，底层的存储或文件服务协议会自动利用RDMA加速。

RDMA对交换机有要求吗

RoCEv2在标准以太网上运行，但为了获得良好效果，建议交换机支持PFC（基于优先级的流量控制）和ECN（显式拥塞通知）等无损网络特性。普通的非管理型交换机虽然也能传输RoCE流量，但可能在高负载时出现丢包，影响RDMA性能。

25G和100G网卡都支持RDMA吗

不一定。RDMA是一项需要网卡芯片专门设计支持的功能，并非所有高速网卡都具备。在选购时，需要确认网卡明确标注支持RDMA或RoCEv2。联瑞电子的LRES1021PF-2SFP28和LRES1014PF-2QSFP28等型号均已支持该功能。

RDMA的安全性如何保障

由于RDMA绕过了操作系统内核，传统的基于内核的网络防火墙和访问控制机制无法直接拦截RDMA流量。在生产环境中，可以通过网络隔离（VLAN/VRF）、加密传输（如IPsec）以及物理层面的安全策略来保障RDMA通信的安全性。

openEuler 社区

openEuler 是由开放原子开源基金会孵化的全场景开源操作系统项目，面向数字基础设施四大核心场景（服务器、云计算、边缘计算、嵌入式），全面支持 ARM、x86、RISC-V、loongArch、PowerPC、SW-64 等多样性计算架构

更多推荐

操作系统 | 虚拟存储器

openEuler 社区

大学生IT学习全攻略：从零基础到职场精英的进阶指南

《大学生IT学习进阶指南》为数字化时代的大学生提供了一条从零基础到职场精英的系统化学习路径。全文分五个阶段：大一夯实编程基础和计算机原理；大二重点攻克数据结构、网络、操作系统、数据库四大核心课程；大三根据兴趣选择前端、后端、AI或网安方向深度发展；大四通过实习和项目积累实战经验；最后强调"20%理论+80%实践"的学习方法，建议建立个人知识库、避免浅尝辄止。指南指出，IT行业核心竞争力源于扎实的基