Marvell 博客

值得共享的特色技术理念和解决方案

Marvell

2019 年 2 月 20 日

NVMe/TCP – 简化是创新的关键

作者:Marvell 产品与技术营销经理 Nishant Lodha

无论是 iPhone设计美学,还是像莫奈“睡莲”这样的艺术品,它们突出的特点就是简单。 我的日常生活中,常常会听到这样的话,比如我老板的口头禅是“简简单单就行”,和我结婚 15 年的妻子常常告诉我十几岁的女儿“美就是简单”。虽然,这些话我一般都当作耳旁风。

如今正推动数据存储发展的 Non-Volatile Memory over PCIe Express (NVMe) 技术,便是简单价值开始逐渐受到认可的又一领域。 尤其是随着 NVMe-over-Fabrics (NVMe-oF) 拓扑的出现,该技术的部署将越来越多。 这一简单又可信的以太网光纤,即传输控制协议 (TCP),现已成为经 NVMe Group 批准认可的 NVMe-oF 标准[1]。


图 1: 当前可用的所有 NVMe 光纤

这里给大家提供一些背景信息,大体而言,NVMe 是借助高速接口(如 PCIe)访问以及专用于闪存实施的简化指令集,以高效利用基于闪存的固态硬盘 (SSD)。 现在,按照定义,NVMe 仅限于单个服务器,这就带来了一项挑战,即很难横向扩展 NVMe 并从数据中心的任何元素进行访问。 这便是 NVMe-oF 派上用处的地方。 全闪存阵列 (AFA)、即闪存簇 (JBOF) 或网络化闪存簇 (FBOF) 和软件定义存储 (SDS) 架构皆能整合一个基于 NVMe-oF 连接的前端。 由此一来,将大大提升服务器、客户端和应用访问外部存储资源的效率。

目前市面上出现了许多用于横向扩展 NVMe 的“光纤”。 其中第一个便是以太网远程直接内存访问 (RDMA) – 基于 RDMA over Converged Ethernet (RoCE) 和 Internet Wide-Area RDMA Protocol (iWARP)。 然后是 NVMe-over-Fiber Channel (FC-NVMe),紧接着是基于 FCoE、Infiniband 和 OmniPath 的光纤。

但是既然已经有如此多的光纤选择,为何还需要再开发一个呢? 我们是否真的也需要 NVMe-over-TCP (NVMe/TCP)? 基于 NVMe 光纤的优秀 RDMA(无论是 RoCE 还是 iWARP)应当能够通过诸如零拷贝和内核旁路等基于专用网络接口控制器 (NIC) 的各种不同技术提供 NVMe 所需的极低延迟。 但是,这里存在几个障碍因素需要予以考量。

  • 首先,大多数早期的光纤(如 RoCE/iWARP)并没有什么值得一提的现有存储网络安装基础(Fiber Channel是唯一一个明显例外)。 例如,目前在企业数据中心运行的 1200 万 10GbE+ NIC 端口中,只有不到 5% 具有 RDMA 功能(根据我的粗略估计)。
  • 最流行的 RDMA 协议 (RoCE) 要求在无损网络上运行(而这则需要配备薪水要求更高的高技术网络工程师)。 更令人沮丧的是,即便如此,该协议也容易发生拥堵问题。
  • 最后,可能也是最具说服力的一点,这两项 RDMA 协议(RoCE 和 iWARP)相互不兼容。

与任何其它 NVMe 光纤不同,TCP 非常普遍,可以说无所不在。 TCP/IP 是互联网的根基,所有以太网 网卡/交换机都支持 TCP 协议。 就 TCP 而言,可用性和可靠性根本无须担心。 扩展基于 TCP 光纤的 NVMe 的规模似乎合情合理。

NVMe/TCP 非常快速(尤其是在使用 Marvell FastLinQ 10/25/50/100GbE NIC 的情况下 – 因为它们具有一个用于 NVMe/TCP 的内置完全卸载),可以充分利用现有的基础架构,让事务本身变得更加简单。 这是所有技术人员期盼的美好前景,而且对于担忧预算的公司首席信息官来说也充满吸引力。

从长远角度来看,简化再一次获胜!

[1] https://nvmexpress.org/welcome-nvme-tcp-to-the-nvme-of-family-of-transports/

评论已关闭。