【嘉勤点评】云脉芯联的网络时延专利,通过基于ECMP等负载均衡场景、建立与RDMA标准一致的网络通信机制,无需增设实体硬件就能实现测量的网络往返时延RTT和实际业务报文的RTT一致,提高网络时延测量的准确度和高效性。
集微网消息,2022开放数据中心(ODCC)峰会在北京国际会议中心拉开帷幕,以“畅享算力精彩 共赴低碳未来”为主题,云脉芯联自研RDMA技术成果公开亮相ODCC峰会。
随着分布式机器学习和大规模流式数据处理对网络带宽和网络时延等核心指标提出了更高的要求。尤其在RDMA通信网络中需获取更精准的时延。RDMA通信连接建立之前,用户期望通过测量网络链路的时延RTT来确保新建连接能够选择一条网络时延较小的链路。然而由于TWAMP等的设置导致网络时延测量不准确,导致网络时延测量方法得到的网络往返时延RTT和实际业务报文的RTT不一致。
为此,云脉芯联于2022年8月5日申请了一项名为“一种网络时延测量的方法、装置、设备以及存储介质”的发明专利(申请号: 202210935005.8),申请人为北京云脉芯联科技有限公司。
图1 网络时延测量的典型场景应用示意图
图1为网络时延测量的典型场景应用示意图,基于ECMP负载均衡的配置,叶交换机A上连接的第一终端11预与连接在叶交换机B上的第二终端12建立RDMA通信连接。采用本发明建立基于ECMP等负载均衡等应用场景、与RDMA(RoCEv2)标准一致的时延测量机制,采用获取链路路径的端口设置,能够实现更加精准地网络往返时延RTT的测量。负载均衡或者负载分担可以包括二层负载分担和三层负载分担。二层负载均衡机制通过MAC寻址,其中三层负载均衡机制通过IP寻址。具体实施中由第一终端和第二终端为主体执行,其中包括能够运行软件的终端设备。
图2 网络时延测量的交互方法示意图
图2为网络时延测量的交互方法示意图,主要包括以下步骤:首先第一终端获取时延测量请求,并根据时延测量请求设置时延测量类型对应的预设端口信息(S210);预设端口信息在ECMP中获取链路路径。第一终端对应于时延测量请求的请求端,针对RDMA网络应用场景存在ECMP等负载均衡的情况,建立与RDMA(RoCEv2)标准一致的时延测量机制来进行网络时延测量。
然后根据时延测量类型和预设端口信息,发送时延测量请求对应的时延测量报文(S220),其中时延测量报文中包含发送时刻信息。根据时延测量类型和预设端口信息,生成与RDMA(RoCEv2)标准一致的、基于ECMP等负载均衡的RDMA网络时延测量场景对应的时延测量报文。
之后第二终端接收时延测量报文(S230)。时延测量报文中设置预设端口信息,从而根据预设端口信息确定的链路路径由第一终端(即请求端)经过交换机发送至第二终端(即响应端)。根据时延测量报文的报文头信息,得到时延测量类型以及预设端口信息(S240);其中预设端口信息在ECMP中获取链路路径。
然后根据时延测量类型和所述预设端口信息,发送测量响应报文,以便获得时延结果(S250);其中量响应报文包含响应时刻信息。最后第一终端接收时延测量请求对应的测量响应报文,并根据测量响应报文与时延测量报文得到时延结果(S260)。
简而言之,云脉芯联的网络时延专利,通过基于ECMP等负载均衡场景、建立与RDMA标准一致的网络通信机制,无需增设实体硬件就能实现测量的网络往返时延RTT和实际业务报文的RTT一致,提高网络时延测量的准确度和高效性。
云脉芯联是一家专注于云数据中心网络芯片产品研发与技术创新的高科技创新企业。公司致力于打造用于大规模数据中心和云计算基础设施的网络互联芯片,帮助用户构建端网融合的高性能网络基础设施,以应对进入全面数字化和智能化时代的技术挑战。