boxmoe_header_banner_img

⋅無⋅限⋅進⋅步⋅

加载中

文章导读

Telemetry协议


avatar
yuhui 2025年10月21日 42

Telemetry协议

网络设备的统一监控,包括数据、控制、管理平面数据

1741920911292-8c361b2c-79c8-441f-8605-de4a98d132ce.png

奈奎斯特采样定律表示,当采样频率大于信息频率的2倍时,才能完整保留原始信号中的信息。SNMP的采集周期为5分钟,通常会导致细节信息丢失

1741920911217-bcf6eec0-104a-41aa-8755-007abb05ed57.png

传统SNMP是Pull mode 的请求响应式交互,每次采集数据都需要网管发起请求,设备解析请求后响应上报数据,各厂家MIB自定义,兼容性差

1741920911334-cf61a171-64be-44d2-8a6f-a32e243f093d.png

传统网络平均5~15分钟pulling数据,更密集的pull可能导致网络瘫痪

1741920911294-1b4a311c-73e8-40eb-9399-aa0ef1a286e7.png

微突发:在非常短的时间(毫秒级)内收到非常多的突发数据,以至于瞬时突发速率达到平均的数十倍、百倍,甚至超过端口带宽,网络设备或网络性能检测软件通常是基于比较长的时间,计算网络实时带宽,这种情况下,看到流量速率通常是一条比较平稳的曲线,但是实际设备可能已由于微突发导致丢包

避免重复查询: SNMP查询是一问一答的,假设一分钟交互1k次,则SNMP解析了1000次查询请求报文 telemetry实现订阅一次,后续设备持续推送数据给网管

1741920911314-4193deac-054d-44e7-bb03-73b81ef641c0.png

Network Telemetry:网络遥测技术,远程从物理设备到虚拟设备上 高速采集数据 的技术,通过推 push mode 周期性主动向采集器上送设备的接口流量统计、CPU或内存数据等信息,相对传统pull模式一问一答,提供更实时更高速的数据采集

1741920916021-d7f3bb29-09ca-4846-8ab2-f6d7c52fd1f1.png

特点:

·推模式工作

·YANG模型定义结构

·精度为亚秒级

1741920916102-53117078-9d00-455f-824e-2ec33f4093ec.png

技术优势:

·精细监控:采集数据精度高,类型丰富,充分反映网络状况

·快速定位:复杂的网络中,快速定位故障达到秒级、亚秒级故障定位速度

·主动上报:仅需配置一次订阅,设备就可以持续上报数据,减轻了设备处理和查询请求压力

Telemetry网络模型:

·广义:包括采集器、分析器、控制器和设备共同构成自闭环系统

·狭义:设备采样数据上送给采集器的功能

利用telemetry技术,采集器可以手机到大量的设备数据,然后将数据交给分析器进行综合分析,分析器将决策结果发送给控制器,由控制器调整设备的配置,便可以几乎实时地反馈调整后的设备状态是否符合预期

1741920916380-3665c23d-0b6c-4c6a-a1e3-582b1612e9e8.png

应用场景:

·广域网

1741920916140-30d1610f-de75-4700-b982-37208972a252.png

路由器端口数据实时上报分析器,流量走向易于洞察

·园区网

1741920916127-35f11dcd-e111-482b-b81c-8910c95be519.png

园区网课通过telemetry将设备状态、有线无线数据同时监控上报分析器,实现智能运维

·数据中心

1741920916920-1779f3b3-1ba0-4bbb-a835-541de923913c.png

分析器接受telemetry上送的数据,计算报文的转发路径,转发时延,链路时延等,完成应用交互关系分析,实现应用和网络路径的关联,并进行统计分析,呈现、实现智能运维

数据中心的采集器通过telemetry采集设备性能数据,通过ERSPAN采集设备流镜像

监控示例:

·有线网络

1741920916856-d6601e4a-4476-4b80-9a04-600a95b1ed8a.png

分析器分析有线网络设备telemetry特性采集的设备、接口等性能metrics数据,主动监控预测网络异常

1741920916814-e0ddee4a-79a5-4982-a7ed-636e26108ead.png

·无线网络

1741920916917-a36e10dc-ba9d-4ce6-97b4-f14d9e0c0f47.png

基于Telemetry技术,分析器监控无线侧关键KPI指标,从AP,射频,用户三个维度呈现无线侧的网络质量,主动识别弱信号覆盖,高干扰,高信道利用率等空口性能类问题

技术原理-框架

狭义上Telemetry框架分为四个模块:

·数据源

·数据生成

·数据订阅

·数据推送

1741920916818-0adcec2f-4dcf-4473-8932-e0d74188cedf.png

协议栈:

具有分层结构

·传输层

·通信层

·数据编码层

·数据模型层

1741920918575-a16f91bd-49ad-468a-8664-00b66c2844bd.png

1741920918505-15c05be5-4bad-4013-b058-808fd7f76f07.png

数据源:定义了可被获取的数据

支持各类YANG模型

1741920918482-f4f6cf24-6abb-4126-be2c-9a064603b78e.png

YANG模型文件与采样路径

1741920918494-dc42dec1-c7b2-47a7-9d25-a1843255329d.png

数据订阅:定义了数据发送端和数据获取端交互关系

1741920918577-ba5eb3ef-5f7a-4aaf-9810-d345e69a9d2e.png

静态订阅:

1、网管对设备下发静态配置,包括采样路径、采样周期、上送目标、编码信息

·支持CLI下发

·支持Netconf下发,netconf使用模型是opconfig-Telemetry.yang

2、设备启动采样任务,主动向采集器发起连接并推送数据

·支持gRPC上送,RPC方法为dataPublish

·支持UDP上送

1741920920237-f495fcb7-8391-4653-b74a-15512f5326ce.png

自定义事件上报

1741920920253-e27646c0-1d16-443d-8e9b-06ff180c889c.png

动态订阅:

1、采集器向设备发起gRPC连接

2、采集器向设备发起动态订阅

·RPC方法:subscribe

·指定采样路径、采样周期

3、启动设备采样任务,将采样数据作为rpc方法的应答,源源不断的返回采集器

1741920920232-eca605bb-5721-45e0-8be3-e9b15d7e6471.png

1741920920219-73af6d41-4bd0-487d-926f-f6df1d1813d6.png

gRPC协议栈

1741920920255-ddc14518-7c4c-4bd8-b790-38e1375db1e0.png

gRPC四种服务模式:

·简单模式:一问一答

·服务端流模式:客户端发送一个请求,服务端不断返回数据给客户端

·客户端流模式:客户端不断向服务端推送数据,等待服务端应答

·双向流模式:客户端和服务端都可以发送一系列消息

1741920922150-7091d99a-92fd-4af4-b28e-bafae80634a5.png

数据生成:

采用GPB编码,提供了一种灵活高效自动序列化结构数据的机制,GPB与XML、JSON编码类似,但GPB是一种二进制编码,性能更高

1741920922184-88ae7934-ed44-4bd4-a3b1-40f97985a9be.png

GPB编码:通过.proto文件描述信息格式,使用数字代替标签名称

1741920922203-899eb169-9c9e-44ba-9871-a9f135f3db4f.png

因为Protocol Buffers是以二进制进行传输,效率比XML、JSON更有优势,数据采集效率是Telemetry重点之一

数据推送:

·基于gRPC方式

·基于UDP方式

1741920922222-a7aae28d-adec-4b6c-b906-7079a2dc790d.png

基于gRPC推送流程

gRPC面向连接,只在采集器和主控板CPU之间建立gRPC隧道

1741920922196-3a7b61b5-5383-4b30-a042-628f7c66e64a.png

1741920924886-a663cfe3-ec79-42f1-a79e-1b1e8e109e24.png

基于UDP的推送流程

1741920924766-240df2cb-363a-4ace-ac46-67a913e1db73.png

1741920924884-d074a55e-40a4-4264-b3c5-704cb4c99e02.png

推送数据格式定义(gRPC)

1741920924909-9a4f19af-a61f-4d80-8773-6642cc22a11d.png

推送数据格式定义(UDP)

1741920924874-5f2e1bc0-a2a0-4454-9979-fc76292801a9.png

配置静态订阅:

1741920927804-437cca65-43ae-45a5-8b8b-f4ca598d1168.png

1741920927918-f1cc5d0f-0b8a-4e06-b020-3531a15cc2a7.png

1741920927844-ff0a4362-a9c5-4eaa-931a-59d3d3b91d79.png

1741920927912-aef809dd-ed2b-4441-bda3-d05106a340ef.png

1741920927887-bec2b9ad-4335-4b27-8aa6-f96be2ae774e.png

1741920930533-cf5a7e34-26a1-47e5-bc02-70261b3bf83d.png

编译完成后当前文件夹下会生成数个python文件

1741920930568-362637c1-2c76-40de-b723-bbf141bc5f56.png

1741920930546-5eb2e76e-e4a0-4567-8b6b-e72a8d884a75.png

1741920930522-8f16b1e1-7132-43a0-a6f8-9b1918480c04.png

1741920930695-b5a85205-8874-458a-910f-d73151b70774.png

1741920936151-6f2c1c8a-4e56-4261-a62b-10ea721d8400.png

更新: 2025-03-14 10:55:43
原文: https://www.yuque.com/yuhui.net/network/hqek2zi21tg80oe0



评论(0)

查看评论列表

暂无评论


发表评论

表情 颜文字

插入代码