?
在免备案CDN对用户请求的内容进行加速的过程中,用户请求会经过众多环节,每个环节都会生成相应的日志。当CDN网络出现故障时,运维人员一般采用人工的方式搜索、分析用户日志,效率低下,而且分析的准确性偏低。本文设计了一套针对CDN整个链路的日志分析系统,首先在每个环节的日志里增加字段跟踪每条请求,借助Hive与ES集群,将日志长期存储并提供接口查询日志的详细内容,CDN运维人员可以检索、查看并生成故障分析报告。系统还支持人工录入故障原因,为后续的机器学习自动分析链路提供数据源。本系统已经部署在中国移动CDN平面并持续稳定运行。
1 ?引言
2 ?本文方案
2.1 ?日志收集
2.1.1 ?日志采集
2.1.2 ?日志存储
图2 ?本文方案的数据流向
2.2 ?日志检索
2.2.1 ?日志高级检索
2.2.2 ?日志溯源
2.3 ?故障自动分析
图4 ?故障分析结果
2.4 ?故障原因人工反馈
3 ?应用成效及分析
4 ?结论