天才一秒记住【梧桐文学】地址:https://www.wtwx.net
在无线业务这块,其竞争对手G就要强大很多。
运营商P有意提升无线业务,目的是超越自己的对手G。
鉴于此,移动网络的体验也就摆在较为重要的位置。
战略目标提出后,运营商P的CTO就牵头组建了一个端到端性能优化的组织。
运营商P的CTO和运维部各级成员要求在手机上安装第三方测速软件,随时了解和体验P网络的实时性能,每周测试数十个到上百个基站。
运营商P的CTO发现问题后,把问题反馈给华为服务团队,并要求协助解决该问题。
对华为服务团队来说,要解决问题,就必须理顺移动业务中涉及的手机、基站、承载网和核心网等众多网元问题。
据了解,运营商P的现网虽然是集成性能管理系统,但是无法自动分析和精准地识别网络容量的瓶颈点。
当无线基站性能指标出现波动或异常问题时,华为服务团队通常核查基站参数配置、覆盖范围、信号强度等。
如果这些指标都没有问题则会怀疑传输链路有问题,比如拥塞、丢包、抖动等。
但传输问题的定位非常复杂,以一个用户浏览视频为例,从基站到网站之间可能有多条通路,每一条通路可能经过数十个传输节点。
由近及远在现网逐段抓包分析,工作量非常大。
(3)
正是因为如此,在耗费了21天的时间后,华为服务团队和客户运维团队依旧没能彻底地解决此问题,因为现网运行的看网工具能够有效监控的指标实在太少。
不得已,华为服务团队和客户运维团队提出一种新的解决办法——移动业务流量压抑自动分析。
该方案是通过对端到端网络拓扑的自动还原,获取到基站和承载网络拓扑的完整链接关系,再利用承载网络各链路的实时性能数据进行关联分析,由此自动分析出“问题基站”
的传输链路。
实现这样的解决方案,就必须通过海量数据资源采集、数据分析逻辑、根因判断和决策等方面进行相关的系统工程设计。
为了尽快解决此问题,华为产品管理分部团队和路由器、微波、网管等研发专家一起,从10月到11月放弃了所有周末,争分夺秒地画流程图、确定方案,以便让开发团队能尽早交付供公共测试的Beta版本,并上网验证。
当地的李长泰团队负责场景分析和总体方案设计。
所幸,经过前后方的高效协作,赶在圣诞节客户封网前的一周,网络性能数字化分析系统Beta版本上线了。
(4)
几天后,首批现网数据中已经可以分析出客户所在区域的基站与承载网拓扑关系、承载网发生拥塞的链路等。
就这样,分析和解决基站延迟劣化的问题也就顺理成章。
当获得基站编码后,华为服务团队通过系统分析出拓扑和拥塞链路数据,把所有可能影响“问题基站”
的链路找出来。
在当时,技术解决方案还没有全自动化处理的能力,只能通过人工手段找出所有链路,一条条进行有效性的匹配分析和排除,最后找到了与该基站延迟劣化相关的四条位于骨干层的“问题链路”
,这四条链路一到晚上7时就流量暴涨。
当地的李长泰团队现网的维护工具看到链路的平均利用率达到70%。
当时服务团队认为70%利用率是一个潜在风险因素,但链路利用率没有到90%~100%,并不会严重影响业务性能。
而在网络性能数字化分析系统Beta系统里,可以很明显地看出这几条链路在平均利用率大于70%时,拥塞、丢包数在急速地增加,从而会成倍地放大业务的端到端延迟,这与客户在第三方测试工具上观察到的,50ms上升到400ms延迟的现象是吻合的。
当得知监测和分析的结果后,服务团队在当晚8时基于李长泰团队指出的四条链路,在设备上进一步查看端口详细的性能数据统计,也发现了流量暴增、端口丢包数急速增加的现象。
通过流量分担等试验操作、数据测试等,客户办公室这边的基站不拥塞了,时延从400ms下降到60ms。
由于影响该基站性能劣化的链路并不在该商业区附近,而是在汇聚全网流量的骨干侧,全网流量的高峰期仍然是晚上8时。
这个分析结果可以百分之百地解释基站在非业务高峰期出现性能劣化的现象。
经过反复对比,持续观察两周后,CTO也认为该问题得到了准确定位和彻底解决。
(5)
为了更好地做好交付和售后服务,让客户更加满意,2009年1月,任正非在“销服体系奋斗颁奖大会上的讲话”
中谈道:“北非地区部努力做厚客户界面,以客户经理、解决方案专家、交付专家组成的工作小组,形成面向客户的‘铁三角’作战单元,有效地提升了客户的信任,较深地理解了客户需求,关注良好有效交付和及时回款。”
所谓“铁三角”
本章未完,请点击下一章继续阅读!若浏览器显示没有新章节了,请尝试点击右上角↗️或右下角↘️的菜单,退出阅读模式即可,谢谢!